01News

Home
Review

Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

Intel Foundry: lajme të reja për teknologjinë e proceseve

Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?
Gaming

Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

Roblox ndalohet në Rusi — platforma bllokohet për miliona përdorues pas vendimit të autoriteteve

Dhjetori i lojtarëve: Lançimet më të mëdha të videolojërave që mbyllin vitin 2025

Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

Nintendo sjell Virtual Boy pas 30 vitesh
Paisje Tech
A po i vjen fundi smartphone-it? Si do të ndryshojë mënyra jonë e ndërveprimit me teknologjinë

Apple rikthen Liquid Glass me iOS 26.2 — efekti vizual shtrihet edhe në ekranin e mbyllur

OnePlus 15 merr dritën jeshile nga FCC-ja, prenotimet në SHBA nisin zyrtarisht

Samsung tërheq vëmendjen botërore: Galaxy Z TriFold, tableti 10-inç që paloset dhe futet në xhep

Sensorë të fshehtë në tualetet e shkollave amerikane – luftë ndaj vaping-ut apo ndaj privatësisë?

HP dhe Dell çaktivizojnë mbështetjen HEVC në disa laptopë, pavarësisht se procesorët e përkrahin
Trending Tags
Kompiuter

Hoskinson paralajmëron për epokën post-kuantike: kripto do të duhet të bëjë kompromise

Raportimet e OpenAI për sigurinë e fëmijëve shënojnë rritje të fortë në 2025

Një javë e zezë për harduerin: iRobot, Luminar dhe Rad Power Bikes shpallin falimentimin

Dokumente të brendshme sugjerojnë se Apple po teston një iMac Pro të ri

Max Hodak: Manipulimi në rrjetet sociale është kërcënim më i madh se hakimi i ndërfaqeve tru-kompjuter

Gaming në PC: pse Windows dominon ende mbi SteamOS në kartat grafike të fuqishme
Aplikacione

Samsung po e kthen televizorin në album digjital me Google Photos

Kur biseda kthehet në veprim: ChatGPT dhe integrimet e reja

Përse numri i ndjekësve në rrjetet sociale po humbet rëndësinë

Gmail drejt një ndryshimi të madh: adresa e email-it nuk do të jetë më fikse

Shoferi akuzohet pasi goditi për vdekje një këmbësor gjatë një transmetimi live në TikTok

Pse GPT-5 nuk po krijon më efektin “wow” në botën e AI-së
Security

Sulmet kibernetike që tronditën vitin 2025: kur askush nuk ishte më i sigurt online

Je shënjestruar nga spyware shtetëror? Ja çfarë duhet të bësh më pas

Grupi pirate “Anna’s Archive” pretendon se ka nxjerrë të dhëna për 86 milionë këngë nga Spotify

Aflac pranon shkelje masive të sigurisë: u ekspozuan të dhënat personale dhe shëndetësore të 22.6 milionë personave

Ekonomia e mashtrimit në epokën e AI-së: rasti i rimbursimeve false në Kinë

Cisco paralajmëron për shfrytëzimin e një cenueshmërie zero-day nga hakerë kinezë

No Result

View All Result

No Result

View All Result

01News

No Result

View All Result

Home Security

Microsoft bllokon sulmet kundër modeleve të AI

Microsoft shpjegoi se si zbulon dhe bllokon sulmet e bëra kundër modeleve gjeneruese të AI që përpiqen të anashkalojnë mbrojtjen.

in Security

Reading Time: 2 mins read

Microsoft bllokon sulmet kundër modeleve të AI

465

SHARES

1.5k

VIEWS

Share on Facebook Share on Twitter

Microsoft ka publikuar një artikull në blogun e tij të sigurisë për të shpjeguar se si zbulon dhe bllokon sulmet kundër modeleve gjeneruese të inteligjencës artificiale. Kompania Redmond përdor metoda të ndryshme për të shmangur manipulimin e LLM (Large Language Model) përmes kërkesave (inputeve) të përdorura për të anashkaluar mbrojtjen e zbatuar. Mjete specifike do të jenë të disponueshme për zhvilluesit në Azure AI Studio.

Si Microsoft zbulon dhe zbut sulmet
Microsoft thekson se sistemet e tij të AI janë të dizajnuara me shtresa të ndryshme mbrojtëse për të parandaluar abuzimin e modeleve. Megjithatë, aktorët e këqij përpiqen t’i anashkalojnë këto mbrojtje për të marrë rezultate të paautorizuara (jailbreaks), të tilla si udhëzime për të kryer aktivitete të paligjshme.

Manipulimi i modelit të AI duke përdorur inpute që anashkalojnë mbrojtjen quhet injeksion direkt i shpejtë. Kur ju kërkohet të përpunoni një dokument të krijuar nga një palë e tretë me synimin për të shfrytëzuar një dobësi në model, kjo quhet injeksion indirekt i shpejtë.

Ky lloj i fundit i sulmit është më i rrezikshëm. Për shembull, mund t’i kërkoni modelit të përmbledhë një email me një ngarkesë që kërkon të dhëna të ndjeshme të përdoruesit dhe i dërgon në një server të largët. Microsoft ka zhvilluar një teknikë, të quajtur Spotlighting, që i mban udhëzimet e modelit të ndara nga të dhënat e jashtme, duke minimizuar shanset që një sulm indirekt i menjëhershëm të ketë sukses.

Kompania Redmond ka zhvilluar gjithashtu një teknikë për të zbutur efektet e një lloji të ri jailbreak, të njohur si Crescendo. Në këtë rast, modeli mashtrohet duke shfrytëzuar përgjigjet e modelit. Në vend të hyrjes së parë, rezultati i dëshiruar merret në rreth 10 përsëritje (pyetje/përgjigje).

Microsoft përditësoi Copilot për të zbutur ndikimin e Crescendo. Filtrat marrin parasysh të gjithë bisedën dhe sistemet janë trajnuar për të zbuluar këtë lloj jailbreak.

Tags: AI Inteligjenca artificiale microsoft

Të Lidhura

Bankat evropiane planifikojnë shkurtime të mëdha të vendeve të punës ndërsa AI merr hov

Inteligjenca Artificiale

Bankat evropiane planifikojnë shkurtime të mëdha të vendeve të punës ndërsa AI merr hov

2026 shënon pjekurinë e AI-së: Fundi i entuziazmit, fillimi i vlerës reale

Inteligjenca Artificiale

2026 shënon pjekurinë e AI-së: Fundi i entuziazmit, fillimi i vlerës reale

Si po ndryshon AI mënyrën e punës dhe kush e përcakton këtë ndryshim sipas CEO-së së Mercor

Inteligjenca Artificiale

Si po ndryshon AI mënyrën e punës dhe kush e përcakton këtë ndryshim sipas CEO-së së Mercor

Kërkesa e AI-së për energji po ringjallin interesin për centralet bërthamore

Inteligjenca Artificiale

Kërkesa e AI-së për energji po ringjallin interesin për centralet bërthamore

Pse rrjeti elektrik nuk mund të funksionojë më pa softuer

Kryesore

Pse rrjeti elektrik nuk mund të funksionojë më pa softuer

Nga prapaskenë teknike në infrastrukturë globale: viti i qendrave të të dhënave

Inteligjenca Artificiale

Nga prapaskenë teknike në infrastrukturë globale: viti i qendrave të të dhënave

Next Post

Gemini Ultra në telefonat inteligjentë Oppo dhe OnePlus

Gemini Ultra në telefonat inteligjentë Oppo dhe OnePlus

Discussion about this post

No Result

View All Result

© 2025 Zero1.al - Part of techzero1.com