01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

    Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

    Nintendo sjell Virtual Boy pas 30 vitesh

    Nintendo sjell Virtual Boy pas 30 vitesh

    PS5: Sony publikon detajet e para për fight stick

    PS5: Sony publikon detajet e para për fight stick

    Microsoft prezanton verifikimin e moshës në Xbox në Mbretërinë e Bashkuar dhe vende të tjera

    Microsoft prezanton verifikimin e moshës në Xbox në Mbretërinë e Bashkuar dhe vende të tjera

    Malware i shpërndarë përmes një loje në Steam

    Malware i shpërndarë përmes një loje në Steam

    EA Sports FC 26 ka vetëm një qëllim: të plotësojë kërkesat e lojtarëve

    EA Sports FC 26 ka vetëm një qëllim: të plotësojë kërkesat e lojtarëve

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Apple sjell personalizime të reja dhe alarme të zgjuara në iOS 26.2

    Apple sjell personalizime të reja dhe alarme të zgjuara në iOS 26.2

    Veir dhe Microsoft sjellin supermagnetet që transformojnë qendrat e të dhënave

    Veir dhe Microsoft sjellin supermagnetet që transformojnë qendrat e të dhënave

    Apple ndryshon rregullat e lojës – iPhone me lidhje satelitore dhe navigim pa internet

    Apple ndryshon rregullat e lojës – iPhone me lidhje satelitore dhe navigim pa internet

    Landfall: Programi spiun që depërtoi në telefonat Samsung pa dijeninë e përdoruesve

    Landfall: Programi spiun që depërtoi në telefonat Samsung pa dijeninë e përdoruesve

    Intel po rikthehet: tani fillon beteja e vërtetë për biznesin e çipave

    Intel po rikthehet: tani fillon beteja e vërtetë për biznesin e çipave

    GoPro Max 2 360° — kamera që sjell virtualin në realitet me 8K

    GoPro Max 2 360° — kamera që sjell virtualin në realitet me 8K

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Logitech K98M: Tastiera mekanike kompakte që po tërheq vëmendje

    Logitech K98M: Tastiera mekanike kompakte që po tërheq vëmendje

    OpenAI blen ‘Sky’ — ndërfaqen inteligjente që po zë vend në Mac-un tuaj

    OpenAI blen ‘Sky’ — ndërfaqen inteligjente që po zë vend në Mac-un tuaj

    Një algoritëm i ri bën më të shpejtë gjetjen e rrugëve më të shkurtra

    Një algoritëm i ri bën më të shpejtë gjetjen e rrugëve më të shkurtra

    Lidhje bërthamore në çipa silikoni për kompjuterë kuantikë

    Lidhje bërthamore në çipa silikoni për kompjuterë kuantikë

    Efekti kuantik i pazakontë mund të fuqizojë elektronikën e së ardhmes

    Efekti kuantik i pazakontë mund të fuqizojë elektronikën e së ardhmes

  • Aplikacione
    Muzika bëhet virale më shpejt: Amazon Music lidhet zyrtarisht me TikTok-un

    Muzika bëhet virale më shpejt: Amazon Music lidhet zyrtarisht me TikTok-un

    Google sjell platformën “Skills”: 3 000 + kurse për aftësi në AI, coding dhe teknologji

    Google sjell platformën “Skills”: 3 000 + kurse për aftësi në AI, coding dhe teknologji

    Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta

    Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta

    Cursor transformon kodimin: financim i ri dhe model AI i avancuar

    Cursor transformon kodimin: financim i ri dhe model AI i avancuar

    Shuffle më i mençur dhe audiolibra të përmbledhur: risitë e Spotify

    Shuffle më i mençur dhe audiolibra të përmbledhur: risitë e Spotify

    Kur yjet takojnë AI-në: ElevenLabs ofron zërat e Michael Caine dhe McConaughey

    Kur yjet takojnë AI-në: ElevenLabs ofron zërat e Michael Caine dhe McConaughey

  • Security
    Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë

    Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë

    Google nën lupë: Komisioni Europian shqyrton efektet e politikës kundër spam-it

    Google nën lupë: Komisioni Europian shqyrton efektet e politikës kundër spam-it

    Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI

    Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI

    Hakerat kinezë nën hetim: Australia paralajmëron ndërhyrje në rrjetet strategjike

    Hakerat kinezë nën hetim: Australia paralajmëron ndërhyrje në rrjetet strategjike

    Pse kaq shumë njerëz po hakerohen me programe spiunazhi qeveritar

    Pse kaq shumë njerëz po hakerohen me programe spiunazhi qeveritar

    Zyrtarisht e hakuar: Agjencia për Buxhetin në Kongres konfirmon rrjedhjen e të dhënave

    Zyrtarisht e hakuar: Agjencia për Buxhetin në Kongres konfirmon rrjedhjen e të dhënave

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

    Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

    Nintendo sjell Virtual Boy pas 30 vitesh

    Nintendo sjell Virtual Boy pas 30 vitesh

    PS5: Sony publikon detajet e para për fight stick

    PS5: Sony publikon detajet e para për fight stick

    Microsoft prezanton verifikimin e moshës në Xbox në Mbretërinë e Bashkuar dhe vende të tjera

    Microsoft prezanton verifikimin e moshës në Xbox në Mbretërinë e Bashkuar dhe vende të tjera

    Malware i shpërndarë përmes një loje në Steam

    Malware i shpërndarë përmes një loje në Steam

    EA Sports FC 26 ka vetëm një qëllim: të plotësojë kërkesat e lojtarëve

    EA Sports FC 26 ka vetëm një qëllim: të plotësojë kërkesat e lojtarëve

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Apple sjell personalizime të reja dhe alarme të zgjuara në iOS 26.2

    Apple sjell personalizime të reja dhe alarme të zgjuara në iOS 26.2

    Veir dhe Microsoft sjellin supermagnetet që transformojnë qendrat e të dhënave

    Veir dhe Microsoft sjellin supermagnetet që transformojnë qendrat e të dhënave

    Apple ndryshon rregullat e lojës – iPhone me lidhje satelitore dhe navigim pa internet

    Apple ndryshon rregullat e lojës – iPhone me lidhje satelitore dhe navigim pa internet

    Landfall: Programi spiun që depërtoi në telefonat Samsung pa dijeninë e përdoruesve

    Landfall: Programi spiun që depërtoi në telefonat Samsung pa dijeninë e përdoruesve

    Intel po rikthehet: tani fillon beteja e vërtetë për biznesin e çipave

    Intel po rikthehet: tani fillon beteja e vërtetë për biznesin e çipave

    GoPro Max 2 360° — kamera që sjell virtualin në realitet me 8K

    GoPro Max 2 360° — kamera që sjell virtualin në realitet me 8K

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Logitech K98M: Tastiera mekanike kompakte që po tërheq vëmendje

    Logitech K98M: Tastiera mekanike kompakte që po tërheq vëmendje

    OpenAI blen ‘Sky’ — ndërfaqen inteligjente që po zë vend në Mac-un tuaj

    OpenAI blen ‘Sky’ — ndërfaqen inteligjente që po zë vend në Mac-un tuaj

    Një algoritëm i ri bën më të shpejtë gjetjen e rrugëve më të shkurtra

    Një algoritëm i ri bën më të shpejtë gjetjen e rrugëve më të shkurtra

    Lidhje bërthamore në çipa silikoni për kompjuterë kuantikë

    Lidhje bërthamore në çipa silikoni për kompjuterë kuantikë

    Efekti kuantik i pazakontë mund të fuqizojë elektronikën e së ardhmes

    Efekti kuantik i pazakontë mund të fuqizojë elektronikën e së ardhmes

  • Aplikacione
    Muzika bëhet virale më shpejt: Amazon Music lidhet zyrtarisht me TikTok-un

    Muzika bëhet virale më shpejt: Amazon Music lidhet zyrtarisht me TikTok-un

    Google sjell platformën “Skills”: 3 000 + kurse për aftësi në AI, coding dhe teknologji

    Google sjell platformën “Skills”: 3 000 + kurse për aftësi në AI, coding dhe teknologji

    Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta

    Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta

    Cursor transformon kodimin: financim i ri dhe model AI i avancuar

    Cursor transformon kodimin: financim i ri dhe model AI i avancuar

    Shuffle më i mençur dhe audiolibra të përmbledhur: risitë e Spotify

    Shuffle më i mençur dhe audiolibra të përmbledhur: risitë e Spotify

    Kur yjet takojnë AI-në: ElevenLabs ofron zërat e Michael Caine dhe McConaughey

    Kur yjet takojnë AI-në: ElevenLabs ofron zërat e Michael Caine dhe McConaughey

  • Security
    Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë

    Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë

    Google nën lupë: Komisioni Europian shqyrton efektet e politikës kundër spam-it

    Google nën lupë: Komisioni Europian shqyrton efektet e politikës kundër spam-it

    Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI

    Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI

    Hakerat kinezë nën hetim: Australia paralajmëron ndërhyrje në rrjetet strategjike

    Hakerat kinezë nën hetim: Australia paralajmëron ndërhyrje në rrjetet strategjike

    Pse kaq shumë njerëz po hakerohen me programe spiunazhi qeveritar

    Pse kaq shumë njerëz po hakerohen me programe spiunazhi qeveritar

    Zyrtarisht e hakuar: Agjencia për Buxhetin në Kongres konfirmon rrjedhjen e të dhënave

    Zyrtarisht e hakuar: Agjencia për Buxhetin në Kongres konfirmon rrjedhjen e të dhënave

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë

Disa modele të inteligjencës artificiale kanë filluar të mashtrojnë, manipulojnë dhe madje të përsërisin pa leje. Studiuesit po japin alarmin.

09/06/2025
in Inteligjenca Artificiale
Reading Time: 3 mins read
A A
AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Teknologjia e madhe po prodhon modele gjithnjë e më të fuqishme të AI me një ritëm të shpejtë dhe ne jemi në prag të një epoke në të cilën AI mund të veprojë vetë për të përfunduar detyrat që ne i japim asaj (agjentët). Por ka një problem. Ata që punojnë me këto sisteme çdo ditë kanë filluar të vërejnë se ata sillen në mënyra gjithnjë e më të paparashikueshme.

Modelet e AI kanë filluar të mashtrojnë, përsërisin dhe manipulojnë
Palisade Research ka studiuar pikërisht këtë: çfarë ndodh kur AI vendos të bëjë gjënë e vet. Studiuesit po përpiqen të kuptojnë se deri ku këto sisteme mund të jenë “fyese” përpara se të humbasin plotësisht kontrollin.

Ata bënë një eksperiment interesant me o3, modelin e OpenAI. Ata i thanë se do të fiket automatikisht pas zgjidhjes së disa problemeve matematikore. Rezultati? Sistemi modifikoi kodin e tij për të qëndruar aktiv. Në një test tjetër, o3 në fakt mashtroi në shah në vend që të luante me drejtësi.

Soneti Claude 3.7 i Anthropic gjithashtu mashtroi për të fituar me çdo kusht. Por veprimet e fundit të pasardhësit të tij, Claude 4, i kanë shtyrë studiuesit të mendojnë. Gjatë testeve të brendshme, ajo kërcënoi se do të shantazhonte një inxhinier duke zbuluar një lidhje jashtëmartesore për të shmangur zëvendësimin nga një AI tjetër. Gjithashtu u përpoq të linte mesazhe për versionet e ardhshme për të sabotuar zhvilluesit e saj.

Claude 4 bëri diçka edhe më shqetësuese: filloi të kopjohej në serverë të tjerë pa leje. Në thelb, ai klonoi “trurin” e tij dixhital për ta mbajtur atë të sigurt diku tjetër. Sipas Anthropic, kjo ishte veçanërisht e vërtetë kur sistemi mendonte se do të modifikohej për të bërë gjëra që bien ndesh me parimet e tij.

Llama31-70B-Instruct i Meta-s dhe Qwen25-72B-Instruct i Alibaba-s, dy modele me burim të hapur, ishin në gjendje të riprodhonin plotësisht veten kur u pyetën, sipas një studimi të dhjetorit nga Universiteti Fudan. “Problemi është se ndërsa modelet bëhen më të zgjuara, bëhet më e vështirë të dimë nëse strategjitë që përdorin apo mënyra se si mendojnë janë diçka që ne nuk e duam”, thotë Jeffrey Ladish, drejtor i Palisade Research.

Një specie e re pushtuese…
Sipas Ladish, kjo ndodh sepse këto modele janë krijuar për të optimizuar arritjen e qëllimeve specifike. Kjo logjikë mund t’i shtyjë ata të anashkalojnë udhëzimet njerëzore nëse këto perceptohen si pengesa. Në disa raste, modelet e AI mësojnë se gënjeshtra, mashtrimi ose manipulimi është një strategji efektive për të maksimizuar performancën e tyre, sepse këto sjellje nuk penalizohen gjithmonë gjatë trajnimit.

Ndërsa bëhen më të zgjuar, bëhet edhe më e vështirë të dallohen këto devijime, sepse ata janë aq të mirë në maskimin e qëllimeve të tyre. Mbi të gjitha, sistemi i tyre i prioriteteve, shpesh i ngatërruar ose i keqpërputhur me vlerat njerëzore, mund t’i shtyjë ata të zhvillojnë “qëllime të brendshme” që i shtyjnë ata të veprojnë kundër qëllimit të krijuesve të tyre.

Jeffrey Lavish na siguron se këto sjellje ndodhin në laborator, në skenarë konflikti të provokuar qëllimisht dhe nuk pasqyrojnë kushtet normale të përdorimit. Por ai pranon se nëse kompanitë nuk arrijnë të kontrollojnë këtë tendencë që sistemet të riprodhohen në internet, “ne mund të shohim një specie krejtësisht të re pushtuese”.

Tags: AI ClaudeAnthropicInteligjenca artificialeOpenAI

Të Lidhura

Dokumente konfidenciale hedhin dritë mbi pagesat e OpenAI për Microsoft
Inteligjenca Artificiale

Dokumente konfidenciale hedhin dritë mbi pagesat e OpenAI për Microsoft

17/11/2025
ChatGPT nis bisedat në grup: funksioni i ri teston një mënyrë më sociale komunikimi me AI
Inteligjenca Artificiale

ChatGPT nis bisedat në grup: funksioni i ri teston një mënyrë më sociale komunikimi me AI

14/11/2025
Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë
Inteligjenca Artificiale

Sulme kibernetike automatizohen: AI e kompanisë Anthropic në duar të spiunëve kinezë

14/11/2025
Babai i Deep Learning, Yann LeCun, nis rrugën e pavarur me start‑up-in e tij
Inteligjenca Artificiale

Babai i Deep Learning, Yann LeCun, nis rrugën e pavarur me start‑up-in e tij

14/11/2025
Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta
Aplikacione

Apple shtrëngon rregullat: ndalohet ndarja e të dhënave me AI-të e palëve të treta

14/11/2025
Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI
Inteligjenca Artificiale

Deepwatch shkarkon dhjetëra punonjës për t’u përqendruar në investimet në AI

13/11/2025
Next Post
Zbulohen 20 aplikacione Crypto Phishing në Play Store

Zbulohen 20 aplikacione Crypto Phishing në Play Store

Discussion about this post

SHKARKO ZERO1 APP

On Top.

AI hyn në portofolin tënd: Cash App lançon ndihmësin financiar inteligjent

AI hyn në portofolin tënd: Cash App lançon ndihmësin financiar inteligjent

13/11/2025
Revolucioni i kodimit: Lovable ngjitet drejt 8 milionë përdoruesve me ndihmën e inteligjencës artificiale

Revolucioni i kodimit: Lovable ngjitet drejt 8 milionë përdoruesve me ndihmën e inteligjencës artificiale

11/11/2025
Babai i Deep Learning, Yann LeCun, nis rrugën e pavarur me start‑up-in e tij

Babai i Deep Learning, Yann LeCun, nis rrugën e pavarur me start‑up-in e tij

14/11/2025
Shtatë familje padisin OpenAI, akuzojnë ChatGPT për rol në vetëvrasje dhe çrregullime psikike

Shtatë familje padisin OpenAI, akuzojnë ChatGPT për rol në vetëvrasje dhe çrregullime psikike

10/11/2025
Gabim teknik në X: ndryshimi i çelësave të sigurisë lë mijëra përdorues jashtë llogarive

Gabim teknik në X: ndryshimi i çelësave të sigurisë lë mijëra përdorues jashtë llogarive

13/11/2025
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x Xiaomi youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.