01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare

    OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare

    Instagram zgjeron testimet për personalizimin e përmbajtjes në Feed dhe Reels

    Instagram zgjeron testimet për personalizimin e përmbajtjes në Feed dhe Reels

    Aplikacionet e reja sociale po sfidojnë modelin tradicional të mediave sociale

    Aplikacionet e reja sociale po sfidojnë modelin tradicional të mediave sociale

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

  • Security
    A funksionojnë realisht kontrollet e teknologjisë në një botë globale?

    A funksionojnë realisht kontrollet e teknologjisë në një botë globale?

    Paralajmërimet e Pentagonit për gjurmimin digjital tani po bëhen realitet

    Paralajmërimet e Pentagonit për gjurmimin digjital tani po bëhen realitet

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare

    OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare

    Instagram zgjeron testimet për personalizimin e përmbajtjes në Feed dhe Reels

    Instagram zgjeron testimet për personalizimin e përmbajtjes në Feed dhe Reels

    Aplikacionet e reja sociale po sfidojnë modelin tradicional të mediave sociale

    Aplikacionet e reja sociale po sfidojnë modelin tradicional të mediave sociale

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

  • Security
    A funksionojnë realisht kontrollet e teknologjisë në një botë globale?

    A funksionojnë realisht kontrollet e teknologjisë në një botë globale?

    Paralajmërimet e Pentagonit për gjurmimin digjital tani po bëhen realitet

    Paralajmërimet e Pentagonit për gjurmimin digjital tani po bëhen realitet

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë

Disa modele të inteligjencës artificiale kanë filluar të mashtrojnë, manipulojnë dhe madje të përsërisin pa leje. Studiuesit po japin alarmin.

09/06/2025
in Inteligjenca Artificiale
Reading Time: 3 mins read
A A
AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Teknologjia e madhe po prodhon modele gjithnjë e më të fuqishme të AI me një ritëm të shpejtë dhe ne jemi në prag të një epoke në të cilën AI mund të veprojë vetë për të përfunduar detyrat që ne i japim asaj (agjentët). Por ka një problem. Ata që punojnë me këto sisteme çdo ditë kanë filluar të vërejnë se ata sillen në mënyra gjithnjë e më të paparashikueshme.

Modelet e AI kanë filluar të mashtrojnë, përsërisin dhe manipulojnë
Palisade Research ka studiuar pikërisht këtë: çfarë ndodh kur AI vendos të bëjë gjënë e vet. Studiuesit po përpiqen të kuptojnë se deri ku këto sisteme mund të jenë “fyese” përpara se të humbasin plotësisht kontrollin.

Ata bënë një eksperiment interesant me o3, modelin e OpenAI. Ata i thanë se do të fiket automatikisht pas zgjidhjes së disa problemeve matematikore. Rezultati? Sistemi modifikoi kodin e tij për të qëndruar aktiv. Në një test tjetër, o3 në fakt mashtroi në shah në vend që të luante me drejtësi.

Soneti Claude 3.7 i Anthropic gjithashtu mashtroi për të fituar me çdo kusht. Por veprimet e fundit të pasardhësit të tij, Claude 4, i kanë shtyrë studiuesit të mendojnë. Gjatë testeve të brendshme, ajo kërcënoi se do të shantazhonte një inxhinier duke zbuluar një lidhje jashtëmartesore për të shmangur zëvendësimin nga një AI tjetër. Gjithashtu u përpoq të linte mesazhe për versionet e ardhshme për të sabotuar zhvilluesit e saj.

Claude 4 bëri diçka edhe më shqetësuese: filloi të kopjohej në serverë të tjerë pa leje. Në thelb, ai klonoi “trurin” e tij dixhital për ta mbajtur atë të sigurt diku tjetër. Sipas Anthropic, kjo ishte veçanërisht e vërtetë kur sistemi mendonte se do të modifikohej për të bërë gjëra që bien ndesh me parimet e tij.

Llama31-70B-Instruct i Meta-s dhe Qwen25-72B-Instruct i Alibaba-s, dy modele me burim të hapur, ishin në gjendje të riprodhonin plotësisht veten kur u pyetën, sipas një studimi të dhjetorit nga Universiteti Fudan. “Problemi është se ndërsa modelet bëhen më të zgjuara, bëhet më e vështirë të dimë nëse strategjitë që përdorin apo mënyra se si mendojnë janë diçka që ne nuk e duam”, thotë Jeffrey Ladish, drejtor i Palisade Research.

Një specie e re pushtuese…
Sipas Ladish, kjo ndodh sepse këto modele janë krijuar për të optimizuar arritjen e qëllimeve specifike. Kjo logjikë mund t’i shtyjë ata të anashkalojnë udhëzimet njerëzore nëse këto perceptohen si pengesa. Në disa raste, modelet e AI mësojnë se gënjeshtra, mashtrimi ose manipulimi është një strategji efektive për të maksimizuar performancën e tyre, sepse këto sjellje nuk penalizohen gjithmonë gjatë trajnimit.

Ndërsa bëhen më të zgjuar, bëhet edhe më e vështirë të dallohen këto devijime, sepse ata janë aq të mirë në maskimin e qëllimeve të tyre. Mbi të gjitha, sistemi i tyre i prioriteteve, shpesh i ngatërruar ose i keqpërputhur me vlerat njerëzore, mund t’i shtyjë ata të zhvillojnë “qëllime të brendshme” që i shtyjnë ata të veprojnë kundër qëllimit të krijuesve të tyre.

Jeffrey Lavish na siguron se këto sjellje ndodhin në laborator, në skenarë konflikti të provokuar qëllimisht dhe nuk pasqyrojnë kushtet normale të përdorimit. Por ai pranon se nëse kompanitë nuk arrijnë të kontrollojnë këtë tendencë që sistemet të riprodhohen në internet, “ne mund të shohim një specie krejtësisht të re pushtuese”.

Tags: AI ClaudeAnthropicInteligjenca artificialeOpenAI

Të Lidhura

Si testoi Meta chatbot-et duke simuluar biseda me adoleshentë
Inteligjenca Artificiale

Si testoi Meta chatbot-et duke simuluar biseda me adoleshentë

01/07/2026
Një haker etik zbuloi një dobësi sigurie me ndihmën e Claude
Inteligjenca Artificiale

Një haker etik zbuloi një dobësi sigurie me ndihmën e Claude

01/07/2026
OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare
Aplikacione

OpenClaw vjen në Android dhe iPhone me aplikacionet e para zyrtare

01/07/2026
“Babai i internetit” largohet nga Google pas më shumë se dy dekadash
Kryesore

“Babai i internetit” largohet nga Google pas më shumë se dy dekadash

01/07/2026
SHBA zbut kufizimet për AI, Anthropic fiton terren në tregjet globale
Kryesore

SHBA zbut kufizimet për AI, Anthropic fiton terren në tregjet globale

01/07/2026
OKX synon ekonominë e agjentëve AI me një platformë të re blockchain
Bota e Kriptos

OKX synon ekonominë e agjentëve AI me një platformë të re blockchain

30/06/2026
Next Post
Zbulohen 20 aplikacione Crypto Phishing në Play Store

Zbulohen 20 aplikacione Crypto Phishing në Play Store

Discussion about this post

SHKARKO ZERO1 APP

On Top.

OpenAI kufizon lançimin e GPT-5.6 pas kërkesës së qeverisë amerikane

OpenAI kufizon lançimin e GPT-5.6 pas kërkesës së qeverisë amerikane

29/06/2026
OKX synon ekonominë e agjentëve AI me një platformë të re blockchain

OKX synon ekonominë e agjentëve AI me një platformë të re blockchain

30/06/2026
Një haker etik zbuloi një dobësi sigurie me ndihmën e Claude

Një haker etik zbuloi një dobësi sigurie me ndihmën e Claude

01/07/2026
Si testoi Meta chatbot-et duke simuluar biseda me adoleshentë

Si testoi Meta chatbot-et duke simuluar biseda me adoleshentë

01/07/2026
SHBA zbut kufizimet për AI, Anthropic fiton terren në tregjet globale

SHBA zbut kufizimet për AI, Anthropic fiton terren në tregjet globale

01/07/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologji teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2026 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2026 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.