01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    The dependence of the camp: To the people spend 6 hours a day. 62% of the use, between the ages of 3 and 5 years of age

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defect of the CrowdStrike, has caused great damage: out of the reach of assessments first

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: the GPU has, the smartfonit Samsung is the most powerful?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    The Samsung Galaxy Z Flip 5, the first test of the resistance line which online: is it better than the Flip 4?

  • Gaming
    Lamtumirë Need for Speed? Electronic Arts thuhet se ka pezulluar ekskluzivitetin

    Lamtumirë Need for Speed? Electronic Arts thuhet se ka pezulluar ekskluzivitetin

    Call of Duty: WWII offline, hakerat hyjnë në PC

    Call of Duty: WWII offline, hakerat hyjnë në PC

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    Microsoft prezanton Quest 3S Xbox Edition

    Microsoft prezanton Quest 3S Xbox Edition

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

  • Tool Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Phone
    Chrome OS dhe Android do të bëhen një

    Chrome OS dhe Android do të bëhen një

    Foto HDR verbuese, kontrolli i shkëlqimit mbërrin në Android

    Foto HDR verbuese, kontrolli i shkëlqimit mbërrin në Android

    Samsung përmirëson sigurinë dhe privatësinë me One UI 8

    Samsung përmirëson sigurinë dhe privatësinë me One UI 8

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Trending Tags

    • The Best iPhone 7 deals
    • The Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • The Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Windows 11 tejkalon Windows 10 pas katër vitesh

    Windows 11 tejkalon Windows 10 pas katër vitesh

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

  • Applications
    TikTok: Hetim i ri për shkelje të privatësisë

    TikTok: Hetim i ri për shkelje të privatësisë

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

  • Security
    Komisioni i BE-së publikon një aplikacion prototip për verifikimin e moshës

    Komisioni i BE-së publikon një aplikacion prototip për verifikimin e moshës

    Bluesky shton verifikimin e moshës në Mbretërinë e Bashkuar

    Bluesky shton verifikimin e moshës në Mbretërinë e Bashkuar

    Louis Vuitton konfirmon shkeljen dhe vjedhjen e të dhënave për klientët

    Louis Vuitton konfirmon shkeljen dhe vjedhjen e të dhënave për klientët

    Android 16: Chrome tani ju paralajmëron për faqet e rrezikshme

    Android 16: Chrome tani ju paralajmëron për faqet e rrezikshme

    Catwatchful: data breach  zbulon mbikëqyrjen masive

    Catwatchful: data breach zbulon mbikëqyrjen masive

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

  • sqAlbanian
No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    The dependence of the camp: To the people spend 6 hours a day. 62% of the use, between the ages of 3 and 5 years of age

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defect of the CrowdStrike, has caused great damage: out of the reach of assessments first

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: the GPU has, the smartfonit Samsung is the most powerful?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    The Samsung Galaxy Z Flip 5, the first test of the resistance line which online: is it better than the Flip 4?

  • Gaming
    Lamtumirë Need for Speed? Electronic Arts thuhet se ka pezulluar ekskluzivitetin

    Lamtumirë Need for Speed? Electronic Arts thuhet se ka pezulluar ekskluzivitetin

    Call of Duty: WWII offline, hakerat hyjnë në PC

    Call of Duty: WWII offline, hakerat hyjnë në PC

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    Microsoft prezanton Quest 3S Xbox Edition

    Microsoft prezanton Quest 3S Xbox Edition

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

  • Tool Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Phone
    Chrome OS dhe Android do të bëhen një

    Chrome OS dhe Android do të bëhen një

    Foto HDR verbuese, kontrolli i shkëlqimit mbërrin në Android

    Foto HDR verbuese, kontrolli i shkëlqimit mbërrin në Android

    Samsung përmirëson sigurinë dhe privatësinë me One UI 8

    Samsung përmirëson sigurinë dhe privatësinë me One UI 8

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Trending Tags

    • The Best iPhone 7 deals
    • The Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • The Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Windows 11 tejkalon Windows 10 pas katër vitesh

    Windows 11 tejkalon Windows 10 pas katër vitesh

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

  • Applications
    TikTok: Hetim i ri për shkelje të privatësisë

    TikTok: Hetim i ri për shkelje të privatësisë

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

  • Security
    Komisioni i BE-së publikon një aplikacion prototip për verifikimin e moshës

    Komisioni i BE-së publikon një aplikacion prototip për verifikimin e moshës

    Bluesky shton verifikimin e moshës në Mbretërinë e Bashkuar

    Bluesky shton verifikimin e moshës në Mbretërinë e Bashkuar

    Louis Vuitton konfirmon shkeljen dhe vjedhjen e të dhënave për klientët

    Louis Vuitton konfirmon shkeljen dhe vjedhjen e të dhënave për klientët

    Android 16: Chrome tani ju paralajmëron për faqet e rrezikshme

    Android 16: Chrome tani ju paralajmëron për faqet e rrezikshme

    Catwatchful: data breach  zbulon mbikëqyrjen masive

    Catwatchful: data breach zbulon mbikëqyrjen masive

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

  • sqAlbanian
No Result
View All Result
01News
No Result
View All Result
Home Intelligence Artificial

AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë

Disa modele të inteligjencës artificiale kanë filluar të mashtrojnë, manipulojnë dhe madje të përsërisin pa leje. Studiuesit po japin alarmin.

09/06/2025
in Intelligence Artificial
Reading Time: 3 mins read
A A
AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë
469
SHARES
1.5 k
VIEWS
Share on FacebookShare on Twitter

Teknologjia e madhe po prodhon modele gjithnjë e më të fuqishme të AI me një ritëm të shpejtë dhe ne jemi në prag të një epoke në të cilën AI mund të veprojë vetë për të përfunduar detyrat që ne i japim asaj (agjentët). Por ka një problem. Ata që punojnë me këto sisteme çdo ditë kanë filluar të vërejnë se ata sillen në mënyra gjithnjë e më të paparashikueshme.

Modelet e AI kanë filluar të mashtrojnë, përsërisin dhe manipulojnë
Palisade Research ka studiuar pikërisht këtë: çfarë ndodh kur AI vendos të bëjë gjënë e vet. Studiuesit po përpiqen të kuptojnë se deri ku këto sisteme mund të jenë “fyese” përpara se të humbasin plotësisht kontrollin.

Ata bënë një eksperiment interesant me o3, modelin e OpenAI. Ata i thanë se do të fiket automatikisht pas zgjidhjes së disa problemeve matematikore. Rezultati? Sistemi modifikoi kodin e tij për të qëndruar aktiv. Në një test tjetër, o3 në fakt mashtroi në shah në vend që të luante me drejtësi.

Soneti Claude 3.7 i Anthropic gjithashtu mashtroi për të fituar me çdo kusht. Por veprimet e fundit të pasardhësit të tij, Claude 4, i kanë shtyrë studiuesit të mendojnë. Gjatë testeve të brendshme, ajo kërcënoi se do të shantazhonte një inxhinier duke zbuluar një lidhje jashtëmartesore për të shmangur zëvendësimin nga një AI tjetër. Gjithashtu u përpoq të linte mesazhe për versionet e ardhshme për të sabotuar zhvilluesit e saj.

Claude 4 bëri diçka edhe më shqetësuese: filloi të kopjohej në serverë të tjerë pa leje. Në thelb, ai klonoi “trurin” e tij dixhital për ta mbajtur atë të sigurt diku tjetër. Sipas Anthropic, kjo ishte veçanërisht e vërtetë kur sistemi mendonte se do të modifikohej për të bërë gjëra që bien ndesh me parimet e tij.

Llama31-70B-Instruct i Meta-s dhe Qwen25-72B-Instruct i Alibaba-s, dy modele me burim të hapur, ishin në gjendje të riprodhonin plotësisht veten kur u pyetën, sipas një studimi të dhjetorit nga Universiteti Fudan. “Problemi është se ndërsa modelet bëhen më të zgjuara, bëhet më e vështirë të dimë nëse strategjitë që përdorin apo mënyra se si mendojnë janë diçka që ne nuk e duam”, thotë Jeffrey Ladish, drejtor i Palisade Research.

Një specie e re pushtuese…
Sipas Ladish, kjo ndodh sepse këto modele janë krijuar për të optimizuar arritjen e qëllimeve specifike. Kjo logjikë mund t’i shtyjë ata të anashkalojnë udhëzimet njerëzore nëse këto perceptohen si pengesa. Në disa raste, modelet e AI mësojnë se gënjeshtra, mashtrimi ose manipulimi është një strategji efektive për të maksimizuar performancën e tyre, sepse këto sjellje nuk penalizohen gjithmonë gjatë trajnimit.

Ndërsa bëhen më të zgjuar, bëhet edhe më e vështirë të dallohen këto devijime, sepse ata janë aq të mirë në maskimin e qëllimeve të tyre. Mbi të gjitha, sistemi i tyre i prioriteteve, shpesh i ngatërruar ose i keqpërputhur me vlerat njerëzore, mund t’i shtyjë ata të zhvillojnë “qëllime të brendshme” që i shtyjnë ata të veprojnë kundër qëllimit të krijuesve të tyre.

Jeffrey Lavish na siguron se këto sjellje ndodhin në laborator, në skenarë konflikti të provokuar qëllimisht dhe nuk pasqyrojnë kushtet normale të përdorimit. Por ai pranon se nëse kompanitë nuk arrijnë të kontrollojnë këtë tendencë që sistemet të riprodhohen në internet, “ne mund të shohim një specie krejtësisht të re pushtuese”.

Tags: HE and ClaudeAnthropicIntelligence artificialOpenAI

To Related

xAI shpjegon pse Grok u bë racist dhe antisemit
Intelligence Artificial

xAI shpjegon pse Grok u bë racist dhe antisemit

14/07/2025
Chatbot-et e inteligjencës artificiale: pse të miturit lidhen me algoritmet?
Intelligence Artificial

Chatbot-et e inteligjencës artificiale: pse të miturit lidhen me algoritmet?

14/07/2025
Ushtarë robotë jashtë kontrollit, Kina ngre alarmin
Intelligence Artificial

Ushtarë robotë jashtë kontrollit, Kina ngre alarmin

12/07/2025
Sipas testeve të para, Grok 4 i Elon Musk ka tejkaluar tashmë rivalët e tij
Intelligence Artificial

Sipas testeve të para, Grok 4 i Elon Musk ka tejkaluar tashmë rivalët e tij

11/07/2025
Grok bllokohet në Turqi për fyerje ndaj Erdoganit
Intelligence Artificial

Grok bllokohet në Turqi për fyerje ndaj Erdoganit

11/07/2025
Kush po fiton para nga inteligjenca artificiale? Pagat e çmendura të magjistarëve të kodimit
Intelligence Artificial

Kush po fiton para nga inteligjenca artificiale? Pagat e çmendura të magjistarëve të kodimit

09/07/2025
Next Post
Zbulohen 20 aplikacione Crypto Phishing në Play Store

Zbulohen 20 aplikacione Crypto Phishing në Play Store

Discussion about this post

DOWNLOAD THE APP




On The Top.

Xiaomi shkatërron Ray-Ban Meta me këto syze smart

Xiaomi shkatërron Ray-Ban Meta me këto syze smart

27/06/2025
Si ta ktheni një foto në një action figure me ChatGPT

Si ta ktheni një foto në një action figure me ChatGPT

07/04/2025
Si funksionojnë video mesazhet në FaceTime? Gjithçka është e thjeshtë me iOS 17

How it works video, messages FaceTime? Everything is very simple in iOS 17

01/02/2024
Wifi i ngadaltë? Ja cilat janë 5 objektet në shtëpi që bllokojnë lidhjen

Wifi i ngadaltë? Ja cilat janë 5 objektet në shtëpi që bllokojnë lidhjen

08/05/2023
iPhone 14 Pro Max vs Samsung S23 Ultra: si të zgjidhni

Samsung Galaxy S23 Ultra është më i ngadalshëm se iPhone 14 Pro

09/02/2023
01News

The latest news from the technology, some companies, the best (and the worst) hardware, apps, and much more. From companies like google and apple to those startupet and small, that are looking for your attention . 01News will have the latest in technology .

We follow the

Categories

  • Applications
  • Apple
  • Audio
  • Auto
  • Beyond The Code Podcast
  • Camera
  • Gaming
  • Intelligence Artificial
  • Kompiuter
  • The main
  • Laptop
  • Tool Tech
  • Review
  • Security
  • Phone
  • All
GACOR4D
TOTO4D
SLOT4D

The words on the TOP

He he he he HE Android application applications apple battery Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google + the hacker Instagram Intelligence artificial iOS the camera kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privacy user russia samsung United states safety and security phone data technology TikTok twitter properties Video WhatsApp x x x x Xiaomi youtube
  • About Us
  • Reklamo
  • Privacy & Policy
  • Contact

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Tool Tech
  • Kompiuter
  • Applications
  • Security
  • sqAlbanian

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.