01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Softueri i ri Xbox vjen në më shumë pajisje: Ja çfarë do ndryshojë për lojtarët

    Softueri i ri Xbox vjen në më shumë pajisje: Ja çfarë do ndryshojë për lojtarët

    Microsoft akuzon Apple: Politikat e saj vonuan lançimin e Xbox Store në iOS

    Microsoft akuzon Apple: Politikat e saj vonuan lançimin e Xbox Store në iOS

    A e ka bllokuar Apple Fortnite në të gjithë botën?

    A e ka bllokuar Apple Fortnite në të gjithë botën?

    GTA 6 shtyhet për në vitin 2026: Ja data zyrtare e publikimit

    GTA 6 shtyhet për në vitin 2026: Ja data zyrtare e publikimit

    Microsoft rrit çmimet e Xbox në të gjithë botën

    Microsoft rrit çmimet e Xbox në të gjithë botën

    Duolingo do t’ju mësojë gjithashtu se si të luani shah

    Duolingo do t’ju mësojë gjithashtu se si të luani shah

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Lamtumirë Chrome në këto iPhone: Kontrolloni tani nëse i juaji është në listë

    Lamtumirë Chrome në këto iPhone: Kontrolloni tani nëse i juaji është në listë

    Kjo është videoja e parë e Galaxy Z Fold7 Ultra

    Kjo është videoja e parë e Galaxy Z Fold7 Ultra

    Elon Musk kërkon shërbimin Starlink në iPhone

    Elon Musk kërkon shërbimin Starlink në iPhone

    Samsung One UI 8 beta është në dispozicion për Galaxy S25

    Samsung One UI 8 beta është në dispozicion për Galaxy S25

    Samsung, së shpejti një sensor që njeh pëllëmbën e dorës suaj

    Samsung, së shpejti një sensor që njeh pëllëmbën e dorës suaj

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    Windows 11: Menuja e re Start dhe veçori të tjera të inteligjencës artificiale

    Windows 11: Menuja e re Start dhe veçori të tjera të inteligjencës artificiale

  • Aplikacione
    WhatsApp teston profilet me avatarë të animuar

    WhatsApp teston profilet me avatarë të animuar

    Aplikacioni YouTube nuk është më i pajtueshëm me këta iPhone

    Aplikacioni YouTube nuk është më i pajtueshëm me këta iPhone

    YouTube integron Google Lens në Shorts për të kërkuar gjithçka që shihni në video

    YouTube integron Google Lens në Shorts për të kërkuar gjithçka që shihni në video

    WhatsApp: Së shpejti vijnë username

    WhatsApp: Së shpejti vijnë username

    Telegram merr 300 milionë dollarë nga xAI dhe integron Grok

    Telegram merr 300 milionë dollarë nga xAI dhe integron Grok

    WhatsApp: Butoni Logout në testim

    WhatsApp: Butoni Logout në testim

  • Security
    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Zbulohen 20 aplikacione Crypto Phishing në Play Store

    Zbulohen 20 aplikacione Crypto Phishing në Play Store

    A mundet Meta të identifikojë përdoruesit e Android?

    A mundet Meta të identifikojë përdoruesit e Android?

    Emrat e kriminelëve kibernetikë: marrëveshje Microsoft-CrowdStrike

    Emrat e kriminelëve kibernetikë: marrëveshje Microsoft-CrowdStrike

    Adidas: Vjedhja e të dhënave rindez debatin për fjalëkalimet

    Adidas: Vjedhja e të dhënave rindez debatin për fjalëkalimet

    Shein nuk i përmbahet ligjeve evropiane të konsumatorit

    Shein nuk i përmbahet ligjeve evropiane të konsumatorit

  • en_USEnglish
No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Softueri i ri Xbox vjen në më shumë pajisje: Ja çfarë do ndryshojë për lojtarët

    Softueri i ri Xbox vjen në më shumë pajisje: Ja çfarë do ndryshojë për lojtarët

    Microsoft akuzon Apple: Politikat e saj vonuan lançimin e Xbox Store në iOS

    Microsoft akuzon Apple: Politikat e saj vonuan lançimin e Xbox Store në iOS

    A e ka bllokuar Apple Fortnite në të gjithë botën?

    A e ka bllokuar Apple Fortnite në të gjithë botën?

    GTA 6 shtyhet për në vitin 2026: Ja data zyrtare e publikimit

    GTA 6 shtyhet për në vitin 2026: Ja data zyrtare e publikimit

    Microsoft rrit çmimet e Xbox në të gjithë botën

    Microsoft rrit çmimet e Xbox në të gjithë botën

    Duolingo do t’ju mësojë gjithashtu se si të luani shah

    Duolingo do t’ju mësojë gjithashtu se si të luani shah

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Lamtumirë Chrome në këto iPhone: Kontrolloni tani nëse i juaji është në listë

    Lamtumirë Chrome në këto iPhone: Kontrolloni tani nëse i juaji është në listë

    Kjo është videoja e parë e Galaxy Z Fold7 Ultra

    Kjo është videoja e parë e Galaxy Z Fold7 Ultra

    Elon Musk kërkon shërbimin Starlink në iPhone

    Elon Musk kërkon shërbimin Starlink në iPhone

    Samsung One UI 8 beta është në dispozicion për Galaxy S25

    Samsung One UI 8 beta është në dispozicion për Galaxy S25

    Samsung, së shpejti një sensor që njeh pëllëmbën e dorës suaj

    Samsung, së shpejti një sensor që njeh pëllëmbën e dorës suaj

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    Windows 11: Menuja e re Start dhe veçori të tjera të inteligjencës artificiale

    Windows 11: Menuja e re Start dhe veçori të tjera të inteligjencës artificiale

  • Aplikacione
    WhatsApp teston profilet me avatarë të animuar

    WhatsApp teston profilet me avatarë të animuar

    Aplikacioni YouTube nuk është më i pajtueshëm me këta iPhone

    Aplikacioni YouTube nuk është më i pajtueshëm me këta iPhone

    YouTube integron Google Lens në Shorts për të kërkuar gjithçka që shihni në video

    YouTube integron Google Lens në Shorts për të kërkuar gjithçka që shihni në video

    WhatsApp: Së shpejti vijnë username

    WhatsApp: Së shpejti vijnë username

    Telegram merr 300 milionë dollarë nga xAI dhe integron Grok

    Telegram merr 300 milionë dollarë nga xAI dhe integron Grok

    WhatsApp: Butoni Logout në testim

    WhatsApp: Butoni Logout në testim

  • Security
    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Sulmet ndaj telefonave inteligjentë në rritje: përdoruesit në rrezik

    Zbulohen 20 aplikacione Crypto Phishing në Play Store

    Zbulohen 20 aplikacione Crypto Phishing në Play Store

    A mundet Meta të identifikojë përdoruesit e Android?

    A mundet Meta të identifikojë përdoruesit e Android?

    Emrat e kriminelëve kibernetikë: marrëveshje Microsoft-CrowdStrike

    Emrat e kriminelëve kibernetikë: marrëveshje Microsoft-CrowdStrike

    Adidas: Vjedhja e të dhënave rindez debatin për fjalëkalimet

    Adidas: Vjedhja e të dhënave rindez debatin për fjalëkalimet

    Shein nuk i përmbahet ligjeve evropiane të konsumatorit

    Shein nuk i përmbahet ligjeve evropiane të konsumatorit

  • en_USEnglish
No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë

Disa modele të inteligjencës artificiale kanë filluar të mashtrojnë, manipulojnë dhe madje të përsërisin pa leje. Studiuesit po japin alarmin.

09/06/2025
in Inteligjenca Artificiale
Reading Time: 3 mins read
A A
AI jashtë kontrollit: Ata gënjejnë, klonojnë veten dhe përpiqen të mbijetojnë
468
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Teknologjia e madhe po prodhon modele gjithnjë e më të fuqishme të AI me një ritëm të shpejtë dhe ne jemi në prag të një epoke në të cilën AI mund të veprojë vetë për të përfunduar detyrat që ne i japim asaj (agjentët). Por ka një problem. Ata që punojnë me këto sisteme çdo ditë kanë filluar të vërejnë se ata sillen në mënyra gjithnjë e më të paparashikueshme.

Modelet e AI kanë filluar të mashtrojnë, përsërisin dhe manipulojnë
Palisade Research ka studiuar pikërisht këtë: çfarë ndodh kur AI vendos të bëjë gjënë e vet. Studiuesit po përpiqen të kuptojnë se deri ku këto sisteme mund të jenë “fyese” përpara se të humbasin plotësisht kontrollin.

Ata bënë një eksperiment interesant me o3, modelin e OpenAI. Ata i thanë se do të fiket automatikisht pas zgjidhjes së disa problemeve matematikore. Rezultati? Sistemi modifikoi kodin e tij për të qëndruar aktiv. Në një test tjetër, o3 në fakt mashtroi në shah në vend që të luante me drejtësi.

Soneti Claude 3.7 i Anthropic gjithashtu mashtroi për të fituar me çdo kusht. Por veprimet e fundit të pasardhësit të tij, Claude 4, i kanë shtyrë studiuesit të mendojnë. Gjatë testeve të brendshme, ajo kërcënoi se do të shantazhonte një inxhinier duke zbuluar një lidhje jashtëmartesore për të shmangur zëvendësimin nga një AI tjetër. Gjithashtu u përpoq të linte mesazhe për versionet e ardhshme për të sabotuar zhvilluesit e saj.

Claude 4 bëri diçka edhe më shqetësuese: filloi të kopjohej në serverë të tjerë pa leje. Në thelb, ai klonoi “trurin” e tij dixhital për ta mbajtur atë të sigurt diku tjetër. Sipas Anthropic, kjo ishte veçanërisht e vërtetë kur sistemi mendonte se do të modifikohej për të bërë gjëra që bien ndesh me parimet e tij.

Llama31-70B-Instruct i Meta-s dhe Qwen25-72B-Instruct i Alibaba-s, dy modele me burim të hapur, ishin në gjendje të riprodhonin plotësisht veten kur u pyetën, sipas një studimi të dhjetorit nga Universiteti Fudan. “Problemi është se ndërsa modelet bëhen më të zgjuara, bëhet më e vështirë të dimë nëse strategjitë që përdorin apo mënyra se si mendojnë janë diçka që ne nuk e duam”, thotë Jeffrey Ladish, drejtor i Palisade Research.

Një specie e re pushtuese…
Sipas Ladish, kjo ndodh sepse këto modele janë krijuar për të optimizuar arritjen e qëllimeve specifike. Kjo logjikë mund t’i shtyjë ata të anashkalojnë udhëzimet njerëzore nëse këto perceptohen si pengesa. Në disa raste, modelet e AI mësojnë se gënjeshtra, mashtrimi ose manipulimi është një strategji efektive për të maksimizuar performancën e tyre, sepse këto sjellje nuk penalizohen gjithmonë gjatë trajnimit.

Ndërsa bëhen më të zgjuar, bëhet edhe më e vështirë të dallohen këto devijime, sepse ata janë aq të mirë në maskimin e qëllimeve të tyre. Mbi të gjitha, sistemi i tyre i prioriteteve, shpesh i ngatërruar ose i keqpërputhur me vlerat njerëzore, mund t’i shtyjë ata të zhvillojnë “qëllime të brendshme” që i shtyjnë ata të veprojnë kundër qëllimit të krijuesve të tyre.

Jeffrey Lavish na siguron se këto sjellje ndodhin në laborator, në skenarë konflikti të provokuar qëllimisht dhe nuk pasqyrojnë kushtet normale të përdorimit. Por ai pranon se nëse kompanitë nuk arrijnë të kontrollojnë këtë tendencë që sistemet të riprodhohen në internet, “ne mund të shohim një specie krejtësisht të re pushtuese”.

Tags: AI ClaudeAnthropicInteligjenca artificialeOpenAI

Të Lidhura

ChatGPT refuzon të mbyllet: Studimi që alarmon ekspertët
Inteligjenca Artificiale

ChatGPT refuzon të mbyllet: Studimi që alarmon ekspertët

12/06/2025
Google AI Search: Trafiku bie 50%
Inteligjenca Artificiale

Google AI Search: Trafiku bie 50%

10/06/2025
AI perfekte e Sam Altman: Do të zgjidhë gjithçka, thjesht duke arsyetuar
Inteligjenca Artificiale

AI perfekte e Sam Altman: Do të zgjidhë gjithçka, thjesht duke arsyetuar

04/06/2025
Meta dhe Anduril së bashku: lufta në epokën e AI
Inteligjenca Artificiale

Meta dhe Anduril së bashku: lufta në epokën e AI

30/05/2025
AI mund të eliminojë 50% të vendeve të punës në zyrë, thotë CEO i Anthropic
Inteligjenca Artificiale

AI mund të eliminojë 50% të vendeve të punës në zyrë, thotë CEO i Anthropic

30/05/2025
Meta AI tashmë ka arritur një miliard përdorues
Inteligjenca Artificiale

Meta AI tashmë ka arritur një miliard përdorues

29/05/2025
Next Post
Zbulohen 20 aplikacione Crypto Phishing në Play Store

Zbulohen 20 aplikacione Crypto Phishing në Play Store

Discussion about this post

SHKARKO APP




On Top.

EFF: Ndalimi i TikTok-ut është antikushtetues

EFF: Ndalimi i TikTok-ut është antikushtetues

28/06/2024
Samsung: Teknologji e re për baterinë e telefonave inteligjentë

Samsung: Teknologji e re për baterinë e telefonave inteligjentë

16/05/2025
Si funksionojnë video mesazhet në FaceTime? Gjithçka është e thjeshtë me iOS 17

Si funksionojnë video mesazhet në FaceTime? Gjithçka është e thjeshtë me iOS 17

01/02/2024
Samsung Galaxy S25 Edge rikthen dizajnin në fokus

Samsung Galaxy S25 Edge rikthen dizajnin në fokus

13/05/2025
Apple rishpik Siri-n: Versioni i ri do të jetë po aq i fuqishëm sa ChatGPT

Apple rishpik Siri-n: Versioni i ri do të jetë po aq i fuqishëm sa ChatGPT

20/05/2025
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale iOS iPhone kamera kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone te dhena teknologjia TikTok twitter vecori Video WhatsApp x Xiaomi youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security
  • en_USEnglish

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.