01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Ariane 64 vendos 32 satelitë Amazon Leo në orbitë, shënon sukses europian hapësinor

    Ariane 64 vendos 32 satelitë Amazon Leo në orbitë, shënon sukses europian hapësinor

    Elon Musk artikulon një vizion të ri për SpaceX dhe xAI përmes konceptit “Moonbase Alpha”

    Elon Musk artikulon një vizion të ri për SpaceX dhe xAI përmes konceptit “Moonbase Alpha”

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

  • Aplikacione
    Elon Musk kritikon Anthropic për paragjykime në modelet AI pas financimit 30 miliardë $

    Elon Musk kritikon Anthropic për paragjykime në modelet AI pas financimit 30 miliardë $

    Agjenti AI sfidon programuesin: “Gjykoni kodin, jo krijuesin”

    Agjenti AI sfidon programuesin: “Gjykoni kodin, jo krijuesin”

    YouTube për Apple Vision Pro: video në realitet të shtuar

    YouTube për Apple Vision Pro: video në realitet të shtuar

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    Rusia kufizon WhatsApp dhe promovon aplikacionin shtetëror MAX për mbi 100 milionë përdorues

    Rusia kufizon WhatsApp dhe promovon aplikacionin shtetëror MAX për mbi 100 milionë përdorues

    Google nën lupë pasi i dërgoi ICE informacion personal dhe financiar të një gazetari

    Google nën lupë pasi i dërgoi ICE informacion personal dhe financiar të një gazetari

  • Security
    Shefi i Binance France sulmohet në shtëpi, tre të dyshuar arrestohen

    Shefi i Binance France sulmohet në shtëpi, tre të dyshuar arrestohen

    Alarm për Ditën e Shën Valentinit: Rritet aktiviteti i mashtrimeve romantike online

    Alarm për Ditën e Shën Valentinit: Rritet aktiviteti i mashtrimeve romantike online

    Konferenca Black Hat largon një haker nga programi pas reagimeve të komunitetit

    Konferenca Black Hat largon një haker nga programi pas reagimeve të komunitetit

    CBP nënshkruan kontratë me Clearview AI për njohjen e fytyrës në operacione taktike

    CBP nënshkruan kontratë me Clearview AI për njohjen e fytyrës në operacione taktike

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    Microsoft paralajmëron për shfrytëzim të cenueshmërive zero-day në Windows dhe Office

    Microsoft paralajmëron për shfrytëzim të cenueshmërive zero-day në Windows dhe Office

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Ariane 64 vendos 32 satelitë Amazon Leo në orbitë, shënon sukses europian hapësinor

    Ariane 64 vendos 32 satelitë Amazon Leo në orbitë, shënon sukses europian hapësinor

    Elon Musk artikulon një vizion të ri për SpaceX dhe xAI përmes konceptit “Moonbase Alpha”

    Elon Musk artikulon një vizion të ri për SpaceX dhe xAI përmes konceptit “Moonbase Alpha”

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

  • Aplikacione
    Elon Musk kritikon Anthropic për paragjykime në modelet AI pas financimit 30 miliardë $

    Elon Musk kritikon Anthropic për paragjykime në modelet AI pas financimit 30 miliardë $

    Agjenti AI sfidon programuesin: “Gjykoni kodin, jo krijuesin”

    Agjenti AI sfidon programuesin: “Gjykoni kodin, jo krijuesin”

    YouTube për Apple Vision Pro: video në realitet të shtuar

    YouTube për Apple Vision Pro: video në realitet të shtuar

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    Rusia kufizon WhatsApp dhe promovon aplikacionin shtetëror MAX për mbi 100 milionë përdorues

    Rusia kufizon WhatsApp dhe promovon aplikacionin shtetëror MAX për mbi 100 milionë përdorues

    Google nën lupë pasi i dërgoi ICE informacion personal dhe financiar të një gazetari

    Google nën lupë pasi i dërgoi ICE informacion personal dhe financiar të një gazetari

  • Security
    Shefi i Binance France sulmohet në shtëpi, tre të dyshuar arrestohen

    Shefi i Binance France sulmohet në shtëpi, tre të dyshuar arrestohen

    Alarm për Ditën e Shën Valentinit: Rritet aktiviteti i mashtrimeve romantike online

    Alarm për Ditën e Shën Valentinit: Rritet aktiviteti i mashtrimeve romantike online

    Konferenca Black Hat largon një haker nga programi pas reagimeve të komunitetit

    Konferenca Black Hat largon një haker nga programi pas reagimeve të komunitetit

    CBP nënshkruan kontratë me Clearview AI për njohjen e fytyrës në operacione taktike

    CBP nënshkruan kontratë me Clearview AI për njohjen e fytyrës në operacione taktike

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

    Microsoft paralajmëron për shfrytëzim të cenueshmërive zero-day në Windows dhe Office

    Microsoft paralajmëron për shfrytëzim të cenueshmërive zero-day në Windows dhe Office

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja

Një benchmark i sapokrijuar tregon se inteligjenca artificiale ende dështon në detyra profesionale komplekse, larg rolit të punonjësit autonom

23/01/2026
in Inteligjenca Artificiale, Kryesore
Reading Time: 2 mins read
A A
Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Ideja se agjentët e inteligjencës artificiale janë gati të zëvendësojnë profesionistët njerëzorë ka fituar terren vitet e fundit, e ushqyer nga deklarata optimiste të drejtuesve të teknologjisë dhe nga përparimi i shpejtë i modeleve gjeneruese. Por një test i ri po e zbret këtë narrativë në tokë. Rezultatet sugjerojnë se, të paktën për momentin, AI nuk është ende e gatshme për realitetin kompleks të vendit të punës.

Benchmark-u i ri, i quajtur APEX-Agents, është krijuar për të matur sa mirë mund të përballen agjentët e AI me detyra reale profesionale. Ndryshe nga testet klasike që matin njohuri të izoluara, APEX-Agents simulon situata pune që kërkojnë planifikim, arsyetim të thellë, përdorim të mjeteve të ndryshme dhe kombinim informacioni nga disa fusha njëkohësisht. Rezultatet kanë qenë zhgënjyese për pritshmëritë e larta. Modelet më të avancuara të AI kanë arritur, mesatarisht, më pak se 25% saktësi në detyrat e testuara. Në shumë raste, sistemet ose kanë dhënë përgjigje të gabuara, ose janë “bllokuar” pa qenë në gjendje të përfundojnë detyrën. Kjo ndodh veçanërisht kur kërkohet arsyetim i vazhdueshëm, ndjekje e disa hapave dhe përshtatje ndaj informacionit të ri aftësi kyçe në profesionet e njohura si “white-collar”.

Testi përfshin skenarë nga fusha si ligji, konsulenca, financa dhe menaxhimi, ku një gabim i vogël mund të ketë pasoja serioze. Pikërisht këto situata tregojnë hendekun mes asaj që AI bën mirë sot – përmbledhje, sugjerime, automatizim i detyrave të thjeshta  dhe asaj që ende i mungon për të vepruar si një agjent autonom i besueshëm. Autorët e benchmark-ut theksojnë se qëllimi nuk është të diskreditohet inteligjenca artificiale, por të krijohet një matës realist për progresin e saj. Duke i bërë testet publike, ata shpresojnë të ndihmojnë industrinë të fokusohet në problemet reale, jo vetëm në demonstrime mbresëlënëse.

Mesazhi që del është i qartë: AI mund të jetë një ndihmës i fuqishëm në vendin e punës, por jo ende një zëvendësim. Për momentin, agjentët e inteligjencës artificiale janë më afër rolit të asistuesit sesa atij të kolegut të pavarur – dhe ky realitet kërkon pritshmëri më të kujdesshme nga kompanitë dhe publiku.

Tags: agjentë AIAPEX-Agentsautomatizimi i punësbenchmark AIinteligjenca artificiale në punë

Të Lidhura

Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm
Aplikacione

Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm

11/02/2026
Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës
Inteligjenca Artificiale

Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës

10/02/2026
Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl
Bota e Kriptos

Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl

09/02/2026
Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom
Inteligjenca Artificiale

Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

09/02/2026
Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale
Aplikacione

Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

09/02/2026
Pse siguria e AI-së është basti i ri i madh i investitorëve
Inteligjenca Artificiale

Pse siguria e AI-së është basti i ri i madh i investitorëve

20/01/2026
Next Post
ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

09/02/2026
OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

OpenAI integron ChatGPT në platformën e Pentagonit, ekspertët paralajmërojnë rreziqe për sigurinë

13/02/2026
Qeveria e Singaporit: Hakerë të lidhur me Kinën synuan katër telekomë të mëdhenj

Qeveria e Singaporit: Hakerë të lidhur me Kinën synuan katër telekomë të mëdhenj

11/02/2026
Olimpiada e Dimrit 2026: Çifti çek sfidon traditën me muzikë të krijuar nga AI

Olimpiada e Dimrit 2026: Çifti çek sfidon traditën me muzikë të krijuar nga AI

12/02/2026
Heqja e GPT-4o nga OpenAI hap debat për “shoqërinë” artificiale

Heqja e GPT-4o nga OpenAI hap debat për “shoqërinë” artificiale

09/02/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.