01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Samsung planifikon që përdoruesit të krijojnë aplikacione Galaxy me ndihmën e AI-së

    Samsung planifikon që përdoruesit të krijojnë aplikacione Galaxy me ndihmën e AI-së

    Meta paditet për syzet inteligjente AI mbi shkelje të privatësisë

    Meta paditet për syzet inteligjente AI mbi shkelje të privatësisë

    MacBook Neo: modeli i ri Apple që kombinon performancë, stil dhe çmim të ulët

    MacBook Neo: modeli i ri Apple që kombinon performancë, stil dhe çmim të ulët

    Jensen Huang: Nvidia mund të mos vazhdojë mbështetjen financiare për OpenAI dhe Anthropic

    Jensen Huang: Nvidia mund të mos vazhdojë mbështetjen financiare për OpenAI dhe Anthropic

    Fuqia e M5 vjen në MacBook: strategjia e Apple për dominim në laptopët premium

    Fuqia e M5 vjen në MacBook: strategjia e Apple për dominim në laptopët premium

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    Alexa po bëhet më “njerëzore”, por me kufij të qartë

    Alexa po bëhet më “njerëzore”, por me kufij të qartë

    Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

    Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

    Tinder prezanton evente reale dhe “speed dating” virtual për të rikthyer përdoruesit

    Tinder prezanton evente reale dhe “speed dating” virtual për të rikthyer përdoruesit

    Facebook Marketplace aktivizon Meta AI për t’iu përgjigjur automatikisht blerësve

    Facebook Marketplace aktivizon Meta AI për t’iu përgjigjur automatikisht blerësve

    WordPress Lançon my.WordPress.net: Ndërto Faqe Web Direkt nga Shfletuesi

    WordPress Lançon my.WordPress.net: Ndërto Faqe Web Direkt nga Shfletuesi

    Revolucion në iOS? AltStore PAL Bashkohet me Fediverse për një Ekosistem më të Hapur

    Revolucion në iOS? AltStore PAL Bashkohet me Fediverse për një Ekosistem më të Hapur

  • Security
    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Si po përdor Google artikujt e vjetër të lajmeve për të parashikuar katastrofat natyrore

    Si po përdor Google artikujt e vjetër të lajmeve për të parashikuar katastrofat natyrore

    OpenAI forcon sigurinë e AI-së me blerjen e startup-it Promptfoo

    OpenAI forcon sigurinë e AI-së me blerjen e startup-it Promptfoo

    Fushatë kibernetike ndaj Signal dhe WhatsApp: inteligjenca holandeze për hakerët rusë

    Fushatë kibernetike ndaj Signal dhe WhatsApp: inteligjenca holandeze për hakerët rusë

    Shkarkimet e VPN-ve shpërthejnë në Australi pas rregullave të reja të verifikimit të moshës

    Shkarkimet e VPN-ve shpërthejnë në Australi pas rregullave të reja të verifikimit të moshës

    Kamerat e sigurisë po kthehen në një armë të re të luftës moderne

    Kamerat e sigurisë po kthehen në një armë të re të luftës moderne

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Samsung planifikon që përdoruesit të krijojnë aplikacione Galaxy me ndihmën e AI-së

    Samsung planifikon që përdoruesit të krijojnë aplikacione Galaxy me ndihmën e AI-së

    Meta paditet për syzet inteligjente AI mbi shkelje të privatësisë

    Meta paditet për syzet inteligjente AI mbi shkelje të privatësisë

    MacBook Neo: modeli i ri Apple që kombinon performancë, stil dhe çmim të ulët

    MacBook Neo: modeli i ri Apple që kombinon performancë, stil dhe çmim të ulët

    Jensen Huang: Nvidia mund të mos vazhdojë mbështetjen financiare për OpenAI dhe Anthropic

    Jensen Huang: Nvidia mund të mos vazhdojë mbështetjen financiare për OpenAI dhe Anthropic

    Fuqia e M5 vjen në MacBook: strategjia e Apple për dominim në laptopët premium

    Fuqia e M5 vjen në MacBook: strategjia e Apple për dominim në laptopët premium

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    Alexa po bëhet më “njerëzore”, por me kufij të qartë

    Alexa po bëhet më “njerëzore”, por me kufij të qartë

    Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

    Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

    Tinder prezanton evente reale dhe “speed dating” virtual për të rikthyer përdoruesit

    Tinder prezanton evente reale dhe “speed dating” virtual për të rikthyer përdoruesit

    Facebook Marketplace aktivizon Meta AI për t’iu përgjigjur automatikisht blerësve

    Facebook Marketplace aktivizon Meta AI për t’iu përgjigjur automatikisht blerësve

    WordPress Lançon my.WordPress.net: Ndërto Faqe Web Direkt nga Shfletuesi

    WordPress Lançon my.WordPress.net: Ndërto Faqe Web Direkt nga Shfletuesi

    Revolucion në iOS? AltStore PAL Bashkohet me Fediverse për një Ekosistem më të Hapur

    Revolucion në iOS? AltStore PAL Bashkohet me Fediverse për një Ekosistem më të Hapur

  • Security
    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Autoritetet çmontojnë një botnet gjigant me mijëra routerë të hakuar në mbarë botën

    Si po përdor Google artikujt e vjetër të lajmeve për të parashikuar katastrofat natyrore

    Si po përdor Google artikujt e vjetër të lajmeve për të parashikuar katastrofat natyrore

    OpenAI forcon sigurinë e AI-së me blerjen e startup-it Promptfoo

    OpenAI forcon sigurinë e AI-së me blerjen e startup-it Promptfoo

    Fushatë kibernetike ndaj Signal dhe WhatsApp: inteligjenca holandeze për hakerët rusë

    Fushatë kibernetike ndaj Signal dhe WhatsApp: inteligjenca holandeze për hakerët rusë

    Shkarkimet e VPN-ve shpërthejnë në Australi pas rregullave të reja të verifikimit të moshës

    Shkarkimet e VPN-ve shpërthejnë në Australi pas rregullave të reja të verifikimit të moshës

    Kamerat e sigurisë po kthehen në një armë të re të luftës moderne

    Kamerat e sigurisë po kthehen në një armë të re të luftës moderne

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja

Një benchmark i sapokrijuar tregon se inteligjenca artificiale ende dështon në detyra profesionale komplekse, larg rolit të punonjësit autonom

23/01/2026
in Inteligjenca Artificiale, Kryesore
Reading Time: 2 mins read
A A
Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Ideja se agjentët e inteligjencës artificiale janë gati të zëvendësojnë profesionistët njerëzorë ka fituar terren vitet e fundit, e ushqyer nga deklarata optimiste të drejtuesve të teknologjisë dhe nga përparimi i shpejtë i modeleve gjeneruese. Por një test i ri po e zbret këtë narrativë në tokë. Rezultatet sugjerojnë se, të paktën për momentin, AI nuk është ende e gatshme për realitetin kompleks të vendit të punës.

Benchmark-u i ri, i quajtur APEX-Agents, është krijuar për të matur sa mirë mund të përballen agjentët e AI me detyra reale profesionale. Ndryshe nga testet klasike që matin njohuri të izoluara, APEX-Agents simulon situata pune që kërkojnë planifikim, arsyetim të thellë, përdorim të mjeteve të ndryshme dhe kombinim informacioni nga disa fusha njëkohësisht. Rezultatet kanë qenë zhgënjyese për pritshmëritë e larta. Modelet më të avancuara të AI kanë arritur, mesatarisht, më pak se 25% saktësi në detyrat e testuara. Në shumë raste, sistemet ose kanë dhënë përgjigje të gabuara, ose janë “bllokuar” pa qenë në gjendje të përfundojnë detyrën. Kjo ndodh veçanërisht kur kërkohet arsyetim i vazhdueshëm, ndjekje e disa hapave dhe përshtatje ndaj informacionit të ri aftësi kyçe në profesionet e njohura si “white-collar”.

Testi përfshin skenarë nga fusha si ligji, konsulenca, financa dhe menaxhimi, ku një gabim i vogël mund të ketë pasoja serioze. Pikërisht këto situata tregojnë hendekun mes asaj që AI bën mirë sot – përmbledhje, sugjerime, automatizim i detyrave të thjeshta  dhe asaj që ende i mungon për të vepruar si një agjent autonom i besueshëm. Autorët e benchmark-ut theksojnë se qëllimi nuk është të diskreditohet inteligjenca artificiale, por të krijohet një matës realist për progresin e saj. Duke i bërë testet publike, ata shpresojnë të ndihmojnë industrinë të fokusohet në problemet reale, jo vetëm në demonstrime mbresëlënëse.

Mesazhi që del është i qartë: AI mund të jetë një ndihmës i fuqishëm në vendin e punës, por jo ende një zëvendësim. Për momentin, agjentët e inteligjencës artificiale janë më afër rolit të asistuesit sesa atij të kolegut të pavarur – dhe ky realitet kërkon pritshmëri më të kujdesshme nga kompanitë dhe publiku.

Tags: agjentë AIAPEX-Agentsautomatizimi i punësbenchmark AIinteligjenca artificiale në punë

Të Lidhura

Cursor lançon Automations, duke sjellë kodim autonom për zhvilluesit e softuerit
Inteligjenca Artificiale

Cursor lançon Automations, duke sjellë kodim autonom për zhvilluesit e softuerit

10/03/2026
Agjentë AI pa mbikëqyrje të fortë? Incidenti në Meta rihap debatin për sigurinë teknologjike
Inteligjenca Artificiale

Agjentë AI pa mbikëqyrje të fortë? Incidenti në Meta rihap debatin për sigurinë teknologjike

24/02/2026
Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm
Aplikacione

Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm

11/02/2026
Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës
Inteligjenca Artificiale

Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës

10/02/2026
Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl
Bota e Kriptos

Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl

09/02/2026
Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom
Inteligjenca Artificiale

Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

09/02/2026
Next Post
ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Boom i aplikacioneve AI, por ka një problem: përdoruesit nuk qëndrojnë gjatë

Boom i aplikacioneve AI, por ka një problem: përdoruesit nuk qëndrojnë gjatë

11/03/2026
OpenAI shtyn sërish “adult mode” për ChatGPT, përdoruesit mbeten në pritje

OpenAI shtyn sërish “adult mode” për ChatGPT, përdoruesit mbeten në pritje

09/03/2026
Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

12/03/2026
Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

Truecaller prezanton mbrojtje familjare kundër telefonatave mashtruese

13/03/2026
Eventi VIP i Trump memecoin ndez çmimin e tokenit dhe spekulime të reja në kripto

Eventi VIP i Trump memecoin ndez çmimin e tokenit dhe spekulime të reja në kripto

13/03/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.