01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Si të dalloni kush po ju telefonon në iPhone vetëm përmes vibrimit

    Si të dalloni kush po ju telefonon në iPhone vetëm përmes vibrimit

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    Si po kthehet tableti në një studio dixhitale për krijuesit?

    Si po kthehet tableti në një studio dixhitale për krijuesit?

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple përditëson App Store Connect me mbi 100 tregues të rinj për zhvilluesit

    Apple përditëson App Store Connect me mbi 100 tregues të rinj për zhvilluesit

    Meta sjell inteligjencën artificiale në WhatsApp për sugjerime të automatizuara përgjigjesh

    Meta sjell inteligjencën artificiale në WhatsApp për sugjerime të automatizuara përgjigjesh

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

  • Security
    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Delve nën presion pas incidentit të sigurisë që preku projektin open-source LiteLLM

    Delve nën presion pas incidentit të sigurisë që preku projektin open-source LiteLLM

    Kreu i Intellexa hedh dyshime mbi përfshirjen e qeverisë greke në hakimin e telefonave

    Kreu i Intellexa hedh dyshime mbi përfshirjen e qeverisë greke në hakimin e telefonave

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Si të dalloni kush po ju telefonon në iPhone vetëm përmes vibrimit

    Si të dalloni kush po ju telefonon në iPhone vetëm përmes vibrimit

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    Si po kthehet tableti në një studio dixhitale për krijuesit?

    Si po kthehet tableti në një studio dixhitale për krijuesit?

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple përditëson App Store Connect me mbi 100 tregues të rinj për zhvilluesit

    Apple përditëson App Store Connect me mbi 100 tregues të rinj për zhvilluesit

    Meta sjell inteligjencën artificiale në WhatsApp për sugjerime të automatizuara përgjigjesh

    Meta sjell inteligjencën artificiale në WhatsApp për sugjerime të automatizuara përgjigjesh

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

  • Security
    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Apple konfirmon efektivitetin e Lockdown Mode kundër spyware-it të avancuar

    Delve nën presion pas incidentit të sigurisë që preku projektin open-source LiteLLM

    Delve nën presion pas incidentit të sigurisë që preku projektin open-source LiteLLM

    Kreu i Intellexa hedh dyshime mbi përfshirjen e qeverisë greke në hakimin e telefonave

    Kreu i Intellexa hedh dyshime mbi përfshirjen e qeverisë greke në hakimin e telefonave

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja

Një benchmark i sapokrijuar tregon se inteligjenca artificiale ende dështon në detyra profesionale komplekse, larg rolit të punonjësit autonom

23/01/2026
in Inteligjenca Artificiale, Kryesore
Reading Time: 2 mins read
A A
Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Ideja se agjentët e inteligjencës artificiale janë gati të zëvendësojnë profesionistët njerëzorë ka fituar terren vitet e fundit, e ushqyer nga deklarata optimiste të drejtuesve të teknologjisë dhe nga përparimi i shpejtë i modeleve gjeneruese. Por një test i ri po e zbret këtë narrativë në tokë. Rezultatet sugjerojnë se, të paktën për momentin, AI nuk është ende e gatshme për realitetin kompleks të vendit të punës.

Benchmark-u i ri, i quajtur APEX-Agents, është krijuar për të matur sa mirë mund të përballen agjentët e AI me detyra reale profesionale. Ndryshe nga testet klasike që matin njohuri të izoluara, APEX-Agents simulon situata pune që kërkojnë planifikim, arsyetim të thellë, përdorim të mjeteve të ndryshme dhe kombinim informacioni nga disa fusha njëkohësisht. Rezultatet kanë qenë zhgënjyese për pritshmëritë e larta. Modelet më të avancuara të AI kanë arritur, mesatarisht, më pak se 25% saktësi në detyrat e testuara. Në shumë raste, sistemet ose kanë dhënë përgjigje të gabuara, ose janë “bllokuar” pa qenë në gjendje të përfundojnë detyrën. Kjo ndodh veçanërisht kur kërkohet arsyetim i vazhdueshëm, ndjekje e disa hapave dhe përshtatje ndaj informacionit të ri aftësi kyçe në profesionet e njohura si “white-collar”.

Testi përfshin skenarë nga fusha si ligji, konsulenca, financa dhe menaxhimi, ku një gabim i vogël mund të ketë pasoja serioze. Pikërisht këto situata tregojnë hendekun mes asaj që AI bën mirë sot – përmbledhje, sugjerime, automatizim i detyrave të thjeshta  dhe asaj që ende i mungon për të vepruar si një agjent autonom i besueshëm. Autorët e benchmark-ut theksojnë se qëllimi nuk është të diskreditohet inteligjenca artificiale, por të krijohet një matës realist për progresin e saj. Duke i bërë testet publike, ata shpresojnë të ndihmojnë industrinë të fokusohet në problemet reale, jo vetëm në demonstrime mbresëlënëse.

Mesazhi që del është i qartë: AI mund të jetë një ndihmës i fuqishëm në vendin e punës, por jo ende një zëvendësim. Për momentin, agjentët e inteligjencës artificiale janë më afër rolit të asistuesit sesa atij të kolegut të pavarur – dhe ky realitet kërkon pritshmëri më të kujdesshme nga kompanitë dhe publiku.

Tags: agjentë AIAPEX-Agentsautomatizimi i punësbenchmark AIinteligjenca artificiale në punë

Të Lidhura

Tokenët e inteligjencës artificiale: avantazh apo kosto e re për kompanitë?
Bota e Kriptos

Tokenët e inteligjencës artificiale: avantazh apo kosto e re për kompanitë?

23/03/2026
Agjentët AI marrin kontrollin në WordPress, nga shkrimi deri te publikimi i artikujve
Aplikacione

Agjentët AI marrin kontrollin në WordPress, nga shkrimi deri te publikimi i artikujve

21/03/2026
Cursor lançon Automations, duke sjellë kodim autonom për zhvilluesit e softuerit
Inteligjenca Artificiale

Cursor lançon Automations, duke sjellë kodim autonom për zhvilluesit e softuerit

10/03/2026
Agjentë AI pa mbikëqyrje të fortë? Incidenti në Meta rihap debatin për sigurinë teknologjike
Inteligjenca Artificiale

Agjentë AI pa mbikëqyrje të fortë? Incidenti në Meta rihap debatin për sigurinë teknologjike

24/02/2026
Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm
Aplikacione

Databricks paralajmëron: AI po e bën modelin SaaS të vjetër dhe të papërfillshëm

11/02/2026
Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës
Inteligjenca Artificiale

Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës

10/02/2026
Next Post
ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Google Gemini lejon përdoruesit të transferojnë bisedat dhe të dhënat nga chatbot‑et e tjera

Google Gemini lejon përdoruesit të transferojnë bisedat dhe të dhënat nga chatbot‑et e tjera

28/03/2026
Chatbot-ët përballë njëri-tjetrit: AI Madness vendos fituesin

Chatbot-ët përballë njëri-tjetrit: AI Madness vendos fituesin

26/03/2026
Pentagon vs. Anthropic: Senatorja Warren kundërshton vendimin e Pentagonit

Pentagon vs. Anthropic: Senatorja Warren kundërshton vendimin e Pentagonit

24/03/2026
Fundi i Sora-s: OpenAI dhe Disney ndërpresin marrëveshjen miliarda­dollarëshe

Fundi i Sora-s: OpenAI dhe Disney ndërpresin marrëveshjen miliarda­dollarëshe

26/03/2026
Silicon Valley në ekran: Dokumentari i ri për AI sfidon udhëheqësit por jo kritikët

Silicon Valley në ekran: Dokumentari i ri për AI sfidon udhëheqësit por jo kritikët

28/03/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.