01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Si NVIDIA e mbajti Shield TV të përditësuar për 10 vjet dhe sfidoi gjithë industrinë Android

    Si NVIDIA e mbajti Shield TV të përditësuar për 10 vjet dhe sfidoi gjithë industrinë Android

    iPhone shënon tremujorin më të suksesshëm në histori dhe thyen rekordet e shitjeve

    iPhone shënon tremujorin më të suksesshëm në histori dhe thyen rekordet e shitjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

  • Aplikacione
    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Snapchat prezanton njoftime automatike për mbërritjen në destinacion

    Snapchat prezanton njoftime automatike për mbërritjen në destinacion

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Gjykata refuzon mbrojtjen me citime letrare: Gabimet e AI-së nuk shpëtojnë avokatin

    Gjykata refuzon mbrojtjen me citime letrare: Gabimet e AI-së nuk shpëtojnë avokatin

    Google Gemini mund të kontrollojë aplikacionet Android, por shqetësimet për privatësinë rriten

    Google Gemini mund të kontrollojë aplikacionet Android, por shqetësimet për privatësinë rriten

    Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

    Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

  • Security
    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    BE urdhëron TikTok të heqë funksionet stimuluese që nxisin përdorimin e tejzgjatur

    BE urdhëron TikTok të heqë funksionet stimuluese që nxisin përdorimin e tejzgjatur

    FBI dështon të aksesoje iPhone-in e një gazetareje për shkak të Lockdown Mode të Apple

    FBI dështon të aksesoje iPhone-in e një gazetareje për shkak të Lockdown Mode të Apple

    Elon Musk: Qyteti i SpaceX në Teksas, krijon departament policie për sigurinë e komunitetit

    Elon Musk: Qyteti i SpaceX në Teksas, krijon departament policie për sigurinë e komunitetit

    Të dhëna personale nga Harvard dhe UPenn publikohen pas sulmeve kibernetike

    Të dhëna personale nga Harvard dhe UPenn publikohen pas sulmeve kibernetike

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    Roblox hap për të gjithë funksionin 4D Creation, duke zgjeruar kufijtë e krijimit virtual

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    A po hyn GameStop në kapitullin e fundit? Sinjale alarmi nga tregu dhe industria e lojërave

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Intel hyn në gaming-un portativ me një platformë handheld dhe çip të dedikuar

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Lojërat më të mëdha që dalin në janar 2026: një nisje e qetë, por premtuese

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Nga argëtim në stërvitje mendore: si lojërat strategjike ndikojnë në tru

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

    Fortnite rikthehet në Google Play në SHBA pas një kthese gjyqësore në betejën e Epic Games

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Modelet e reja iPad po vijnë: Apple rrit fuqinë, ruan dizajnin

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    Intel planifikon prodhimin e GPU-ve, duke hyrë në tregun e dominuar nga Nvidia

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    iPhone Flip mund të jetë hapi i radhës i Apple në telefonët e palosshëm

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Pajisjet AI që regjistrojnë dhe transkriptojnë takimet automatikisht

    Si NVIDIA e mbajti Shield TV të përditësuar për 10 vjet dhe sfidoi gjithë industrinë Android

    Si NVIDIA e mbajti Shield TV të përditësuar për 10 vjet dhe sfidoi gjithë industrinë Android

    iPhone shënon tremujorin më të suksesshëm në histori dhe thyen rekordet e shitjeve

    iPhone shënon tremujorin më të suksesshëm në histori dhe thyen rekordet e shitjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Windows 11 kalon 1 miliard përdorues – arriti objektivin më shpejt se Windows 10

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Intel paralajmëron vonesa të mundshme për Core Ultra Series 3 për shkak të mungesës së çipave

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

    Nvidia zbulon Rubin: arkitektura e re e çipave që synon të përshpejtojë epokën e AI-së

  • Aplikacione
    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Snapchat prezanton njoftime automatike për mbërritjen në destinacion

    Snapchat prezanton njoftime automatike për mbërritjen në destinacion

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Gjykata refuzon mbrojtjen me citime letrare: Gabimet e AI-së nuk shpëtojnë avokatin

    Gjykata refuzon mbrojtjen me citime letrare: Gabimet e AI-së nuk shpëtojnë avokatin

    Google Gemini mund të kontrollojë aplikacionet Android, por shqetësimet për privatësinë rriten

    Google Gemini mund të kontrollojë aplikacionet Android, por shqetësimet për privatësinë rriten

    Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

    Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

  • Security
    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Mbi 500,000 përdorues stalkerware të ekspozuar nga aktivistët digjitalë

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    Nga spiunimi te ekspozimi: Pse stalkerware po kthehet në rrezik digjital

    BE urdhëron TikTok të heqë funksionet stimuluese që nxisin përdorimin e tejzgjatur

    BE urdhëron TikTok të heqë funksionet stimuluese që nxisin përdorimin e tejzgjatur

    FBI dështon të aksesoje iPhone-in e një gazetareje për shkak të Lockdown Mode të Apple

    FBI dështon të aksesoje iPhone-in e një gazetareje për shkak të Lockdown Mode të Apple

    Elon Musk: Qyteti i SpaceX në Teksas, krijon departament policie për sigurinë e komunitetit

    Elon Musk: Qyteti i SpaceX në Teksas, krijon departament policie për sigurinë e komunitetit

    Të dhëna personale nga Harvard dhe UPenn publikohen pas sulmeve kibernetike

    Të dhëna personale nga Harvard dhe UPenn publikohen pas sulmeve kibernetike

No Result
View All Result
01News
No Result
View All Result
Home Inteligjenca Artificiale

Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja

Një benchmark i sapokrijuar tregon se inteligjenca artificiale ende dështon në detyra profesionale komplekse, larg rolit të punonjësit autonom

23/01/2026
in Inteligjenca Artificiale, Kryesore
Reading Time: 2 mins read
A A
Kur AI përballet me realitetin e punës: çfarë tregojnë testet e reja
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

Ideja se agjentët e inteligjencës artificiale janë gati të zëvendësojnë profesionistët njerëzorë ka fituar terren vitet e fundit, e ushqyer nga deklarata optimiste të drejtuesve të teknologjisë dhe nga përparimi i shpejtë i modeleve gjeneruese. Por një test i ri po e zbret këtë narrativë në tokë. Rezultatet sugjerojnë se, të paktën për momentin, AI nuk është ende e gatshme për realitetin kompleks të vendit të punës.

Benchmark-u i ri, i quajtur APEX-Agents, është krijuar për të matur sa mirë mund të përballen agjentët e AI me detyra reale profesionale. Ndryshe nga testet klasike që matin njohuri të izoluara, APEX-Agents simulon situata pune që kërkojnë planifikim, arsyetim të thellë, përdorim të mjeteve të ndryshme dhe kombinim informacioni nga disa fusha njëkohësisht. Rezultatet kanë qenë zhgënjyese për pritshmëritë e larta. Modelet më të avancuara të AI kanë arritur, mesatarisht, më pak se 25% saktësi në detyrat e testuara. Në shumë raste, sistemet ose kanë dhënë përgjigje të gabuara, ose janë “bllokuar” pa qenë në gjendje të përfundojnë detyrën. Kjo ndodh veçanërisht kur kërkohet arsyetim i vazhdueshëm, ndjekje e disa hapave dhe përshtatje ndaj informacionit të ri aftësi kyçe në profesionet e njohura si “white-collar”.

Testi përfshin skenarë nga fusha si ligji, konsulenca, financa dhe menaxhimi, ku një gabim i vogël mund të ketë pasoja serioze. Pikërisht këto situata tregojnë hendekun mes asaj që AI bën mirë sot – përmbledhje, sugjerime, automatizim i detyrave të thjeshta  dhe asaj që ende i mungon për të vepruar si një agjent autonom i besueshëm. Autorët e benchmark-ut theksojnë se qëllimi nuk është të diskreditohet inteligjenca artificiale, por të krijohet një matës realist për progresin e saj. Duke i bërë testet publike, ata shpresojnë të ndihmojnë industrinë të fokusohet në problemet reale, jo vetëm në demonstrime mbresëlënëse.

Mesazhi që del është i qartë: AI mund të jetë një ndihmës i fuqishëm në vendin e punës, por jo ende një zëvendësim. Për momentin, agjentët e inteligjencës artificiale janë më afër rolit të asistuesit sesa atij të kolegut të pavarur – dhe ky realitet kërkon pritshmëri më të kujdesshme nga kompanitë dhe publiku.

Tags: agjentë AIAPEX-Agentsautomatizimi i punësbenchmark AIinteligjenca artificiale në punë

Të Lidhura

Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës
Inteligjenca Artificiale

Kur efikasiteti kthehet në burnout: përdoruesit e AI përballë presionit të ri të punës

10/02/2026
Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl
Bota e Kriptos

Crypto.com blen AI.com për 70 milionë dollarë dhe e prezanton gjatë Super Bowl

09/02/2026
Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom
Inteligjenca Artificiale

Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

09/02/2026
Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale
Aplikacione

Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

09/02/2026
Pse siguria e AI-së është basti i ri i madh i investitorëve
Inteligjenca Artificiale

Pse siguria e AI-së është basti i ri i madh i investitorëve

20/01/2026
Blerjet online hyjnë në epokën e agjentëve AI, me standardin e ri të Google
Inteligjenca Artificiale

Blerjet online hyjnë në epokën e agjentëve AI, me standardin e ri të Google

12/01/2026
Next Post
ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

ChatGPT me reklama? Kreu i DeepMind thotë se OpenAI po nxiton

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Netflix në qendër të kritikave në Senat për “ideologjinë transgjinore” në shfaqjet për fëmijë

Netflix në qendër të kritikave në Senat për “ideologjinë transgjinore” në shfaqjet për fëmijë

06/02/2026
Besnikëria në Silicon Valley ka vdekur: Talentet e AI lëvizin lirshëm

Besnikëria në Silicon Valley ka vdekur: Talentet e AI lëvizin lirshëm

07/02/2026
Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

Ambicia për AI autonome përplaset me realitetin e sigurisë digjitale

09/02/2026
Amazon dhe Google po dominojnë investimet në AI, ndërsa rritet presioni për rezultate

Amazon dhe Google po dominojnë investimet në AI, ndërsa rritet presioni për rezultate

06/02/2026
SHBA kërkon të dhëna nga kompanitë teknologjike për kritikët e Trump

SHBA kërkon të dhëna nga kompanitë teknologjike për kritikët e Trump

04/02/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.