Në një epokë ku asistentët digjitalë me inteligjencë artificiale po bëhen gjithnjë e më të zakonshëm në punë, mësim dhe argëtim, revista teknologjike Tom’s Guide ka organizuar “AI Madness”, një turne i pazakontë që vuri përballë tetë nga chatbotët më të njohur të momentit. Qëllimi i turneut ishte të matë performancën e këtyre sistemeve në mënyrë të gjithëanshme, duke përfshirë saktësinë e përgjigjeve, kreativitetin, shpejtësinë dhe dobishmërinë në situata reale përdorimi.
Formati i turneut ishte i ngjashëm me një sistem eliminimi me raunde, ku platforma si ChatGPT, Google Gemini, Claude, Grok dhe Perplexity u përballën direkt me njëri-tjetrin. Testet përfshinin pyetje të përgjithshme, detyra kreative, zgjidhje problemi dhe kërkime të informacionit në kohë reale, duke synuar të tregojnë se cili chatbot ofron ndihmën më të vlefshme për përdoruesin e zakonshëm. Në raundet e para, ChatGPT doli fitues ndaj Perplexity, duke fituar katër nga pesë sfidat e testuara, duke demonstruar aftësi të forta në udhëzime praktike, interpretim pyetjesh dhe gjenerim kreativ. Perplexity u dallua për kapacitetet e tij në kërkimin e informacionit në kohë reale dhe integrimin e lajmeve aktuale, duke treguar se disa modele shquhen më shumë për mbështetje informative sesa për krijim origjinal. Ky krahasim nuk u fokusua vetëm te aftësitë teknike të modeleve, por edhe te performanca e tyre në detyra që përdoruesit realë mund t’i hasin çdo ditë. Për shembull, ChatGPT dhe Claude u testuan në situata ku duhej të ofronin zgjidhje praktike, këshilla për vendimmarrje dhe shkrim krijues, ndërsa Grok u vlerësua për ndërveprim më të natyrshëm dhe strukturë të qartë të përgjigjeve. “AI Madness” ilustron një trend më të gjerë në industrinë e inteligjencës artificiale: përdorimi i testeve në situata reale për të matur performancën e chatbotëve, duke tejkaluar matjet klasike laboratorike. Ky fokus mbi dobishmërinë dhe adaptueshmërinë i jep përdoruesve një tregues më të mirë se cili asistent digjital mund të integrohet më mirë në jetën e përditshme.
Turneu vazhdon të monitorohet nga përdoruesit dhe ekspertët, ndërsa secili raund nxjerr në pah forcën dhe dobësitë e modeleve të ndryshme. Në një kohë kur asistentët digjitalë po bëhen gjithnjë e më të pranishëm në punë, shkolla dhe shtëpi, “AI Madness” ofron një panoramë praktike të aftësive reale të teknologjisë dhe mënyrës se si këto sisteme mund të ndikojnë në mënyrën se si ne komunikojmë dhe punojmë me AI.


















































Discussion about this post