Edhe pse modelet e inteligjencës artificiale po përparojnë me hapa gjigantë, një studim i fundit tregon një dobësi të çuditshme: disa nga modelet më të avancuara nuk arrijnë të lexojnë orët e analogave me saktësi. Hulumtues nga Universidad Politécnica de Madrid dhe universitete të tjera testuan katër modele multimodale (MLLM) me një databazë të krijuar nga më shumë se 43,000 imazhe sintetike të orëve analoge, që tregonin kohë të ndryshme. Në testin fillestar, të gjitha modelet dështuan në mënyrë të dukshme.
Më pas, modelet u stërvitën me rreth 5,000 imazhe shtesë dhe performanca përmirësohej, por sapo përballeshin me imazhe nga një koleksion krejtësisht i ri, saktësia bie prapë. Shkencëtarët shpjegojnë se modeli ka vështirësi të dallojë dorën e shkurtër nga ajo e gjatë dhe të interpretojë këndet që ato formojnë, veçanërisht kur format e duarëve janë të pazakonta ose deformohen, si në piktura të stilit Dalí.
Gabimet nuk janë thjesht vizuale. Një lexim i pasaktë i duarëve ndikon direkt në vendosjen e kohës, duke dëshmuar kufizimet e modeleve në interpretimin hapësinor. Autorët nënvizojnë se kjo nuk do të thotë që AI është “budalla”, por tregon se performanca nuk mund të merret si garanci, sidomos në aplikime reale ku perceptimi vizual është kritik, si në mjekësi apo automjete autonome.
Një përfundim kryesor i studimit është se modelet AI duhet të ekspozohen ndaj më shumë llojeve imazhesh dhe variacione të ndryshme për t’u bërë të qëndrueshme dhe të përgjithshme, jo thjesht të mësojnë nga setet standarde.













































Discussion about this post