Ndërsa industria e lojërave po diskuton videolojërat e mundshme të krijuara tërësisht nga AI, Apple na kujton se kjo teknologji është larg të qenit perfekt. Në fakt ekziston një kufizim i rëndësishëm në një fushë që mund ta konsideroni bazë.
Siç është raportuar edhe nga PhoneArena dhe Gizchina më 17 tetor 2024, një grup studiuesish të Apple publikuan së fundmi një punim, të disponueshëm në portalin arXiv, në të cilin analizohen disa kufij “logjikë” të inteligjencës artificiale. Kjo është veçanërisht e vërtetë për fusha veçanërisht komplekse.
Në fakt, nëse përfshihen numrat dhe matematika, modelet aktuale të AI nuk janë saktësisht të afta të ofrojnë rezultate perfekte. Në fakt, LLM-të (modelet e mëdha gjuhësore) mund të jenë të pasakta edhe me problemet bazë të matematikës që do të caktoheshin në shkollën fillore. Nga ana tjetër, marrëdhënia midis AI dhe matematikës është jashtëzakonisht e ndërlikuar, megjithëse është bërë përparim në krahasim me fazat fillestare të përhapjes së teknologjisë.
Si pjesë e disa testeve LLM, studiuesit e Apple filluan me një grup të dhënash prej 8,000 problemesh elementare matematikore, të quajtura GSM8K. Më pas grupi i të dhënave u modifikua duke ndryshuar pak formulimin e problemit, por pa ndryshuar logjikën. Kjo çoi në testin që studiuesit e quajtën GSM-Symbolic, duke gjetur se një modifikim i thjeshtë i këtij lloji çon në një rënie të performancës midis 0.3% dhe 9.2%.
Megjithatë, kur studiuesit vendosën të prezantonin një grup të dhënash shtesë, duke përfshirë deklarata që nuk kishin asnjë lidhje me përgjigjet, u gjetën “rënie katastrofike në performancë”. Në këtë rast, në fakt, diapazoni i rënies së performancës shkon nga 17.5% në 65.7%.
Testet e kryera nga studiuesit e Apple na kujtojnë edhe një herë se ka ende një rrugë të gjatë për të bërë në fushën e AI, veçanërisht në disa fusha. Shkurtimisht, pavarësisht lançimit të fundit të modelit të avancuar të AI të OpenAI o1, ka hapësirë të konsiderueshme për përmirësim në fushën matematikore.
Discussion about this post