Java që po përfundon ka qenë mjaft e ngarkuar me njoftime nga Microsoft. Gjiganti Redmond prezantoi jo vetëm Muse, por edhe Magma, një model bazë i AI që kombinon përpunimin vizual dhe gjuhësor për të kontrolluar ndërfaqet e softuerit dhe sistemet robotike.
Siç shpjegon Microsoft Research, Magma mund të përfaqësojë një hap të madh përpara drejt krijimit të një AI multimodale për qëllime të përgjithshme, të aftë për të vepruar në mënyrë interaktive si në hapësira reale ashtu edhe në ato dixhitale. Magma është në fakt modeli i parë i AI që jo vetëm përpunon të dhëna multimodale si teksti, imazhet dhe videot, por është gjithashtu në gjendje të ndërveprojë në mënyrë natyrale me to: jepet shembulli i lundrimit në një ndërfaqe përdoruesi ose manipulimi i objekteve fizike.
Në studimin, të kryer me studiues nga Universiteti i Maryland, Universiteti i Wisconsin-Madison dhe Universiteti i Uashingtonit, Microsoft e përshkruan atë si një hap të madh drejt krijimit të agjentit AI, i aftë për të bërë plane në mënyrë autonome dhe për të ekzekutuar të gjitha detyrat me shumë hapa në emër të një njeriu.
Në dokumentin për Github, lexojmë se “Magma është në gjendje të zhvillojë plane dhe t’i zbatojë ato për të arritur qëllimet e saj. Duke shfrytëzuar në mënyrë efektive informacionin nga të dhënat vizuale dhe tekstuale të disponueshme lirisht, sistemi integron inteligjencën verbale, hapësinore dhe kohore, duke e lejuar atë të trajtojë detyra dhe mjedise komplekse.
Discussion about this post