Pasi ka pësuar goditjen e rëndë të gjobës prej 1.2 miliardë eurosh për shkelje të GDPR-së, Meta po përpiqet të rifitojë favorin e publikut duke aktivizuar një projekt të ri mjaft interesant lidhur me inteligjencën artificiale. Për çfarë bëhet fjalë? Ruajtja e diversitetit gjuhësor përmes modeleve të kërkimit masivisht shumëgjuhësh të AI të të folurit, të cilat premtojnë të identifikojnë mbi 4,000 gjuhë të folura përmes tekstit në të folur dhe fjalës në tekst.
Meta shikon me interes diversitetin gjuhësor
Me një deklaratë të publikuar në blogun zyrtar, kompania e Mark Zuckerberg vuri në dukje rrezikun e zhdukjes së një morie gjuhësh të folura keq, të trashëguara nga grupe të vogla shoqërore dhe të fshehura nga shumica e popullsisë globale. Për të lehtësuar aksesin edhe në to, Meta vë baste në modelet e tij të të folurit masivisht shumëgjuhësh (të njohur ndryshe si MMS).
Nëpërmjet AI dhe mësimit të makinerive, kompania Menlo Park ka mbledhur të dhëna audio nga mijëra gjuhë të ndryshme, kryesisht duke përdorur tekste të përkthyera fetare, si Bibla. Duke shfrytëzuar përkthimet dhe duke krahasuar tekstet, u ngrit një grup leximesh të Dhiatës së Re në mbi 1100 gjuhë të ndryshme, për të arritur më pas në 4000 duke përdorur dokumente të tjera të krishtera.
Ndërsa këto të dhëna vijnë nga një fushë specifike dhe shpesh lexohen nga folësit meshkuj, analizat tregojnë se modelet e firmës së Metës funksionojnë po aq mirë për zërat mashkullorë dhe femra. Dhe ndërsa përmbajtja e regjistrimeve audio është fetare, është e qartë se modeli mund të punojë edhe me përmbajtje jo fetare.
Këto janë ende zgjidhje të papërsosura për t’u trajnuar më tej; megjithatë, ato ofrojnë një bazë të shkëlqyer për të punuar për të mbrojtur gjuhët e rrezikuara.
Discussion about this post