OpenAI njoftoi GPT-4o, një model i ri multimodal që e bën më të natyrshëm ndërveprimin njeri-kompjuter. Ai do të jetë i disponueshëm për të gjithë, duke përfshirë përdoruesit që aksesojnë ChatGPT falas. Pa një abonim tani është e mundur të hyni në Dyqanin GPT dhe të përdorni GPT-të. Kompania e udhëhequr nga Sam Altman gjithashtu zbuloi aplikacionin e ri për macOS dhe përditësoi ndërfaqen në internet të chatbot.
GPT-4o shkruan, sheh dhe flet
Të gjitha lajmet u bënë të ditura nga Mira Murati, Shef i Teknologjisë i OpenAI, gjatë eventit të transmetuar në YouTube. Më e rëndësishmja është padyshim GPT-4o, ku shkronja o është iniciali i omni (të gjitha në latinisht). Versioni i fundit i modelit gjenerues të AI mund të marrë një kombinim teksti, imazhesh dhe audio si hyrje dhe të gjenerojë tekst, imazhe dhe audio si dalje.
OpenAI ka publikuar një seri videosh për të shfaqur aftësitë e GPT-4o. Përmirësimet në krahasim me modelet e mëparshme janë evidente, veçanërisht kur bëhet fjalë për bisedë. Veçoria Voice Mode aktualisht përdor tre modele të dallueshme, një për transkriptimin e audios në tekst, një për ofrimin e përgjigjes me tekst (p.sh. GPT-3.5 ose GPT-4) dhe një për konvertimin e tekstit në audio. Përpunimi kërkon deri në 5,4 sekonda vonesë.
Për GPT-4o, u trajnua një model i vetëm që mund të trajtojë tekstin, imazhet dhe audion me shpejtësi të ngjashme me njeriun. Ai në fakt mund t’i përgjigjet një hyrje audio në më pak se 232 milisekonda me një mesatare prej 320 milisekonda. Chatbot ofron një ndërveprim shumë të ngjashëm me atë të Samantës, asistentes zanore në filmin Ajo me Joaquin Phoenix.
Këto aftësi të reja do të shtohen në Voice Mode për ChatGPT Plus në javët e ardhshme. GPT-4o do të jetë i disponueshëm së shpejti për përdoruesit e ChatGPT Plus dhe Team. Versioni falas i ChatGPT do të përditësohet gjithashtu me GPT-4o, por me kufizime në numrin e mesazheve. Fillimisht do të mund të përdorni futjen e tekstit dhe imazhit. Zhvilluesit mund t’i qasen modelit nëpërmjet API. Mënyrat e tjera të hyrjes (audio dhe video) do të jenë të disponueshme vetëm për një grup të kufizuar partnerësh.
GPT dhe GPT Store për ChatGPT Falas
Gjatë ngjarjes së mbrëmshme, OpenAI njoftoi gjithashtu disa veçori të reja për përdoruesit e paabonuar. Mund të përdorni modelin GPT-4o, të merrni përgjigje nga uebi me funksionalitetin Shfleto me Bing, të analizoni të dhënat në dokumente dhe të krijoni grafikë, të përdorni imazhe si hyrje, të ngarkoni skedarë dhe të përfitoni nga funksionaliteti i kujtesës.
Përdoruesit që përdorin ChatGPT Free më në fund mund të hyjnë në Dyqanin GPT dhe të përfitojnë nga GPT-të. Megjithatë, krijimi i chatbot-eve të personalizuara me GPT Builder mbetet ekskluziv për abonentët e ChatGPT Plus Kur arrihet kufiri i mesazheve (i paspecifikuar), ChatGPT kalon automatikisht në modelin GPT-3.5 për të vazhduar bisedën.
Aplikacion për macOS dhe ndërfaqe të re ueb
Si përdoruesit e lirë ashtu edhe abonentët do të jenë në gjendje të ndërveprojnë me ChatGPT përmes aplikacionit të ri për macOS. Me shkurtoren Option + Space hapet një dritare e vogël mbi atë të programeve të tjera. Chatbot mund t’u përgjigjet pyetjeve që lidhen me atë që “sheh” në ekran.
Përveç futjes tekstuale, hyrja vokale është e disponueshme (përmes Voice Mode) duke klikuar në ikonën e mikrofonit në fund djathtas. Aftësitë audio dhe video të GPT-4o do të shtohen në të ardhmen. Aplikacioni është tashmë i disponueshëm për përdoruesit e Plus Një version i Windows do të arrijë më vonë këtë vit.
Më në fund, OpenAI tregoi ndërfaqen e re ChatGPT në ueb. Përmirësimet kanë të bëjnë kryesisht me ekranin bazë dhe paraqitjen e mesazheve.
Discussion about this post