OpenAI ka lëshuar dy modele të reja: o1-preview dhe o1-mini (i cili ), të cilat tashmë ishin diskutuar me emrin e koduar “Strawberry”. Ka shumë për të kuptuar në lidhje me këto modele: nuk është thjesht një evolucion i GPT-4o, por ato paraqesin disa kompromise të rëndësishme për sa i përket kostos dhe performancës në këmbim të aftësive më të mira “arsyetimi”.
Çfarë është OpenAI o1?
Për disa javë, madje që në korrik, qarkulluan lajme për një model të ri OpenAI, emri i koduar i të cilit ishte “Strawberry”. Fillimisht ishte e paqartë nëse ishte pasardhësi i GPT-4o apo diçka ndryshe. Më 12 shtator 2024, pezullimi u zhduk me prezantimin zyrtar të modeleve OpenAI o1, duke përfshirë o1-preview dhe o1-mini.
Ndër të tjera, pak ditë pas lançimit të modeleve o1, OpenAI rriti kufijtë ditorë (edhe për përdoruesit falas) pas interesit të lartë të ngjallur. Kufijtë e o1-mini janë zgjeruar shtatë herë, nga 50 mesazhe në javë në 50 në ditë. Duke qenë se o1-preview është pak më i shtrenjtë, OpenAI e rriti pak këtë normë, duke rritur kufijtë nga 30 mesazhe në javë në 50 mesazhe në javë.
Modelet e mëparshme OpenAI si GPT-4o japin përgjigje duke analizuar kryesisht korrelacionet midis fjalëve bazuar në sasi të mëdha të të dhënave të trajnimit. Kjo do të thotë, ata kuptojnë se cilat fjalë priren të shfaqen së bashku në një kontekst të caktuar. Me o1, megjithatë, përveç kësaj analize të bazuar në të dhëna, modeli përpiqet të simulojë arsyetimin logjik për të përcaktuar mënyrën më të mirë për t’iu përgjigjur një pyetjeje komplekse.
Për shembull, nëse i kërkoni të zgjidhë një problem matematikor, o1 nuk propozon thjesht përgjigjen më të mundshme bazuar në të dhënat e trajnimit, por përpiqet të ndjekë një arsyetim hap pas hapi siç do të bënte një person për të arritur në zgjidhje. Prandaj o1 synon të shkojë përtej korrelacionit të thjeshtë statistikor midis fjalëve, duke u përpjekur të realizojë arsyetimin real.
Çfarë mund të bëjë OpenAI o1?
OpenAI o1 mund të kryejë shumë detyra si çdo model tjetër OpenAI GPT, të tilla si përgjigjja e pyetjeve, përmbledhja e përmbajtjes dhe gjenerimi i përmbajtjes së re. Si një model arsyetimi i avancuar, o1 është veçanërisht i përshtatshëm për disa detyra dhe raste përdorimi, si p.sh.
Arsyetimi i avancuar: modelet o1 janë optimizuar për detyra komplekse arsyetimi, veçanërisht në STEM (shkencë, teknologji, inxhinieri dhe matematikë).
Brainstorming dhe ideim: Aftësitë e avancuara të arsyetimit të modelit e bëjnë atë të dobishëm për gjenerimin e ideve dhe zgjidhjeve kreative në kontekste të ndryshme.
Kërkimi shkencor: Modelet o1 janë ideale për lloje të ndryshme aktivitetesh kërkimore shkencore. Për shembull, o1 mund të shënojë të dhënat e renditjes celulare dhe të trajtojë formula komplekse matematikore të nevojshme në fusha të tilla si optika kuantike.
Kodimi: Sipas OpenAI, modelet o1 janë efektive në gjenerimin dhe korrigjimin e kodit, duke performuar mirë në standardet e kodimit si HumanEval dhe Codeforces. Modelet janë gjithashtu efektive për të ndihmuar në ndërtimin dhe ekzekutimin e flukseve të punës me shumë hapa për zhvilluesit.
Matematika: Sipas OpenAI, o1 shkëlqen në standardet e matematikës, duke tejkaluar modelet e mëparshme të kompanisë. Në një provim kualifikues për Olimpiadën Ndërkombëtare të Matematikës (IMO), o1 shënoi 83% saktësi, krahasuar me 13% për GPT-4o. Fuqia matematikore e o1 është testuar me rezultate të shkëlqyera në gara të tjera të avancuara të matematikës, duke përfshirë Provimin Amerikan të Matematikës Ftesore (AIME). Aftësitë matematikore të modelit mund të përdoren për të gjeneruar formula komplekse matematikore për fizikantët.
Self-fact-checking: Modeli o1 është i aftë të vetëkontrollojë, duke përmirësuar saktësinë e përgjigjeve të tij.
Discussion about this post