Elon Musk dje njoftoi disponueshmërinë e Grok (në versionin beta për disa përdorues), chabot i zhvilluar nga xAI. Kompania tani ka ofruar të gjitha detajet e modelit gjenerues të AI dhe ka publikuar një tabelë për të krahasuar performancën me ato të konkurrentëve.
Grok-1 superior ndaj Llama 2 dhe GPT-3.5
xAI thekson se Grok është një inteligjencë artificiale “e modeluar sipas Udhëzuesit të Autostopeve në Galaxy”, kështu që ai mund t’i përgjigjet çdo pyetjeje. Një nga avantazhet e chatbot-it është se ai mund të aksesojë informacionin në kohë reale nëpërmjet platformës X. Ai gjithashtu u përgjigjet pyetjeve që refuzohen nga shumica e sistemeve të tjera të AI.
Grok bazohet në modelin Grok-1 të zhvilluar gjatë katër muajve të fundit. Prototipi Grok-0 u trajnua me 33 miliardë parametra dhe tashmë ofronte performancë të krahasueshme me modelin Llama 2 të Meta-s (i trajnuar me 70 miliardë parametra). Grok-1 ka performancë dukshëm superiore veçanërisht në aftësitë e arsyetimit dhe kodimit.
xAI ka publikuar rezultatet e testeve të kryera me katër standarde: GSM8k (probleme matematikore të shkollës së mesme), MMLU (pyetje shumëdisiplinore me shumë zgjedhje), HumanEval (kodimi i detyrave në Python) dhe MATH (probleme matematikore të shkollave të mesme dhe të mesme të shkruara në LaTeX).
Në të gjitha testet, Grok-1 tejkalon modelet Llama 2, Inflection-1 dhe GPT-3.5. Modelet Palm2 (Google), Claude 2 (Anthropic) dhe GPT-4 (OpenAI) ofrojnë performancë superiore sepse janë të trajnuar me më shumë parametra dhe për këtë arsye kërkojnë më shumë burime. “Dritarja e kontekstit” e Grok-1 është 8,192 shenja.
xAI ka planifikuar tashmë përditësime për Grok-1 për të rritur dritaren e kontekstit, për të përmirësuar sigurinë dhe për të shtuar mbështetje multimodale (audio, imazhe dhe video). Për momentin, Grok është i aksesueshëm për një numër të kufizuar përdoruesish në Shtetet e Bashkuara (vetëm ata të verifikuar në X mund të aplikojnë për t’u bashkuar me listën e pritjes). Ai do të jetë i disponueshëm për abonentët e X Premium+ në të ardhmen.
Discussion about this post