Në ditën që GPT-4o bëhet edhe më i fuqishëm, falë përmirësimit të veçorive të shkrimit krijues, një laborator kinez ka zbuluar atë që duket të jetë një nga modelet e para të inteligjencës artificiale “arsyeuese” të aftë për të konkurruar me o1 të OpenAI.
DeepSeek në fakt ka publikuar një vrojtim të DeepSeek-41, i cili sipas asaj që deklaruan vetë zhvilluesit është një model arsyetimi që mund të konkurrojë me o1. Ka shumë ndryshime në krahasim me shumicën e modeleve: duke qenë një model arsyetimi, ai mund të verifikojë në mënyrë efektive faktet, gjë që megjithatë përkthehet në kohë më të larta përgjigjeje, por në përgjigje më të besueshme.
Megjithatë, DeepSeek-R1 arsyeton në mënyrë të ngjashme me o1, pra përmes detyrave dhe planeve paraprakisht dhe ekzekuton një sërë veprimesh të cilat më pas e çojnë modelin drejt përgjigjes. Megjithatë, krahasuar me atë që ndodh me o1, përgjigjet mund të mbërrijnë pas dhjetëra sekondash. Zhvilluesit pohojnë se DeepSeek-R1 performon në të njëjtin nivel me modelin o1-preview të OpenAI në dy standarde të njohura të AI, AIME dhe MATH.
AIME përdor modele të tjera të AI për të vlerësuar performancën, ndërsa MATH është një koleksion problemesh me fjalë. Është e qartë se ky nuk është një model i përsosur dhe në fakt në X shumë përdorues kanë shfaqur tashmë vështirësi të ndryshme me probleme tik-tac-toe dhe logjike.
Discussion about this post