Ndërsa modeli R1 i DeepSeek vazhdon të jetë në qendër të vëmendjes për kostot e supozuara të bëra për trajnimin, kompania kineze dëshiron të vrapojë dhe të mos shikojë prapa, duke maksimizuar avantazhin që ka grumbulluar sa më shumë që të jetë e mundur.
Sipas disa burimeve pranë kompanisë Hangzhou, zhvilluesit po përshpejtojnë punën në R2, modeli pasardhës i R1 që u lançua në janar. DeepSeek me sa duket kishte planifikuar të lansonte R2 në fillim të majit, por planet kanë ndryshuar dhe tani kompania kineze synon ta vërë në dispozicion sa më shpejt të jetë e mundur.
R2 duhet të ketë aftësi më të mira kodimi se R1, por më e rëndësishmja do të jetë gjithashtu në gjendje të arsyetojë në gjuhë të tjera përveç anglishtes. Megjithëse DeepSeek nuk iu përgjigj një kërkese për koment nga Reuters në lidhje me lançimin e LLM-së së re, zhurma rreth R2 është tashmë shumë e lartë, por edhe vëmendja e konkurrentëve: R1 sipas të dhënave zyrtare është ndërtuar me çipa NVIDIA më pak të fuqishëm se ato të përdorura nga ChatGPT dhe Gemini, me implikime të rëndësishme edhe për sa i përket kostove të bëra.
Sipas Vijayasimha Alilughatta, COO i ofruesit të shërbimeve teknologjike indiane Zensar, “Lansimi i modelit R2 të DeepSeek mund të jetë një moment vendimtar në industrinë e AI”.
Discussion about this post