Menjëherë pas lançimit të tij publik, ChatGPT u bë chatbot i preferuar i shumë njerëzve. Aftësitë e tij i kishin bërë përshtypje gjysmës së botës, pavarësisht halucinacioneve të shpeshta të modeleve fillestare. Për të mos përmendur gjeneratorin e imazhit DALL-E. Por në pak vite gjërat kanë ndryshuar dhe Gemini, Big G chatbot, i ka shkurtuar shumë distancat, aq sa ka kaluar rivalin e tij.
Në disa fronte, Gemini kanë një avantazh. Një dritare e madhe e kontekstit, integrim pa probleme me Google Workspace dhe gjëra të mira si NotebookLM Plus dhe Gemini Canvas.
5 Avantazhet e Gemini ndaj ChatGPT
1. Dritarja e kontekstit më e madhe se ChatGPT
Falë dritares së saj më të madhe të kontekstit, Gemini është “më i zgjuar”. Nga rruga, Google sapo njoftoi lançimin e Gemini 2.5, duke e quajtur atë modelin më të avancuar ndonjëherë. Dhe numrat flasin vetë: ajo zë vendin e parë në LMARena me një avantazh të qartë prej 39 pikësh ELO, një hendek mbresëlënës në krahasim me konkurrencën e OpenAI, Anthropic, xAI dhe DeepSeek. Krahasuar me versionet e mëparshme, në fakt, ai duhet të japë më pak përgjigje të pasakta ose të rastësishme, falë një metode arsyetimi më të ngjashme me atë njerëzore.
Aktualisht, Gemini 1.5 Pro krenohet me një dritare kontekstuale prej 2 milion argumentesh, me një qëllim për të arritur deri në 3 milion. Një hap i madh përpara nga kufiri i shenjave prej 128,000 të ChatGPT Plus.
Në thelb, sa më e madhe të jetë dritarja e kontekstit, aq më e madhe është aftësia e modelit për të përpunuar kërkesat komplekse, duke gjeneruar rezultate më të qëndrueshme, të përshtatshme dhe të dobishme. Gemini Advanced mund të përpunojë dhe kujtojë rreth 3000 faqe teksti në një bisedë të vetme, ndërsa ChatGPT Plus trajton shumë më pak. Sigurisht, madhësia e dritares së kontekstit të Gemini ndryshon në varësi të modelit që përdorni. Për shembull, flashi Gemini 1.0 ka një dritare konteksti prej 1 milion shenjash.
Si përkthehet e gjithë kjo në terma praktikë? Në një kuptim më të mirë të kërkesave komplekse, qëndrueshmëri më e madhe në përgjigje dhe përpunim më efektiv i teksteve të gjata.
2. Integrimi i Google Workspace
Si Gemini Advanced i Google dhe ChatGPT Plus i OpenAI po integrojnë AI në vendet e zakonshme të punës, por me qasje të ndryshme. Big G ka zgjedhur një integrim të thellë dhe origjinal të Gemini brenda paketës së tij Workspace, i cili përfshin Gmail, Docs, Slides, Sheets dhe Calendar. ChatGPT është miratuar nga Microsoft, i cili e ka integruar atë në produktet e Microsoft 365 (Word, Excel, Outlook, Teams, etj.) përmes Copilot AI. Por ky integrim ndonjëherë duket më shumë si një mendim i mëvonshëm sesa një element vendas i sistemit. Prandaj, qasja e Google është më harmonike.
Për shembull, Copilot mund të përmbledhë një dokument Word, por Gemini mund të nxjerrë kontekstin nga një email ose prezantim për të personalizuar përmbledhjet e tij. Ky integrim i thellë në Workspace përmirëson përvojën e përdoruesit.
3. NotebookLM Plus për krijimin e podkasteve për çdo gjë
NotebookLM është një goditje e vërtetë gjeniale, ne duhet t’i japim kredi Google për këtë. Transformoni sasi masive informacioni në përmbajtje audio lehtësisht të konsumueshme. Ai tashmë ofron shumë për përdoruesit e rastësishëm, por NotebookLM Plus (versioni me pagesë) heq kufizimet në grumbullimin, kërkimin dhe daljen e të dhënave, duke e bërë atë një mjet të fuqishëm për ata që punojnë me vëllime të mëdha informacioni.
Me NotebookLM mund të gjeneroni podkaste për pothuajse çdo temë, nga lajmet deri te raportet e detajuara të shpenzimeve mujore, kështu që mund të bëni shumë më tepër sepse nuk keni nevojë të shikoni ekranin për të lexuar. Për më tepër, aftësia për të personalizuar stilin e përgjigjes së AI dhe mjetet e avancuara të bashkëpunimit përmirësojnë më tej përvojën e përdoruesit.
Por si mund të gjeneroni një podcast me shumë zëra nga një libër, faqe interneti ose video në YouTube? Shumë e thjeshtë! Thjesht futni dokumente në burimet e NotebookLM, filloni funksionin “Deep Conversation” dhe klikoni “Customize”. Pas kësaj ju duhet të futni një kërkesë si: “Podkasti duhet të jetë në italisht. Shmangni futjen e fjalëve të huaja”. Dhe pastaj klikoni “Generate” për të krijuar skedarin audio.
4. Kuptimi multimodal
Aftësia e Gemini për të analizuar drejtpërdrejt imazhet është tepër e dobishme për gjithçka, nga identifikimi i bimëve në kopsht deri tek leximi i tekstit në një fotografi. Gemini është projektuar me një fokus specifik në përpunimin multimodal, që do të thotë se mund të kuptojë dhe kombinojë informacionin nga teksti, imazhet dhe videot në një mënyrë të rrjedhshme dhe të natyrshme.
ChatGPT po përmirëson gjithashtu aftësitë e tij multimodale, por arkitektura e Gemini u ndërtua që në fillim për të trajtuar në mënyrë origjinale këtë lloj të dhënash të ndryshme.
5. Gjenerimi i imazheve
OpenAI sapo integroi një gjenerues të ri imazhesh në ChatGPT që premton të jetë një shpërthim. Përdoruesit ishin aq entuziastë për të (thjesht mendoni për bumin e meme-ve të stilit Ghibli) saqë kompania u detyrua të kufizonte përkohësisht gjenerimin e imazheve për të menaxhuar më mirë ngarkesën e kërkesave… Për të mos përmendur që ky përmirësim vlen vetëm për përdoruesit me pagesë.
Pavarësisht pritshmërive të larta, rezultatet nuk kanë qenë gjithmonë në nivel. Modeli i ri premtoi imazhe më realiste dhe të detajuara edhe nga porositë e thjeshta, por në shumë raste cilësia ishte e paqëndrueshme, me rezultate jokonsistente. Për krahasim, gjenerimi i imazheve origjinale të Gemini 2.0 Flash Experimental duket dukshëm më superior.
Bonus: Integrim më i thellë me Google Search
Si produkt i Google, Gemini është thellësisht i integruar me kërkimin në Google, duke rezultuar në akses më të shpejtë dhe më efikas në informacione të përditësuara. Ky integrim bën vërtet një ndryshim kur punoni në projekte që kërkojnë të dhëna në kohë reale. Në shumë raste, Gemini është në gjendje të rimarrë dhe sintetizojë shpejt informacionin nga ueb-i, duke ofruar përgjigje më të përditësuara dhe të detajuara sesa chatbot-et e tjera.
Discussion about this post