Opera deri më tani ka përdorur modelet GPT të OpenAI për chatbot të integruar në shfletues. Shtëpia norvegjeze e softuerit ka njoftuar fillimin e bashkëpunimit me Google dhe për rrjedhojë mbështetjen për modelet Gemini. Funksionaliteti i të kuptuarit të imazhit është shtuar gjithashtu me Funksionet më të fundit.
Opera Aria: Gemini dhe Imagen 2
Në realitet, Opera kishte filluar tashmë bashkëpunimin me Google, pasi përdor modelin Imagen 2 për gjenerimin e imazheve dhe modelin Wavenet për leximin me zë të përgjigjeve të Aria. Marrëveshja tani është shtrirë në modelet Gemini, përveç më shumë se 150 Modeleve të Gjuhës së Mëdha (LLM) tashmë të disponueshme për ekzekutim lokal.
Sidoqoftë, Gemini kërkon qasje në cloud, veçanërisht në shërbimin Vertex AI të Google Cloud (siç është rasti me Imagen 2). Opera Aria përdor një motor multi-LLM Composer AI që zgjedh automatikisht shabllonin më të mirë bazuar në kërkesën e përdoruesit.
Funksioni i ri i prezantuar sot quhet Kuptimi i Imazhit. Duke përfituar nga aftësitë multimodale të chatbot-it, mund të ngarkoni deri në tre imazhe në panelin anësor dhe të kërkoni informacione për përmbajtjen.
Funksioni mund të përdoret gjithashtu për të zgjidhur probleme matematikore. Për shembull, chatbot mund të identifikojë një ekuacion dhe të japë zgjidhjen hap pas hapi. Në mënyrë të ngjashme, ai mund të gjenerojë kod në Python bazuar në tekstin në imazh. Së fundi, mund të gjenerojë një imazh duke filluar nga një vizatim.
Discussion about this post