Së bashku me Gemini Pro, kompania Mountain njoftoi disponueshmërinë e Imagen 2 në Vertex AI në Google Cloud. Klientët do të jenë në gjendje të përdorin modelin për të krijuar imazhe fotorealiste. MedLM është modeli i ri gjenerues i AI për sektorin e kujdesit shëndetësor. Në të dyja rastet, aksesi kërkon regjistrim në listën e pritjes dhe miratim pasues.
Imazhi 2 në Vertex AI
Imagen 2, i zhvilluar nga Google DeepMind, është modeli më i avancuar i tekstit në imazh nga kompania kaliforniane. Klientët mund të zgjedhin modelin në platformën Vertex AI (konkurrent i Amazon Bedrock) dhe të gjenerojnë imazhe fotorealiste me rezolucion të lartë nëpërmjet një përshkrimi teksti (prompt). Krahasuar me gjeneratën e parë ka përmirësime të dukshme, por Google nuk ka zbuluar se cilat të dhëna janë përdorur për të trajnuar modelin (një nga detyrimet sipas Aktit të AI në Evropë).
Një nga mangësitë e modeleve tekst-në-imazh lidhet me paraqitjen e tekstit. Imagen 2 mund të gjenerojë imazhe në të cilat ka një fjalë ose frazë të saktë (të dobishme për fushatat reklamuese). Këta janë dy shembuj:
Imagen 2 gjithashtu mund të gjenerojë logo realiste për kompanitë, markat dhe produktet që mund të mbivendosen në imazhet ekzistuese. Modeli gjithashtu mund të krijojë tituj të detajuar dhe t’u përgjigjet pyetjeve rreth elementeve në imazh. Gjuhët e mbështetura janë anglisht, kinezisht, hindisht, japonisht, koreanisht, portugalisht dhe spanjisht. Filigrami i padukshëm SynthID i zhvilluar nga Google DeepMind aplikohet në imazhet e krijuara.
MedLM në Vertex AI
MedLM është modeli i ri gjenerues i AI për sektorin e kujdesit shëndetësor. Aktualisht bazohet në Med-PaLM 2, por Gemini do të përdoret në muajt e ardhshëm. Mund të përdoret për të kryer një sërë detyrash, nga krijimi i përmbledhjeve të bisedave deri te hulumtimi i ilaçeve dhe trajtimeve mjekësore. Është i aksesueshëm vetëm për klientët e Google Cloud në Shtetet e Bashkuara.
Discussion about this post