Pikërisht një javë pas lançimit të Sora nga OpenAI, Google ka zyrtarizuar disa risi të rëndësishme në lidhje me modelet e saj të inteligjencës artificiale. Ndër këto spikat modeli Veo 2, i aftë për të gjeneruar fizikë më realiste.
Direkt nga një postim i publikuar në blogun zyrtar të Google më 16 dhjetor 2024 mësohet për shpalljen e versionit të ri të modelit tekst-në-video, i shoqëruar ndër të tjera me përsëritjen e re të tekstit në- Modeli i imazhit Imagen 3. Google thotë se Veo 2 “siguron një kuptim më të mirë të fizikës së botës reale dhe nuancave të lëvizjes dhe shprehjes njerëzore, gjë që ndihmon në përmirësimin e detajeve dhe realizmit të përgjithshëm”.
Veo 2 mund të gjenerojë video deri në rezolucion 4K për një kohëzgjatje maksimale prej disa minutash. Google thotë se modeli është gjithashtu në gjendje të kuptojë kërkesat e kinemasë, duke shpjeguar se është e mundur të futet në kërkesë, për shembull, treguesi në lidhje me përdorimin e një “lente 18 mm” për të marrë efektin me kënd të gjerë për të cilin është. i njohur i fundit. Ju gjithashtu mund të luani me thellësinë e fushës, duke turbulluar sfondin. Sipas BigG, Veo 2 është gjithashtu më pak i prirur ndaj halucinacioneve sesa modelet e tjera më të mira.
Veo 2 është aktualisht në mes të një prezantimi në lidhje me mjetin VideoFX të Google Labs, megjithëse ju duhet të bashkoheni në një listë pritjeje për të provuar shërbimin dhe modeli aktualisht nuk është i aksesueshëm nga Shqiperia. Në çdo rast, rezultatet e krijuara integrojnë filigranin e padukshëm SynthID për të ndihmuar përdoruesit të identifikojnë përmbajtjen e krijuar me këtë mjet. Ju mund të gjeni videot mbresëlënëse demonstruese të krijuara me Veo 2 duke ndjekur lidhjen në burim.
Megjithatë, për sa i përket modelit Imagen 3 tekst-në-imazh, ky i fundit tani gjeneron imazhe më të ndritshme dhe të kompozuara më mirë. Modelja gjithashtu mund të gjurmojë më saktë stilet artistike. Imagen 3 po shpërndahet në mbi 100 vende në ImageFX, mjet për gjenerimin e imazheve të Google Labs. Megjithatë, edhe në këtë rast, Italia nuk është ende ndër vendet e përfshira.
Google shfrytëzoi gjithashtu rastin për të njoftuar eksperimentin e tij më të fundit në fushën e gjenerimit të imazheve me AI. Ky është një mjet i quajtur Whisk, i cili sapo është lançuar në Shtetet e Bashkuara të Amerikës. Ky shërbim është kombinimi i Imagen 3 me aftësitë e të kuptuarit dhe përshkrimit vizual të Binjakëve. Mund të “bashkojë” tre imazhe për të kryer një lloj remiksi që lidhet me një krijim të vetëm. Shkurtimisht, ne po përpiqemi ta bëjmë më të lehtë ofrimin e një urdhri për AI duke i bërë Gemini të marrë automatikisht një titull të detajuar për imazhet. Më shumë detaje në videon e mëposhtme.
Discussion about this post