OpenAI njoftoi një version paraprak të Voice Engine, një model text-to-speech që mund të gjenerojë një zë sintetik nga futja e tekstit dhe një mostër audio 15 sekondash. Teknologjia, e zhvilluar që nga fundi i vitit 2022 dhe e përdorur për funksionalitetin Read Aloud të ChatGPT, mund të testohet vetëm nga një numër i kufizuar partnerësh.
Vetëm 15 sekonda audio për të klonuar zërin tuaj
Voice Engine u trajnua me një përzierje të të dhënave publike dhe të licencuara (OpenAI nuk dha detaje). Modeli gjeneron një zë pothuajse identik me atë origjinal, pasi merr një mostër audio prej 15 sekondash si hyrje.
Mund të përdoret për aplikime të ndryshme. Disa shembuj të ofruar nga partnerët janë publikuar në blogun zyrtar. Age of Learning krijoi një mjet ndihmës për lexim, ndërsa HeyGen përdori Voice Engine për të përkthyer audion nga anglishtja në gjuhë të tjera (spanjisht, frëngjisht, gjermanisht, japonisht dhe mandarin).
Këto modele gjithashtu mund të shfrytëzohen për të gjeneruar falsifikime të thella audio. OpenAI është i vetëdijshëm për rreziqet, prandaj Voice Engine aktualisht është testuar nga disa partnerë të përzgjedhur të cilët duhet të respektojnë rreptësisht rregullat. Ndalohet përdorimi i shabllonit për të klonuar një zë pa pëlqimin e qartë dhe të informuar të folësit origjinal.
Partnerët duhet gjithashtu të zbulojnë se zëri është krijuar nga inteligjenca artificiale dhe të zbatojnë një sërë masash për të gjurmuar origjinën e çdo audio të gjeneruar (për shembull përmes filigranit). Disa çështje të privatësisë dhe sigurisë duhet të zgjidhen përpara prezantimit të përgjithshëm.
Duke qëndruar në temë, Microsoft dhe OpenAI thuhet se kanë planifikuar ndërtimin e një qendre të dhënash që do të presë një superkompjuter AI të quajtur Stargate. Sipas burimeve të The Information, shpenzimi është mbi 100 miliardë dollarë.
Discussion about this post