Perchè ne parlano tutti?
Sora è un modello AI in grado di creare scene realistiche e imaginative da istruzioni testuali.
Seppure Sora è in sviluppo da qualche hanno sta facendo ultimamente parlare molto di se grazie ai progressi effettuati negli ultimi due anni da Sora.
Basta guardare i progressi sul famoso video di Will Smith per rendersene conto, Sora è pronta ed è qui per restare.
Le sfide
Sebbene presenti ancora delle limitazioni ed inesattezze appare chiaro come Sora sia uno strumento tanto potente quanto pericoloso, dalle implicazioni sui copyrights delle persone usate dal modello all’impatto che potrebbe avere sui deepfake.
Jun-Yan Zhu, professore nella Carnegie Mellon University che si occupa di ricerca sull’AI generativa scrive:
“C’è una preoccupazione reale su come, quando chiunque può mettere le mani sull’ultima applicazione di OpenAI, sarà più facile creare deepfake e contenuti offensivi. Già ci sono stati diversi deepfake negativi di alto profilo che hanno colpito i media mainstream, tra cui foto esplicite di Taylor Swift su X e un falso Presidente Joe Biden che diceva agli elettori potenziali nelle primarie del New Hampshire di rimanere a casa e “salvare il loro voto” evitando le elezioni primarie dello stato il mese scorso.
Le limitazioni
OpenAI scrive al riguardo
“Oggi, Sora sta diventando disponibile per i team red per valutare aree critiche di danni o rischi…
…Il modello attuale ha delle debolezze. Potrebbe avere difficoltà a simulare accuratamente la fisica di una scena complessa e potrebbe non comprendere istanze specifiche di causa ed effetto.
Ad esempio, una persona potrebbe prendere un morso da un biscotto, ma successivamente il biscotto potrebbe non avere un segno del morso.
Il modello potrebbe anche confondere dettagli spaziali di un prompt, ad esempio, mescolare sinistra e destra, e potrebbe avere difficoltà con descrizioni precise di eventi che si verificano nel tempo, come seguire una traiettoria specifica della telecamera.”
Come funziona?
Sora si basa sulla ricerca passata nei modelli DALL·E e GPT. Utilizza la tecnica di ricatturazione da DALL·E 3, che consiste nel generare didascalie altamente descrittive per i dati di addestramento visivo.
Di conseguenza, il modello è in grado di seguire più fedelmente le istruzioni testuali dell’utente nel video generato.
Cosa cambierà adesso?
Dalle poche scene viste fin ora Sora cambierà le regole del gioco per quanto riguarda filmaking e il montaggio, ma come ogni altra tecnologia AI l’idea alla base è quella di restare uno strumento in grado di massimizzare la produzione e portare l’esperienza dell’utente finale ancora più in alto.
Rendere la produzione video accessibile a tutti e più rapida è un beneficio da non sottovalutare: Youtube, Instagram e i altri tipi di contenuti digitali potranno proliferare più velocemente.
I content creators potranno accedere al mondo visuale e arricchire i propri contenuti facilmente e rapidamente, ma dall’altra parte molto deve essere fatto da un punto di vista tecnico e legislativo per rendere questa tecnologia pubblica e sicura quanto più possibile, attualmente sembra che anche OpenAI sia della stessa opinione, vedremo in seguito se e in che modo tali misure di sicurezza verranno adottate.
Data di lancio
Al momento non c’è ancora una data definita per il lancio di Sora al pubblico. Basandoci sui rilasci precedenti di OpenAI, potremmo vedere una qualche versione di esso rilasciata a qualche persona in qualche momento del 2024.
Pingback: OpenAI senza rivali - Boricam Entertainment