OpenAI ha presentato Sora 2, il nuovo modello di generazione video e audio che segna un salto di qualità rispetto alla prima versione, lanciata nel febbraio 2024. Se allora il progresso era stato paragonato al momento “GPT-1 per i video”, con Sora 2 si entra in quella che l’azienda descrive come la fase “GPT-3.5”: un sistema più fisicamente accurato, capace di rispettare le leggi della fisica, con sincronizzazione naturale di dialoghi ed effetti sonori e con un controllo creativo molto più raffinato.

Il modello riesce a rappresentare scene che i sistemi precedenti deformavano per rispettare il prompt. In Sora 2, se un giocatore di basket sbaglia un tiro, la palla rimbalza realisticamente sul tabellone, mentre un esercizio di ginnastica olimpica o un salto mortale su una tavola galleggiante vengono riprodotti con una coerenza fisica mai vista. L’obiettivo dichiarato è quello di costruire simulatori generali del mondo reale, capaci un giorno di alimentare agenti robotici e sistemi di IA in grado di funzionare nello spazio fisico.
Controllo creativo e nuovi stili
Sora 2 non si limita a una maggiore fedeltà fisica: introduce strumenti di controllo dettagliato delle scene, mantenendo coerenza tra più inquadrature e riuscendo ad adattarsi a diversi stili visivi, dal cinematografico al realistico fino all’anime. È possibile inserire elementi del mondo reale all’interno di un video generato, con persone, animali o oggetti riprodotti fedelmente a partire da un semplice filmato.
L’app Sora e la funzione Cameo
Per rendere questa tecnologia più accessibile, OpenAI ha lanciato l’app Sora su iOS, al momento disponibile in fase iniziale negli Stati Uniti e in Canada. Gli utenti possono creare contenuti, remixare quelli altrui e scoprire nuove produzioni attraverso un feed personalizzabile. Una delle funzioni principali è il Cameo, che permette di registrare un breve video e una traccia audio per essere inseriti direttamente all’interno di qualsiasi scena generata, con fedeltà visiva e vocale notevole. Secondo OpenAI, questa funzione rappresenta una nuova forma di comunicazione sociale, in grado di rendere la creazione video un’esperienza collettiva. La distribuzione avviene per invito, con l’obiettivo di rafforzare dinamiche di comunità e non un semplice consumo passivo di contenuti.
La filosofia del feed
Il cuore dell’app è il Sora feed, progettato con principi dichiaratamente diversi rispetto ai social tradizionali. L’obiettivo è favorire creatività e connessioni, non il tempo speso in app. Per questo il ranking privilegia i contenuti creativi e la partecipazione attiva, dando agli utenti strumenti per orientare il tipo di raccomandazioni ricevute. I genitori possono inoltre intervenire tramite i parental control di ChatGPT, disattivando personalizzazione e scroll continuo per gli account dei minori. OpenAI spiega che la priorità è incoraggiare la creazione, rafforzare i legami tra persone (grazie anche ai Cameo) e mantenere un equilibrio tra sicurezza e libertà di espressione. I sistemi di raccomandazione prendono in considerazione diversi segnali, dalle interazioni degli utenti su Sora ai dati di engagement, fino a eventuali riferimenti alla cronologia di ChatGPT, disattivabili in qualsiasi momento.
Sicurezza e moderazione
La gestione della sicurezza è centrale: già nella fase di generazione i contenuti vengono filtrati con guardrail robusti, che impediscono materiale esplicitamente sessuale, violento o legato a propaganda estremista. Successivamente, un mix di strumenti automatici e moderazione umana assicura che il feed sia adatto a tutti, inclusi gli adolescenti. OpenAI dichiara di filtrare attivamente contenuti potenzialmente dannosi come autolesionismo, diete malsane, linguaggio d’odio, sfide pericolose o promozione di sostanze vietate. Il bilanciamento non è semplice: troppe restrizioni rischiano di soffocare la creatività, mentre troppa libertà mina la fiducia. L’approccio scelto è quello di interventi proattivi dove il rischio è maggiore, affiancati da un sistema reattivo di segnalazioni e rimozioni rapide. OpenAI riconosce che i sistemi di raccomandazione sono dinamici e in evoluzione, e dichiara di volerli affinare progressivamente grazie ai feedback degli utenti.
Disponibilità e prospettive
Sora 2 è disponibile gratuitamente con limiti ampi ma vincolati alla capacità di calcolo. Gli utenti ChatGPT Pro possono accedere a una versione “Pro” del modello, pensata per generazioni di qualità superiore. L’azienda ha annunciato inoltre che Sora 2 sarà presto integrato via API, mentre la precedente versione, Sora 1 Turbo, resterà disponibile con tutti i contenuti già creati. Il lancio di Sora 2 non è quindi solo un’evoluzione tecnologica, ma anche un esperimento sociale che punta a ridefinire l’esperienza di creazione e condivisione digitale. OpenAI lo presenta come un passo verso un futuro in cui i simulatori generali del mondo e l’IA fisicamente consapevole avranno un impatto profondo, non solo nella ricerca ma anche nell’intrattenimento e nella comunicazione quotidiana.




































Lascia un commento