Come utilizzare OpenAI Sora: tutto ciò che devi sapere

Maris B.AI1 anno fa49 Visite

Home
AI
Come utilizzare OpenAI Sora: tutto ciò che devi sapere

Dopo ChatGPT, OpenAI ha introdotto una piattaforma text-to-video, Sora, che produce video ad alta definizione in base alle istruzioni testuali dell’utente. Gli sviluppatori mirano ad addestrare l’intelligenza artificiale a comprendere il mondo fisico e i suoi oggetti di uso quotidiano per creare scene fantasiose che siano strettamente fedeli al mondo reale.

Attualmente, Sora può generare video della durata di un minuto in linea con le richieste dell’utente mantenendo intatta la qualità. Può immaginare paesaggi visivi, vita cittadina, natura e quant’altro. Tuttavia, il modello potrebbe avere difficoltà a catturare la precisione relativa all’interazione e ai movimenti umani, soprattutto quando il suggerimento coinvolge più di un personaggio.

Punti chiave

Sora è un testo in video Modello AI, sviluppato da OpenAI in grado di generare video duraturi fino a un minuto in base alle richieste dell’utente.
È ancora nel fase di test e non disponibile per uso pubblico.
L’utente inserirà un dettagliato richiesta di testo descrivendo la scena affinché Sora generi un video.
Sora ha il suo limitazioni come la visualizzazione di movimenti umani imprecisi quando sono coinvolti più personaggi, oggetti che appaiono dal nulla, modelli fisici imprecisi e altro ancora.

AVVERTIMENTO: Sora potrebbe non fornire sempre dettagli accurati. Pertanto, ricontrolla sempre l’output in modo approfondito, soprattutto i minimi dettagli.

È disponibile al pubblico?

A partire da febbraio 2024, Sora non viene resa pubblica; solo un gruppo limitato di persone ha accesso. Ciò comprende;

Membri della squadra rossa: Esperti di sicurezza che giudicheranno criticamente il modello di intelligenza artificiale e ne valuteranno i rischi e le possibilità di uso improprio. Se trovati, verranno inoltrati agli sviluppatori in modo che il problema possa essere risolto tempestivamente prima che Sora sia disponibile per l’uso pubblico.
Squadra di test: Si tratta di individui selezionati, come grafici, artisti visivi, montatori video e registi. Giudicheranno l’accuratezza del modello e la precisione con cui produce ciò che l’utente desidera. Gli sviluppatori utilizzeranno eventuali modifiche e feedback degli esperti per migliorare lo strumento.

Come utilizzare OpenAI Sora?

Sora funziona su principi simili a quelli del suo collega modello di intelligenza artificiale, ChatGPT. Inserisci un messaggio di testo nella barra di ricerca, aggiungendo quanti più dettagli possibili sulla scena che hai in mente, ad esempio l’ambientazione, lo sfondo, i colori, i dettagli del personaggio e altro ancora.

Il modello AI farà del suo meglio per comprendere la richiesta e generare la rappresentazione più fedele dei dettagli, anche se potrebbe richiedere del tempo prima di ricevere l’output. Ad esempio, ecco un video pubblicato su X in cui l’utente chiede a Sora di generare un video di una formica che esplora l’interno di un nido.

Il modello ha superato se stesso creando una rappresentazione visiva accurata di una scena, come si vede nel video.

Inoltre, puoi avere un’ulteriore idea della chiarezza e del dettaglio in questo frammento in cui il prompt richiedeva “Un trailer cinematografico con le avventure dell’astronauta trentenne che indossa un casco da motociclista lavorato a maglia di lana rossa, cielo azzurro, deserto di sale, stile cinematografico, girato su pellicola 35mm, colori vividi.” L’attenzione alla lavorazione a maglia di lana e la fusione dei colori sullo sfondo dimostrano quanto esattamente soddisfi le esigenze dell’utente.

Immagine Sora — Frammento di un video generato da Sora (immagine di OpenAI Sora)

Nota: Dato che Sora è ancora in fase di test e non è ancora pronto per l’uso pubblico, c’è la possibilità che gli sviluppatori modifichino alcuni aspetti del suo modello di lavoro, ma soprattutto sarà sulla stessa linea di ChatGPT

Pro e contro di OpenAI Sora

Professionisti	Contro
✅ Produce video di alta qualità	❌ I video non possono superare un minuto
✅ Visualizza l’ispirazione e le scene creative	❌ Potrebbe visualizzare in modo impreciso le interazioni umane
✅ Aiuta grafici, registi	❌ Gli oggetti potrebbero apparire dal nulla
✅ I video sono super realistici	❌ Può non riuscire a strutturare gli oggetti fisici
✅ Può far risparmiare tempo e risorse nella realizzazione di film	❌ Potrebbe generare movimenti impossibili