Dopo ChatGPT, OpenAI ha introdotto una piattaforma text-to-video, Sora, che produce video ad alta definizione in base alle istruzioni testuali dell’utente. Gli sviluppatori mirano ad addestrare l’intelligenza artificiale a comprendere il mondo fisico e i suoi oggetti di uso quotidiano per creare scene fantasiose che siano strettamente fedeli al mondo reale.
Attualmente, Sora può generare video della durata di un minuto in linea con le richieste dell’utente mantenendo intatta la qualità. Può immaginare paesaggi visivi, vita cittadina, natura e quant’altro. Tuttavia, il modello potrebbe avere difficoltà a catturare la precisione relativa all’interazione e ai movimenti umani, soprattutto quando il suggerimento coinvolge più di un personaggio.
Punti chiave
AVVERTIMENTO: Sora potrebbe non fornire sempre dettagli accurati. Pertanto, ricontrolla sempre l’output in modo approfondito, soprattutto i minimi dettagli.
A partire da febbraio 2024, Sora non viene resa pubblica; solo un gruppo limitato di persone ha accesso. Ciò comprende;
Sora funziona su principi simili a quelli del suo collega modello di intelligenza artificiale, ChatGPT. Inserisci un messaggio di testo nella barra di ricerca, aggiungendo quanti più dettagli possibili sulla scena che hai in mente, ad esempio l’ambientazione, lo sfondo, i colori, i dettagli del personaggio e altro ancora.
Il modello AI farà del suo meglio per comprendere la richiesta e generare la rappresentazione più fedele dei dettagli, anche se potrebbe richiedere del tempo prima di ricevere l’output. Ad esempio, ecco un video pubblicato su X in cui l’utente chiede a Sora di generare un video di una formica che esplora l’interno di un nido.
Il modello ha superato se stesso creando una rappresentazione visiva accurata di una scena, come si vede nel video.
Inoltre, puoi avere un’ulteriore idea della chiarezza e del dettaglio in questo frammento in cui il prompt richiedeva “Un trailer cinematografico con le avventure dell’astronauta trentenne che indossa un casco da motociclista lavorato a maglia di lana rossa, cielo azzurro, deserto di sale, stile cinematografico, girato su pellicola 35mm, colori vividi.” L’attenzione alla lavorazione a maglia di lana e la fusione dei colori sullo sfondo dimostrano quanto esattamente soddisfi le esigenze dell’utente.
Nota: Dato che Sora è ancora in fase di test e non è ancora pronto per l’uso pubblico, c’è la possibilità che gli sviluppatori modifichino alcuni aspetti del suo modello di lavoro, ma soprattutto sarà sulla stessa linea di ChatGPT
Professionisti | Contro |
---|---|
✅ Produce video di alta qualità | ❌ I video non possono superare un minuto |
✅ Visualizza l’ispirazione e le scene creative | ❌ Potrebbe visualizzare in modo impreciso le interazioni umane |
✅ Aiuta grafici, registi | ❌ Gli oggetti potrebbero apparire dal nulla |
✅ I video sono super realistici | ❌ Può non riuscire a strutturare gli oggetti fisici |
✅ Può far risparmiare tempo e risorse nella realizzazione di film | ❌ Potrebbe generare movimenti impossibili |
Caratteristiche | OpenAI Sora | CanvaAI | PicsArt AI |
---|---|---|---|
Chiarezza | SÌ | SÌ | SÌ |
Immagini realistiche | SÌ | SÌ | NO |
Precisione | Alto | medio | medio |
Durata massima | Un minuto | Pochi secondi | Pochi secondi |