Attenzione, appassionati di intelligenza artificiale: c’è un nuovo modello video AI in città e si chiama Kling. Sviluppato dai ragazzi di Kuaishou, una piattaforma video cinese, questo gioiellino promette di dare del filo da torcere a Sora, la creatura di OpenAI che ultimamente ha fatto molto parlare di sé.
Kling sembra avere tutte le carte in regola per diventare il nuovo re dei video AI: generazioni più lunghe, movimenti più fluidi, una migliore interpretazione dei prompt e addirittura sequenze multi-shot. Insomma, se Sora era già impressionante, Kling potrebbe portare i video generati dall’AI a un livello completamente nuovo.
Cappuccino?
Kling vs Sora, è già scontro tra titani
Quando si parla di video AI, è impossibile non pensare a Sora, il modello sviluppato da OpenAI che ha fatto scalpore al momento del suo annuncio. Con la sua capacità di generare video realistici e di seguire fedelmente i prompt degli utenti, Sora sembra destinato a rivoluzionare il mondo dell’intelligenza artificiale applicata al video. Anzi, addirittura l’estetica di questi anni. O forse dovrei dire “sembrava”: con l’arrivo di Kling, le carte in tavola potrebbero rimescolarsi.
Certo, a prima vista, i due modelli sembrano avere molte caratteristiche in comune. Entrambi si basano su architetture transformer e sono in grado di generare video di alta qualità partendo da semplici descrizioni testuali. Ma è scendendo nei dettagli che Kling sembra avere diversi vantaggi.
Secondo quanto dichiarato da Kuaishou, infatti, Kling è in grado di generare video AI lunghi fino a due minuti, in 1080p e a 30 fotogrammi al secondo. Una capacità notevole, che supera quella di Sora e che apre la strada a una vasta gamma di applicazioni, dalla creazione di contenuti per i social media alla produzione di filmati pubblicitari o di intrattenimento. E non è tutto.
Con questo nuovo modello video AI il Panda se la canta e se la suona. Immagini: Kling.
La fisica non è più un problema
Il modello text-to-video cinese, stanti le dichiarazioni dei suoi sviluppatori, sembra eccellere anche nella simulazione della fisica del mondo reale, un aspetto in cui gli attualo modelli video AI fanno fatica. I video AI generati da Kling mostrano una grande fluidità di movimento e un’interazione realistica tra oggetti e ambienti, rendendo l’esperienza visiva ancora più convincente.
A questo si aggiunge la capacità di Kling di effettuare ricostruzioni 3D avanzate di volti e corpi, migliorando l’espressività e il movimento degli arti nei video generati. Un dettaglio tecnico che può fare la differenza quando si tratta di creare personaggi o situazioni complesse.
Sarà contento Zarrillo.
Una questione di diffusione
Nonostante le premesse piuttosto interessanti, comunque, la vera minaccia di Kling per Sora si chiama “disponibilità”. Mentre il modello di OpenAI resta in fase di test, accessibile solo a un ristretto gruppo di creatori e ricercatori, Kling sembra essere già pronto per un pubblico più vasto.
Kuaishou, infatti, ha aperto una lista d’attesa per gli utenti interessati a provare il suo nuovo modello. Un approccio che potrebbe permettere a Kling di guadagnare terreno rapidamente, costruendo una base di utenti e raccogliendo preziosi feedback mentre Sora resta chiuso nei laboratori di OpenAI.
Video AI, inizia la lotta
Naturalmente, è ancora presto per dichiarare un vincitore in questa sfida. OpenAI ha dalla sua una reputazione consolidata e un team di ricercatori di prim’ordine, “cannibali” ambiziosi che potrebbero riservare sorprese nei prossimi mesi. E poi, la cautela di OpenAI nel rilasciare Sora al grande pubblico è comprensibile: l’azienda vuole assicurarsi che il modello sia pronto e che non possa essere usato per scopi malevoli o per diffondere disinformazione.
D’altra parte, Kuaishou sembra determinata a portare Kling sulla scena globale. L’azienda cinese ha già dimostrato di saper gestire una piattaforma video di successo nel suo mercato interno e potrebbe avere le risorse e l’esperienza necessarie per scalare rapidamente.
Uno scrupolo che non sappiamo quanto Kling vorrà conservare. E non c’è solo Kling: la corsa ai video AI è appena cominciata. Con nuovi modelli che si affacciano sulla scena e con i progressi costanti della ricerca, possiamo aspettarci di vedere video sempre più lunghi, realistici e impressionanti nei prossimi anni.
Video AI, l’impatto sull’industria
Ma cosa significa tutto questo per l’industria video? L’arrivo di strumenti come Kling e Sora potrebbe rivoluzionare il modo in cui i contenuti vengono creati e prodotti. Immaginate di poter generare un intero spot pubblicitario o un corto animato partendo da una semplice descrizione testuale. O di poter popolare i vostri video con personaggi realistici senza bisogno di attori o di costose sessioni di motion capture.
Certo, questo solleva anche interrogativi sul futuro di alcune professioni creative. Saranno i modelli AI a sostituire artisti, animatori e registi? Probabilmente no, o almeno non a breve termine. Ma queste tecnologie potrebbero diventare un potente strumento nelle loro mani, permettendo di sperimentare, di prototipare rapidamente le idee e di espandere i confini della creatività.
Che sia Kling, Sora o un altro modello ancora a emergere come leader, il futuro dei video generati dall’AI si preannuncia folle.
L’articolo La Cina sfida OpenAI con Kling, il modello per video AI che impressiona è tratto da Futuro Prossimo.
Tecnologia, intelligenza artificiale, Video