Nel report da loro redatto i ricercatori spiegano che questo nuovo modello ha un differente approccio rispetto a quelli già esistenti, come ad esempio Pika, che permette di sintetizzare video che rappresentano movimenti realistici, diversificati e coerenti; un passo fondamentale nella generazione di video. Per il momento non sono disponibili modelli da testare; quando saranno rilasciati gli utenti, per utilizzare Lumiere, così è stato denominato il programma, potranno fornire delle descrizioni testuali ed eventualmente fornire un'immagine statica che, aggiungendo delle specifiche richieste, potrà trasformarsi in un video dinamico.
Il modello, inoltre, è predisposto per funzionalità aggiuntive, come ad esempio l'inserimento di oggetti specifici tramite istruzioni di testo o l'animazione di parti specifiche di una scena. Funzionalità non nuove nel settore, ma Lumiere utilizza dei recenti protocolli che permettono di generare l'intera durata temporale di un video in una volta sola, portando ad un movimento più realistico e coerente.
Nel documento di ricerca, gli studiosi affermano che attualmente il modello produce video da 1024×1024 pixel della durata di cinque secondi "a bassa risoluzione".
Nonostante queste limitazioni, i ricercatori hanno eseguito uno studio sugli utenti ed affermano che i risultati di Lumiere erano preferiti rispetto ai modelli di sintesi video AI esistenti. Per ora, infine, Lumiere non è ancora in grado di generare video costituiti da inquadrature multiple o che coinvolgano transizioni tra scene, limiti che sicuramente verranno superati in futuro.
Davide Fifaco