
La nuova funzionalità di generazione di immagini, denominata 'ChatGpt immagini', è resa possibile dal modello omnimodale GPT-4o; questa novità consente di creare immagini contestualmente alle conversazioni testuali. ChatGpt immagini è accessibile agli abbonati ChatGpt Plus, Pro e Team, paganti e gratuiti.
Sul blog ufficiale di OpenAI, l'azienda sottolinea le capacità del modello di generare immagini fotografiche realistiche ed a differenza di altri generatori di immagini IA, che spesso confondono colori e forme, 'ChatGpt immagini' dimostrerebbe di essere in grado di associare in modo corretto caratteristiche ad un numero significativamente maggiore di oggetti, portando quindi ad un reale progresso della resa del testo all'interno delle immagini.
Il modello può trascrivere riferimenti testuali coerenti e privi di errori di battitura, superando perciò una delle principali sfide nel campo della generazione di immagini con l'intelligenza artificiale.
Questo risultato è frutto di "molti mesi di piccoli miglioramenti", ha sottolineato al sito The Verge il responsabile della ricerca di OpenAI, Gabriel Goh.
Dal punto di vista tecnico, il sistema genera immagini in sequenza, in modo similare alla scrittura di testo. Questo si distingue dalla tecnica del modello di diffusione, utilizzata da Dall-e ed altri strumenti, che invece creano l'immagine intera in una volta sola.
Davide Fifaco