OpenAI aggiorna ChatGPT Images: nuovo modello più veloce

OpenAI ha annunciato il lancio di una nuova versione ottimizzata di ChatGPT Images, basata su quello che l’azienda definisce il proprio modello per immagini più avanzato fino a oggi. L’aggiornamento introduce miglioramenti significativi nella capacità di seguire le istruzioni, nell’accuratezza dell’editing e nei tempi di generazione, che risultano fino a quattro volte più rapidi rispetto alla versione precedente. L’obiettivo dichiarato riguarda la semplificazione dei flussi creativi e una maggiore accessibilità nella produzione e revisione di contenuti visivi.

Un editing più preciso e controllabile

La nuova versione di ChatGPT Images interviene in modo più selettivo sulle immagini, modificando esclusivamente gli elementi richiesti dall’utente. OpenAI sottolinea la capacità del modello di preservare dettagli considerati critici, come somiglianza del volto, illuminazione, composizione e tonalità cromatica, anche durante interventi complessi di editing. Questo approccio punta a ridurre alterazioni indesiderate e a mantenere coerenza tra input e output.

Un’interfaccia dedicata alla creazione visiva

L’aggiornamento introduce anche un’esperienza specifica per le immagini all’interno della barra laterale di ChatGPT. Lo spazio include stili predefiniti e suggerimenti di tendenza, pensati per facilitare l’esplorazione visiva senza la necessità di prompt articolati. La scelta segna un’evoluzione dell’interfaccia, che passa da un utilizzo puramente conversazionale a un ambiente più strutturato per il lavoro creativo.

Dal semplice esperimento a uno strumento operativo

Secondo OpenAI, la nuova versione rappresenta un passaggio dalla generazione di immagini come elemento dimostrativo a un utilizzo più concreto e orientato a contesti reali. ChatGPT Images viene presentato come uno studio creativo flessibile, adatto a modifiche quotidiane, trasformazioni espressive e applicazioni pratiche, con un livello di fedeltà visiva più elevato rispetto al passato.

Il modello gpt-image-1.5 e la disponibilità

Il nuovo modello, denominato gpt-image-1.5, risulta disponibile da oggi per tutti gli utenti di ChatGPT e tramite API, ampliando le possibilità di integrazione anche per sviluppatori e aziende. OpenAI segnala che ulteriori dettagli tecnici sono disponibili nel blog ufficiale e in un approfondimento pubblicato su Substack da Fidji Simo, CEO of Applications di OpenAI.

Le dichiarazioni di Fidji Simo

Fidji Simo ha spiegato che per molte persone il primo contatto con ChatGPT avviene proprio attraverso la trasformazione di un prompt testuale in un’immagine. Secondo la dirigente, l’interfaccia di dialogo tradizionale non era stata progettata per supportare in modo ottimale attività visive, che richiedono spazi e strumenti differenti.

Simo ha evidenziato come il nuovo punto di accesso dedicato funzioni più come uno studio creativo, grazie a schermate pensate per la visualizzazione e la modifica delle immagini. L’obiettivo riguarda la possibilità di creare contenuti coerenti con l’idea dell’utente oppure trovare ispirazione tramite prompt di tendenza e filtri predefiniti.

Un ulteriore aspetto messo in evidenza riguarda le prestazioni del modello, descritto come più rapido e più affidabile nel seguire istruzioni dettagliate. La coerenza tra input e output, in termini di luce, composizione e somiglianza, viene indicata come uno dei fattori chiave per ottenere risultati più aderenti all’immaginazione dell’utente.

Aiutaci a crescere: lasciaci un like :)

Le notizie tech prima di tutti? Nella nostra newsletter!

* indicates required
Accettazione privacy

Intuit Mailchimp