Un salto qualitativo per la generazione di immagini

ChatGPT ha recentemente lanciato la versione 2.0 del suo motore di immagini, promettendo miglioramenti sostanziali rispetto ai precedenti modelli. Tra le novità più rilevanti spiccano una tipografia più raffinata, l’accesso diretto al web e una maggiore capacità di ragionamento contestuale. Per valutarne le reali potenzialità, Axios ha condotto una serie di test pratici.

Differenze tra versione standard e modalità "thinking"

La nuova versione supporta diversi rapporti d’aspetto e offre due modalità operative: la versione standard, accessibile a tutti gli utenti, e la modalità "thinking", riservata agli abbonati a pagamento. Quest’ultima si distingue per la capacità di elaborare richieste complesse con un ragionamento più approfondito.

Test pratici: risultati sorprendenti ma non perfetti

In una giornata di utilizzo intensivo, il nuovo motore ha dimostrato versatilità in compiti diversi:

  • Immagini commemorative: Ha creato un’immagine commemorativa per un gatto scomparso, personalizzata con due giocattoli preferiti del defunto animale, simile a un biglietto di condoglianze.
  • Rielaborazione fotografica: Ha trasformato due foto di matrimonio in uno stile vintage, come se fossero incollate in un album con angoli decorativi.
  • Poster creativi: Ha generato un poster per un evento fittizio, come un concorso di sosia di Mike Allen a Washington Square Park.
  • Infografiche: Ha prodotto una grafica per sostenere che il "candy corn" non è né caramella né mais, anche se con scarso successo nel convincere i colleghi.
  • Riorganizzazione spazi: Ha mostrato come sarebbe una camera da letto sgombra da oggetti, suscitando reazioni contrastanti tra gli utenti.
  • Carte da collezione: Ha trasformato foto di partite di softball e calcio in carte da trading, complete di nome, ruolo e logo della squadra.

Criticità emerse nei test

Nonostante i risultati promettenti, il motore presenta alcune limitazioni:

  • Precisione temporale: Quando richiesto di creare un falso giornale basato sulle ultime notizie di Axios, inizialmente ha utilizzato articoli vecchi. Solo al secondo tentativo ha generato contenuti aggiornati, ma con un layout ancora grezzo.
  • Qualità variabile: Alcune richieste, come una scheda strategica per il mahjong, hanno prodotto risultati accurati ma poco raffinati.
  • Tempi di generazione: La modalità "thinking" richiede più tempo per completare le immagini, suggerendo la necessità di una pianificazione anticipata.

Un futuro promettente ma ancora in evoluzione

Il nuovo motore di immagini di ChatGPT rappresenta un passo avanti significativo nel campo della generazione automatica di contenuti visivi. Tuttavia, come evidenziato dai test, la tecnologia è ancora in fase di perfezionamento. Le potenzialità sono enormi, ma la qualità finale e la velocità di esecuzione rimangono aspetti da migliorare. Per ora, gli utenti possono sperimentare con entusiasmo, tenendo conto dei limiti attuali.

Fonte: Axios