ChatGPT Images 2.0: OpenAI migliora la generazione di immagini con testo non latino

intelligenza artificiale OpenAI ChatGPT Generazione immagini AI tools Testo Non Latino

Meno di un anno dopo aver introdotto la possibilità di generare immagini direttamente da ChatGPT, OpenAI presenta ChatGPT Images 2.0, un’evoluzione che promette di rivoluzionare i modelli di generazione visiva. Secondo l’azienda, si tratta di un "salto qualitativo" grazie a miglioramenti significativi nella comprensione delle istruzioni, nella resa di testo denso e nella disposizione degli elementi all’interno di una scena.

Per la prima volta, OpenAI ha integrato capacità di ragionamento nel modello di generazione immagini. Questo consente al sistema di effettuare ricerche sul web e verificare i risultati prodotti, garantendo maggiore affidabilità in termini di accuratezza, coerenza e coesione visiva. Un esempio delle nuove capacità di ChatGPT nella resa di testo non latino. OpenAI

Un focus particolare è stato posto sul miglioramento della comprensione e della resa di lingue non latine. OpenAI afferma di aver ottenuto "guadagni significativi" nella gestione di lingue come il giapponese, il coreano, il cinese, l’hindi e il bengalese. Inoltre, il modello è ora in grado di riprodurre con maggiore fedeltà le caratteristiche visive di diversi alfabeti, rendendolo uno strumento più efficace per compiti come la prototipazione di videogiochi e la creazione di storyboard.

Tra le altre novità, Images 2.0 offre una maggiore flessibilità nei rapporti di aspetto, supportando formati estremi come 3:1 (orizzontale) e 1:3 (verticale). Il modello può generare immagini con risoluzioni fino a 2K e produrre fino a otto output contemporaneamente.

Per testare le nuove funzionalità, abbiamo avuto accesso a una versione preliminare di Images 2.0. Il primo test consisteva nella generazione di un’immagine di un gatto tartaruga in stile pixel art, ispirato alla terza generazione dei giochi Pokémon. Un compito impegnativo, considerato che i modelli AI faticano spesso con gli stili pixel art e i giochi Game Boy Advance sono iconici per il loro design. Il risultato ottenuto è stato soddisfacente, con una resa che ha rispettato lo stile richiesto.

Nel secondo test, abbiamo chiesto a ChatGPT di convertire l’immagine generata in un formato PNG trasparente. Il processo ha richiesto più tempo rispetto agli altri test, e il risultato finale presentava alcune lievi differenze rispetto all’immagine originale, ma ha comunque rispettato la richiesta di trasparenza, un’operazione che altri modelli faticano a eseguire correttamente.

Infine, abbiamo sottoposto il modello a una prova più complessa: la creazione di un manga in quattro pagine che raffigurasse il nostro gatto mentre trascorreva una giornata soleggiata vicino a un ruscello in una città idilliaca. Anche in questo caso, il risultato è stato apprezzabile, con alcune differenze stilistiche rispetto all’immagine del gatto generata in precedenza, ma comunque coerente con la richiesta iniziale.

Con l’uso diffuso di Images 2.0, sarà possibile valutare meglio le sue prestazioni rispetto a modelli concorrenti come Google Nano Banana 2. Nel frattempo, OpenAI continua a spingere i limiti della generazione di immagini basata su intelligenza artificiale, rendendo gli strumenti sempre più accessibili e potenti per creatori, sviluppatori e professionisti del settore.

Fonte: Engadget

← Precedente

Antibiotici nei neonati: effetti duraturi sul sistema immunitario dei...

ChatGPT potenzia la generazione di immagini: novità per utenti e sviluppatori

12:00 · 16 maggio 2026

I migliori laptop per ogni esigenza: guida all'acquisto 2026

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

11:00 · 16 maggio 2026

CFTC usa l'IA per contrastare le frodi nei mercati predittivi offshore

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 maggio 2026

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maggio 2026

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maggio 2026

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maggio 2026

arXiv vieta la pubblicazione di contenuti generati da AI con errori

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maggio 2026

OpenAI riorganizza la leadership per accelerare lo sviluppo degli agenti AI

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

18:13 · 15 maggio 2026

OpenAI minaccia azioni legali contro Apple per l’integrazione deludente di ChatGPT

OpenAI is reportedly exploring legal options after Apple's ChatGPT integration into its products didn't live up to the AI firm's expectations. When th...

Tecnologia

ChatGPT Images 2.0: OpenAI migliora la generazione di immagini con testo non latino e maggiore precisione

Antibiotici nei neonati: effetti duraturi sul sistema immunitario dei...

ChatGPT potenzia la generazione di immagini: novità per utenti e svilu...

Tecnologia

ChatGPT Images 2.0: OpenAI migliora la generazione di immagini con testo non latino e maggiore precisione

Antibiotici nei neonati: effetti duraturi sul sistema immunitario dei...

ChatGPT potenzia la generazione di immagini: novità per utenti e svilu...

Articoli correlati

I migliori laptop per ogni esigenza: guida all'acquisto 2026

CFTC usa l'IA per contrastare le frodi nei mercati predittivi offshore

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo

arXiv vieta la pubblicazione di contenuti generati da AI con errori

OpenAI riorganizza la leadership per accelerare lo sviluppo degli agenti AI

OpenAI minaccia azioni legali contro Apple per l’integrazione deludente di ChatGPT