Google Gemma 4: 3 volte più veloce con la predizione di token futuri

intelligenza artificiale Google hardware AI AI locale prestazioni AI tecnologia AI Gemma 4 Multi-Token Prediction MTP drafters modelli open-source

Google Gemma 4: prestazioni potenziate con la predizione di token futuri

Google ha presentato i modelli Gemma 4 questa primavera, introducendo una nuova generazione di intelligenza artificiale open-source pensata per l’AI locale. Ora, con l’aggiunta dei Multi-Token Prediction (MTP) drafters, questi modelli potrebbero diventare ancora più veloci ed efficienti.

Secondo Google, gli MTP drafters sfruttano una tecnica di decodifica speculativa per prevedere i token futuri, accelerando così il processo di generazione rispetto ai metodi tradizionali. Questa innovazione potrebbe rivoluzionare l’uso dell’AI su dispositivi locali, riducendo i tempi di risposta e migliorando l’esperienza utente.

Come funziona la tecnologia dietro Gemma 4

I modelli Gemma 4 si basano sulla stessa architettura che alimenta Gemini, il modello AI di punta di Google. Tuttavia, a differenza di Gemini, ottimizzato per i chip TPU di Google in configurazioni ad alte prestazioni, Gemma 4 è progettato per funzionare direttamente sui dispositivi degli utenti.

Questa flessibilità consente di eseguire anche i modelli più grandi di Gemma 4 in precisione piena su un singolo acceleratore AI ad alta potenza. Inoltre, la quantizzazione permette di far girare il modello su GPU consumer, rendendo l’AI locale accessibile a un pubblico più ampio.

Vantaggi e limiti dell’AI locale con Gemma 4

Uno dei principali vantaggi di Gemma 4 è la possibilità di utilizzare l’AI direttamente sul proprio hardware, senza dover condividere dati sensibili con servizi cloud esterni. Questo approccio offre maggiore privacy e controllo sull’elaborazione delle informazioni.

Google ha inoltre aggiornato la licenza di Gemma 4 alla versione Apache 2.0, molto più permissiva rispetto alle licenze personalizzate utilizzate in passato. Tuttavia, le prestazioni dell’AI locale dipendono fortemente dalle capacità hardware degli utenti. È qui che entrano in gioco gli MTP drafters, progettati per ottimizzare ulteriormente l’efficienza dei modelli.

«Gli MTP drafters rappresentano un passo avanti significativo per l’AI locale, consentendo di sfruttare al meglio le risorse hardware disponibili e riducendo i tempi di generazione dei token.»

— Dichiarazione di Google

Prospettive future per l’AI locale

Con l’introduzione degli MTP drafters, Google dimostra un impegno costante nel migliorare le prestazioni dei propri modelli open-source. Questa innovazione potrebbe aprire la strada a nuove applicazioni pratiche, dalla generazione di testo alla traduzione automatica, fino all’assistenza vocale, tutto in tempo reale e con una latenza minima.

Mentre l’AI locale continua a evolversi, strumenti come Gemma 4 e gli MTP drafters potrebbero rendere la tecnologia più accessibile e performante per sviluppatori e utenti finali.

Fonte: Ars Technica

← Precedente

Sondaggio: Anche gli elettori di Trump respingono la sua immagine come...

Joe Scarborough attacca Trump e Vance: "Lontani dalla realtà dopo promesse tradite"

16:34 · 16 maggio 2026

OpenAI lancia ChatGPT Plus a Malta con formazione AI obbligatoria

Residents will have to go through a course on artificial intelligence before activating the subscription.

15:37 · 16 maggio 2026

Sony chiarisce il funzionamento dell’Assistente IA della fotocamera dopo le critiche

The variety of terrible is impressive. After Sony drew some unwanted attention for a post demonstrating its AI Camera Assistant on the Xperia 1 XIII,...

12:00 · 16 maggio 2026

I migliori laptop per ogni esigenza: guida all'acquisto 2026

Need a new laptop? It’s a tough decision. If you’re like most people, a laptop is one of the most expensive tech purchases you’ll make, and it’s somet...

11:00 · 16 maggio 2026

CFTC usa l'IA per contrastare le frodi nei mercati predittivi offshore

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

00:12 · 16 maggio 2026

Snapchat e YouTube risolvono un'altra causa per dipendenza dai social media

The companies are facing numerous other legal challenges.

22:25 · 15 maggio 2026

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maggio 2026

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maggio 2026

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

Tecnologia

Google Gemma 4 diventa 3 volte più veloce con la predizione di token futuri

Google Gemma 4: prestazioni potenziate con la predizione di token futuri

Come funziona la tecnologia dietro Gemma 4

Vantaggi e limiti dell’AI locale con Gemma 4

Prospettive future per l’AI locale

Sondaggio: Anche gli elettori di Trump respingono la sua immagine come...

Joe Scarborough attacca Trump e Vance: "Lontani dalla realtà dopo prom...

Tecnologia

Google Gemma 4 diventa 3 volte più veloce con la predizione di token futuri

Google Gemma 4: prestazioni potenziate con la predizione di token futuri

Come funziona la tecnologia dietro Gemma 4

Vantaggi e limiti dell’AI locale con Gemma 4

Prospettive future per l’AI locale

Sondaggio: Anche gli elettori di Trump respingono la sua immagine come...

Joe Scarborough attacca Trump e Vance: "Lontani dalla realtà dopo prom...

Articoli correlati

OpenAI lancia ChatGPT Plus a Malta con formazione AI obbligatoria

Sony chiarisce il funzionamento dell’Assistente IA della fotocamera dopo le critiche

I migliori laptop per ogni esigenza: guida all'acquisto 2026

CFTC usa l'IA per contrastare le frodi nei mercati predittivi offshore

Snapchat e YouTube risolvono un'altra causa per dipendenza dai social media

YouTube estende il rilevamento AI delle deepfake a tutti gli utenti adulti

La controversa transazione da 1,5 miliardi di dollari di Anthropic per violazione del copyright: il giudice blocca l'approvazione

ArXiv vieta ai ricercatori che pubblicano articoli generati da AI senza controllo