Google Gemma 4 : des modèles IA locaux 3 fois plus rapides avec MTP

Google GPU IA locale TPU modèles IA Gemma 4 Multi-Token Prediction MTP edge AI Apache 2.0

Google a dévoilé cette春季 ses modèles Gemma 4, une série de modèles d'IA ouverts conçus pour fonctionner localement sur des appareils edge. Ces modèles, basés sur la même technologie que les modèles Gemini de pointe de Google, offrent désormais un gain de performance supplémentaire grâce à l'intégration des drafters Multi-Token Prediction (MTP).

Selon Google, ces nouveaux drafters expérimentaux utilisent une forme de décodage spéculatif pour anticiper les tokens futurs. Cette approche permet d'accélérer considérablement la génération de texte par rapport aux méthodes traditionnelles, où les modèles génèrent les tokens un par un de manière séquentielle.

Les modèles Gemma 4 sont optimisés pour s'exécuter sur du matériel local, contrairement à Gemini qui repose sur les puces TPU personnalisées de Google, fonctionnant dans des clusters massifs avec des interconnexions ultra-rapides. Malgré cette différence, un seul accélérateur IA haute performance suffit pour faire tourner le plus grand modèle Gemma 4 en précision totale. De plus, une quantification permet d'exécuter ces modèles sur des GPU grand public.

L'un des principaux avantages de Gemma réside dans la possibilité pour les utilisateurs d'exécuter des modèles d'IA directement sur leur propre matériel, sans avoir à partager leurs données avec des systèmes cloud externes. Google a également simplifié la licence d'utilisation des Gemma 4, passant à la licence Apache 2.0, bien plus permissive que les licences personnalisées des versions précédentes.

Cependant, les performances des modèles locaux restent limitées par les capacités matérielles des appareils grand public. C'est précisément dans ce contexte que les drafters MTP interviennent, offrant une solution pour contourner ces contraintes et améliorer significativement la vitesse de génération des modèles Gemma 4.

Source : Ars Technica

← Précédent

Sondage : Même les électeurs de Trump rejettent son post le représenta...

Joe Scarborough critique Trump et Vance : un parti républicain déconnecté des réalités américaines

17:09 · 15 mai 2026

Des DJ IA à l'antenne : quand l'IA échoue à gérer seule une station radio

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 mai 2026

Google renforce ses règles anti-spam pour lutter contre la manipulation de l’IA dans les résultats

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

14:00 · 15 mai 2026

Podcast Engadget : Android 17, les nouvelles fonctionnalités à ne pas manquer

We also dive into all the new features in Android 17.

12:08 · 15 mai 2026

Le fisc britannique mise sur l'IA pour lutter contre la fraude fiscale

Human staff members will still check the AI's findings.

11:00 · 15 mai 2026

L'essor de l'IA menace l'intégrité de la recherche scientifique

Last summer, Peter Degen's postdoctoral supervisor came to him with an unusual problem: One of his papers was being cited too much. Citations are the...

10:30 · 15 mai 2026

Anthropic mise à jour Claude Code : limites d'usage, transparence et stratégie produit

SAN FRANCISCO—Amid an ever-expanding array of surfaces, growing demand for tokens and compute, and a rapidly evolving user base, Anthropic doesn't hav...

06:08 · 15 mai 2026

xAI lance Grok Build, un nouvel agent de codage en version bêta

It's in early beta and only available to SuperGrok Heavy subscribers right now.

22:46 · 14 mai 2026

Honda dévoile ses nouveaux prototypes hybrides Accord et RDX pour une stratégie 2024

Honda revealed prototypes of two new hybrid models, an Accord sedan and the Acura RDX SUV, during its annual business briefing this week, built on a p...

Technologie

Google Gemma 4 : des modèles IA locaux 3 fois plus rapides grâce à la prédiction de tokens futurs

Sondage : Même les électeurs de Trump rejettent son post le représenta...

Joe Scarborough critique Trump et Vance : un parti républicain déconne...

Technologie

Google Gemma 4 : des modèles IA locaux 3 fois plus rapides grâce à la prédiction de tokens futurs

Sondage : Même les électeurs de Trump rejettent son post le représenta...

Joe Scarborough critique Trump et Vance : un parti républicain déconne...

Articles connexes

Des DJ IA à l'antenne : quand l'IA échoue à gérer seule une station radio

Google renforce ses règles anti-spam pour lutter contre la manipulation de l’IA dans les résultats

Podcast Engadget : Android 17, les nouvelles fonctionnalités à ne pas manquer

Le fisc britannique mise sur l'IA pour lutter contre la fraude fiscale

L'essor de l'IA menace l'intégrité de la recherche scientifique

Anthropic mise à jour Claude Code : limites d'usage, transparence et stratégie produit

xAI lance Grok Build, un nouvel agent de codage en version bêta

Honda dévoile ses nouveaux prototypes hybrides Accord et RDX pour une stratégie 2024