Gemma 4 da Google ganha 3x mais velocidade com previsão de tokens futuros

inteligência artificial Google tecnologia de IA modelos de linguagem IA local Gemma 4 MTP drafters Edge AI

O Google lançou os modelos de IA Gemma 4 na primavera deste ano, prometendo um novo patamar de poder e desempenho para inteligência artificial local. Agora, a empresa apresenta uma atualização que pode tornar esses modelos ainda mais rápidos: os Multi-Token Prediction (MTP) drafters para o Gemma.

Segundo o Google, esses modelos experimentais utilizam uma forma de decodificação especulativa para antecipar tokens futuros, acelerando significativamente a geração de respostas em comparação ao método tradicional de geração sequencial de tokens.

Tecnologia por trás do Gemma 4

Os modelos mais recentes do Gemma são construídos com a mesma tecnologia que alimenta o Gemini, o avançado sistema de IA do Google. No entanto, o Gemma 4 é otimizado para rodar localmente, em vez de depender de clusters massivos de TPUs (Tensor Processing Units) da empresa.

O Gemini é projetado para operar em chips TPU personalizados, conectados por redes ultrarrápidas e com memória de alta capacidade. Já o Gemma 4 pode ser executado em um único acelerador de IA de alta potência, em precisão total, ou até mesmo em uma GPU convencional, graças à técnica de quantização.

Vantagens da execução local

Uma das principais vantagens do Gemma 4 é permitir que usuários executem modelos de IA diretamente em seus próprios hardwares, sem a necessidade de compartilhar dados com sistemas de nuvem de terceiros. Além disso, o Google alterou a licença do Gemma 4 para Apache 2.0, muito mais permissiva do que as licenças anteriores, facilitando o uso e a modificação pelos desenvolvedores.

Limitações e a solução MTP

Apesar dos avanços, a maioria dos usuários ainda enfrenta limitações de hardware para rodar modelos de IA localmente. É aí que entram os MTP drafters, que prometem contornar esse problema ao prever múltiplos tokens de uma só vez, reduzindo o tempo de resposta e melhorando a eficiência.

Com essa inovação, o Google reforça seu compromisso em democratizar o acesso à IA avançada, tornando-a mais rápida e acessível para desenvolvedores e entusiastas.

Fonte: Ars Technica

← Anterior

Eleitores de Trump rejeitam imagem dele como Jesus em nova pesquisa

Joe Scarborough critica Trump e Vance por 'desconectados' com realidade após promessas quebradas

00:12 · 16 maio 2026

Snap e YouTube fecham acordo em novo processo por vício em redes sociais

The companies are facing numerous other legal challenges.

22:25 · 15 maio 2026

YouTube amplia ferramenta de detecção de deepfakes para todos os usuários adultos

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maio 2026

Justiça dos EUA adia acordo bilionário da Anthropic por suspeitas de irregularidades

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maio 2026

ArXiv proíbe pesquisadores que publicarem artigos com conteúdo gerado por IA sem revisão

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maio 2026

Servidor de pré-prints arXiv proíbe submissões com 'alucinações' geradas por IA

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maio 2026

OpenAI reorganiza lideranças para focar em agentes de IA e unificar plataformas

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 maio 2026

Experimentos com DJs de IA mostram riscos de confiar apenas em inteligência artificial

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 maio 2026

Google atualiza regras contra spam e manipulação de IA em resultados de busca

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

Tecnologia

Google acelera Gemma 4 com nova técnica que prevê tokens futuros

Tecnologia por trás do Gemma 4

Vantagens da execução local

Limitações e a solução MTP

Eleitores de Trump rejeitam imagem dele como Jesus em nova pesquisa

Joe Scarborough critica Trump e Vance por 'desconectados' com realidad...

Tecnologia

Google acelera Gemma 4 com nova técnica que prevê tokens futuros

Tecnologia por trás do Gemma 4

Vantagens da execução local

Limitações e a solução MTP

Eleitores de Trump rejeitam imagem dele como Jesus em nova pesquisa

Joe Scarborough critica Trump e Vance por 'desconectados' com realidad...

Artigos relacionados

Snap e YouTube fecham acordo em novo processo por vício em redes sociais

YouTube amplia ferramenta de detecção de deepfakes para todos os usuários adultos

Justiça dos EUA adia acordo bilionário da Anthropic por suspeitas de irregularidades

ArXiv proíbe pesquisadores que publicarem artigos com conteúdo gerado por IA sem revisão

Servidor de pré-prints arXiv proíbe submissões com 'alucinações' geradas por IA

OpenAI reorganiza lideranças para focar em agentes de IA e unificar plataformas

Experimentos com DJs de IA mostram riscos de confiar apenas em inteligência artificial

Google atualiza regras contra spam e manipulação de IA em resultados de busca