구글 Gemma 4 AI 모델, MTP 드라프터로 속도 3배 향상

AI 모델 로컬 AI 구글 Gemma 4 MTP 드라프터 Apache 2.0

구글이 올해 봄 출시한 Gemma 4 오픈 모델이 Multi-Token Prediction(MTP) 드라프터 도입으로 AI 생성 속도를 획기적으로 개선했다고 밝혔다. 실험용 MTP 드라프터는Gemini AI의 핵심 기술인 사pekulative decoding(추측 디코딩)을 활용해 미래 토큰을 예측하는 방식으로, 기존 방식보다 훨씬 빠른 AI 응답을 가능하게 한다.

Gemma 4는 구글의 최신 AI 모델 Gemma의 후속작으로,Gemini와 동일한 기술 기반이지만 로컬 환경에 최적화되어 있다.Gemini는 TPU 칩과 대규모 클러스터에서 구동되지만, Gemma 4는 개별 사용자의 하드웨어에서도 구동 가능하도록 설계되었다.고성능 AI 가속기에서는 Gemma 4의 최대 모델을 정밀도로 실행할 수 있으며, 양자화(quantizing)를 통해 소비자용 GPU에서도 구동이 가능하다.

로컬 AI 혁신: 데이터 프라이버시와 접근성 향상

Gemma 4는 사용자가 데이터를 클라우드 AI에 업로드하지 않고도 로컬 장치에서 AI 모델을 직접 실행할 수 있도록 지원한다.이는 데이터 프라이버시 보호와 동시에 로컬 AI 활용의 장벽을 낮추는 데 중점을 두고 있다.또한Gemma 4는 이전 버전과 달리 Apache 2.0 라이선스로 전환되어 개발자 커뮤니티의 참여와 재사용이 용이해졌다.

MTP 드라프터: AI 생성 속도의 새로운 기준

MTP 드라프터는Gemma 4 모델의 AI 생성 프로세스를 혁신하는 핵심 기술이다.기존에는 AI가 한 번에 하나의 토큰을 생성하는 방식이었지만,MTP는 여러 개의 미래 토큰을 동시에 예측하여 생성 속도를 3배까지 가속시킨다.이는Gemini의 TPU 기반 최적화와는 달리, 로컬 환경에서도 높은 효율성을 발휘하도록 설계되었다.

구글은 Gemma 4의 MTP 드라프터가 로컬 AI 모델의 성능 한계를 극복하는 데 기여할 것으로 기대하고 있다.특히Gemma 4는Gemini의 기술적 기반을 공유하지만, 로컬 환경에 맞게 최적화되어 있어 개발자와 연구자들에게 새로운 가능성을 제시할 것으로 보인다.

출처: Ars Technica

← 이전

트럼프 지지자들도 거부한 ‘예수 Cristo’ 이미지, 종교 정치화 한계 드러내

20:38 · 15 5월 2026

아카이브, AI로 생성된 ‘슬롭’ 논문 제출 연구자 제재 강화

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 5월 2026

아카이브 arXiv, AI 허위 생성물 제출자에 대해 제재 강화

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 5월 2026

OpenAI, AI 에이전트 경쟁력 강화 위해 조직 개편…브록먼 대표 제품 총괄

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 5월 2026

AI 라디오 DJ 실험 실패…자율 운영 20분 만에 돈 바닥

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 5월 2026

구글, AI 검색 결과 조작 시도도 스팸으로 규정하는 정책 개정

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

14:00 · 15 5월 2026

구글북스 없이도 살아남는 법? 엔가젯 팟캐스트가 알려준다

We also dive into all the new features in Android 17.

12:08 · 15 5월 2026

영국 세무청, AI 도입으로 세금 사기 적발 강화

Human staff members will still check the AI's findings.

11:00 · 15 5월 2026

AI 논문 급증으로 과학계 혼란…'과도한 인용' 문제 심각

Last summer, Peter Degen's postdoctoral supervisor came to him with an unusual problem: One of his papers was being cited too much. Citations are the...

기술

구글 Gemma 4 AI 모델, 'MTP 드라프터'로 속도 3배 향상

로컬 AI 혁신: 데이터 프라이버시와 접근성 향상

MTP 드라프터: AI 생성 속도의 새로운 기준

트럼프 지지자들도 거부한 ‘예수 Cristo’ 이미지, 종교 정치화 한계 드러내

‘모닝조’ 스칼버로, 트럼프·밴스 ‘일반 시민과 유리된 정치인’ 비판

기술

구글 Gemma 4 AI 모델, 'MTP 드라프터'로 속도 3배 향상

로컬 AI 혁신: 데이터 프라이버시와 접근성 향상

MTP 드라프터: AI 생성 속도의 새로운 기준

트럼프 지지자들도 거부한 ‘예수 Cristo’ 이미지, 종교 정치화 한계 드러내

‘모닝조’ 스칼버로, 트럼프·밴스 ‘일반 시민과 유리된 정치인’ 비판

관련 기사

아카이브, AI로 생성된 ‘슬롭’ 논문 제출 연구자 제재 강화

아카이브 arXiv, AI 허위 생성물 제출자에 대해 제재 강화

OpenAI, AI 에이전트 경쟁력 강화 위해 조직 개편…브록먼 대표 제품 총괄

AI 라디오 DJ 실험 실패…자율 운영 20분 만에 돈 바닥

구글, AI 검색 결과 조작 시도도 스팸으로 규정하는 정책 개정

구글북스 없이도 살아남는 법? 엔가젯 팟캐스트가 알려준다

영국 세무청, AI 도입으로 세금 사기 적발 강화

AI 논문 급증으로 과학계 혼란…'과도한 인용' 문제 심각