גוגל מרחיבה את יכולות Gemma 4 עם מנגנון חדשני להאצת ביצועים

גוגל השיקה באביב האחרון את מודלי הבינה המלאכותית Gemma 4 המיועדים להפעלה מקומית, והם כעת זוכים לשדרוג מהירות משמעותי באמצעות מנגנון חדש בשם Multi-Token Prediction (MTP). הטכנולוגיה החדשה מאפשרת למודלים לחזות אסטרטגית אספקטים עתידיים של הטקסט, ובכך לקצר משמעותית את זמן התגובה בהשוואה לשיטות המסורתיות של יצירת אספקטים באופן סדרתי.

איך עובד המנגנון החדש?

ה-MTP פועל באמצעות מנגנון של decoding ספקולטיבי, שבו המודל מנסה לנחש מספר אספקטים עתידיים בו-זמנית במקום ליצור אותם אחד אחרי השני. גישה זו מפחיתה את מספר הפעולות הנדרשות ומזרזת את תהליך יצירת הטקסט. ההאצה מוערכת בכ-300% בהשוואה לשיטות המסורתיות, מה שהופך את המודלים למתאימים יותר לשימוש מקומי על גבי חומרה צרכנית.

הבסיס הטכנולוגי וההבדלים מ-Gemini

מודלי Gemma 4 מבוססים על אותה טכנולוגיה העומדת בבסיס מודלי הבינה המלאכותית המתקדמים ביותר של גוגל, Gemini. עם זאת, בעוד ש-Gemini מותאם במיוחד לפעולה על שבבי TPU מתקדמים של גוגל הפועלים באשכולות עצומים עם זיכרון ומהירות תקשורת גבוהים, Gemma 4 מותאם להפעלה מקומית על גבי חומרה צרכנית.

גודל המודל הגדול ביותר של Gemma 4 יכול לרוץ במלואו על מאיץ AI יחיד בעל ביצועים גבוהים, ואילו גרסאות מקווצות מאפשרות הפעלה גם על גבי כרטיסי גרפיקה צרכניים. יכולת זו מאפשרת למשתמשים לבצע עיבוד מקומי של נתונים ללא צורך בהעלאתם לענן, ובכך לשמור על פרטיותם.

שינוי ברישיון והגבלות טכניות

גוגל שינתה את רישיון השימוש ב-Gemma 4 לרישיון Apache 2.0, שהוא רישיון פתוח ומאפשר שימושים נרחבים יותר בהשוואה לרישיונות המוגבלים ששימשו בגרסאות קודמות. שינוי זה מאפשר למפתחים ולמשתמשים להתאים ולשנות את המודלים בהתאם לצרכיהם.

עם זאת, קיימות מגבלות טכניות הנובעות מהחומרה הזמינה למשתמשים פרטיים. רוב החומרה הצרכנית אינה מסוגלת להתמודד עם דרישות החישוב הגבוהות של מודלי בינה מלאכותית מתקדמים, מה שמגביל את ביצועי המודלים המקומיים. כאן נכנס לתמונה המנגנון החדש MTP, שמאפשר האצה משמעותית גם על גבי חומרה מוגבלת יחסית.

יתרונות מרכזיים של Gemma 4 עם MTP:

  • מהירות גבוהה פי 3: הפחתת זמן התגובה בעד 300% הודות לחיזוי אספקטים עתידיים.
  • שימוש מקומי: אפשרות להפעיל מודלים מקומיים ללא צורך בענן, תוך שמירה על פרטיות הנתונים.
  • גמישות רישוי: רישיון Apache 2.0 מאפשר שימושים נרחבים יותר ופיתוח מותאם אישית.
  • תאימות לחומרה צרכנית: יכולת ריצה על כרטיסי גרפיקה סטנדרטיים לאחר קווצה מתאימה.

עתיד הבינה המלאכותית המקומית

השדרוגים החדשים ב-Gemma 4, ובמיוחד המנגנון MTP, מהווים צעד חשוב לקראת הפיכת הבינה המלאכותית המקומית לנגישה ויעילה יותר עבור משתמשים פרטיים ועסקיים כאחד. גוגל ממשיכה לחדש בתחום זה, תוך התמקדות בשיפור ביצועים והפחתת תלות בענן.

"הטכנולוגיה החדשה מאפשרת למשתמשים ליהנות מביצועים גבוהים יותר מבלי לוותר על פרטיותם או על גמישות השימוש." — דובר גוגל

עם השקת המנגנון החדש, גוגל מרחיבה את היכולות של Gemma 4 ומקדמת את השימוש בבינה מלאכותית מקומית כאופציה בת קיימא ויעילה עבור מגוון רחב של יישומים.

מקור: Ars Technica