חומרה חדשנית לניצול דלילות במודלי AI: חיסכון אנרגטי של פי 70

בינה מלאכותית AI חדשנות טכנולוגית קיימות GPU מודלי שפה יעילות אנרגטית חומרה סטנפורד דלילות

מודלים גדולים, בעיות גדולות

ככל שמודלי הבינה המלאכותית גדלים, כך גדלות גם יכולותיהם – אך גם צריכת האנרגיה שלהם ועלויות ההפעלה. מודל Llama האחרון של מטא, למשל, כולל שני טריליון פרמטרים, מה שמגדיל משמעותית את דרישות החומרה ואת טביעת הרגל האקולוגית של המערכות.

למרות אזהרות מומחים לגבי החזר הולך ופוחת בביצועים כתוצאה מהגדלת המודלים, חברות ממשיכות להשיק כלים גדולים יותר. הפתרון המסורתי היה מעבר למודלים קטנים יותר או שימוש במספרים בעלי דיוק נמוך יותר, אך גישה זו מוגבלת ביכולותיה. כעת, חוקרים מציעים דרך חדשה: ניצול היעילות הטמונה בערכי האפס במודלים.

הכוח הנסתר של האפסים

ברוב המודלים, למעלה מ-50% מהפרמטרים – המשקלים והפעילויות – הם למעשה אפסים או קרובים לאפס. תופעה זו, המכונה דלילות (sparsity), מאפשרת חיסכון משמעותי בחישובים ובזיכרון. במקום לבצע פעולות חוזרות על אפסים, ניתן לדלג עליהן לחלוטין, ובמקום לאחסן אלפי אפסים, לאחסן רק את הערכים הלא-אפסיים.

עם זאת, חומרה מסורתית כמו מעבדים רב-ליבתיים ו-GPUs אינה מנצלת את הדלילות באופן מלא. כדי לממש את הפוטנציאל הזה במלואו, יש צורך בשינוי יסודי בכל שכבות התכנון: חומרה, קושחה ברמה נמוכה ותוכנה.

שבב חדש ממחקר סטנפורד: חיסכון אנרגטי של פי 70 וביצועים מהירים פי 8

צוות חוקרים מאוניברסיטת סטנפורד פיתח את השבב הראשון הידוע שמסוגל לבצע הן עומסי עבודה דלילים והן עומסים מסורתיים באופן יעיל. השבב הציג חיסכון אנרגטי ממוצע של פי 70 בהשוואה למעבדים רגילים, תוך שהוא מאיץ את החישובים בממוצע פי 8. ההישג הושג באמצעות תכנון מחדש מלא של החומרה, הקושחה והתוכנה כדי לנצל את הדלילות.

מהי דלילות ואיך היא עובדת?

דלילות מתייחסת למבנים מתמטיים כמו וקטורים, מטריצות או טנזורים, שבהם רוב הערכים הם אפסים. לדוגמה, גרף רשתות חברתיות הוא דליל מטבעו: רוב האנשים אינם מקושרים זה לזה, כך שמטריצה המייצגת קשרים בין כל המשתמשים תכיל בעיקר אפסים. דלילות יכולה להופיע באופן טבעי או להיות מושרית באמצעות טכניקות אופטימיזציה.

כאשר מערכת עובדת עם נתונים דלילים, ניתן לייעל את החישובים על ידי:

דילוג על פעולות על אפסים: הימנעות מכפל או חיבור של ערכים שאינם משפיעים על התוצאה.
אחסון יעיל: שמירה של נתונים לא-אפסיים בלבד, תוך הפחתת דרישות הזיכרון.
חומרה ייעודית: תכנון רכיבים שמזהים ומנצלים דלילות באופן אוטומטי.

עתיד ירוק יותר לבינה מלאכותית

החוקרים מקווים שהשבב החדש יהווה צעד ראשון בהתפתחות חומרה ותוכנה שתאפשר מודלי AI יעילים יותר מבחינה אנרגטית. בעוד שמרבית המערכות הנוכחיות אינן מנצלות דלילות, פיתוחים כמו זה עשויים להוביל לעידן חדש שבו גודל המודל לא יהיה גורם מגביל לצורך ביצועים גבוהים וקיימות סביבתית.

«הדרך להפוך מודלי AI לגדולים ויעילים בו זמנית עוברת דרך חומרה שתוכל לנצל את הדלילות הטבעית שלהם. זהו מפנה שיכול לחולל מהפכה בתעשייה.»

— חוקרי סטנפורד

סיכום ומגמות עתידיות

הפיתוח של שבב המנצל דלילות מצביע על כיוון חדש בתחום הבינה המלאכותית: במקום להסתמך על הגדלת מודלים, ניתן לייעל את החומרה כך שתעבוד באופן חכם יותר עם הנתונים הקיימים. מגמה זו עשויה להוביל ל:

צמצום משמעותי בצריכת האנרגיה של מערכות AI.
האצת תהליכי אימון והפעלה של מודלים גדולים.
הרחבת השימוש בבינה מלאכותית בתחומים שבהם משאבים מוגבלים, כגון מכשירים ניידים או מערכות קצה.

מקור: IEEE Spectrum

← הקודם

איך להפעיל את האירוע הסודי של הדיסקו במשחק ARC Raiders: עדכון Riven Ti...

חוזה ענק לויל אנדרסון: הטקסאנס חתמו על הסכם של 150 מיליון דולר לשלוש שנים

11:00 · 16 מאי 2026

רשות הסחורות העתידיות בארה״ב משתמשת בבינה מלאכותית למלחמה בהונאות בשווקי התחזיות

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 מאי 2026

יוטיוב מרחיבה כלי זיהוי דיפייק AI לכל משתמשי האתר הבוגרים

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 מאי 2026

הסכם זכויות היוצרים של Anthropic בסכום 1.5 מיליארד דולר נתקל בקשיים בעקבות עיכוב של שופטת

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 מאי 2026

ArXiv מטיל איסור על חוקרים המעלים מאמרים מלאי 'AI slop'

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 מאי 2026

שרת המאמרים המדעיים arXiv תאסור הגשות של תוכן מלאכותי שגוי

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 מאי 2026

OpenAI מבצעת שינויים ארגוניים נוספים בניסיון להאיץ את פיתוח סוכני הבינה המלאכותית

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 מאי 2026

תחנות רדיו בינה מלאכותית נכשלו – והראו מדוע אי אפשר לסמוך על AI לבדו

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 מאי 2026

גוגל מעדכנת את כללי הספאם: ניסיונות להשפיע על תוצאות הבינה המלאכותית ייחשבו כספאם

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

טכנולוגיה

חומרה מתקדמת יכולה להפוך מודלי AI קטנים לגיבורים ירוקים וחסכוניים

מודלים גדולים, בעיות גדולות

הכוח הנסתר של האפסים

שבב חדש ממחקר סטנפורד: חיסכון אנרגטי של פי 70 וביצועים מהירים פי 8

מהי דלילות ואיך היא עובדת?

עתיד ירוק יותר לבינה מלאכותית

סיכום ומגמות עתידיות

איך להפעיל את האירוע הסודי של הדיסקו במשחק ARC Raiders: עדכון Riven Ti...

חוזה ענק לויל אנדרסון: הטקסאנס חתמו על הסכם של 150 מיליון דולר לשלוש ש...

טכנולוגיה

חומרה מתקדמת יכולה להפוך מודלי AI קטנים לגיבורים ירוקים וחסכוניים

מודלים גדולים, בעיות גדולות

הכוח הנסתר של האפסים

שבב חדש ממחקר סטנפורד: חיסכון אנרגטי של פי 70 וביצועים מהירים פי 8

מהי דלילות ואיך היא עובדת?

עתיד ירוק יותר לבינה מלאכותית

סיכום ומגמות עתידיות

איך להפעיל את האירוע הסודי של הדיסקו במשחק ARC Raiders: עדכון Riven Ti...

חוזה ענק לויל אנדרסון: הטקסאנס חתמו על הסכם של 150 מיליון דולר לשלוש ש...

כתבות קשורות

רשות הסחורות העתידיות בארה״ב משתמשת בבינה מלאכותית למלחמה בהונאות בשווקי התחזיות

יוטיוב מרחיבה כלי זיהוי דיפייק AI לכל משתמשי האתר הבוגרים

הסכם זכויות היוצרים של Anthropic בסכום 1.5 מיליארד דולר נתקל בקשיים בעקבות עיכוב של שופטת

ArXiv מטיל איסור על חוקרים המעלים מאמרים מלאי 'AI slop'

שרת המאמרים המדעיים arXiv תאסור הגשות של תוכן מלאכותי שגוי

OpenAI מבצעת שינויים ארגוניים נוספים בניסיון להאיץ את פיתוח סוכני הבינה המלאכותית

תחנות רדיו בינה מלאכותית נכשלו – והראו מדוע אי אפשר לסמוך על AI לבדו

גוגל מעדכנת את כללי הספאם: ניסיונות להשפיע על תוצאות הבינה המלאכותית ייחשבו כספאם