Effektivare AI med sparsitet: Stanfords genombrott inom hårdvara

AI:s storlekskris: Större modeller ger allt mindre vinst

När det kommer till AI-modeller är storlek avgörande – men kanske inte på det sätt man tror. Trots varningar om att allt större språkmodeller (LLM) ger allt mindre prestandaförbättringar fortsätter företag att utveckla allt mer omfattande AI-verktyg. Metas senaste släpp av Llama-modellen har till exempel imponerande två biljoner parametrar.

När modellerna växer ökar deras förmågor, men också energiförbrukningen och beräkningstiden. Detta leder till en större klimatpåverkan. För att motverka detta har man tidigare fokuserat på mindre modeller och lägre precision i parametrarna. Men det finns ett annat sätt: att utnyttja nollorna i modellerna.

Sparsitet: Nyckeln till effektivare AI

I många AI-modeller består majoriteten av parametrarna – vikterna och aktiveringarna – av nollor eller värden så nära noll att de kan behandlas som nollor utan att påverka noggrannheten. Denna egenskap kallas sparsitet.

Sparsitet öppnar för stora beräkningsbesparingar. Istället för att slösa tid och energi på att addera eller multiplicera nollor, kan dessa beräkningar helt hoppas över. Dessutom behöver man inte lagra alla nollor i minnet – bara de icke-noll parametrarna.

Problemet är att dagens hårdvara, som flerkärniga processorer och grafikprocessorer (GPU), inte är optimerade för att utnyttja sparsitet fullt ut. För att dra full nytta av sparsitet krävs en omdesign av hela utvecklingsstacken, inklusive hårdvara, låg-nivå firmware och applikationsmjukvara.

Stanfords genombrott: Hårdvara som utnyttjar sparsitet

Forskare vid Stanford University har utvecklat den första hårdvaran som effektivt kan hantera både sparsamma och traditionella beräkningsbelastningar. Deras chip förbrukar i genomsnitt en sjundedel av energin jämfört med en CPU och utför beräkningarna åtta gånger snabbare.

För att uppnå detta har teamet byggt hårdvara, firmware och mjukvara från grunden för att dra full nytta av sparsitet. Resultatet visar potentialen för mer energieffektiv AI i framtiden.

Vad är sparsitet?

Neurala nätverk och den data som matar in dem representeras ofta som arrayer av tal. Dessa arrayer kan vara endimensionella (vektorer), tvådimensionella (matriser) eller flerdimensionella (tensorer). En spars array har huvudsakligen nollor bland sina element. När antalet nollor överstiger 50 procent av det totala antalet element kan man dra nytta av sparsitets-specifika beräkningsmetoder. Omvänt kallas en array med få nollor för tät (eng. dense).

Sparsitet kan vara naturligt förekommande eller inducerad. Till exempel är en social nätverksgraf ofta naturligt sparsam. Om varje nod representerar en person och varje kant en vänskap, kommer matrisen som representerar alla möjliga kanter huvudsakligen bestå av nollor, eftersom de flesta människor inte är vänner med varandra.

Andra tillämpningar av AI, som bildigenkänning eller rekommendationssystem, kan också dra nytta av sparsitet. Genom att medvetet skapa sparsamma strukturer kan man effektivisera beräkningar och minska minnesanvändningen.

"Vår forskning visar att det är möjligt att utveckla hårdvara som utnyttjar sparsitet fullt ut. Detta kan leda till en ny era av energieffektiv AI, där prestanda och hållbarhet går hand i hand."

Framtidens AI: Mindre resurser, mer effektivitet

Stanfords genombrott är bara början. Genom att omdesigna hårdvara och mjukvara för att dra nytta av sparsitet kan AI-modeller bli både snabbare och mer energieffektiva. Detta öppnar för möjligheten att utveckla avancerade AI-system utan att öka den miljömässiga påverkan.

Framtiden för AI ligger kanske inte i att göra modellerna större, utan i att göra dem smartare – och det börjar med hårdvaran.

Källa: IEEE Spectrum

← Föregående

Så löser du Disco-evenemangets påskägg i ARC Raiders: Riven Tides

Nästa →

Will Anderson blir NFL:s högst betalda icke-kvartback tack vare ny 150...

22:25 · 15 maj 2026

YouTube inför AI-verktyg för att upptäcka deepfakes för alla vuxna användare

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maj 2026

Anthropic och $1,5 miljarders upphovsrättsavtal i gungning – domare stoppar godkännande

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maj 2026

ArXiv inför stränga regler mot AI-genererade forskningsartiklar

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maj 2026

arXiv förbjuder inskick av AI-genererad forskning med felaktigheter

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maj 2026

OpenAI:s omorganisation för att vinna AI-agentkriget – Brockman tar ledarroll

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 maj 2026

AI-drivna radiostationer misslyckas med att tjäna pengar – experiment avslöjar riskerna

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 maj 2026

Google skärper mot spammare som försöker manipulera AI-sökresultat

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

14:00 · 15 maj 2026

Android 17: De nya funktionerna som gör Google Books överflödigt

We also dive into all the new features in Android 17.

Teknik

Mindre kan bli mer: Hårdvara banar väg för effektivare AI-modeller

AI:s storlekskris: Större modeller ger allt mindre vinst

Sparsitet: Nyckeln till effektivare AI

Stanfords genombrott: Hårdvara som utnyttjar sparsitet

Vad är sparsitet?

Framtidens AI: Mindre resurser, mer effektivitet

Så löser du Disco-evenemangets påskägg i ARC Raiders: Riven Tides

Will Anderson blir NFL:s högst betalda icke-kvartback tack vare ny 150...

Teknik

Mindre kan bli mer: Hårdvara banar väg för effektivare AI-modeller

AI:s storlekskris: Större modeller ger allt mindre vinst

Sparsitet: Nyckeln till effektivare AI

Stanfords genombrott: Hårdvara som utnyttjar sparsitet

Vad är sparsitet?

Framtidens AI: Mindre resurser, mer effektivitet

Så löser du Disco-evenemangets påskägg i ARC Raiders: Riven Tides

Will Anderson blir NFL:s högst betalda icke-kvartback tack vare ny 150...

Relaterade artiklar

YouTube inför AI-verktyg för att upptäcka deepfakes för alla vuxna användare

Anthropic och $1,5 miljarders upphovsrättsavtal i gungning – domare stoppar godkännande

ArXiv inför stränga regler mot AI-genererade forskningsartiklar

arXiv förbjuder inskick av AI-genererad forskning med felaktigheter

OpenAI:s omorganisation för att vinna AI-agentkriget – Brockman tar ledarroll

AI-drivna radiostationer misslyckas med att tjäna pengar – experiment avslöjar riskerna

Google skärper mot spammare som försöker manipulera AI-sökresultat

Android 17: De nya funktionerna som gör Google Books överflödigt