Nye hardwareløsninger for energieffektiv AI: Sparsomhet som nøkkelen

AI maskinlæring hardware energieffektivitet sparsomhet Stanford

AI-modeller vokser – men effektiviteten må følge med

Størrelse betyr fortsatt mye når det gjelder AI-modeller. Selv om eksperter advarer om at stadig større språkmodeller (LLM) gir mindre ytelsesgevinst per ekstra parameter, lanserer selskaper likevel stadig større AI-verktøy. Meta nylig sluppet sin Llama-modell med hele 2 billioner parametere.

Ettersom modellene blir større, øker både kapasiteten og energibehovet. Lange beregningstider og høyt strømforbruk gir større klimafotavtrykk. For å motvirke dette har utviklere i stedet begynt å bruke mindre og mindre presise modeller, samt redusere nøyaktigheten på parameterne.

Sparsomhet i AI-modeller kan revolusjonere effektiviteten

En mer lovende tilnærming er å utnytte at de fleste parameterne i store AI-modeller egentlig er null – eller så nær null at de kan behandles som det uten tap av nøyaktighet. Dette kalles sparsomhet.

Ved å ignorere nuller i beregninger og lagring kan man spare betydelig tid og energi. I stedet for å utføre unødvendige operasjoner med nuller, kan man hoppe over dem. I stedet for å lagre tusenvis av nuller, holder man bare på de ikke-null parameterne.

Problemet er at dagens standardhardware, som flerkjernede CPUer og GPUer, ikke er designet for å utnytte sparsomhet effektivt. For å få full gevinst av sparsomhet må hele designkjeden omtenkes – fra hardware og firmware til programvare.

Stanford-forskere utvikler ny hardware for sparsomme AI-modeller

Forskere ved Stanford University har nå laget det de mener er den første hardwareløsningen som effektivt kan håndtere både tradisjonelle og sparsomme beregninger. Resultatene var slående: På gjennomsnittlig basis brukte brikken bare 1/70 av energien til en CPU, samtidig som den utførte beregningene åtte ganger raskere.

For å oppnå dette måtte forskerne bygge hardware, firmware og programvare fra grunnen av med sparsomhet i fokus. De håper dette er starten på en ny æra med energieffektiv AI-utvikling.

Hva er sparsomhet?

AI-modeller og dataene de trenes på representeres som tallmatriser – enten som vektorer, matriser eller høyere-dimensjonale strukturer kalt tensorer. En sparsom struktur inneholder hovedsakelig nuller, mens en tett struktur har få nuller.

Sparsomhet kan enten være naturlig til stede eller kunstig fremkalt. Et eksempel på naturlig sparsomhet er sosiale medier-grafer, der de fleste brukerne ikke er venner med hverandre. En matrise som representerer alle mulige vennskap vil derfor bestå av nesten bare nuller.

Andre AI-applikasjoner, som bildegjenkjenning eller anbefalingssystemer, kan også dra nytte av sparsomhet for å effektivisere beregningene.

Fremtidens AI krever nytenkning

Selv om sparsomhet ikke er en ny idé, har mangelen på riktig hardware hindret utnyttelsen av potensialet. Med nye brikker som den fra Stanford kan AI-modeller bli både raskere og mer energieffektive – uten å gå på bekostning av ytelse.

Forskerne understreker at dette bare er begynnelsen. Med videreutvikling av hardware og modeller kan vi se en ny generasjon AI-systemer som er både kraftfulle og miljøvennlige.

Kilde: IEEE Spectrum

← Forrige

Slik løser du Disco-easter egg i ARC Raiders: Riven Tides

Neste →

Will Anderson blir NFLs best betalte forsvarsspiller – her er detaljen...

22:25 · 15 mai 2026

YouTube utvider AI-verktøy mot deepfakes til alle voksne brukere

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 mai 2026

Anthropic-kontroversen: Dommer utsetter $1,5 milliarder-kopiavtale

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 mai 2026

ArXiv innfører forbud mot forskere som publiserer AI-generert sladder

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 mai 2026

arXiv innfører forbud mot AI-generert innhold med feil

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 mai 2026

OpenAI omorganiserer igjen – Brockman tar styringen i kampen om AI-agenter

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 mai 2026

AI-drevne radioverter viser hvorfor de ikke kan styre seg selv

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

16:42 · 15 mai 2026

Google strammer regelverket: AI-manipulering i søkeresultater blir regnet som spam

Google updated its spam policy to mark attempts to "manipulate" its AI model in search results as spam, including results in AI Overview or AI Mode in...

14:00 · 15 mai 2026

Podkast fra Engadget: Hvem trenger egentlig Google Books?

We also dive into all the new features in Android 17.

Teknologi

Nye hardwareløsninger kan gjøre AI-modeller mer effektive og miljøvennlige

AI-modeller vokser – men effektiviteten må følge med

Sparsomhet i AI-modeller kan revolusjonere effektiviteten

Stanford-forskere utvikler ny hardware for sparsomme AI-modeller

Hva er sparsomhet?

Fremtidens AI krever nytenkning

Slik løser du Disco-easter egg i ARC Raiders: Riven Tides

Will Anderson blir NFLs best betalte forsvarsspiller – her er detaljen...

Teknologi

Nye hardwareløsninger kan gjøre AI-modeller mer effektive og miljøvennlige

AI-modeller vokser – men effektiviteten må følge med

Sparsomhet i AI-modeller kan revolusjonere effektiviteten

Stanford-forskere utvikler ny hardware for sparsomme AI-modeller

Hva er sparsomhet?

Fremtidens AI krever nytenkning

Slik løser du Disco-easter egg i ARC Raiders: Riven Tides

Will Anderson blir NFLs best betalte forsvarsspiller – her er detaljen...

Relaterte artikler

YouTube utvider AI-verktøy mot deepfakes til alle voksne brukere

Anthropic-kontroversen: Dommer utsetter $1,5 milliarder-kopiavtale

ArXiv innfører forbud mot forskere som publiserer AI-generert sladder

arXiv innfører forbud mot AI-generert innhold med feil

OpenAI omorganiserer igjen – Brockman tar styringen i kampen om AI-agenter

AI-drevne radioverter viser hvorfor de ikke kan styre seg selv

Google strammer regelverket: AI-manipulering i søkeresultater blir regnet som spam

Podkast fra Engadget: Hvem trenger egentlig Google Books?