Nowe układy scalone rewolucjonizują AI – oszczędność energii do 70% i 8-krotne przyspieszenie

sztuczna inteligencja AI badania naukowe energooszczędność układy scalone rzadkość w AI

Problem rosnących modeli AI

W świecie sztucznej inteligencji wielkość modelu ma znaczenie. Mimo ostrzeżeń ekspertów, że powiększanie dużych modeli językowych (LLM) przynosi coraz mniejsze korzyści, firmy nadal wprowadzają na rynek coraz większe narzędzia AI. Najnowsza wersja modelu Llama od Meta liczy aż 2 biliony parametrów.

Wraz ze wzrostem modeli rośnie ich wydajność, ale także zapotrzebowanie na energię oraz czas potrzebny do ich uruchomienia. To z kolei zwiększa ślad węglowy. Aby przeciwdziałać temu problemowi, sięga się po mniejsze modele lub stosuje liczby o niższej precyzji. Istnieje jednak alternatywny sposób: wykorzystanie zer w dużych modelach AI.

Potencjał rzadkości w modelach AI

W wielu modelach większość parametrów – wag i aktywacji – to zera lub wartości tak bliskie zeru, że można je uznać za nieistotne bez utraty dokładności. Zjawisko to nazywane jest rzadkością (sparsity). Pozwala ono na oszczędności obliczeniowe: zamiast marnować czas i energię na dodawanie lub mnożenie zer, można pominąć te operacje. Zamiast przechowywać wiele zer w pamięci, wystarczy zapisać tylko niezerowe parametry.

Problem w tym, że współczesne układy scalone, takie jak wielordzeniowe procesory CPU czy karty graficzne GPU, nie są przystosowane do efektywnego wykorzystania rzadkości. Aby w pełni ją wykorzystać, konieczna jest przebudowa całego stosu technologicznego – od sprzętu, przez firmware, aż po oprogramowanie aplikacyjne.

Przełomowe rozwiązanie z Uniwersytetu Stanforda

Naukowcy z Uniwersytetu Stanforda opracowali pierwsze (według ich wiedzy) układy scalone zdolne do efektywnego przetwarzania zarówno rzadkich, jak i tradycyjnych obciążeń obliczeniowych. Testy wykazały, że nowy chip zużywa średnio 70 razy mniej energii niż procesor CPU, a obliczenia wykonuje średnio osiem razy szybciej.

Osiągnięcie to wymagało całkowitego przeprojektowania sprzętu, niskopoziomowego oprogramowania układowego i oprogramowania aplikacyjnego, aby w pełni wykorzystać potencjał rzadkości. Badacze mają nadzieję, że to dopiero początek rozwoju energooszczędnych rozwiązań w dziedzinie AI.

Czym jest rzadkość w modelach AI?

Sieci neuronowe i dane, którymi są zasilane, reprezentowane są jako tablice liczb. Mogą to być wektory (tablice jednowymiarowe), macierze (tablice dwuwymiarowe) lub tensory (tablice wielowymiarowe). Rzadka macierz, wektor lub tensor charakteryzuje się tym, że większość jego elementów to zera. Im więcej zer, tym większe korzyści z metod obliczeniowych dostosowanych do rzadkości. W przeciwieństwie do rzadkości, gęste struktury danych zawierają niewiele zer w porównaniu z całkowitą liczbą elementów.

Rzadkość może występować naturalnie lub być indukowana. Przykładem naturalnej rzadkości jest graf sieci społecznościowej. Każdy węzeł reprezentuje osobę, a krawędzie – znajomości. Ponieważ większość osób nie zna się nawzajem, macierz przedstawiająca wszystkie możliwe połączenia będzie w większości wypełniona zerami.

„Rzadkość to klucz do bardziej efektywnych obliczeń w AI. Dzięki niej możemy znacząco ograniczyć zużycie energii i przyspieszyć działanie modeli, nie tracąc przy tym na jakości.”

Przyszłość energooszczędnej AI

Opracowanie nowego układu scalonego to dopiero początek. Aby w pełni wykorzystać potencjał rzadkości, konieczna jest współpraca między inżynierami, badaczami i producentami sprzętu. Przyszłość AI może należeć do modeli, które będą nie tylko potężne, ale także energooszczędne.

Źródło: IEEE Spectrum

← Poprzedni

Jak odblokować sekretny easter egg z dyskoteką w ARC Raiders: Riven Ti...

Następny →

Will Anderson Jr. najlepiej opłacanym obrońcą NFL niebędącym rozgrywaj...

15:37 · 16 maja 2026

Sony tłumaczy, jak działa asystent AI w aparacie Xperia 1 XIII

The variety of terrible is impressive. After Sony drew some unwanted attention for a post demonstrating its AI Camera Assistant on the Xperia 1 XIII,...

11:00 · 16 maja 2026

USA inwestuje w AI, aby zwalczać manipulacje na rynkach predykcyjnych

For most of the past year, it looked like prediction markets had kicked off a new golden age of fraud. On Polymarket, traders raked in fortunes from s...

22:25 · 15 maja 2026

YouTube udostępnia narzędzie do wykrywania deepfake’ów dla wszystkich dorosłych użytkowników

YouTube is expanding its AI likeness detection program to all users over the age of 18 - meaning just about anyone can have the platform hunt for pote...

21:51 · 15 maja 2026

Sąd odrzuca gigantyczną ugodę Anthropic o 1,5 mld dolarów za naruszenia praw autorskich

After several authors and class members raised objections to Anthropic's $1.5 billion settlement over its widespread book piracy to train AI, a federa...

20:38 · 15 maja 2026

ArXiv wprowadza surowe kary za „AI slop” — zakaz publikacji na rok

ArXiv, a popular platform for preprint academic research, is taking a new step to attempt to reduce the volume of papers that include AI slop. If a pa...

18:25 · 15 maja 2026

Serwer preprintów arXiv wprowadza surowe kary za fałszywe treści AI

AI-generated slop has shown up everywhere, including in the peer-reviewed literature. Fake citations, unedited prompt responses, and nonsensical diagr...

18:21 · 15 maja 2026

OpenAI reorganizuje struktury, aby przyspieszyć prace nad AI agentami

OpenAI announced yet another reorganization Friday, consolidating certain areas and making company president Greg Brockman the official lead of all th...

17:09 · 15 maja 2026

AI jako prezenterzy radiowi: eksperyment Andon Labs pokazuje zagrożenia sztucznej inteligencji

AI radio DJs demonstrated their volatile personalities. | Image: Cath Virginia / The Verge, Getty Images Andon Labs has been running a series of exper...

Technologia

Nowe układy scalone mogą zrewolucjonizować działanie modeli AI

Problem rosnących modeli AI

Potencjał rzadkości w modelach AI

Przełomowe rozwiązanie z Uniwersytetu Stanforda

Czym jest rzadkość w modelach AI?

Przyszłość energooszczędnej AI

Jak odblokować sekretny easter egg z dyskoteką w ARC Raiders: Riven Ti...

Will Anderson Jr. najlepiej opłacanym obrońcą NFL niebędącym rozgrywaj...

Technologia

Nowe układy scalone mogą zrewolucjonizować działanie modeli AI

Problem rosnących modeli AI

Potencjał rzadkości w modelach AI

Przełomowe rozwiązanie z Uniwersytetu Stanforda

Czym jest rzadkość w modelach AI?

Przyszłość energooszczędnej AI

Jak odblokować sekretny easter egg z dyskoteką w ARC Raiders: Riven Ti...

Will Anderson Jr. najlepiej opłacanym obrońcą NFL niebędącym rozgrywaj...

Powiązane artykuły

Sony tłumaczy, jak działa asystent AI w aparacie Xperia 1 XIII

USA inwestuje w AI, aby zwalczać manipulacje na rynkach predykcyjnych

YouTube udostępnia narzędzie do wykrywania deepfake’ów dla wszystkich dorosłych użytkowników

Sąd odrzuca gigantyczną ugodę Anthropic o 1,5 mld dolarów za naruszenia praw autorskich

ArXiv wprowadza surowe kary za „AI slop” — zakaz publikacji na rok

Serwer preprintów arXiv wprowadza surowe kary za fałszywe treści AI

OpenAI reorganizuje struktury, aby przyspieszyć prace nad AI agentami

AI jako prezenterzy radiowi: eksperyment Andon Labs pokazuje zagrożenia sztucznej inteligencji