La construction massive de data centers consomme une part importante des composants électroniques haut de gamme, en particulier les puces processeurs et mémoires. Cette demande exerce une pression sur les fabricants d'appareils grand public, qui peinent à s'approvisionner en puces, même si les serveurs IA et les smartphones utilisent des types de puces distincts.

La différence fondamentale réside dans les besoins spécifiques de chaque secteur. Les smartphones et les PC nécessitent des puces optimisées pour une faible consommation d'énergie, une gestion thermique efficace et une intégration compacte. En revanche, les data centers dédiés à l'IA, comme ceux exécutant des modèles de langage avancés, exigent une puissance de calcul maximale, une bande passante mémoire élevée et un débit de stockage optimisé.

Pour répondre à ces exigences, les appareils grand public s'appuient souvent sur des systèmes sur puce (SoC), combinant traitement et stockage, associés à de la mémoire vive (DRAM) et de la mémoire non volatile (NAND). À l'inverse, les serveurs IA privilégient les unités de traitement graphique (GPU) ou d'autres processeurs accélérateurs, couplés à des mémoires haute bande passante.

Pourquoi les appareils grand public manquent-ils de puces ?

Cette pénurie s'explique par la nature même du marché des semi-conducteurs : sa concentration extrême, ses coûts prohibitifs et sa sensibilité aux cycles économiques. L'IA ne remplace pas les appareils grand public, mais elle réorganise le marché en redéfinissant les priorités pour les caractéristiques des puces. Les data centers attirent désormais les investissements et les capacités de production limitées vers les processeurs accélérateurs et les mémoires haute bande passante, ainsi que vers les équipements électroniques associés.

Un marché dominé par quelques acteurs

L'industrie des semi-conducteurs fonctionne davantage comme un oligopole stratifié que comme un marché concurrentiel classique. L'échelle de production est cruciale : les leaders peuvent réinvestir dans la R&D, améliorer leurs rendements, sécuriser des équipements haut de gamme et renforcer leurs relations clients.

Par exemple, les concepteurs de GPU comme NVIDIA, qui détient 85 % de parts de marché, dépendent des fonderies avancées comme TSMC (plus de 70 % de parts de marché), elles-mêmes équipées de machines de lithographie extrême ultraviolet (EUV) fournies par ASML, un quasi-monopole. De même, la production de mémoires est dominée par un petit nombre d'acteurs : Samsung, Micron et SK Hynix se partagent la majorité du marché.

Les cycles de développement longs, les coûts fixes exorbitants et la nécessité de maintenir une avance technologique renforcent cette concentration au fil du temps.

L'impact des cycles de surcapacité et de pénurie

Depuis 2000, l'industrie des mémoires a connu plusieurs phases de surcapacité et de pénurie : l'éclatement de la bulle Internet, le surplus de 2007-2009, la consolidation des années 2010, le ralentissement sévère de 2022-2023 et, plus récemment, la tension liée à l'IA en 2024-2025. Ces fluctuations ont conduit à une concentration accrue du secteur et à une réticence des fabricants à augmenter leurs capacités de production.

Les usines de fabrication de puces (fabs) fonctionnent souvent à pleine capacité, voire au-delà, en raison des coûts prohibitifs d'exploitation. Cette situation limite la flexibilité du marché et aggrave les pénuries lorsque la demande explose, comme c'est le cas actuellement avec l'essor de l'IA.