Les datacenters d’intelligence artificielle sont sur le point d’atteindre leurs limites.
Pour répondre à la demande croissante, les fabricants de puces comme Nvidia Corp. produisent des puces toujours plus puissantes, ce qui nécessite une nouvelle génération de centres de données qui consommeront beaucoup plus d'énergie que leurs prédécesseurs.
La consommation électrique effrénée, alimentée par les « usines d’IA » qui engloutissent suffisamment d’énergie pour alimenter des millions de foyers en courant, menace d’exercer une pression accrue sur les prix de l’électricité aux États-Unis, d’augmenter l’empreinte carbone de l’IA – et potentiellement de ralentir le boom de l’IA.
Les réactions politiques contre les centres de données créent déjà des frictions, et les dirigeants de l’industrie mettent en garde contre une autre contrainte plus fondamentale : les limites de la production d’électricité.
« Très bientôt, peut-être même plus tard cette année, nous produirons plus de puces que nous ne pouvons en allumer », ont déclaré Elon Musk, PDG de Tesla Inc. et de SpaceX, plus tôt cette année.
La demande continue cependant de croître. On s’attend à ce que les pénuries d’énergie se répercutent sur le développement de l’IA, ce qui laisse penser que les pénuries d’énergie pourraient devenir l’un des principaux freins à la croissance de l’IA.
Cette crise oblige les principaux acteurs de l’IA à rendre des comptes : les hyperscalers, les opérateurs de centres de données, les fabricants de puces et les producteurs d’équipements électriques. À mesure qu’ils évoluent, ils doivent réinventer la façon dont les centres de données sont conçus, construits et alimentés.
Les centres de données traditionnels qui prennent en charge des services tels que le stockage dans le cloud, le commerce électronique et l'hébergement Web utilisent des puces appelées unités centrales de traitement, ou CPU. Ces tâches sont généralement beaucoup moins gourmandes en énergie que le traitement de l’IA.
Un rack de serveur standard dans ce type de centre de données peut nécessiter entre 25 et 40 kilowatts, soit suffisamment pour alimenter une vingtaine de climatiseurs.
Mais les centres de données IA fonctionnent sur des unités de traitement graphique ou GPU plus denses et plus avancées. À mesure que les modèles d’IA deviennent plus rapides et plus puissants, les racks contiennent beaucoup plus de puces dans le même espace.
« De plus en plus, la règle du jeu dans l'IA est que plus vous pouvez intégrer de performances dans une puce, les densités continueront de croître », a déclaré Sachin Jain, directeur de l'exploitation chez CoreWeave, Inc., un fournisseur de cloud.
À l’heure actuelle, environ 30 % de l’énergie circulant dans les centres de données n’est pas utilisée pour l’IA, selon Nvidia. Une grande partie est utilisée par les systèmes de refroidissement qui empêchent les serveurs de surchauffer et par l'électricité qui parcourt de longues distances à travers des campus tentaculaires. Cela amplifie les émissions de carbone liées à la consommation d’énergie des centres de données, étant donné que les opérateurs utilisent des centrales au gaz naturel et au charbon pour alimenter leurs projets. Microsoft Corp., par exemple, envisage de poursuivre ses objectifs ambitieux en matière d'énergie propre alors qu'elle tente d'éliminer les obstacles qui pourraient la freiner dans la course à l'IA, ont déclaré à Bloomberg le mois dernier des personnes proches du dossier.
À mesure que la demande d’énergie et les centres de données augmentent, ces pertes d’énergie ne feront qu’augmenter. Mais les gains potentiels découlant de toute amélioration de l’efficacité le seront également, a déclaré Tony Harvey, analyste chez Gartner. Les racks sont passés de huit GPU chacun à 72 il y a deux ans, nécessitant environ 150 kilowatts de puissance.
Et la demande d’électricité ne cesse de croître. Rubin, le nom du nouveau système GPU et rack de Nvidia qui sortira plus tard cette année, aura finalement besoin d'environ 300 kilowatts pour fonctionner, selon les experts.
Au-delà de Rubin, l’industrie se prépare à des puces qui rapprochent les racks de 1 mégawatt, soit suffisamment pour alimenter 750 foyers américains en moyenne.
« À cette échelle, cela fait une grande différence », a-t-il ajouté.
Dans l'ensemble, cependant, il est difficile de savoir dans quelle mesure ces correctifs peuvent réduire la demande d'énergie des centres de données, étant donné l'ampleur des projets et leur nombre supplémentaire.
Alors qu’ils réorganisent leurs installations, les acteurs de l’IA investissent également dans des startups économes en énergie. Nvidia, dont les serveurs et les puces représentent 70 % des dépenses des hyperscalers en IA, selon Bloomberg Intelligence, a investi des millions de dollars dans Emerald AI, qui fabrique des logiciels qui aident les centres de données à éviter de surcharger le réseau pendant les pics de demande. Les hyperscalers comme Google d'Alphabet Inc. s'efforcent de rendre leurs modèles d'IA plus économes en énergie.
« Il s'agit d'une recherche constante pour trouver chaque once d'efficacité que nous pouvons en quelque sorte tirer de cette enveloppe de puissance », a déclaré Dion Harris, directeur principal du calcul haute performance et des solutions d'infrastructure hyperscale d'IA chez Nvidia.
Cette croissance exponentielle de la capacité a déjà conduit à de nouvelles conceptions de centres de données. La puce Blackwell de Nvidia, lancée en 2024, a augmenté la capacité de traitement tout en utilisant la même quantité d'énergie que son prédécesseur, ce qui représente un bond en avant en matière d'efficacité énergétique.
Mais il générait également beaucoup plus de chaleur, trop pour que les systèmes de refroidissement à air traditionnels puissent empêcher un dysfonctionnement.
Le fonctionnement constant du cycle de refroidissement par air nécessite beaucoup d'énergie, c'est pourquoi les entreprises ont développé une méthode de refroidissement liquide directement sur la puce.
Le refroidissement liquide peut augmenter l'efficacité énergétique d'un centre de données de 15 %, selon une étude réalisée par Nvidia et le fabricant d'équipements électriques Vertiv Holdings Co.
Aujourd’hui, l’industrie de l’IA, dirigée par Nvidia, tente d’économiser de l’énergie en rationalisant le cheminement de l’électricité du réseau à la puce.
Les centres de données abaissent la tension du réseau électrique de 34 500 volts – les niveaux de tension dangereusement élevés qui circulent sur les lignes de transmission – aux 12 volts dont ont besoin les puces.
Ces conversions nécessitent de nombreuses étapes, l'énergie s'échappant à chaque fois sous forme de chaleur.
« Toutes ces étapes introduisent de petites inefficacités », a déclaré Harris de Nvidia. « Ils sont progressifs, fractionnaires dans de nombreux cas, mais ils totalisent de grands nombres lorsque vous les appliquez sur un très grand campus. »
Nvidia teste actuellement un nouvel équipement qui consolide ce processus en moins d'étapes, économisant ainsi de l'énergie et de l'espace : un side-car.
Une refonte encore plus radicale est en préparation pour les futurs centres de données. L'industrie tente de remplacer certains équipements des salles électriques par un transformateur à semi-conducteurs, un dispositif électronique plus intelligent capable de commuter les courants entre le courant alternatif et le courant continu et de mieux gérer les tensions plus élevées.
Les systèmes de distribution d'énergie représentent à eux seuls environ un tiers des pertes totales d'énergie, « et cela est dû à toutes ces transitions », a déclaré Harvey, analyste chez Gartner. « Si nous parvenons à atteindre cet ultime 800 volts CC, cela tombera probablement à moins de 1 %. »
L’énergie économisée grâce à un système électrique repensé peut servir de mesure climatique, en particulier lorsqu’elle est combinée à des efforts visant à utiliser des sources d’énergie plus propres. Un autre avantage potentiel du passage à un système d’alimentation CC est que les centres de données peuvent être plus facilement connectés à l’énergie renouvelable, qui génère généralement ce type de courant.
« L'alimentation CC s'intègre mieux par nature aux énergies renouvelables », a déclaré Scott Armul, directeur des produits et de la technologie chez Vertiv.
La Chine, par exemple, construit déjà des centres de données dans des régions produisant des énergies renouvelables. Les États-Unis sont loin de disposer d’énergies renouvelables supplémentaires, mais les opérateurs se tournent vers l’énergie solaire pour aider à faire fonctionner les centres de données, même s’ils doivent encore compter sur l’énergie au gaz pour faire le gros du travail.
Les mises à niveau du système d’alimentation sont une priorité pour les joueurs IA. Nvidia, par exemple, a promis de sortir de nouvelles puces plus puissantes environ une fois par an. GE Vernova Inc., qui fabrique des équipements électriques pour centres de données, constate déjà une forte demande de la part des hyperscalers pour des systèmes 800 volts CC.
« Tout le monde nous demande d'apporter des solutions pour les prochaines commandes à venir », a déclaré Philippe Piron, directeur général du segment électrification de GE Vernova.
Forgash et Dottle écrivent pour Bloomberg.