AWS Mise sur le Refroidissement Liquide pour ses Serveurs IA
Alors que les besoins en puissance de calcul ne cessent de croître, tirés par l'essor de l'intelligence artificielle, les géants du cloud computing doivent repenser leurs infrastructures pour gagner en efficacité. C'est dans ce contexte qu'AWS, le leader du marché, vient d'annoncer une évolution majeure : l'adoption du refroidissement liquide pour ses serveurs IA.
Le refroidissement liquide, un impératif face à la montée en puissance de l'IA
Face à l'explosion des charges de travail liées à l'IA, les data centers d'AWS doivent s'adapter. Les processeurs dédiés comme les Trainium2 d'AWS ou les accélérateurs de Nvidia dégagent une chaleur intense qui ne peut plus être dissipée efficacement par les systèmes de refroidissement à air traditionnels.
C'est là qu'intervient le refroidissement liquide. En immergeant directement les composants dans un fluide caloporteur ou en les exposant à un flux de liquide, on peut évacuer bien plus efficacement la chaleur. Un passage obligé pour qu'AWS puisse continuer à délivrer un maximum de performance sur ses serveurs IA.
Un système hybride air-liquide pour une flexibilité maximale
AWS a opté pour un design ingénieux permettant de combiner refroidissement à air et à liquide au sein d'un même datacenter. Les serveurs classiques peuvent ainsi continuer à fonctionner normalement tandis que les racks dédiés à l'IA bénéficient d'un refroidissement liquide.
Ce design modulaire et multimodal nous permet d'optimiser les performances et l'efficacité à moindre coût, que ce soit pour les charges de travail traditionnelles ou les modèles d'IA.
Prasad Kalyanaraman, vice-président infrastructure chez AWS
Des data centers repensés de A à Z pour plus d'efficacité
Au-delà du refroidissement, AWS revoit en profondeur le design de ses data centers pour gagner en fiabilité et en efficacité énergétique :
- Simplification des systèmes électriques et mécaniques
- Réduction du nombre de conversions AC/DC pour minimiser les pertes
- Disponibilité accrue atteignant les 99,9999%
L'entreprise déploie également un nouveau système de contrôle intégrant des services de télémétrie pour faciliter la supervision et le dépannage. Et même l'agencement des serveurs est optimisé grâce à l'IA pour maximiser l'utilisation de chaque watt disponible.
Un bond en avant qui ouvre la voie à l'IA du futur
Grâce à ces innovations, AWS sera en mesure de faire face à l'augmentation exponentielle des besoins en puissance de calcul nécessaire aux applications d'IA. La firme de Seattle évoque un bond de capacité d'un facteur 6 sur les deux prochaines années, qui pourrait même atteindre un facteur 18 à terme !
Une avancée cruciale alors que les modèles de deep learning n'en finissent plus de gagner en taille et en complexité. Avec ses data centers nouvelle génération, AWS se donne les moyens de ses ambitions pour rester le cloud provider de référence sur le marché porteur de l'intelligence artificielle.