Nvidia dévoile un super calculateur monstrueux taillé pour l'ère ChatGPT

Un monstre de puissance et d’efficacité énergétique : c’est ce que promet Nvidia pour son premier supercalculateur annoncé au Computex de Taipei. Une machine appelée DGX GH200 et qui promet d’atteindre la puissance dite exascale pour seulement une fraction de la consommation énergétique des machines concurrentes en x86… Et à une vitesse promise sans pareille. Présentée en grande pompe par le fondateur et PDG de Nvidia, le truculent Jensen Huang, cette machine est une concrétisation pour Nvidia.

Archi-leader dans le domaine du calcul sur GPU, Nvidia est un nain côté processeur. Si le californien a bien un savoir-faire avéré en matière de CPU, on le connaît surtout au travers de ses processeurs Tegra. Des SoC qu’on a déjà rencontré dans des PC Windows 8 ou encore la célèbre Nintendo Switch. La puce que Nvidia a développé pour les centres de données, et ici son super calculateur, est cependant d’une toute autre magnitude de puissance. La puce principale appelée Grace Hopper Superchip est en fait un duo. D’un côté, la puce « Grace », un CPU 72 cœurs ARM Neoverse V2 et, en face de lui, un GPU « Hopper » H100. Les deux profitent de 96 Go de mémoire ultra-rapide HBM3 (GPU) et 512 Go de LPDDR5X (CPU).

Le CPU comme le GPU sont tous les deux fabriqués à Taïwan par TSMC. © Adrian BRANCO / 01net.com

Prenez 256 de ces cartes GH200 combinant CPU, GPU et RAM et vous vous retrouvez avec autant de GPU, 18 432 cœurs CPU ARM et 144 To de mémoire DDR5 partagée. La force de cet ensemble qui forme le DGX GH200 tenant dans le fait que Nvidia est devenu un champion de la mise en réseau à haute vitesse.

Un super calculateur qui fonctionne comme un seul GPU

Depuis le rachat de Mellanox en 2019 (aux nez et à la barbe d’Intel qui voulait, lui aussi, racheter ce fleuron israélien), Nvidia a dans sa manche des produits réseaux ultraperformants taillés pour les super calculateurs. Sans trop rentrer dans les détails, ces 256 cartes GH200 combinant CPU, GPU et mémoires sont pilotées et interconnectées par des puces réseaux spécialisées (des DPU appelées BlueField-3 et des adaptateurs réseau ConnectX-7). D’une part, le CPU et le GPU « parlent » entre eux deux à très grande vitesse avec une technologie appelée NVLink-C2C (oui, il y a plein de noms et d’acronymes !), qui leur permet d’échanger des données à 900 Go/s (oui, vous avez bien lu). Mais surtout, les autres puces réseaux permettent un échange de données sans pertes, là encore à très haute vitesse.

Sur scène, Jensen Huang explique que son mastodonte dispose de nombreuses forces (logique, il est là pour vendre). Dont une qui est, dans les faits, assez exceptionnelle : ce super calculateur tout entier se pilote comme un seul accélérateur. Une prouesse, quand on sait que la distribution des informations et les différents goulets d’étranglements que sont les nœuds réseaux, sont les principaux freins à la pleine exploitation de la puissance brute des puces. Le bénéfice étant ici que les développeurs n’ont rien à faire de spécial : pas d’adaptation de code pour le distribuer de manière efficace. Ce titan se programme et fonctionne comme un unique GPU. Et déploie une puissance affolante.

Si on sait bien que les marques communiquent toujours sur les mesures de performances qui les arrangent (on appelle ça le « cherry picking » dans le jargon anglophone), certains graphs de Nvidia donnent le tournis. Ce monstre de 256 Grace Hopper Superchips envoie 1 ExaFLOPS de puissance de calcul et s’avère jusqu’à 244 fois plus puissant dans certains usages que des appareils équivalents. Le diable étant dans les détails, il faut détailler un peu ce que sont ces « certains usages ».

Une bête taillée pour l’IA

Le DGX GH200 a suffisamment de jus pour faire bien des calculs mais avec ses unités dites « transformers », c’est surtout un roi de l’exécution des IA et plus particulièrement des Large Language Models. Ces fameux LLM dont le plus célèbre est le déjà incontournable ChatGPT. Dans ce domaine, son très grand nombre de cœurs et sa capacité à gérer un énorme pool de mémoire semblent être des avantages critiques face à la concurrence… Dans ce domaine. Il reste encore à voir comment se comporte la machine dans d’autres domaines comme le calcul scientifique pour pouvoir le comparer à ce que peuvent proposer Intel ou AMD.

Déjà ultra-dominant dans le domaine des GPU pour les tâches techniques et scientifiques « classiques », Nvidia, qui vendait déjà ses produits à la pelle, semble désormais seul dans le monde des IA dites génératives. Alors que tous les industriels du domaine se jetaient déjà sur ses GPU, le DGX GH200 semble avoir les armes pour enterrer la concurrence (dans ce domaine) avant même qu’elle ne soit partie. Google Cloud, Meta et Microsoft seront ainsi les premiers clients de ce super calculateur qui sera ensuite vendu aux autres. Et le patron de Nvidia a même annoncé que l’entreprise allait se doter elle-même de son propre bébé pour continuer de le peaufiner. Et le rendre plus redoutable au fil du temps.

Nvidia maîtrise tout et sa valeur explose

Le DGX GH200 a ceci d’impressionnant que Nvidia maîtrise tous les composants importants. À savoir le CPU, le GPU mais aussi le processeur réseau. Alors qu’Intel arrive à peine sur le marché des GPU professionnels (avec Ponte Vecchio) et qu’AMD a pour l’heure du mal à imposer ses solutions face à Nvidia, la marque au logo vert conçoit tous les maillons de chaîne pour son super calculateur. Ce qui est une petite revanche pour l’entreprise qui ne dispose pas de licence x86 et ne pouvait, jusqu’à présent, pas lutter face à Intel et AMD (et IBM dans certaines applications où l’architecture Power brille encore).

Son bébé de 40 tonnes, comptant 240 km de câbles de fibre optique ou encore 2 112 ventilateurs de 60 mm devrait rentrer en service dans l’année. Et si les résultats sont au rendez-vous et que la vague IA se renforce (mais comment parier le contraire), l’entreprise qui pèse désormais plus de 1 000 milliards de dollars en bourse pourrait continuer d’exploser. Pour, qui sait, rejoindre le club très sélect des entreprises à plus de 2000 milliards. Pas mal pour une société qui a fait son succès initial en vendant des cartes graphiques 3D aux joueurs PC !

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

Votre opinion

Serge Rochain dit :

30 mai 2023 à 23:59

Bluff

Répondre
1. Jounff dit :
  
  31 mai 2023 à 01:06
  
  Bien raconté le bluff !
  Et la fin est à tomber par terre !
  40 tonnes ?
  Ça va pas tenir sur mon bureau…
  
  Répondre
stigmamax dit :

1 juin 2023 à 09:52

Je ne crois pas trop à ces effets d’annonce. C’est la course à qui aura la plus grosse. Les humains sont pitoyables.

Répondre
1. laine francis dit :
  
  8 juin 2023 à 00:20
  
  C nécessaire pour la cryptographie militaire
  Supprimer la guerre est souhaitable mais irréalisables
  
  Répondre

Les commentaires sont fermés.