Nvidia Corp. a dévoilé un processeur d’intelligence artificielle amélioré qui augmente la capacité et les performances de la puce, dans le but de consolider la suprématie de l’entreprise dans un domaine en pleine croissance. NVIDIA GH200 Grace Hopper sera disponible au deuxième trimestre 2024.
Nvidia a déclaré mardi lors de la conférence Siggraph à Los Angeles que la Grace Hopper Superchip, une puce graphique hybride, et CPU, bénéficiera d’une nouvelle forme de mémoire. L’appareil est basé sur une mémoire à bande passante élevée 3, ou HBM3e, qui peut accéder aux données à la vitesse fulgurante de 5 gigaoctets par seconde.
La dernière annonce de Nvidia fait suite au GH200 avec HBM3 annoncé précédemment, qui est actuellement en production et sera disponible plus tard cette année. Cela implique que NVIDIA produira deux versions du même appareil, la première utilisant HBM3 et la seconde incorporant HBM3e. Nvidia indique également que le GH200 de nouvelle génération sera capable d’exécuter des modèles d’IA 3,5 fois plus rapidement que le modèle actuel grâce à la mémoire HBM3e.
Nvidia GH200 Grace Hopper : construit sur un processeur Grace à 72 cœurs
Le nouveau GH200 Grace Hopper Superchip est basé sur un processeur Grace à 72 cœurs avec 480 Go de mémoire ECC LPDDR5X et un GPU de calcul GH100 avec 141 Go de mémoire HBM3E dans six piles de 24 Go et une interface mémoire d’une largeur de 6 144 bits. NVIDIA installe physiquement 144 Go de mémoire, cependant, seuls 141 Go sont accessibles pour des rendements accrus.
L’actuelle puce GH200 Grace Hopper de NVIDIA dispose de 96 Go de mémoire HBM3 avec une bande passante inférieure à 4 To/s. En comparaison, le nouveau modèle augmente la capacité de mémoire d’environ la moitié et la bande passante de plus d’un quart. Ces améliorations majeures permettent à la nouvelle plate-forme d’exécuter des modèles d’IA plus grands que l’itération précédente, ce qui se traduit par une augmentation considérable des performances.
Microsoft et NVIDIA signent un accord pour apporter Passe de jeu pour Nvidia GeForce Now
Nvidia affirme que cela est dû à des configurations différentes du même composant, similaires aux versions 40 Go et 80 Go de l’A100 d’il y a quelques années. En vérité, le chargement de la RAM est la principale distinction ici, du moins pour le moment. Au lieu des 96 Go de vRAM HBM3 et 480 Go de DRAM LPDDR5x trouvés dans le GH200 de génération actuelle, le GH200 de « nouvelle génération » dispose de 141 Go de HBM3e et de 500 Go de LPDDR5x 400 Go/sec plus lent. Une mémoire DRAM LPDDR5x de 512 Go/s a été utilisée lors de l’itération précédente.
Nvidia travaille sur Grace Hopper Superchips depuis un moment maintenant
Depuis au moins 2021, lorsque la société a dévoilé ses plans préliminaires, les superpuces Grace Hopper sont un sujet brûlant pour le PDG de Nvidia.
Le Superchip est construit sur l’architecture Arm, qui est largement utilisée dans les appareils mobiles et est en concurrence avec la technologie x86 d’Intel et d’AMD. Il est qualifié de “superchip” par Nvidia car il combine le processeur Nvidia Grace basé sur Arm avec l’architecture GPU Hopper.
Le Grace Hopper Superchip reçoit un coup de pouce de la mémoire la plus rapide au monde, HBM3e, dans la dernière itération du Nvidia GH200 Grace Hopper. Selon Nvidia, la mémoire HBM3e est jusqu’à 50 % plus rapide que la technologie HBM3 incluse dans l’itération actuelle du GH200.
Nvidia Computex 2023 apporte l’avenir du jeu
« Nous sommes ravis de ce nouveau GH200. Il comportera 141 gigaoctets de mémoire HBM3e. HBM3e augmente non seulement la capacité et la quantité de mémoire attachée à nos GPU, mais est également beaucoup plus rapide », a déclaré Ian Buck, vice-président et directeur général de l’hyperscale et du HPC chez Nvidia, lors d’une réunion avec la presse et les analystes, selon Battement d’entreprise.
Nvidia ne se contente pas de développer du matériel plus rapide, mais le fait également évoluer dans une nouvelle conception de serveur.
Buck a déclaré que Nvidia travaille sur un nouveau système de serveur Nvidia MGX basé sur le double GH200 qui aurait deux Grace Hopper Superchips de la prochaine génération. Il a poursuivi en disant que le nouveau GH200 sera lié à l’aide de NVLink, la technologie d’interconnexion de Nvidia.
Les CPU et les GPU du nouveau serveur dual-GH200 seront couplés à une connexion mémoire totalement cohérente grâce à NVLink.
Date de sortie du Nvidia GH200 Grace Hopper
Selon NVIDIA, la plate-forme GH200 Grace Hopper avec HBM3 est maintenant en production et sera disponible dans le commerce le mois prochain. En revanche, la plate-forme GH200 Grace Hopper avec HBM3e est en cours d’échantillonnage et devrait être prête au deuxième trimestre 2024.
Le nouveau GH200 Grace Hopper, selon NVIDIA, utilise la même technologie Grace CPU et GH100 GPU que l’itération précédente, donc aucune autre modification ou étape n’est nécessaire.
Crédit image en vedette : Nvidia
Source: Voici le nouveau Nvidia GH200 Grace Hopper