GPU Hopper GH100, Nvidia dévoile ses principales caractéristiques

Le GPU Hopper GH100 de Nvidia à l’origine du processeur de calcul H100 s’arme d’un équipement impressionnant. Dans un document la firme révèle ses principales spécifications.

L’engin est issu du processus de fabrication le plus avancé actuellement de TSMC à savoir du N4 (gravure EUV en 4 nm). Nous retrouvons une approche accompagnée d’un maximum de six piles HBM3. L’ensemble s’équipe de 80 milliards de transistors soit une augmentation de presque 50% par rapport au GA100 tout en ayant une surface plus petite (814 mm² au lieu de 826 mm²). Cette avancée s’explique par l’adoption d’une finesse de gravure plus petite ( 4 nm Vs 7 nm).

GPU Hopper GH100 de Nvidia

L’architecture s’appuie sur144 multiprocesseurs (SM) en streaming soit la présence de 18 432 cœurs CUDA FP32 et 9 216 cœurs CUDA double précision (FP64). A cela s’ajoute 576 cœurs Tensor de quatrième génération et une interface HBM3 6144-bit afin d’exploiter 80 Go de mémoire. La bande passante mémoire devrait dépasser les 3 To/s et prendre en charge l’ECC.

Les interfaces hôtes bénéficient également d’une mise à niveau. La carte SXM5 s’accompagne d’une interconnexion NVLink de dernière génération qui dispose d’une bande passante de 900 Go/s. Le modèle AIC (carte d’extension) exploite de son coté une interface PCI-Express 5.0 x16 (128 Go/s). Les deux interfaces introduisent des fonctionnalités de mise en commun des ressources.

Enfin, Nvidia repousse la limite de puissance avec du 700 W contre 400 W pour le A100. A noter que le H100 dispose de 132 SM au travers d’une solution au format SXM5 contre 114 SM avec un format AIC (carte fille PCIe). Dans les deux cas les fréquences devraient atteindre les 1,80 GHz.

GH100 GA100 GV100
Architecture Hopper Ampere Volta
Approche Monolithique
Finesse de gravure TSMC N4 TSMC N7 TSMC 12FFN
Nombre de transistors 80,0 Milliarden 54,2 Milliarden 21,1 Milliarden
Surface du die 814 mm² 826 mm² 815 mm²
Nombre de SMs 144 128 84
Cœurs CUDA FP64 9.216 4.096 2.688
Cœurs CUDA FP32 18.432 8.192 5.376
Cœurs Tensor 576 512 672
Fréquence GPU ? 1.41 GHz 1,45 GHZ
Mémoire vidéo 80 Go HBM3 48 Go HBM2 et 80 Go HBM2e 32 Go HBM2
Fréquence mémoire ? 1,25 GHz 0.88 Ghz
Interface mémoire 6144-bit 6144-bit 4096-bit
Bande passante mémoire + 3 To/s 1,9 To/s et 2,4 To/s 900 Go/s
TDP 700 Watt 400 Watt 300 Watt
Interconnexion NVLink 900 Go/s
PCIe 5.0 128 Go/s
NVLink 600 Go/s
PCIe 4.0 64 Go/s
NVLink 300 Go/s
PCIe 3.0 32 Go/s

Source

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading