NVIDIA GH200 NVL32 : révolutionner les performances du délai d'obtention du premier jeton pour les applications d'IA en temps réel