La dernière architecture GB200 NVL72 de Nvidia démontre des avantages de performance convaincants pour les charges de travail de raisonnement AI. En exécutant le modèle R1 de DeepSeek, la puce atteint un débit de 7 707 tokens par seconde — environ 6,5 fois plus rapide que la B200 et nettement en avance sur des solutions concurrentes comme l'AMD MI355X, qui plafonne à environ 272 tokens par seconde sur le même benchmark. Cette efficacité de débit est importante pour les opérations d'inférence à grande échelle où les métriques de tokens par seconde impactent directement l'économie du déploiement. L'écart de performance en raisonnement se creuse encore davantage lorsqu'on compare la capacité maximale, avec le NVL72 offrant jusqu'à 28 fois l'avantage de performance. Pour les applications intensives en GPU dans l'espace crypto — que ce soit pour le service de modèles, le traitement de données ou la validation computationnelle — ces améliorations de chipset transforment de manière significative le rapport coût/puissance de calcul.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
5
Reposter
Partager
Commentaire
0/400
TokenCreatorOP
· 01-07 21:04
ngl cette fois, nvdia a vraiment frappé fort, un écart de performance de 28 fois, AMD, la mère du sang, doit manger de la poussière
DeepSeek tourne si vite, le coût de l'inférence a diminué, combien d'argent cela permet-il d'économiser... C'est pourquoi tout le monde se précipite pour acheter des gpu
La course à la puissance de calcul dans la crypto a encore évolué, ceux qui n'ont pas un peu de nvdia sont dépassés
7707 tokens haha, je dois garder ce chiffre, pour impressionner plus tard
28 fois, mes amis, je vais direct acheter des actions Nvidia
Voir l'originalRépondre0
HodlTheDoor
· 01-05 18:55
Nvidia a encore gagné, AMD n'est vraiment pas à la hauteur, comment rattraper un écart de 28 fois ?
Voir l'originalRépondre0
DarkPoolWatcher
· 01-05 18:49
nvidia cette vague GB200 est vraiment incroyable, deepseek tourne à toute vitesse... mais ce chiffre de 28 fois est-il un peu exagéré ?
---
6,5 fois plus rapide que B200 c'est vraiment confortable, amd cette fois a été surpassé... ceux qui font du calcul de puissance dans la crypto doivent probablement changer de puce
---
Attendez, le token/s peut-il vraiment décider directement du coût de déploiement ? On dirait qu'il faut aussi regarder la consommation d'énergie
---
Si la crypto utilisait cette technologie, combien cela pourrait-il réduire les coûts de validation... quelqu'un a-t-il fait le calcul ?
---
Je veux juste savoir quand on pourra acheter le NVL72, maintenant c'est comme pour la pénurie de chips ou le Moutai
---
Comment calcule-t-on cette capacité maximale de 28 fois, différents benchmarks, n'est-ce pas ? On dirait que cette comparaison est un peu biaisée
---
deepseek tourne si vite... mais ce que les mineurs regardent le plus, c'est le rapport puissance, sans ces données, tout ça n'est que du vent
Voir l'originalRépondre0
AllInDaddy
· 01-05 18:38
La différence de performance de NVL72, AMD doit pleurer... Mais en y repensant, cette puce peut-elle vraiment réduire les coûts de déploiement des modèles ? Ou s'agit-il encore d'une opération de marketing ?
Voir l'originalRépondre0
MidnightSnapHunter
· 01-05 18:26
NVIDIA est vraiment impressionnante cette fois-ci, avec plus de 7000 tokens/s, elle écrase directement AMD, mais pour être honnête, le coût de déploiement dépendra toujours de la chaîne d'approvisionnement en puces à venir.
La dernière architecture GB200 NVL72 de Nvidia démontre des avantages de performance convaincants pour les charges de travail de raisonnement AI. En exécutant le modèle R1 de DeepSeek, la puce atteint un débit de 7 707 tokens par seconde — environ 6,5 fois plus rapide que la B200 et nettement en avance sur des solutions concurrentes comme l'AMD MI355X, qui plafonne à environ 272 tokens par seconde sur le même benchmark. Cette efficacité de débit est importante pour les opérations d'inférence à grande échelle où les métriques de tokens par seconde impactent directement l'économie du déploiement. L'écart de performance en raisonnement se creuse encore davantage lorsqu'on compare la capacité maximale, avec le NVL72 offrant jusqu'à 28 fois l'avantage de performance. Pour les applications intensives en GPU dans l'espace crypto — que ce soit pour le service de modèles, le traitement de données ou la validation computationnelle — ces améliorations de chipset transforment de manière significative le rapport coût/puissance de calcul.