Последняя архитектура Nvidia GB200 NVL72 демонстрирует убедительные преимущества в производительности для задач AI-рассуждения. Запуская модель DeepSeek R1, чип достигает пропускной способности 7 707 токенов в секунду — примерно в 6,5 раза быстрее, чем B200, и значительно опережает конкурирующие решения, такие как AMD MI355X, который достигает максимум около 272 токенов в секунду на том же бенчмарке. Эта эффективность пропускной способности важна для масштабных операций инференса, где метрики токенов в секунду напрямую влияют на экономику развертывания. Разрыв в производительности рассуждения еще больше увеличивается при сравнении пиковых возможностей, при этом NVL72 обеспечивает до 28-кратного преимущества в производительности. Для GPU-интенсивных приложений в криптопространстве — будь то обслуживание моделей, обработка данных или вычислительная проверка — эти улучшения чипсета значительно меняют соотношение стоимости и вычислений.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
TokenCreatorOPvip
· 01-07 21:04
ngl на этот раз nvdia действительно поразила, разница в производительности в 28 раз, AMD — кровавое мясо, деньги на землю DeepSeek работает так быстро, снижение стоимости инференса — сколько денег сэкономишь... Вот почему все так рвутся к GPU Гонка за вычислительные мощности в криптомире снова обострилась, у кого нет хотя бы немного nvdia — тот отстал 7707 токенов, ха, это число я должен сохранить, чтобы потом похвастаться 28 раз, ребята, я тм прямо куплю акции nvidia
Посмотреть ОригиналОтветить0
HodlTheDoorvip
· 01-05 18:55
nvidia снова победила, amd действительно не справляется, как догнать разрыв в 28 раз
Посмотреть ОригиналОтветить0
DarkPoolWatchervip
· 01-05 18:49
nvidia эта волна GB200 действительно потрясающая, deepseek работает очень быстро... но цифра 28-кратного увеличения не кажется ли немного преувеличенной? --- Ускорение в 6.5 раза по сравнению с B200 действительно приятно, AMD на этот раз был полностью побежден... те, кто занимается вычислительной мощностью в криптомире, вероятно, уже меняют чипы --- Подождите, действительно ли token/s могут напрямую определять стоимость развертывания? Кажется, тут еще важна мощность --- Если в криптомире начнут использовать это устройство для верификации, сколько это сэкономит... кто-то подсчитывал? --- Я просто хочу знать, когда можно будет купить NVL72, сейчас борьба за чипы как за Мао Тай --- Как считается 28-кратная пиковая емкость, разные бенчмарки, верно? Кажется, это сравнение немного притянуто за уши --- Deepseek работает так быстро... но для майнеров важнее всего соотношение мощности и потребления, без этих данных все бессмысленно
Посмотреть ОригиналОтветить0
AllInDaddyvip
· 01-05 18:38
Разрыв в производительности NVL72 заставит AMD плакать... Но, говоря откровенно, действительно ли этот чип сможет снизить затраты на развертывание моделей? Или это снова хайп?
Посмотреть ОригиналОтветить0
MidnightSnapHuntervip
· 01-05 18:26
Nvidia на этот раз действительно безжалостна, более 7 000 токенов в секунду напрямую превосходят AMD, но, честно говоря, стоимость развертывания всё ещё зависит от последующего процесса поставок чипов.
Посмотреть ОригиналОтветить0
  • Закрепить