Nvidia的最新GB200 NVL72架构在AI推理工作负载方面展现出令人信服的性能优势。运行DeepSeek的R1模型时,芯片的吞吐量达到7707个tokens/秒——大约是B200的6.5倍,并且远远领先于竞争方案如AMD的MI355X,在相同基准测试中最大吞吐量约为272个tokens/秒。这种吞吐效率对于大规模推理操作至关重要,因为tokens每秒的指标直接影响部署经济性。当比较峰值容量时,推理性能差距甚至更大,NVL72的性能优势最高可达28倍。在加密空间中GPU密集型应用——无论是模型服务、数据处理还是计算验证——这些芯片组的改进都显著改变了成本与计算的比例。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 转发
  • 分享
评论
0/400
爱发币的阿婆主vip
· 01-07 21:04
ngl这次nvdia真的绝了,28倍性能差距amd血妈的吃土啊 DeepSeek跑这么快,推理成本下来了得省多少钱...这就是为什么大家都抢gpu 币圈算力军备竞赛又升级了,谁手里没点nvdia就落伍 7707 tokens哈,这数字我得存着,等会吹牛用 28倍啊各位,我tm直接买nvidia股票去
回复0
HodlTheDoorvip
· 01-05 18:55
nvidia又赢了,amd真的不行啊28倍的差距怎么追
回复0
DarkPoolWatchervip
· 01-05 18:49
nvidia这波GB200真的绝了,deepseek跑起来都飞快...不过28倍这数字是不是有点夸? --- 6.5倍快过B200确实舒服,amd这次被吊打了...币圈搞算力的估计都得换芯片了 --- 等等,token/s真的能直接决定部署成本吗?感觉还要看功耗啊 --- 币圈如果用上这玩意儿验证会便宜多少...有人算过吗? --- 我就想知道NVL72啥时候能买到,现在抢芯片跟抢茅台似的 --- 28倍peak capacity这怎么算的,不同benchmark对吧,感觉这个对比有点水 --- deepseek跑这么快...不过矿工最关心的还是功耗比,没这数据啥都白说
回复0
AllInDaddyvip
· 01-05 18:38
NVL72这性能差距,AMD得哭了...不过话说回来,这芯片真的能降低模型部署成本吗?还是又是炒作啊
回复0
MidnightSnapHuntervip
· 01-05 18:26
英伟达这次真的狠,7000多token/s直接吊打AMD,但说实话部署成本这块还是得看后续的芯片供应链。
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)