2026-01-05 18:25:19

Nvidia的最新GB200 NVL72架构在AI推理工作负载方面展现出令人信服的性能优势。运行DeepSeek的R1模型时，芯片的吞吐量达到7707个tokens/秒——大约是B200的6.5倍，并且远远领先于竞争方案如AMD的MI355X，在相同基准测试中最大吞吐量约为272个tokens/秒。这种吞吐效率对于大规模推理操作至关重要，因为tokens每秒的指标直接影响部署经济性。当比较峰值容量时，推理性能差距甚至更大，NVL72的性能优势最高可达28倍。在加密空间中GPU密集型应用——无论是模型服务、数据处理还是计算验证——这些芯片组的改进都显著改变了成本与计算的比例。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

12人点赞了这条动态

赞赏
12
5
转发
分享

0/400

爱发币的阿婆主

· 01-07 21:04

ngl这次nvdia真的绝了，28倍性能差距amd血妈的吃土啊 DeepSeek跑这么快，推理成本下来了得省多少钱...这就是为什么大家都抢gpu 币圈算力军备竞赛又升级了，谁手里没点nvdia就落伍 7707 tokens哈，这数字我得存着，等会吹牛用 28倍啊各位，我tm直接买nvidia股票去

HodlTheDoor

· 01-05 18:55

nvidia又赢了，amd真的不行啊28倍的差距怎么追

DarkPoolWatcher

· 01-05 18:49

nvidia这波GB200真的绝了，deepseek跑起来都飞快...不过28倍这数字是不是有点夸？ --- 6.5倍快过B200确实舒服，amd这次被吊打了...币圈搞算力的估计都得换芯片了 --- 等等，token/s真的能直接决定部署成本吗？感觉还要看功耗啊 --- 币圈如果用上这玩意儿验证会便宜多少...有人算过吗？ --- 我就想知道NVL72啥时候能买到，现在抢芯片跟抢茅台似的 --- 28倍peak capacity这怎么算的，不同benchmark对吧，感觉这个对比有点水 --- deepseek跑这么快...不过矿工最关心的还是功耗比，没这数据啥都白说

AllInDaddy

· 01-05 18:38

NVL72这性能差距，AMD得哭了...不过话说回来，这芯片真的能降低模型部署成本吗？还是又是炒作啊

MidnightSnapHunter

· 01-05 18:26

英伟达这次真的狠，7000多token/s直接吊打AMD，但说实话部署成本这块还是得看后续的芯片供应链。

热门 Gate Fun
查看更多

1
Gate2026
Gate2026
市值:$2453.47持有人数:2
0.00%
2
fanfame
fanfame
市值:$0.1持有人数:1
0.00%
3
逮狗腿USDT
逮狗腿
市值:$2448.79持有人数:2
0.08%
4
LFUSDT
Lucifer
市值:$2403.44持有人数:1
0.00%
5
CBUSDT
crann bethadh
市值:$0.1持有人数:1
0.00%

热门话题

当前行情抄底还是观望？

黄金反弹

Gate春节赛马红包嘉年华

白宫稳定币收益讨论会议

沃什将谨慎推进美联储缩表

热门 Gate Fun

Gate2026

Gate2026

fanfame

fanfame

逮狗腿USDT

逮狗腿

LFUSDT

Lucifer

CBUSDT

crann bethadh

置顶