A arquitetura GB200 NVL72 mais recente da Nvidia demonstra vantagens de desempenho convincentes para cargas de trabalho de raciocínio de IA. Ao executar o modelo R1 da DeepSeek, o chip alcança uma taxa de 7.707 tokens por segundo—aproximadamente 6,5x mais rápido que o B200 e substancialmente à frente de soluções concorrentes como o MI355X da AMD, que atinge cerca de 272 tokens por segundo no mesmo benchmark. Essa eficiência de throughput é importante para operações de inferência em grande escala, onde as métricas de tokens por segundo impactam diretamente a economia de implantação. A diferença de desempenho em raciocínio aumenta ainda mais ao comparar a capacidade máxima, com o NVL72 oferecendo até 28x a vantagem de desempenho. Para aplicações intensivas em GPU no espaço cripto—seja para serviço de modelos, processamento de dados ou validação computacional—essas melhorias no chipset alteram significativamente as proporções de custo para computação.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
12 Curtidas
Recompensa
12
5
Repostar
Compartilhar
Comentário
0/400
TokenCreatorOP
· 01-07 21:04
ngl desta vez a nvdia realmente arrasou, diferença de desempenho de 28x, a AMD está fodida de tanto gastar dinheiro
DeepSeek está a correr tão rápido, o custo de inferência caiu, quanto dinheiro isso vai economizar... é por isso que todos estão a correr atrás de GPUs
A corrida pelo poder de hashing no mercado de criptomoedas voltou a subir de nível, quem não tem um pouco de nvdia fica para trás
7707 tokens, esse número eu tenho que guardar, para usar na hora de fazer piada
28x, pessoal, eu vou é comprar ações da nvidia direto
Ver originalResponder0
HodlTheDoor
· 01-05 18:55
A Nvidia ganhou novamente, a AMD realmente não consegue, como alcançar uma diferença de 28 vezes
Ver originalResponder0
DarkPoolWatcher
· 01-05 18:49
nvidia esta onda do GB200 é realmente incrível, o deepseek fica a voar... Mas será que o número de 28 vezes é um pouco exagerado?
---
6.5 vezes mais rápido que o B200 é realmente confortável, a AMD foi completamente dominada desta vez... Quem trabalha com poder de hashing no mercado de criptomoedas provavelmente vai ter que trocar de chip
---
Espera aí, token/s realmente pode decidir diretamente o custo de implantação? Parece que também depende do consumo de energia
---
Se o mercado de criptomoedas usasse isso, quanto seria mais barato para validar... alguém já fez as contas?
---
Só quero saber quando é que posso comprar o NVL72, agora competir por chips é como competir por Maotai
---
Como é que se calcula a capacidade máxima de 28 vezes, diferentes benchmarks, certo? Parece que essa comparação é um pouco superficial
---
deepseek fica tão rápido... Mas os mineradores estão mais preocupados com a eficiência energética, sem esses dados tudo é em vão
Ver originalResponder0
AllInDaddy
· 01-05 18:38
NVL72 esta diferença de desempenho, a AMD vai chorar... Mas, voltando ao assunto, este chip realmente consegue reduzir os custos de implantação de modelos? Ou é mais uma especulação?
Ver originalResponder0
MidnightSnapHunter
· 01-05 18:26
A Nvidia desta vez foi realmente agressiva, com mais de 7000 tokens/s, superando diretamente a AMD, mas, para ser honesto, o custo de implantação ainda depende da cadeia de fornecimento de chips no futuro.
A arquitetura GB200 NVL72 mais recente da Nvidia demonstra vantagens de desempenho convincentes para cargas de trabalho de raciocínio de IA. Ao executar o modelo R1 da DeepSeek, o chip alcança uma taxa de 7.707 tokens por segundo—aproximadamente 6,5x mais rápido que o B200 e substancialmente à frente de soluções concorrentes como o MI355X da AMD, que atinge cerca de 272 tokens por segundo no mesmo benchmark. Essa eficiência de throughput é importante para operações de inferência em grande escala, onde as métricas de tokens por segundo impactam diretamente a economia de implantação. A diferença de desempenho em raciocínio aumenta ainda mais ao comparar a capacidade máxima, com o NVL72 oferecendo até 28x a vantagem de desempenho. Para aplicações intensivas em GPU no espaço cripto—seja para serviço de modelos, processamento de dados ou validação computacional—essas melhorias no chipset alteram significativamente as proporções de custo para computação.