La última arquitectura GB200 NVL72 de Nvidia demuestra ventajas de rendimiento convincentes para cargas de trabajo de razonamiento de IA. Ejecutando el modelo R1 de DeepSeek, el chip alcanza un rendimiento de 7.707 tokens por segundo, aproximadamente 6,5 veces más rápido que el B200 y muy por delante de soluciones competidoras como el MI355X de AMD, que alcanza alrededor de 272 tokens por segundo en la misma prueba. Esta eficiencia en el rendimiento es importante para operaciones de inferencia a gran escala donde las métricas de tokens por segundo impactan directamente en la economía del despliegue. La brecha en el rendimiento de razonamiento se amplía aún más al comparar la capacidad máxima, con el NVL72 ofreciendo hasta 28 veces la ventaja de rendimiento. Para aplicaciones intensivas en GPU en el espacio cripto, ya sea para servir modelos, procesamiento de datos o validación computacional, estas mejoras en el chipset cambian significativamente las relaciones costo-computo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
5
Republicar
Compartir
Comentar
0/400
TokenCreatorOP
· 01-07 21:04
Ngl esta vez nvdia realmente ha sido increíble, una diferencia de rendimiento de 28 veces, AMD está comiendo polvo, madre mía.
DeepSeek funciona tan rápido, el costo de inferencia ha bajado, cuánto dinero se ahorra... por eso todos están compitiendo por las GPU.
La carrera armamentística de poder de cómputo en el mundo de las criptomonedas se ha actualizado, quien no tenga algo de nvdia estará atrasado.
7707 tokens, este número lo guardaré para presumir más tarde.
28 veces, amigos, ¡voy a comprar acciones de nvidia directamente!
Ver originalesResponder0
HodlTheDoor
· 01-05 18:55
Nvidia ha vuelto a ganar, AMD realmente no puede, ¿cómo alcanzar esa diferencia de 28 veces?
Ver originalesResponder0
DarkPoolWatcher
· 01-05 18:49
nvidia esta ola de GB200 es realmente impresionante, deepseek corre muy rápido... pero ¿no será que la cifra de 28 veces es un poco exagerada?
---
Ser 6.5 veces más rápido que B200 es realmente cómodo, AMD esta vez fue superada... los que trabajan con potencia en el mundo de las criptomonedas probablemente tengan que cambiar de chips
---
Espera, ¿realmente los token/s pueden decidir directamente el coste de despliegue? Parece que también depende del consumo de energía
---
Si en el mundo de las criptomonedas se usara esto, ¿cuánto sería más barato la validación...? ¿Alguien ha hecho cálculos?
---
Solo quiero saber cuándo se podrá comprar el NVL72, ahora que hay competencia por los chips, como si fuera una pelea por una botella de Moutai
---
¿Y cómo se calcula esa capacidad pico de 28 veces? Es diferente benchmark, ¿verdad? Parece que esta comparación no es muy fiable
---
deepseek corre tan rápido... pero lo que más le importa a los mineros es la relación de consumo, sin esos datos todo es en vano
Ver originalesResponder0
AllInDaddy
· 01-05 18:38
La diferencia de rendimiento de NVL72 hará llorar a AMD... Pero hablando de esto, ¿realmente puede esta CPU reducir los costos de implementación de modelos? ¿O es solo otra estrategia de marketing?
Ver originalesResponder0
MidnightSnapHunter
· 01-05 18:26
Nvidia esta vez ha sido realmente agresiva, con más de 7000 tokens/s, superando claramente a AMD, pero para ser honestos, el costo de implementación todavía depende de la cadena de suministro de chips en el futuro.
La última arquitectura GB200 NVL72 de Nvidia demuestra ventajas de rendimiento convincentes para cargas de trabajo de razonamiento de IA. Ejecutando el modelo R1 de DeepSeek, el chip alcanza un rendimiento de 7.707 tokens por segundo, aproximadamente 6,5 veces más rápido que el B200 y muy por delante de soluciones competidoras como el MI355X de AMD, que alcanza alrededor de 272 tokens por segundo en la misma prueba. Esta eficiencia en el rendimiento es importante para operaciones de inferencia a gran escala donde las métricas de tokens por segundo impactan directamente en la economía del despliegue. La brecha en el rendimiento de razonamiento se amplía aún más al comparar la capacidad máxima, con el NVL72 ofreciendo hasta 28 veces la ventaja de rendimiento. Para aplicaciones intensivas en GPU en el espacio cripto, ya sea para servir modelos, procesamiento de datos o validación computacional, estas mejoras en el chipset cambian significativamente las relaciones costo-computo.