Lo más importante de hoy es la conferencia GTC de NVIDIA, prácticamente una historia de la humanidad en versión IA.

robot
Generación de resúmenes en curso

Hoy lo más importante es la conferencia GTC de NVIDIA, que es prácticamente una historia de la humanidad en versión IA.

Jensen Huang aún no ha subido al escenario, pero la cantidad de información filtrada ya es suficiente para escribir un libro.

Wanwans ha recopilado tres grandes puntos destacados, vamos amigos, síganme.

  1. El costo de la potencia de cálculo de IA se reduce directamente a un 10%

La generación anterior, Blackwell, ya era bastante potente, ¿verdad? Pronto se anunciará la producción en masa del nuevo chip Vera Rubin.

¿Qué tiene de impresionante Vera Rubin? En pocas palabras, dos palabras: barato.

Al ejecutar el mismo modelo de IA,
el número de chips se reduce a una cuarta parte, y el costo de cálculo de inferencia se reduce en un 90%.
Un 90% amigos.
AWS, Microsoft y Google, los tres grandes proveedores de la nube, son los primeros en subirse al tren.

  1. Groq, que se adquirió por 20 mil millones el año pasado, entrega su trabajo hoy

Anteriormente, Jensen Huang mencionó en la conferencia de resultados que Groq se integrará como una arquitectura de expansión en el ecosistema de NVIDIA, al igual que cuando adquirieron Mellanox para mejorar la capacidad de red.

El LPU de Groq y el GPU de NVIDIA estarán en el mismo centro de datos, el GPU entiende el problema, y el LPU se encarga de dar respuestas rápidas.

La colaboración entre ambos tipos de chips reduce la latencia en escenarios de agentes.

Los agentes de IA hacen el trabajo por las personas, un solo tarea puede requerir ajustar el modelo decenas de veces, cada ronda consume potencia de cálculo de inferencia, y los usuarios están esperando, un pequeño retraso arruina la experiencia.

La inferencia se divide en dos pasos, primero entiende tu pregunta y luego proporciona la respuesta palabra por palabra.

El GPU es bueno en el primer paso, pero en el segundo paso, la velocidad y estabilidad de la respuesta, el LPU de Groq es más fuerte.

¿Son 20 mil millones caros?

Piénsalo, en el futuro, cada empresa tendrá cientos de agentes, y cada agente ajustará modelos miles de veces al día.

  1. Se lanza la versión de NVIDIA de OpenClaw, llamada NemoClaw

Es una plataforma de código abierto que las empresas pueden instalar para desplegar empleados de IA que sustituyan a humanos en la ejecución de procesos, procesamiento de datos y gestión de proyectos.
Se dice que ya están en conversaciones con Salesforce y Adobe.

Lo interesante es que NemoClaw no requiere que uses los chips de NVIDIA.
Reflexiona sobre esta lógica.
Vender chips solo genera ganancias en el nivel del hardware, establecer reglas permite ganar dinero en toda la cadena. Jensen Huang lo tiene muy claro.

  1. Jensen Huang dice que va a mostrar “chips que el mundo nunca ha visto”

Es muy probable que se trate de la primera aparición de la próxima generación de arquitectura Feynman, que se producirá en 2028, con el proceso más avanzado de TSMC de 1.6nm.

Además, hay un dato menos conocido que me parece bastante interesante.

NVIDIA ha lanzado procesadores para laptops, dos modelos, orientados a juegos.
Los que venden tarjetas gráficas están a punto de robar el trabajo de los CPU.

Siento que, en el futuro, Jensen Huang se convertirá en un gran líder.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado