El laboratorio chino de IA DeepSeek lanzó recientemente su modelo de inferencia Código abierto, DeepSeek-R1, que provocó un seguimiento generalizado en la industria. El modelo se denomina "modelo de inferencia" y se dice que ha funcionado en algunas pruebas de Indicador de referencia de IA comparables al o1 de OpenAI. R1 ha sido lanzado bajo la licencia MIT a través de Hugging Face, una plataforma de desarrollo de IA, lo que permite a los usuarios comercializarlo sin restricciones.
DeepSeek afirma que R1 superó a o1 en varias pruebas de referencia, incluyendo la Competencia de Matemáticas de Invitación de Estados Unidos (AIME), MATH-500 y SWE-bench Verified. AIME utiliza otros modelos para evaluar la capacidad de razonamiento, MATH-500 se centra en problemas de texto y SWE-bench Verified prueba tareas de programación.
El modelo R1 tiene ventajas pero está limitado por la política
Según se dice, como modelo de razonamiento, R1 tiene una capacidad única de autoverificación, lo que lo hace más confiable que los modelos tradicionales en campos como la física, la ciencia y las matemáticas. Aunque los modelos de razonamiento suelen requerir más tiempo de cálculo, de varios segundos a minutos (, su alta precisión les confiere una gran ventaja para abordar problemas complejos.
El informe técnico señala que R1 contiene 671 mil millones de parámetros, lo que supera con creces a muchos modelos existentes. La cantidad de parámetros suele estar directamente relacionada con la capacidad del modelo para resolver problemas, lo que convierte a R1 en un modelo de gran escala. Sin embargo, D...
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
China AI se pone al día: DeepSeek lanza el modelo R1 para desafiar la posición líder de Estados Unidos en tecnología
El laboratorio chino de IA DeepSeek lanzó recientemente su modelo de inferencia Código abierto, DeepSeek-R1, que provocó un seguimiento generalizado en la industria. El modelo se denomina "modelo de inferencia" y se dice que ha funcionado en algunas pruebas de Indicador de referencia de IA comparables al o1 de OpenAI. R1 ha sido lanzado bajo la licencia MIT a través de Hugging Face, una plataforma de desarrollo de IA, lo que permite a los usuarios comercializarlo sin restricciones.
DeepSeek afirma que R1 superó a o1 en varias pruebas de referencia, incluyendo la Competencia de Matemáticas de Invitación de Estados Unidos (AIME), MATH-500 y SWE-bench Verified. AIME utiliza otros modelos para evaluar la capacidad de razonamiento, MATH-500 se centra en problemas de texto y SWE-bench Verified prueba tareas de programación.
El modelo R1 tiene ventajas pero está limitado por la política
Según se dice, como modelo de razonamiento, R1 tiene una capacidad única de autoverificación, lo que lo hace más confiable que los modelos tradicionales en campos como la física, la ciencia y las matemáticas. Aunque los modelos de razonamiento suelen requerir más tiempo de cálculo, de varios segundos a minutos (, su alta precisión les confiere una gran ventaja para abordar problemas complejos.
El informe técnico señala que R1 contiene 671 mil millones de parámetros, lo que supera con creces a muchos modelos existentes. La cantidad de parámetros suele estar directamente relacionada con la capacidad del modelo para resolver problemas, lo que convierte a R1 en un modelo de gran escala. Sin embargo, D...