Noticias de Bi界网, noticias de ME News, 26 de marzo (UTC+8), el proyecto ARC-AGI anunció recientemente el lanzamiento del benchmark ARC-AGI-3. Según su afirmación, este es el único benchmark de inteligencia de agentes no saturado del mundo, diseñado para probar cómo los modelos aprenden, en lugar de probar el conocimiento que ya poseen los modelos. Los datos proporcionados en el artículo muestran que los humanos obtienen una puntuación del 100% en este benchmark, mientras que la puntuación de la IA es inferior al 1%. Esta brecha enorme indica que, según la medición de este benchmark, aún no se ha logrado la inteligencia artificial general.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado