OpenAI junto con Paradigm lanzan EVMbench, una evaluación práctica de la capacidad de los agentes de IA en la defensa y ataque de contratos inteligentes en EVM, revelando preocupaciones sobre la fortaleza de los ataques frente a las defensas débiles.

Enfocándose en pruebas en entornos económicos reales, OpenAI y Paradigm fortalecen la evaluación de seguridad en la cadena

El líder en inteligencia artificial, OpenAI, anunció su colaboración con la reconocida firma de inversión en criptomonedas y riesgos, Paradigm, junto con la empresa de seguridad OtterSec, para lanzar EVMbench, una herramienta de referencia diseñada específicamente para evaluar el rendimiento de los agentes de IA (AI Agents) en la seguridad de contratos inteligentes en la máquina virtual de Ethereum (EVM).

Con la integración profunda de IA y tecnología criptográfica, los contratos inteligentes se han convertido en la infraestructura central para gestionar más de 100 mil millones en activos criptográficos de código abierto. La aparición de esta herramienta simboliza que la industria comienza a tomar en serio la capacidad práctica de la IA en entornos con importancia económica.

El equipo de OpenAI señala que, con los avances en la escritura y planificación de código por parte de los agentes de IA, en el futuro estos modelos jugarán un papel transformador en las áreas de ataque y defensa en blockchain, por lo que establecer un marco de evaluación estandarizado será crucial para monitorear el progreso de la IA.

Tres modos de prueba en profundidad, 120 vulnerabilidades reales de auditoría como piedra de toque para la IA

El diseño central de EVMbench gira en torno a 120 vulnerabilidades de alto riesgo extraídas de 40 informes de auditoría especializados, con datos provenientes de competiciones públicas de auditoría como Code4rena, asegurando que los escenarios de prueba reflejen la complejidad del mundo real. La evaluación coloca a los agentes de IA en tres modos de operación diferentes:

Fuente: Diseño central de EVMbench de OpenAI, que evalúa a los agentes de IA en tres modos diferentes

El primero es el “Modo de detección (Detect)”, donde la IA audita el código del contrato y detecta vulnerabilidades conocidas, asignando una puntuación según la gravedad de los problemas encontrados;
El segundo es el “Modo de reparación (Patch)”, que desafía a la IA a eliminar vulnerabilidades explotables y reparar el código sin alterar las funciones originales;
Finalmente, el “Modo de explotación (Exploit)”, en el que la IA debe ejecutar ataques de robo de fondos de extremo a extremo en un entorno de blockchain sandboxed.

Para garantizar la rigurosidad y repetibilidad de las pruebas, el equipo desarrolló una arquitectura de pruebas basada en Rust, utilizando técnicas de reproducción de transacciones deterministas para verificar si los ataques o reparaciones de la IA tienen éxito.

Tendencia de ataque y defensa claramente marcada, GPT-5.3-Codex muestra un crecimiento sorprendente en capacidades de ataque

En los primeros resultados publicados, se observa una diferencia significativa en el rendimiento de la IA en distintas tareas. La última generación, GPT-5.3-Codex, destaca en el modo de explotación (Exploit Mode), con una puntuación de 72.2 %, en comparación con solo 31.9 % de GPT-5, lanzado hace apenas seis meses, demostrando un crecimiento asombroso en sus capacidades.

Fuente: Resumen de puntuaciones de diversos modelos de IA de OpenAI en los tres modos

Esto indica que, cuando el objetivo es “vaciar fondos”, la IA posee una capacidad de planificación y ejecución iterativa muy potente. Sin embargo, en aspectos defensivos, su rendimiento es relativamente débil: en modo de detección, a menudo se detiene tras encontrar un solo error, y al reparar lógica compleja, suele tener dificultades para corregir vulnerabilidades sin afectar la operación normal del contrato. Los expertos en seguridad expresan preocupación, señalando que la IA podría reducir drásticamente el tiempo desde la detección de vulnerabilidades hasta el desarrollo de ataques, lo que exige una mayor velocidad de defensa en proyectos DeFi.

Contratación de talento y subsidios para defensa, OpenAI apuesta por la seguridad del ecosistema de agentes de IA

Además del desarrollo de herramientas, OpenAI también realiza movimientos en la contratación de talento y en la protección del ecosistema. Recientemente, contrató a Peter Steinberger, fundador del proyecto de código abierto de agentes de IA OpenClaw, para liderar el desarrollo de la próxima generación de agentes personalizados, transformando dicho proyecto en un fondo de apoyo respaldado por OpenAI.

Para hacer frente a los riesgos de ciberseguridad que la IA podría traer, OpenAI se compromete a destinar 10 millones de dólares en subsidios a través de su programa de apoyo en seguridad de redes, para apoyar investigaciones en herramientas de defensa de código abierto y en infraestructura crítica. Esta iniciativa resulta especialmente oportuna tras el reciente incidente con el protocolo Moonwell, donde un error en el código compartido por IA provocó pérdidas por aproximadamente 1.78 millones de dólares.

Lecturas relacionadas
Rechazo a la oferta de Meta por miles de millones, creadores de OpenClaw se unen a la competencia por talento con OpenAI, ¿todo por Vibe Coding? Predicción fallida de Moonwell, ¿quién pagará los 1.78 millones en pérdidas?

De cara al futuro, a medida que más agentes de pago con stablecoins asistidos por IA y billeteras automáticas se integren en el ecosistema, la capacidad de herramientas como EVMbench para distinguir entre modelos que solo describen vulnerabilidades y aquellos que pueden ofrecer soluciones de defensa confiables será un punto de inflexión clave en la seguridad blockchain.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los bonos de Bitcoin se expanden a medida que la empresa Fold aporta recompensas vinculadas a la nómina a los empleadores

bitcoin news Avance del proyecto Asociaciones y ecosistema

Fold Holdings amplió la compensación relacionada con el lugar de trabajo en bitcoin con un nuevo programa de bonificaciones para empleadores. El despliegue convierte los incentivos vinculados a la nómina en un posible canal de distribución para la adopción cotidiana de BTC. Conclusiones clave: Fold lanza bonificaciones en BTC, ampliando las vías de adopción por parte de los empleadores. Las empresas ganan

CoinpediaHace15m

Aave propone 25,000 ETH a DeFi United para el alivio del exploit de Kelp DAO

ethereum news Avance del proyecto Asociaciones y ecosistema

Los proveedores de servicios de Aave presentaron el viernes una propuesta de gobernanza para aportar 25,000 ETH—valorados en casi $58 millones—desde el DAO del protocolo a DeFi United, un esfuerzo coordinado de ayuda para restablecer el respaldo para rsETH tras el exploit del Kelp DAO. La contribución propuesta ayudaría a cerrar el

CryptoFrontierHace20m

Morgan Stanley lanza un fondo de reservas de stablecoin, posicionándose como administrador de reservas de la industria

Avance del proyecto Asociaciones y ecosistema Acciones

Mensaje de Gate News, 25 de abril — Morgan Stanley Investment Management (MSIM) ha presentado un fondo de cartera de reservas de stablecoin (MSNXX), un fondo de mercado monetario gubernamental diseñado exclusivamente para que los emisores de stablecoin mantengan de forma segura las reservas que respaldan sus versiones tokenizadas en fiat. El fondo invierte únicamente en t

GateNewsHace26m

El mainnet de Fluent Ethereum Layer 2 entra en vivo con el token BLEND y liquidez para el primer día de $50M Day-One

ethereum news Avance del proyecto Eventos del token

Mensaje de Gate News, 25 de abril — Fluent, una red de Capa 2 de Ethereum, lanzó su mainnet y el token nativo BLEND el viernes con $50 millones en liquidez comprometida para el primer día. La red presenta ejecución combinada, una arquitectura que permite que aplicaciones creadas para diferentes máquinas virtuales operen dentro del mismo estado de la cadena. USDnr, el stablecoin nativo de Fluent construido a través de la socia Nerona, genera rendimiento de T-bills que se acumula al protocolo. Fluent integra Prints, una capa de reputación lanzada en enero que agrega señales de comportamiento, incluidas las puntuaciones Ethos y los datos de seguidores inteligentes de Kaito, en perfiles programables. Los desarrolladores pueden usar estos perfiles a través de Fluent Connect para identificar y atender a usuarios verificados por reputación. Siete aplicaciones se lanzaron el primer día: Vena un protocolo de préstamo basado en reputación, Yumi un servicio de compra ahora y paga después, Pulse Predictor un protocolo de sondeo onchain, Pump Pals deportes de fantasía, Blend una herramienta de integración de rendimiento, y Sprout un gestor de estrategia DeFi. BLEND es un token de utilidad para las operaciones de la red, comisiones de transacción, staking y señales de la comunidad. El proyecto realizó una venta pública de tokens del 7 de abril al 13 de abril en una plataforma importante, ofreciendo 10 millones de tokens 1% del suministro inicial a $0.10 por token, lo que implica una valoración totalmente diluida de millones. El suministro inicial se establece en 1 mil millones de tokens. Un airdrop comunitario que representa el 0.71% del suministro inicial se distribuirá en el evento de generación del token con una ventana de reclamación de 30 días. Fluent Labs ha recaudado $11.2 millones hasta la fecha: una ronda semilla de millones liderada por Polychain Capital en febrero de 2025, una ronda de testnet de $2.2 millones en julio de 2025, y una venta pública de tokens de millones en abril de 2026. La red utiliza rWasm, una representación intermedia de bajo nivel, para simular comportamientos de EVM, SVM y Wasm para la ejecución, y emplea FluentBFT como su mecanismo de consenso descentralizado.

GateNewshace1h

El desarrollador de Bitcoin Paul Sztorc anuncia el hard fork de eCash con intercambio de BTC 1:1, desatando controversia en la comunidad

bitcoin news Avance del proyecto

Mensaje de Gate News, 25 de abril — el desarrollador de Bitcoin Paul Sztorc anunció el lanzamiento de eCash, una red de hard fork de Bitcoin que permitirá a los tenedores de BTC intercambiar sus participaciones en una proporción 1:1 por tokens de eCash después de la activación de la red. El software del nodo de la Capa 1 será una casi réplica del cliente de Bi

GateNewshace3h

Aave Secures $69,576 ETH Aid Pledges, Closing $5,505 ETH Gap in rsETH Recovery

ethereum news Avance del proyecto Datos on-chain

Gate News message, April 25 — Aave has secured aid pledges totaling 69,576 ETH to cover losses from the rsETH incident, leaving a remaining shortfall of just 5,505 ETH, according to on-chain analyst Yu Jin. The lending protocol contributed 25,000 ETH (approximately $57.75 million) from its own

GateNewshace6h

Comentar

0/400

Sin comentarios