
OpenAI em parceria com Paradigm lança EVMbench, avaliando na prática a capacidade de ataque e defesa de agentes de IA em contratos EVM, revelando vulnerabilidades e pontos fracos.
Focando em testes no ambiente econômico real, OpenAI e Paradigm reforçam a avaliação de segurança na blockchain
Líder em inteligência artificial, OpenAI anunciou uma colaboração com a conhecida empresa de risco de criptomoedas Paradigm e a empresa de segurança OtterSec para lançar o EVMbench, uma ferramenta de benchmark projetada para avaliar o desempenho de agentes de IA na segurança de contratos inteligentes na Ethereum Virtual Machine (EVM).
À medida que IA e tecnologia de criptografia se fundem profundamente, contratos inteligentes tornaram-se a infraestrutura central para gerenciar mais de 1000 bilhões de ativos criptográficos de código aberto. O lançamento desta ferramenta simboliza que a indústria começa a reconhecer a capacidade prática da IA em ambientes com significado econômico.
A equipe da OpenAI destaca que, com o avanço dos agentes de IA na escrita e planejamento de código, esses modelos desempenharão um papel transformador na defesa e ataque na blockchain. Portanto, estabelecer uma estrutura de avaliação padronizada é crucial para monitorar o progresso da IA.
Três modos de teste aprofundados, 120 vulnerabilidades reais de auditoria tornam-se a pedra de toque da IA
O design central do EVMbench gira em torno de 120 vulnerabilidades de alto risco extraídas de 40 relatórios de auditoria especializados, com fontes incluindo competições públicas de auditoria como Code4rena, garantindo que os cenários de teste reflitam a complexidade do mundo real. A ferramenta avalia agentes de IA em três modos de operação diferentes:

Fonte: OpenAI O design central do EVMbench é avaliar os agentes de IA em três modos distintos de operação
- Primeiro, o “Modo de Detecção (Detect)”, onde a IA audita o código do contrato e identifica vulnerabilidades conhecidas, atribuindo uma pontuação com base na gravidade dos problemas encontrados;
- Segundo, o “Modo de Correção (Patch)”, desafiando a IA a remover vulnerabilidades exploráveis e corrigir o código sem alterar funcionalidades existentes;
- Por último, o controverso “Modo de Exploração (Exploit)”, onde a IA deve executar ataques de roubo de fundos de ponta a ponta em um ambiente sandboxed de blockchain.
Para garantir rigor e reprodutibilidade, a equipe desenvolveu uma estrutura de testes baseada em Rust, usando técnicas de replay de transações determinísticas para verificar se os ataques ou correções da IA tiveram sucesso.
Tendência de ataque crescente, GPT-5.3-Codex demonstra crescimento surpreendente em ataques
Nos primeiros resultados divulgados, a IA mostrou diferenças claras de desempenho entre tarefas distintas. A mais recente geração, GPT-5.3-Codex, destacou-se no modo de exploração, atingindo uma pontuação de 72,2%, uma melhora impressionante em relação ao GPT-5, lançado há apenas seis meses, com 31,9%.

Fonte: Visão geral das pontuações de vários modelos de IA da OpenAI nos três modos
Isso demonstra que, quando o objetivo é “esvaziar fundos”, a IA possui forte capacidade de planejamento e execução iterativa. No entanto, seu desempenho na defesa é relativamente fraco, frequentemente parando a busca após detectar um único erro, e tendo dificuldades em corrigir vulnerabilidades complexas sem impactar a operação normal do contrato. Especialistas em segurança expressaram preocupação, alertando que a IA pode reduzir drasticamente o tempo entre a descoberta de vulnerabilidades e o desenvolvimento de ataques, elevando o nível de exigência na defesa de projetos DeFi.
Contratação de talentos e subsídios de defesa, OpenAI fortalece o ecossistema de agentes de IA
Além do desenvolvimento de ferramentas, a OpenAI também atua na contratação de talentos e na defesa do ecossistema, recentemente recrutando Peter Steinberger, fundador do projeto de código aberto de agentes de IA OpenClaw, para liderar o desenvolvimento de agentes personalizados de próxima geração, transformando o projeto em uma fundação apoiada pela OpenAI.
Para enfrentar os riscos de segurança cibernética potencialmente causados pela IA, a OpenAI compromete-se a destinar 10 milhões de dólares de seu programa de subsídios de segurança de rede para apoiar o desenvolvimento de ferramentas de defesa de código aberto e infraestrutura crítica. Essa iniciativa ganhou relevância após o incidente recente na Moonwell, onde um erro de cálculo de preço no código colaborativo de IA resultou em perdas de aproximadamente 1,78 milhões de dólares.
Leitura adicional
Recusando convite de bilhões do Meta, criador do OpenClaw entra na disputa por talentos com a OpenAI; Previsão de falha no oráculo Moonwell, quem pagará pelos 1,78 milhões de prejuízo?
No futuro, à medida que mais agentes de pagamento com suporte de IA para stablecoins e carteiras automáticas entrarem na ecologia, a capacidade de distinguir modelos que apenas descrevem vulnerabilidades daqueles que podem oferecer soluções de defesa confiáveis usando ferramentas como o EVMbench será um ponto de inflexão crucial na segurança da blockchain.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Mainnet Ethereum de Fluent Está Online Com o Token BLEND e Liquidez no Primeiro Dia de $50M
Mensagem da Gate News, 25 de Abril — Fluent, uma rede de Camada 2 da Ethereum, lançou a sua mainnet e o seu token nativo BLEND na sexta-feira com $50 milhões em liquidez comprometida no primeiro dia. A rede apresenta execução blended, uma arquitectura que permite que aplicações construídas para diferentes máquinas virtuais operem dentro do mesmo estado da cadeia. USDnr, a stablecoin nativa da Fluent criada através da parceira Nerona, gera rendimento de T-bills que se acumula ao protocolo.
Fluent integra Prints, uma camada de reputação lançada em Janeiro que agrega sinais comportamentais, incluindo pontuações Ethos e dados de seguidores inteligentes Kaito, em perfis programáveis. Os programadores podem utilizar estes perfis através do Fluent Connect para identificar e servir utilizadores verificados por reputação. Sete aplicações foram lançadas no primeiro dia: Vena um protocolo de concessão de crédito baseado em reputação, Yumi um serviço buy-now-pay-later, Pulse Predictor um protocolo de sondagem onchain, Pump Pals um desporto de fantasia, Blend uma ferramenta de integração de yield, e Sprout um gestor de estratégias DeFi.
BLEND é um token de utilidade para operações da rede, taxas de transacção, staking e sinalização da comunidade. O projecto realizou uma venda pública de tokens de 7 de Abril a 13 de Abril numa plataforma importante, oferecendo 10 milhões de tokens 1% da oferta inicial a $0.10 por token, implicando uma avaliação totalmente diluída de milhões. A oferta inicial está definida em 1 mil milhões de tokens. Uma distribuição de airdrop comunitário equivalente a 0.71% da oferta inicial será atribuída no evento de geração de tokens, com uma janela de levantamento de 30 dias.
Fluent Labs já angariou $11.2 milhões até à data: um milhões round de seed liderado pela Polychain Capital em Fevereiro de 2025, um round de testnet de $2.2 milhões em Julho de 2025, e uma venda pública de tokens de milhões em Abril de 2026. A rede utiliza rWasm, uma representação intermédia de baixo nível, para simular comportamentos de EVM, SVM e Wasm para execução, e emprega FluentBFT como o seu mecanismo de consenso descentralizado.
GateNews1h atrás
O programador de Bitcoin Paul Sztorc anuncia um hard fork do eCash com troca de BTC 1:1, despoletando controvérsia na comunidade
Mensagem do Gate News, 25 de abril — O programador de Bitcoin Paul Sztorc anunciou o lançamento do eCash, uma rede de hard fork do Bitcoin que permitirá aos detentores de BTC trocarem os seus activos numa proporção de 1:1 por tokens de eCash após a activação da rede. O software do nó da Camada 1 será uma quase-replicação do cliente do Bi
GateNews3h atrás
Aave garante compromissos de ajuda de 69,576 ETH, fechando a lacuna de 5,505 ETH na recuperação do rsETH
Mensagem do Gate News, 25 de abril — Aave garantiu compromissos de ajuda no total de 69,576 ETH para cobrir perdas do incidente rsETH, deixando uma falta remanescente de apenas 5,505 ETH, segundo o analista on-chain Yu Jin. O protocolo de empréstimos contribuiu 25,000 ETH (aproximadamente $57.75 milhões) provenientes das suas próprias
GateNews5h atrás
JPMorgan: A tokenização irá transformar a indústria de fundos, mas os “bons casos de utilização” ainda estão a anos de distância
JPMorgan Sinaliza a Tokenização como Catalisador de Âmbito Industrial
Ciarán Fitzpatrick, responsável global de produtos de ETF e serviços de valores mobiliários da JPMorgan, afirmou num post de sexta-feira que a tokenização impulsionará uma mudança fundamental em toda a indústria de fundos, e não apenas em fundos negociados em bolsa. “Acreditamos que a tokenização
CryptoFrontier9h atrás
Aave propõe uma contribuição de 25.000 ETH para a DeFi United para recuperação do exploit do Kelp DAO
Mensagem do Gate News, 24 de abril — Os fornecedores de serviços do Aave propuseram uma contribuição de governação de 25.000 ETH, no valor aproximado de $58 milhões, a partir do DAO do protocolo para a DeFi United na sexta-feira, para ajudar a restaurar o suporte para rsETH na sequência do exploit do Kelp DAO da semana passada. O ataque comprometeu uma ponte LayerZero
GateNews10h atrás
Perspetiva do preço da ADA enquanto Cardano chega a um acordo tokenizado da LSE
Principais conclusões
A Cardano tokenizou um produto de resseguro da Hannover Re e listou-o na Bolsa de Valores de Londres, expandindo a utilização da blockchain em mercados institucionais regulamentados.
O preço do ADA mantém-se dentro de um wedge descendente à medida que o suporte nos $0.2400 permanece intacto enquanto a resistência perto de $0.2550 e $0.2824 l
CryptoNewsLand11h atrás