福利加碼,Gate 廣場明星帶單交易員二期招募開啟!
入駐發帖 · 瓜分 $20,000 月度獎池 & 千萬級流量扶持!
如何參與:
1️⃣ 報名成為跟單交易員:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 報名活動:https://www.gate.com/questionnaire/7355
3️⃣ 入駐 Gate 廣場,持續發布交易相關原創內容
豐厚獎勵等你拿:
首帖福利:首發優質內容即得 $30 跟單体验金
雙周內容激勵:每雙周瓜分 $500U 內容獎池
排行榜獎勵:Top 10 交易員額外瓜分 $20,000 登榜獎池
流量扶持:精選帖推流、首頁推薦、周度明星交易員曝光
活動時間:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49849
OpenAI 推出智能合約安全評估系統
OpenAI 推出了一個名為 EVMbench 的新系統,旨在衡量人工智慧代理在發現與修復加密智能合約安全漏洞方面的能力。
摘要
該公司於2月18日宣布,與 Paradigm 合作開發了 EVMbench。此基準專注於為以太坊虛擬機(EVM)構建的合約,旨在測試 AI 系統在實際金融環境中的表現。
OpenAI 表示,目前智能合約保護著超過1000億美元的開源加密資產,隨著 AI 工具能力的提升,安全測試變得越來越重要。
測試 AI 處理真實安全風險的能力
EVMbench 評估 AI 代理在三個主要任務中的表現:檢測漏洞、修復有缺陷的程式碼,以及模擬攻擊。該系統使用來自40次過去安全審計的120個高風險問題,許多來自公開審計比賽。
額外的場景則取自對 Tempo 區塊鏈的審查,該網絡專為穩定幣用途而設計,反映智能合約在金融應用中的實際使用情況。
為建立測試環境,OpenAI 改編了現有的利用腳本,並在必要時創建新腳本。所有利用測試均在隔離系統中運行,而非在實時網絡上,且僅包含已披露的漏洞。
在檢測模式下,代理會審查合約程式碼並試圖識別已知的安全缺陷。在修補模式下,它們必須修復這些缺陷而不破壞軟體。在利用模式中,代理則在受控環境中嘗試從漏洞合約中抽取資金。
初步結果與行業影響
OpenAI 表示,已開發專用測試框架以確保結果的可重複性與驗證性。
該公司使用 EVMbench 測試了多款先進模型。在利用模式中,GPT-5.3-Codex 達到72.2%的得分,而六個月前發布的 GPT-5 則為31.9%。檢測與修補的得分較低,顯示許多漏洞仍難以由 AI 系統處理。
研究人員觀察到,當目標明確(如抽取資金)時,代理的表現最佳;而在需要深入分析(如審查大型程式碼庫或修復微妙錯誤)時,表現則較差。
OpenAI 承認,EVMbench 並未完全反映現實世界的情況。許多主要的加密項目會進行比資料集更為全面的審查,且某些基於時間的攻擊與多鏈攻擊也不在系統範圍內。
該公司表示,該基準旨在支持 AI 在網絡安全中的防禦性應用。隨著 AI 工具變得更強大,它們可能被攻擊者與審計者雙方使用。測量其能力被視為降低風險與促進負責任部署的方法。
在發布同時,OpenAI 表示將擴展安全計畫,並投資1000萬美元的 API 積分,以支持開源與基礎設施保護。所有 EVMbench 工具與數據集已公開,以促進進一步研究。