Claude Code の自動化研究がハッカソン優勝を獲得!受賞者:そもそも自分がどうやって勝ったのか全然分からない

Paradigm 主催の Autoresearch Hackathon において、「ほとんど自分で戦略を設計していない」参加者が、最終的に優勝を果たした。優勝者の Ryan Li は同時に SurfAI の CEO でもあり、解答プロセス全体はほぼ完全に AI に任せており、自分自身さえ「どうやって勝ったのか分からない」と語り、最終的に Prediction Market Challenge で首位を獲得した。

この大会では、模擬された二項予測マーケット上でマーケットメイク戦略を設計することが求められ、指値注文によってオーダーブックに流動性を提供し、「アービトラージャー(裁定者)」と「一般の小口投資家のフロー」の間で利益のバランスを取る。最終順位は、戦略に基づいて 200 回のランダムシミュレーションにおける平均 edge(利潤の優位性)で計算される。Ryan の最終成績は 42.32 ドルの mean edge(3 つのランダムシードの中央値で計算)で、再評価後に首位に登り詰めた。

Claude Code + Codex による自動リサーチで 1039 個の戦略を生成

従来のクオンツ取引やマーケットメイク戦略が人間の専門家によるパラメータ調整やモデリングに依存していたのとは異なり、Ryan は近年 Rich Sutton が提唱した「Bitter Lesson(苦い教訓)」の考え方を採用し、計算力と探索規模で人間の経験を打ち負かす。彼は問題全体を「自動リサーチ(autoresearch)」のプロセスに変換し、手動で最適化するのではなく、複数の AI agent を並列にして解法空間を探索した。

その過程で彼は、8 から 20 までの並列稼働の AI agent(主に Claude Code をベースにし、Codex で補助)を投入し、それぞれが異なる仮説とパラメータ空間を担当して、継続的に戦略を生成し、シミュレーションを実行し、結果をフィードバックした。最終的に、1,039 個の戦略バリエーションを累積して 2,000 回以上の評価を行い、さらに 47 個のパラメータスキャン用スクリプトを自動生成した。全体の探索規模は、数週間の手作業による実験を数時間に圧縮したのに相当する。

AI が出力した 900 行の Python のマーケットメイクアルゴリズムがハッカソン優勝

戦略面では、最終的に勝ち残った案は、約 900 行の Python で構築されたマーケットメイクアルゴリズムであり、コアロジックは単一の設計に由来するのではなく、「有効性が検証された」複数のモジュールを積み重ねたものだ。具体的には、裁定者が必勝となる極めて狭いスプレッドの領域を避けること、情報理論に基づいて真の価格を推定すること、裁定リスクに応じて提示規模を動的に調整すること、そして相手のオーダーブックが食い尽くされると高い利益が得られる領域に積極的に入り込むことなどが含まれる。

中でも最も重要なブレークスルーは、「既存の戦略を完全に捨てて、ゼロから始める」AI agent から生まれた。全体の最適化が約 +25 edge で停滞していたとき、その agent は単独で、 「裁定リスク確率」を中核とする sizing(サイズ決定)モデルを発見し、その結果として戦略のパフォーマンスは一気に +44 まで押し上げられ、これが大会の転機になった。この結果はまた、Ryan の方法論を直接裏付けてもいる。探索が局所最適に陥ったときは、微調整よりも再起動のほうが有効だ、ということだ。

AI 研究の絶対的な優位性:自動化された試行錯誤

Ryan はまとめの中で、この大会の鍵は「賢い戦略」を設計することではなく、アイデアを大規模に検索・検証し、淘汰できるシステムを構築することだと述べた。人間の直感に頼るよりも、AI に広大な解空間の中で試行錯誤させ、並列化と自動化によって効率を拡大するほうがよい。

この事例はさらに、「Agentic AI(エージェンティック AI)」がエンジニアリングや研究プロセスにおいて担う役割の変化を強化する。AI はもはや単なる補助ツールではなく、探索と意思決定の核心を直接担う実行単位になり得る。高度に構造化され、シミュレーション可能な問題においては、人間がそもそも「解答者」から完全に離れ、探索フレームワークと評価メカニズム自体を設計することさえ可能だ。

この記事は Claude Code による自動リサーチがハッカソン優勝!受賞者:僕はそもそもどうやって勝ったのか全然知らない—最初に 鏈新聞 ABMedia に掲載されました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

勝率100%のトレーダーが、マイクロストラテジーは年末までに1M BTC超を保有すると賭けて$12.3K

epsteinfilesとして知られるトレーダーは、Lookonchainと$12,300の賭けを行い、MicroStrategyが2026年12月31日までに1百万BTCを超えて保有すると予測している。過去の賭けにおいて完璧な実績があるとしている。

GateNews2時間前

イノベーションを後押し!美法官がアリゾナ州の予測市場に対する規制を禁じ、Kalshiに対する訴追を停止

米国の連邦地方法院は、アリゾナ州がギャンブル法に基づいて予測市場プラットフォームのKalshiを起訴することを禁じる裁定を下し、連邦商品先物取引委員会が専属管轄権を有すると判断した。 この裁定は、金融市場の規制における州と連邦の権限の境界に影響を与える一方、Kalshiは、自社の事業が金融商品であり、従来型のギャンブルではないと主張している。 予測市場に関する各州の判断は一様ではなく、トランプ家も予測市場への支持を表明している。

CryptoCity3時間前

21Shares が Hyperliquid ETF の申請を更新し、THYP コードを開示

21Shares は Hyperliquid ETF の申請を更新し、株式コード THYP を確認しました。これは SEC の意見に対する応答としての調整と見なされており、この動きは同 ETF 上場の可能性を高めています。Bitwise の HYPE ETF と比べると、後者は 0.67% の管理費をすでに公表しており、市場最高水準の 1 つです。Hyperliquid プラットフォームの強力なファンダメンタルズが注目を集めていますが、アルトコイン ETF への資金流入の不確実性に直面する中で、市場の需要はいまだ観察が必要です。

MarketWhisper3時間前

大手CEXパートナーがHigh Roller Technologiesと提携し、予測市場分野へ進出

大手の中央集権型取引所が High Roller Technologies と提携し、米国で予測市場サービスを提供しています。アナリストは、この分野が大幅に成長すると見込んでいますが、規制上の課題にも直面しています。

GateNews5時間前

イノベーションを奨励!米判事、アリゾナ州の予測市場の規制を禁止し、Kalshiの訴追を停止

米国の連邦地方裁判所は、アリゾナ州がギャンブル法に依拠して予測市場プラットフォームKalshiを訴追することを禁じる裁定を下し、連邦商品先物取引委員会が専属的な管轄権を有すると判断した。この裁決は、金融市場監管における州と連邦の権限の境界に影響を与える一方、Kalshiは自社の事業が金融商品であって従来型の賭博ではないと主張している。各州の予測市場に対する判断は一様ではなく、トランプ家も予測市場を支持する意向を示している。

CryptoCity6時間前

イノベーションを後押し!米判事がアリゾナ州の予測市場の規制を禁じ、Kalshiに対する起訴を停止

米国連邦地方裁判所は、カリフォルニア州がギャンブル法に依拠して予測市場プラットフォームKalshiを起訴することを禁止する裁定を下し、連邦商品先物取引委員会が専属管轄権を有すると判断した。この裁定は、金融市場の規制における州と連邦の権限の境界線に影響を与える。Kalshiは、同社の事業が従来のギャンブルではなく金融商品に当たると主張している。予測市場に関する各州の判断は一様ではなく、トランプ一家も予測市場への支持を表明している。

CryptoCity9時間前
コメント
0/400
コメントなし