Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

Kimi K2 Thinkingは、推論、コーディング、エージェント能力のベンチマーク評価において新記録を樹立しました

金十データ11月8日付によると、月の暗面公式サイトによると、Kimi K2 Thinkingは推論、コーディング、エージェント能力のベンチマーク評価で新記録を達成しました。K2 ThinkingはHLEベンチマーク評価で44.9%のSOTA成績を収め、BrowseCompテストで60.2%、SWE-Bench Verifiedテストで71.3%を記録し、最先端の思考エージェントモデルとしての強力な汎用性を示しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
関連トピック
#
ai
コメント
0/400
コメントなし
  • ピン