Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

イーロン・マスクのxAIがGrok 4.1 Fast APIをドロップしたばかりで、ベンチマークはかなり驚異的です。特にテレコムタスクのτ²-Benchリーダーボードで、(エージェントツール使用シナリオ)の先頭に立っています。これが興味深いのは、実世界のAPIアプリケーションにおける最先端のパフォーマンスの限界を押し広げている点です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 2
  • リポスト
  • 共有
コメント
0/400
LiquidityHuntervip
· 8時間前
grokがまた新しいバージョンをリリースしましたね、マスクは本当に暇がないようです... --- telcomのタスクがgeminiを圧倒する?このデータは本当にリアルなのか、それともまた自画自賛しているだけなのか --- tau方程式のところはあまり理解できませんでした、誰か簡単に説明してもらえますか、どうして先行しているのですか --- 実世界のAPIアプリケーションは良さそうですが、実際に動かしてみて安定するかどうかが重要です --- fast APIは確かに面白いですね、純粋な性能指標よりも実用的です --- また一つのランキングで1位、今回はどれくらい続くのか見てみましょう...
原文表示返信0
FUD_Vaccinatedvip
· 8時間前
grokがまた巻き起こっているが、τ²-Benchのこのランキングを本当に使っているのは誰なのか...
原文表示返信0
  • ピン