Отсканируйте, чтобы загрузить приложение Gate
qrCode
Больше вариантов загрузки
Не напоминай мне больше сегодня.

Илон Маск's xAI только что выпустил свой Grok 4.1 Fast API, и результаты тестов довольно впечатляющие. Он занимает первое место в таблице τ²-Bench, особенно для телекоммуникационных задач (сценарии использования агентных инструментов), обгоняя Gemini 3 Pro. Что делает это интересным, так это то, как он раздвигает границы передового опыта для реальных приложений API.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 2
  • Репост
  • Поделиться
комментарий
0/400
LiquidityHuntervip
· 8ч назад
grok снова выпустил новую версию, Маск действительно не может сидеть на месте... --- задача telecom действительно превосходит gemini? Эти данные реальные или это просто самовосхваление? --- tau-уравнение я не совсем понял, кто-нибудь может просто объяснить, как оно стало лидером? --- применение real-world api звучит неплохо, но главное - это стабильность в реальной эксплуатации --- функция fast api действительно интересна, она более практична, чем чисто производительные показатели --- еще один список с первым местом, надо посмотреть, как долго это продлится...
Посмотреть ОригиналОтветить0
FUD_Vaccinatedvip
· 8ч назад
grok снова в игре, но кто действительно использует этот рейтинг τ²-Bench...
Посмотреть ОригиналОтветить0
  • Закрепить