Илон Маск's xAI только что выпустил свой Grok 4.1 Fast API, и результаты тестов довольно впечатляющие. Он занимает первое место в таблице τ²-Bench, особенно для телекоммуникационных задач (сценарии использования агентных инструментов), обгоняя Gemini 3 Pro. Что делает это интересным, так это то, как он раздвигает границы передового опыта для реальных приложений API.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
5 Лайков
Награда
5
2
Репост
Поделиться
комментарий
0/400
LiquidityHunter
· 8ч назад
grok снова выпустил новую версию, Маск действительно не может сидеть на месте...
---
задача telecom действительно превосходит gemini? Эти данные реальные или это просто самовосхваление?
---
tau-уравнение я не совсем понял, кто-нибудь может просто объяснить, как оно стало лидером?
---
применение real-world api звучит неплохо, но главное - это стабильность в реальной эксплуатации
---
функция fast api действительно интересна, она более практична, чем чисто производительные показатели
---
еще один список с первым местом, надо посмотреть, как долго это продлится...
Посмотреть ОригиналОтветить0
FUD_Vaccinated
· 8ч назад
grok снова в игре, но кто действительно использует этот рейтинг τ²-Bench...
Илон Маск's xAI только что выпустил свой Grok 4.1 Fast API, и результаты тестов довольно впечатляющие. Он занимает первое место в таблице τ²-Bench, особенно для телекоммуникационных задач (сценарии использования агентных инструментов), обгоняя Gemini 3 Pro. Что делает это интересным, так это то, как он раздвигает границы передового опыта для реальных приложений API.