Илон Маск's xAI только что выпустил свой Grok 4.1 Fast API, и результаты тестов довольно впечатляющие. Он занимает первое место в таблице τ²-Bench, особенно для телекоммуникационных задач (сценарии использования агентных инструментов), обгоняя Gemini 3 Pro. Что делает это интересным, так это то, как он раздвигает границы передового опыта для реальных приложений API.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

5 Лайков

Награда
5
2
Репост
Поделиться

комментарий

0/400

LiquidityHunter

· 8ч назад

grok снова выпустил новую версию, Маск действительно не может сидеть на месте... --- задача telecom действительно превосходит gemini? Эти данные реальные или это просто самовосхваление? --- tau-уравнение я не совсем понял, кто-нибудь может просто объяснить, как оно стало лидером? --- применение real-world api звучит неплохо, но главное - это стабильность в реальной эксплуатации --- функция fast api действительно интересна, она более практична, чем чисто производительные показатели --- еще один список с первым местом, надо посмотреть, как долго это продлится...

Посмотреть ОригиналОтветить0

FUD_Vaccinated