Ілон Маск's xAI тільки що випустила свій Grok 4.1 Fast API, і результати тестування досить вражаючі. Він очолює таблицю лідерів τ²-Bench, зокрема для телекомунікаційних завдань (сценаріїв використання агентних інструментів), обганяючи Gemini 3 Pro. Що робить це цікавим, так це те, як він розширює межі сучасної продуктивності для реальних API-додатків.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
5 лайків
Нагородити
5
2
Репост
Поділіться
Прокоментувати
0/400
LiquidityHunter
· 4год тому
grok знову випустив нову версію, Маск справді не може сидіти на місці...
---
завдання telecom розриває gemini? Ці дані реальні чи знову самозадоволення?
---
dau рівняння не зовсім зрозумів, хтось може просто пояснити, як вони випередили?
---
реальні API застосування звучать непогано, але важливо, щоб вони працювали стабільно на практиці
---
швидкий API дійсно цікавий, це більш корисно, ніж просто показники продуктивності
---
ще один перше місце в рейтингу, подивимось, як довго це триватиме...
Переглянути оригіналвідповісти на0
FUD_Vaccinated
· 4год тому
grok знову в дії, але хто насправді використовує цей список τ²-Bench...
Ілон Маск's xAI тільки що випустила свій Grok 4.1 Fast API, і результати тестування досить вражаючі. Він очолює таблицю лідерів τ²-Bench, зокрема для телекомунікаційних завдань (сценаріїв використання агентних інструментів), обганяючи Gemini 3 Pro. Що робить це цікавим, так це те, як він розширює межі сучасної продуктивності для реальних API-додатків.