Ілон Маск's xAI тільки що випустила свій Grok 4.1 Fast API, і результати тестування досить вражаючі. Він очолює таблицю лідерів τ²-Bench, зокрема для телекомунікаційних завдань (сценаріїв використання агентних інструментів), обганяючи Gemini 3 Pro. Що робить це цікавим, так це те, як він розширює межі сучасної продуктивності для реальних API-додатків.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

5 лайків

Нагородити
5
2
Репост
Поділіться

Прокоментувати

0/400

LiquidityHunter

· 4год тому

grok знову випустив нову версію, Маск справді не може сидіти на місці... --- завдання telecom розриває gemini? Ці дані реальні чи знову самозадоволення? --- dau рівняння не зовсім зрозумів, хтось може просто пояснити, як вони випередили? --- реальні API застосування звучать непогано, але важливо, щоб вони працювали стабільно на практиці --- швидкий API дійсно цікавий, це більш корисно, ніж просто показники продуктивності --- ще один перше місце в рейтингу, подивимось, як довго це триватиме...

Переглянути оригіналвідповісти на0

FUD_Vaccinated