A xAI de Elon Musk acaba de lançar a sua Gota 4.1 Fast API, e os benchmarks são bastante impressionantes. Está no topo da tabela de líderes τ²-Bench, especificamente para tarefas de telecomunicações (pensando em cenários de uso de ferramentas agentivas), ultrapassando o Gemini 3 Pro. O que torna isso interessante é como está a ultrapassar limites no desempenho de ponta para aplicações API do mundo real.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
5 Curtidas
Recompensa
5
2
Repostar
Compartilhar
Comentário
0/400
LiquidityHunter
· 8h atrás
o grok lançou mais uma versão, o Musk realmente não consegue ficar parado...
---
A tarefa de telecom está superando a gemini? Esses dados são reais ou é só mais uma autocelebração?
---
eu não entendi muito bem a parte da equação tau, alguém pode explicar de forma simples como eles conseguiram estar à frente?
---
A aplicação de API do mundo real parece boa, mas o que realmente importa é se ela funciona de forma estável na prática
---
A velocidade da API é realmente interessante, é mais prático do que apenas indicadores de desempenho puro
---
Mais uma vez no primeiro lugar do ranking, vamos ver por quanto tempo conseguem se manter...
Ver originalResponder0
FUD_Vaccinated
· 8h atrás
grok está de volta, mas quem realmente está usando o ranking τ²-Bench...
A xAI de Elon Musk acaba de lançar a sua Gota 4.1 Fast API, e os benchmarks são bastante impressionantes. Está no topo da tabela de líderes τ²-Bench, especificamente para tarefas de telecomunicações (pensando em cenários de uso de ferramentas agentivas), ultrapassando o Gemini 3 Pro. O que torna isso interessante é como está a ultrapassar limites no desempenho de ponta para aplicações API do mundo real.