A xAI de Elon Musk acaba de lançar a sua Gota 4.1 Fast API, e os benchmarks são bastante impressionantes. Está no topo da tabela de líderes τ²-Bench, especificamente para tarefas de telecomunicações (pensando em cenários de uso de ferramentas agentivas), ultrapassando o Gemini 3 Pro. O que torna isso interessante é como está a ultrapassar limites no desempenho de ponta para aplicações API do mundo real.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
5 gostos
Recompensa
5
2
Republicar
Partilhar
Comentar
0/400
LiquidityHunter
· 8h atrás
o grok lançou mais uma versão, o Musk realmente não consegue ficar parado...
---
A tarefa de telecom está superando a gemini? Esses dados são reais ou é só mais uma autocelebração?
---
eu não entendi muito bem a parte da equação tau, alguém pode explicar de forma simples como eles conseguiram estar à frente?
---
A aplicação de API do mundo real parece boa, mas o que realmente importa é se ela funciona de forma estável na prática
---
A velocidade da API é realmente interessante, é mais prático do que apenas indicadores de desempenho puro
---
Mais uma vez no primeiro lugar do ranking, vamos ver por quanto tempo conseguem se manter...
Ver originalResponder0
FUD_Vaccinated
· 8h atrás
grok está de volta, mas quem realmente está usando o ranking τ²-Bench...
A xAI de Elon Musk acaba de lançar a sua Gota 4.1 Fast API, e os benchmarks são bastante impressionantes. Está no topo da tabela de líderes τ²-Bench, especificamente para tarefas de telecomunicações (pensando em cenários de uso de ferramentas agentivas), ultrapassando o Gemini 3 Pro. O que torna isso interessante é como está a ultrapassar limites no desempenho de ponta para aplicações API do mundo real.