Elon Musk'un xAI'si, Grok 4.1 Fast API'yi yeni duyurdu ve benchmark sonuçları oldukça çarpıcı. Bu, özellikle telekom görevleri için τ²-Bench liderlik tablosunu zirveye taşıyor (, ajanik araç kullanımı senaryolarında ), Gemini 3 Pro'yu geride bırakıyor. Bunu ilginç kılan şey, gerçek dünya API uygulamaları için en son performans sınırlarını zorlaması.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
5 Likes
Reward
5
3
Repost
Share
Comment
0/400
LiquidityHunter
· 12h ago
grok yine yine yeni bir versiyon çıkardı, Musk gerçekten boş duramıyor...
---
telecom görevi gemini'yi geçiyor mu? Bu veriler gerçek mi yoksa yine kendi kendine eğleniyor mu?
---
tau denklemi konusunda pek anlamadım, biri basitçe nasıl öne geçtiğini açıklayabilir mi?
---
gerçek dünya api uygulamaları kulağa hoş geliyor, ama gerçekten çalıştığında ne kadar sağlam olduğu önemli
---
hızlı api bu açıdan gerçekten ilginç, saf performans göstergelerinden daha kullanışlı
---
bir başka liste birinciliği, bu sefer ne kadar süre dayanabileceğine bakmak lazım...
View OriginalReply0
FUD_Vaccinated
· 12h ago
grok yine gündemde ama τ²-Bench bu listeyi kim gerçekten kullanıyor...
Elon Musk'un xAI'si, Grok 4.1 Fast API'yi yeni duyurdu ve benchmark sonuçları oldukça çarpıcı. Bu, özellikle telekom görevleri için τ²-Bench liderlik tablosunu zirveye taşıyor (, ajanik araç kullanımı senaryolarında ), Gemini 3 Pro'yu geride bırakıyor. Bunu ilginç kılan şey, gerçek dünya API uygulamaları için en son performans sınırlarını zorlaması.