API xAI Elon Musk baru saja meluncurkan Grok 4.1 Fast API, dan hasil benchmark-nya cukup mengesankan. Ini memuncaki papan pemimpin τ²-Bench khusus untuk tugas telekomunikasi (membayangkan skenario penggunaan alat yang agens ), melampaui Gemini 3 Pro. Yang membuat ini menarik adalah bagaimana ini mendorong batasan dalam kinerja mutakhir untuk aplikasi API dunia nyata.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
5 Suka
Hadiah
5
2
Posting ulang
Bagikan
Komentar
0/400
LiquidityHunter
· 8jam yang lalu
grok telah merilis versi baru lagi, Elon Musk memang tidak bisa diam...
---
apakah tugas telecom mengalahkan gemini? apakah data ini nyata atau hanya euforia semata?
---
tentang persamaan tau, saya tidak begitu mengerti, ada yang bisa menjelaskan mengapa itu bisa unggul?
---
aplikasi api dunia nyata terdengar bagus, tetapi yang terpenting adalah seberapa stabil saat dijalankan
---
fast api memang menarik, lebih praktis daripada sekedar indikator kinerja murni
---
lagi-lagi peringkat pertama, kita lihat seberapa lama ini bisa bertahan...
Lihat AsliBalas0
FUD_Vaccinated
· 8jam yang lalu
grok kembali mengganggu, tapi siapa yang benar-benar menggunakan daftar τ²-Bench ini...
API xAI Elon Musk baru saja meluncurkan Grok 4.1 Fast API, dan hasil benchmark-nya cukup mengesankan. Ini memuncaki papan pemimpin τ²-Bench khusus untuk tugas telekomunikasi (membayangkan skenario penggunaan alat yang agens ), melampaui Gemini 3 Pro. Yang membuat ini menarik adalah bagaimana ini mendorong batasan dalam kinerja mutakhir untuk aplikasi API dunia nyata.