API xAI của Elon Musk vừa Thả Grok 4.1 Fast API, và các chỉ số thử nghiệm thì khá ấn tượng. Nó đang dẫn đầu bảng xếp hạng τ²-Bench đặc biệt cho các tác vụ viễn thông (tình huống sử dụng công cụ agentic ), vượt lên trên Gemini 3 Pro. Điều khiến điều này trở nên thú vị là cách mà nó đang đẩy giới hạn trong hiệu suất hàng đầu cho các ứng dụng API trong thế giới thực.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
5 thích
Phần thưởng
5
2
Đăng lại
Retweed
Bình luận
0/400
LiquidityHunter
· 6giờ trước
grok lại ra phiên bản mới, Elon Musk thật sự không thể ngồi yên...
---
Nhiệm vụ telecom đánh bại gemini? Dữ liệu này có thật không hay lại đang tự sướng vậy nhỉ
---
tau phương trình đó tôi không hiểu lắm, có ai có thể giải thích đơn giản tại sao lại dẫn đầu không
---
Ứng dụng api trong thế giới thực nghe có vẻ ổn, nhưng vấn đề là nó có chạy ổn không mới là điều quan trọng
---
Fast api điểm này thật sự thú vị, thực dụng hơn là chỉ số hiệu suất thuần túy
---
Một bảng xếp hạng nữa đứng đầu, phải xem lần này có duy trì được bao lâu...
Xem bản gốcTrả lời0
FUD_Vaccinated
· 6giờ trước
grok lại đến rồi, nhưng ai thực sự đang sử dụng bảng xếp hạng τ²-Bench này...
API xAI của Elon Musk vừa Thả Grok 4.1 Fast API, và các chỉ số thử nghiệm thì khá ấn tượng. Nó đang dẫn đầu bảng xếp hạng τ²-Bench đặc biệt cho các tác vụ viễn thông (tình huống sử dụng công cụ agentic ), vượt lên trên Gemini 3 Pro. Điều khiến điều này trở nên thú vị là cách mà nó đang đẩy giới hạn trong hiệu suất hàng đầu cho các ứng dụng API trong thế giới thực.