إيلون ماسك's xAI قد اسقطت API Grok 4.1 السريع، والنتائج مثيرة للغاية. إنها تتصدر قائمة τ²-Bench للقائد بشكل خاص لمهام telecom ( سيناريوهات استخدام الأدوات الوكيلة )، متفوقة على Gemini 3 Pro. ما يجعل هذا مثيرًا للاهتمام هو كيف أنها تدفع الحدود في الأداء الرائد للتطبيقات API في العالم الحقيقي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 5
أعجبني
5
3
إعادة النشر
مشاركة
تعليق
0/400
LiquidityHunter
· منذ 12 س
غروك أطلق إصدارًا جديدًا مرة أخرى، ما زال ماسك مشغولاً...
---
هل مهمة الاتصالات تتفوق على جيميني؟ هل هذه البيانات حقيقية أم أنها مجرد فرحة زائدة؟
---
لم أفهم كثيرًا عن معادلة الطاو، هل يمكن لأحد أن يشرح ببساطة كيف أصبحت رائدة؟
---
تطبيق واجهة برمجة التطبيقات في العالم الحقيقي يبدو جيدًا، لكن الاستقرار عند التشغيل هو الأهم
---
نقطة واجهة برمجة التطبيقات السريعة هذه مثيرة للاهتمام، فهي أكثر فائدة من مجرد مؤشرات الأداء النقية
---
مركز آخر في قائمة، يجب أن نرى كم ستستمر هذه المرة...
شاهد النسخة الأصليةرد0
FUD_Vaccinated
· منذ 12 س
غروك عاد مرة أخرى، لكن من يستخدم فعلاً قائمة τ²-Bench هذه...
إيلون ماسك's xAI قد اسقطت API Grok 4.1 السريع، والنتائج مثيرة للغاية. إنها تتصدر قائمة τ²-Bench للقائد بشكل خاص لمهام telecom ( سيناريوهات استخدام الأدوات الوكيلة )، متفوقة على Gemini 3 Pro. ما يجعل هذا مثيرًا للاهتمام هو كيف أنها تدفع الحدود في الأداء الرائد للتطبيقات API في العالم الحقيقي.