امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

حقق Kimi K2 Thinking أرقامًا قياسية جديدة في تقييمات الأداء الأساسية التي تقيم قدرات الاستنتاج، والبرمجة، والوكالة

بيانات جينشيو 8 نوفمبر، وفقًا لموقع ويب مونث الظلام، حقق Kimi K2 Thinking رقمًا قياسيًا جديدًا في تقييمات المعايير التي تقيم قدرات الاستنتاج، الترميز، والوكيل. حقق K2 Thinking معدل أداء قياسي (SOTA) بنسبة 44.9% في تقييم HLE، ووصل إلى 60.2% في اختبار BrowseComp، وحقق 71.3% في اختبار SWE-Bench Verified، مما يظهر قدرته القوية على التعميم كنموذج وكيل تفكير متقدم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
مواضيع ذات صلة
#
ai
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$4.33Kعدد الحائزين:2
    0.01%
  • القيمة السوقية:$4.28Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$4.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.46Kعدد الحائزين:2
    0.92%
  • تثبيت