العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
نقرت المؤشر على تفاصيل تقنية Composer 2: مبنية على Kimi K2.5، ويتم تحديث النموذج كل خمس ساعات
كيف قمت بتوضيح هذه المسألة
لقد قرأت الورقة الرسمية على arXiv، والمدونات، والنقاشات على وسائل التواصل الاجتماعي، مع التركيز بشكل رئيسي على سؤالين: ما هي بنية نموذج Composer 2 وحدود قدراته؟ كيف يتم تحقيق حلقة التدريب المعتمدة على بيانات الإنتاج ودورة التحديث التي تمتد لخمسة ساعات بشكل دقيق؟
توضح المواد الرسمية عدة أمور: النموذج الأساسي يأتي من Kimi K2.5 التابع لـ Moonshot AI؛ تم إجراء إعادة تدريب مستمرة على هذا الأساس وتطبيق تعلم تعزيز واسع النطاق؛ طريقة التدريب مشابهة لـ PULSE، حيث يُزعم أنه تم تحقيق تدريب فعال عبر مراكز البيانات على نطاق 1T من المعلمات.
تحتوي هذه المسألة على حادثة صغيرة: لم تكشف Cursor في البداية عن من هو النموذج الأساسي، وبعد تعرضها للانتقادات من المجتمع، قامت بإضافة الإفصاح، وشرحت أن جزء التدريب الذاتي يمثل حوالي 75% من القدرة الحاسوبية. وهذا يدل على أنهم يسيرون في طريق “قاعدة مفتوحة/أساسية خارجية + طبقة إضافية مطورة داخلياً”.
ماذا حدث
لماذا تستحق هذه المسألة الانتباه
وجهة نظري: إن التعلم المعزز الفوري ينقل الدورة “التدريب-النشر” مباشرة إلى بيئة الإنتاج، مما يقلص فترة التغذية الراجعة بشكل كبير، ويحقق فوائد قابلة للقياس عبر الإنترنت.
بخصوص بيانات الإنتاج مقابل البيانات الاصطناعية:
بخصوص إيقاع الهندسة:
بخصوص المنافسة:
البيانات والجدل
من حيث الوظائف: تدعم البحث الدلالي، تنفيذ shell، والمهام متعددة الخطوات، مما يجعلها مناسبة للمحادثات الطويلة وسير العمل البرمجي المعقد.
حجم التدريب: بالاستناد إلى طريقة PULSE، تم تحقيق التدريب عبر مراكز البيانات على نطاق 1T من المعلمات، مع التركيز على الإنتاجية وكفاءة التكلفة.
جدل الإفصاح: لم يتم الإفصاح عن أن النموذج الأساسي هو Kimi في البداية، واعترفوا بذلك بعد الانتقادات. تؤكد الشركة أن الاستثمار في التدريب الذاتي يمثل حوالي 75%.
التأثير على الصناعة
المخاطر والقيود
تقييم الأهمية
حكمي: هذه نموذج هندسي “مبكر ولكنه فعال”. المستفيدون المباشرون هم المطورون ورؤساء الفرق: كلما تم إنشاء حلقة بيانات إنتاجية وعملية نشر تقييم عالية التكرار مبكرًا، زادت القدرة على التميز في سرعة تكرار المنتجات والتكلفة.