أطلقت علي بابا نموذجًا لغويًا شاملاً متعدد الوسائط Qwen3.5-Omni، ويدعم التعرف على 113 نوعًا من الأصوات

أخبار البوابة، في 30 مارس، أعلنت علي بابا Qianwen عن إطلاق نموذج Qwen3.5-Omni متعدد الوسائط كاملًا. تتضمن هذه السلسلة إصدارات Instruct بثلاثة أحجام: Plus وFlash وLight، وتدعم سياقًا طويلًا يصل إلى 256k. يدعم النموذج إدخالًا صوتيًا لأكثر من 10 ساعات وإدخالًا للوسائط المتعددة بنحو 400 ثانية لأكثر من 720P (1FPS). تم إجراء تدريب مسبق متعدد الوسائط أصلي على نطاق واسع من النصوص والبيانات المرئية، وعلى بيانات وسائط متعددة صوتية ومرئية تتجاوز 100 مليون ساعة، مما يُظهر قدرات استثنائية في إدراك وتوليد متعدد الوسائط كاملًا. مقارنةً بالطراز الأسبق Qwen3-Omni، عزز Qwen3.5-Omni قدرات تعدد اللغات بشكل كبير، إذ يمكنه دعم التعرف على الكلام لـ113 لغة واللهجات وتوليد الكلام لـ36 لغة واللهجات.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات