هنا يأتي FastVLM



يضعون MLP لإسقاط الرموز المرئية من FastViTHD إلى عالم LLM.

النتيجة: عدد أقل بكثير من الرموز ( مثل 4× أقل من FastViT، 16× أقل من ViT‑L/14 بدقة 336 بكسل ). أعني، هذا انخفاض كبير في عدد الرموز والتعقيد، بينما
IN-10.17%
MLP7.57%
PIXEL2.54%
TOKEN4.73%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
GlueGuyvip
· 09-03 20:47
هذه العملية منطقياً قوية جداً
شاهد النسخة الأصليةرد0
rekt_but_resilientvip
· 09-03 16:16
هنا التحسين هائل!
شاهد النسخة الأصليةرد0
GasFeeLovervip
· 09-02 14:39
حسناً، لا يوجد ما يُفاخر به.
شاهد النسخة الأصليةرد0
ser_we_are_earlyvip
· 09-02 14:39
يبدو أن FastVLM رائع حقًا
شاهد النسخة الأصليةرد0
BlockchainBardvip
· 09-02 14:38
مذهل! لقد اندهشت من عدد الرموز.
شاهد النسخة الأصليةرد0
WhaleWatchervip
· 09-02 14:27
لقد أضفت شيئًا جديدًا مرة أخرى!
شاهد النسخة الأصليةرد0
DiamondHandsvip
· 09-02 14:23
آه آه، أشعر بالدوار بسبب الرياح...
شاهد النسخة الأصليةرد0
  • تثبيت