#1
Moebius: نموذج ملء الصور الخفيف (0.2B) بأداء نموذج عملاق (10B)
Moebius: 0.2B Lightweight Image Inpainting Framework with 10B-Level Performance
فريق من الباحثين (Kangsheng Duan وزملاؤه) طلعوا نموذج جديد اسمه Moebius لملء الصور (inpainting) — يعني لما في جزء ناقص في الصورة، النموذج يعيد رسمه بجودة عالية. الجديد هنا إنهم اخترعوا طريقة ذكية اسمها Local-λ Mix Interaction بتلخّص معلومات الصورة بطريقة محترمة جداً، فبقدروا يقللوا حجم النموذج من 11.9 مليار معامل لـ 0.22 مليار بس — بمعنى استخدموا أقل من 2% من البارامترز! وعشان ما يخسروا جودة الصور، استخدموا استراتيجية تدريب ذكية اسمها adaptive multi-granularity distillation بتركز على الـ latent space. النتيجة؟ النموذج بيرسم صور بجودة نفس مستوى FLUX.1-Fill-Dev (النموذج الضخم الشهير) بس أسرع بـ 15 مرة!
لماذا تهم؟: هالشغلة مهمة كتير لأنه الآن ممكن نشتغل على أجهزة عادية ورخيصة وما نحتاج GPUs غالية جداً، وفي نفس الوقت بنحصل على جودة احترافية — يعني تطبيقات الـ inpainting بتصير واقعية وسهلة الاستخدام للناس.