مرة أخرى في أغسطس 2023 ، كشفت Meta عن نموذج ترجمة “الكل في واحد” قادر على فهم ما يقرب من 100 لغة مختلفة.
هذه هي محاولة Meta لإنشاء “مترجم عالمي” أقرب إلى The Babel Fish في Douglas Adams ‘Classic Sci ، وهي محاولة Meta لإنشاء “مترجم عالمي” أقرب إلى Fish في دوغلاس آدمز. دليل Hitchhiker إلى المجرة.
لقد قام الفريق الذي يقف وراء أداة SemlessM4T الآن بتفصيل عملها في مقال في المجلة طبيعةيوفر الكشف عن النظام المتقدم حلًا للجميع لنص على نص إلى نص ، وترجمات خطاب إلى نص ، وترجمات نصية ، وترجمات نصية إلى كلام عبر مجموعة من اللغات المثيرة للإعجاب والمتنامية.
أكثر من 400 عام من الصوت الخام
SELLISLANSM4T ، والتي ، من بين أشياء أخرى ، يتم استخدامها لاستنباط مقاطع الفيديو تلقائيًا على Facebook و Instagram ، تدعم حاليًا ترجمة الكلام إلى الكلام من 101 إلى 36 لغة ، وترجمة من الكلام إلى النص من 101 إلى 96 لغة ، نص إلى نص. -ترجمة النص لـ 96 لغة ، وترجمة نص إلى كلام من 96 إلى 36 لغة ، والتعرف على الكلام التلقائي لـ 96 لغة. يتغلب هذا النهج الموحد على قيود الأنظمة المتتالية التقليدية ، والتي تتطلب غالبًا أنظمة فرعية منفصلة للتعرف على الكلام والترجمة وتوليف النص إلى كلام.
من خلال تبسيط هذه العمليات ، تقول Meta إن Semlessm4t يتفوق على النماذج الحالية ، حيث تحقق ما يصل إلى 23 ٪ من درجات Bleu (التقييم ثنائي اللغة) في دقة الترجمة وإظهار المرونة المثيرة للإعجاب لضوضاء الخلفية وتغيرات السماعات.
لإنشاء سلس M4T ، بدأت META مع 4 ملايين ساعة (أكثر من 400 عام) من الصوت الخام متعدد اللغات الناشئة من مستودع متاح للجمهور لبيانات الويب المزروعة. طور الفريق سلسًا ، مجموعة متعددة الوسائط تحتوي على أكثر من 470،000 ساعة من الكلام المحاذاة وتجمع بين مجموعة البيانات مع تقنيات التعلم الآلي المتطورة ، بما في ذلك التشرد على مستوى الجملة (على مستوى الجملة متعددة الوسائط واللغة). للنص والكلام.
يقول Meta إنه من خلال معالجة التحديات الاجتماعية والأخلاقية من خلال استخدام الضمانات ، يمكن أن يكون SemlessM4T أداة قيمة للتواصل العالمي. تقلل هذه الضمانات من التحيز بين الجنسين – الأخطاء في تحديد النوع الاجتماعي النحوي – وتخفيف مشكلة السمية المضافة – حيث تظهر الكلمات الهجومية في الترجمات ولكن ليس في المصدر الأصلي.