نموذج ميتا قادر على التعامل مع أنواع متعددة من الترجمات
في خطوة كبيرة إلى الأمام نحو سعيها لإطلاق “مترجم عالمي”، أعلنت شركة ميتا Meta عن نموذج جديد للترجمة مدعوم بالذكاء الاصطناعي، يسمح للأشخاص بالتواصل دون عناء من خلال الكلام والنص عبر لغات مختلفة.
وأطلقت الشركة على النموذج الجديد اسم SeamlessM4T، التي تعني “الترجمة الآلية المتعددة اللغات والمتعددة الوسائط”.
وأوضحت، في بيان عبر مدونتها، أن النموذج قادر على التعامل مع أنواع متعددة من الترجمات، بما في ذلك النص إلى كلام، والكلام إلى نص، والكلام إلى كلام، والنص إلى نص، عبر ما يقرب من 100 لغة مختلفة.
وبالنسبة لإجراءات تحويل الكلام إلى كلام وتحويل النص إلى كلام، فإن النموذج يتعرف على 100 لغة إدخال ويحولها إلى 35 لغة إخراج.
وعلى عكس برامج الترجمة الأخرى، فإن SeamlessM4T هو نظام واحد متكامل، وهذا يجعله “يقلل من الأخطاء والتأخير” ويزيد من “كفاءة وجودة عملية الترجمة”، وفق “ميتا”.
وأشارت إلى أن النموذج يوفر ترجمات عند الطلب تمكن الأشخاص الذين يتحدثون لغات مختلفة من التواصل بشكل أكثر فعالية، حيث يتعرف ضمنيًا على اللغات المصدر من دون الحاجة إلى نموذج منفصل لتعريف اللغة.
كيف تم تطويره؟
في بيانها، أشارت “ميتا” إلى أن نموذج SeamlessM4T يعتمد على التطورات التي حققتها الشركة بالإضافة إلى شركات أخرى على مر السنين في السعي لإنشاء مترجم عالمي.
وفي العام الماضي، أصدرت ميتا، نموذج (NLLB)، وهو نموذج للترجمة الآلية من نص إلى نص يدعم 200 لغة، ومنذ ذلك الحين تم دمجه في ويكيبيديا كأحد موفري الترجمة.
وفي وقت سابق من هذا العام، كشفت ميتا عن نظام الكلام متعدد اللغات على نطاق واسع، والذي يوفر تقنية التعرف على الكلام وتحديد اللغة وتركيب الكلام عبر أكثر من 1100 لغة.
لذلك، يعتمد SeamlessM4T على نتائج جميع هذه المشاريع للخروج بتجربة ترجمة متعددة اللغات ومتعددة الوسائط تنبع من نموذج واحد، مبني عبر مجموعة واسعة من مصادر البيانات المنطوقة مع أحدث النتائج.
واستخدمت ميتا النص والكلام لإنشاء مجموعة بيانات التدريب لنموذجها الجديد، وقام الباحثون بربط 443000 ساعة من الكلام مع النصوص وإنشاء 29000 ساعة من محاذاة “تحويل الكلام إلى كلام”، والتي “علّمت” SeamlessM4T كيفية نسخ الكلام إلى نص، وترجمة النص، وتوليد الكلام من النص وحتى ترجمة الكلمات المنطوقة بلغة واحدة إلى الكلمات في لغة أخرى.
وترى شركة ميتا أن أداء SeamlessM4T كان أفضل في مواجهة ضوضاء الخلفية و”اختلافات السماعات” في مهام تحويل الكلام إلى نص مقارنةً بنموذج نسخ الكلام المتطور الحالي.
وتعزو ذلك إلى المزيج الغني من بيانات الكلام والنص في مجموعة بيانات التدريب، والذي تعتقد ميتا أنه يمنح نموذجها الجديد ميزة على نماذج الكلام فقط والنص فقط.
وكتبت ميتا في منشور المدونة: “مع أحدث النتائج، نعتقد أن SeamlessM4T يعد إنجازًا مهمًا في سعي مجتمع الذكاء الاصطناعي نحو إنشاء أنظمة عالمية متعددة المهام”.
ثورة في التواصل
لا يزال نموذج SeamlessM4T قيد التطوير، لكنه أظهر بالفعل نتائج مبهرة، لذلك يعتبر البعض أنه قادر على إحداث ثورة في طريقة تواصلنا عبر اللغات.
وبناء على إمكانياته، يمكن استخدام النموذج الجديد لترجمة المحادثات بين الأشخاص الذين يتحدثون لغات مختلفة، ولترجمة مقاطع الفيديو أو التسجيلات الصوتية، ولترجمة النص على مواقع الويب أو المستندات، ولتوفير ترجمة فورية للسياح أو المسافرين من رجال الأعمال.
ميزة أخرى مهمة لـSeamlessM4T هي أنه يمكنه ترجمة النصوص من مجموعة متنوعة من اللغات، وهذا يجعله أداة قوية للشركات التي تعمل على المستوى الدولي أو التي تتواصل مع العملاء من جميع أنحاء العالم.
ويمكن استخدامه أيضًا لمساعدة الأشخاص الذين يعانون من إعاقات لغوية على التواصل بشكل أكثر فعالية.
لذلك يعتبر SeamlessM4T أداة جديدة لديها القدرة على كسر حواجز اللغة وجعل العالم مكانًا أكثر اتصالاً.
ويقول خوان بينو، عالم الأبحاث في قسم أبحاث الذكاء الاصطناعي في ميتا والمساهم في المشروع إن نهج النظام الموحد هذا يقلل من الأخطاء والتأخير، ويزيد من كفاءة وجودة عملية الترجمة، ويقربنا من جعل الترجمة السلسة ممكنة”.
ويضيف: “في المستقبل، نريد استكشاف كيف يمكن لهذا النموذج التأسيسي أن يتيح قدرات اتصال جديدة، ما يجعلنا في نهاية المطاف أقرب إلى عالم يمكن فهم الجميع فيه”.
قيود الاستخدام
مثل العديد من نماذج الذكاء الاصطناعي السابقة لشركة ميتا، تم إصدار SeamlessM4T بموجب ترخيص بحثي للسماح للباحثين والمطورين بالبناء على التكنولوجيا.
لذلك فإن هذا النموذج لايزال قيد التطوير، وليس متاحًا للمستخدمين والجمهور في الوقت الحالي، لكن من المحتمل أن يتم طرحه للجمهور في المستقبل.
بالإضافة إلى ذلك، فإن المشكلة الأكبر مع نماذج الترجمة المدعومة بالذكاء الاصطناعي هي فقدان الثراء المعجمي الذي يقوم به المترجمون البشريون.
على عكس الذكاء الاصطناعي، يتخذ المترجمون الفوريون خيارات فريدة لهم عند الترجمة من لغة إلى أخرى، قد يقومون بالشرح أو التكثيف والتلخيص، مما يؤدي إلى إنشاء بصمات تُعرف بشكل غير رسمي باسم “الترجمة”.
لكن على العكس، قد تولد أنظمة الذكاء الاصطناعي ترجمات أكثر “دقة”، لكن هذه الترجمات قد تأتي على حساب تنوع الترجمة.
ربما لهذا السبب تنصح ميتا بعدم استخدام SeamlessM4T للترجمة الطويلة والترجمات المعتمدة، مثل تلك المعترف بها من قبل الوكالات الحكومية وسلطات الترجمة.
ولا تشجع ميتا أيضًا على استخدام SeamlessM4T للأغراض الطبية أو القانونية في الوقت الراهن.