أخبار الآن | dailymail
تختبر شركة غوغل خدمة جديدة، وهي خدمة “ترانسلاتوترون” Translatotron لترجمة الكلام الشفاهي مباشرةً، ما يلغي الحاجة للنص.
وفي هذا الصدد، قالت عملاقة التقنية الأمريكية أن “Translatotron هو أول نموذج قائم على طرفين يستطيع مباشرةً ترجمة الكلام من لغة إلى أخرى مشافهةً”
وأضافت غوغل أنه هناك ثلاث مراحل لأنظمة الترجمة في الوقت الراهن، وهي: التعرف التلقائي على الكلام، الذي يحول الكلام إلى نص، والترجمة الآلية، التي تترجم النص إلى لغة أخرى، ومرحلة تحويل النص إلى كلام.
Google's Translate can now listen to a language and make it into an audio translation in the original speaker's voice https://t.co/sXaewnprBi
— Daily Mail Online (@MailOnline) May 17, 2019
وأوضحت غوغل أن Translatotron يستخدم الصور الطيفية، ويولد صوراً طيفية أخرى، ويعتمد أيضاً على مشفر صوتي عصبي، ومشفر لإخراج الصوت، ما يحفظ الخصائص الصوتية للمتحدث عند الترجمة.
وأشارت الشركة إلى أن تنظيم هذه الخطوات المتتالية أدى إلى تطوير خدمات، مثل “مترجم غوغل”، والآن تنوي الشركة استخدام نموذج واحد يتجنب تقسيم المهمة إلى مراحل منفصلة، والاستغناء عن النص في الترجمة، ما يعني سرعة أعلى وأخطاءً أقل.
Translatotron is our experimental model for direct end-to-end speech-to-speech translation, which demonstrates the potential for improved translation efficiency, fewer errors, and better handling of proper nouns. Learn all about it below! https://t.co/CvXL4lbPvP
— Google AI (@GoogleAI) May 15, 2019
مصدر الصورة: Storyblocks
للمزيد: