أطلقت غوغل أحدث نماذجها للترجمة الصوتية الفورية تحت اسم Gemini 3.5 Live Translate، وهي تقنية جديدة تهدف إلى توفير محادثات متعددة اللغات بشكل أكثر سلاسة وواقعية. وتؤكد الشركة أن نموذج الذكاء الاصطناعي الجديد قادر على اكتشاف أكثر من 70 لغة مختلفة وتقديم ترجمة صوتية شبه فورية مع الحفاظ على نبرة المتحدث وسرعة حديثه وطريقة تنغيمه.
وتتوفر ميزة Gemini 3.5 Live Translate حاليًا عبر عدد من خدمات غوغل، بما في ذلك Google Translate وGoogle Meet وGoogle AI Studio، بالإضافة إلى Gemini Live API المخصص للمطورين.

أكدت غوغل، عبر مدونتها الرسمية، أن Gemini 3.5 Live Translate تمثل مرحلة جديدة في رحلة الشركة الطويلة بمجال الترجمة الآلية، التي بدأت منذ نحو عقدين من الزمن ضمن أوائل مشاريع التعلم الآلي التي عملت عليها.
وأوضحت الشركة أن ميزة الترجمة الحية الفورية الجديدة تناسب الاجتماعات متعددة اللغات، والبث المباشر، والدروس التعليمية، وخدمات دعم العملاء، إضافة إلى مختلف تطبيقات الترجمة الفورية التي تتطلب استجابة سريعة ودقيقة.
تعتمد تقنية Gemini 3.5 Live Translate على معالجة الصوت في الوقت الفعلي أثناء بثه، ما يسمح بإنتاج ترجمة صوتية متأخرة لبضع ثوانٍ فقط عن المتحدث الأصلي.
وأشارت غوغل إلى أن النموذج الجديد يتجنب فترات التوقف الطويلة التي تظهر عادة في أنظمة الترجمة التقليدية المعتمدة على تبادل الأدوار بين المتحدث والمترجم، وهو ما يجعل المحادثات أكثر طبيعية وانسيابية.
من أبرز مزايا Gemini 3.5 Live Translate قدرتها على التعرف على أكثر من 70 لغة مختلفة والتبديل بينها تلقائيًا أثناء المحادثة، دون الحاجة إلى تغيير إعدادات اللغة يدويًا.
وأكدت غوغل أن نظام الترجمة الجديد يحافظ على كفاءته حتى في البيئات الصاخبة أو غير المتوقعة، ما يجعله مناسبًا للاستخدام في مختلف الظروف اليومية والمهنية.
أعلنت غوغل كذلك عن توسيع إمكانيات الترجمة داخل Google Meet، فقد أصبح التطبيق يدعم الترجمة بأكثر من 70 لغة عبر تقنية Gemini 3.5 Live Translate.
ويمثل هذا التحديث قفزة كبيرة مقارنة بالإصدار السابق الذي كان يدعم خمس لغات فقط، ما يمنح المستخدمين تجربة أفضل خلال الاجتماعات والمؤتمرات الدولية.
بدأت غوغل أيضًا في دمج ميزة Gemini 3.5 Live Translate داخل تطبيق Google Translate على نظامي أندرويد وiOS.
ومن خلال خدمة الترجمة الفورية الجديدة، سيتمكن المستخدمون من سماع الصوت المترجم مباشرة عبر سماعات الرأس المتوافقة، ما يسهل التواصل الفوري بين الأشخاص الذين يتحدثون لغات مختلفة.
ردًا على المخاوف المتعلقة بالمحتوى الناتج عن الذكاء الاصطناعي، أوضحت غوغل أن جميع الأصوات التي يتم إنشاؤها بواسطة Gemini 3.5 Live Translate تحمل تقنية SynthID الخاصة بالشركة.
وتعمل هذه التقنية كعلامة مائية رقمية مدمجة داخل الصوت، بما يساعد على التعرف إلى المحتوى المُنشأ بالذكاء الاصطناعي وتعزيز الشفافية في استخدامه.
أتاحت غوغل الوصول إلى Gemini 3.5 Live Translate في مرحلة المعاينة العامة عبر Gemini Live API وGoogle AI Studio، ما يمنح المطورين فرصة الاستفادة من إمكانيات الترجمة الصوتية الفورية في تطبيقاتهم وخدماتهم.
كما أشارت الشركة إلى دعم التكامل مع عدد من المنصات المتخصصة، بهدف تسهيل تطوير تطبيقات الترجمة الصوتية ونشرها على نطاق أوسع.
أكدت غوغل أن نموذج Gemini 3.5 Live Translate بدأ في الوصول إلى المستخدمين حول العالم عبر منتجاتها المختلفة اعتبارًا من اليوم، في خطوة تعكس التوجه المتزايد نحو استخدام الذكاء الاصطناعي لتطوير أدوات التواصل وكسر الحواجز اللغوية بين المستخدمين في مختلف الدول.