جوجل تتصدر المشهد بابتكار نظام ترجمة صوتية يحاكي المترجمين البشر باستخدام الذكاء الاصطناعي

شريف جمال

منذ 1 شهر

جوجل تتصدر المشهد بابتكار نظام ترجمة صوتية يحاكي المترجمين البشر باستخدام الذكاء الاصطناعي

أعلنت شركة جوجل عن إطلاق نموذجها الأكثر تطوراً في مجال الذكاء الاصطناعي، والذي يحمل اسم Gemini 3.5 Live Translate. يهدف هذا الابتكار إلى توفير تجربة ترجمة فورية لصوت المستخدمين بأكثر من 70 لغة، مما يساهم في تحسين التواصل بالنسبة للأشخاص الذين لا يتحدثون الإنجليزية. تتميز هذه التقنية الجديدة بقدرتها على تقديم ترجمات فورية أثناء حديث المستخدم، مما يلغي الحاجة إلى الانتظار حتى انتهاء الجملة، كما كان يحدث في الأنظمة السابقة.

كما أكدت جوجل أن النموذج الجديد صُمم للحفاظ على نبرة المتحدث الأصلية وإيقاع حديثه، مما يجعل المحادثات المت translated بي أكثر سلاسة وشبيهة بالتواصل البشري الطبيعي. من خلال الاستجابة السريعة وجودة الترجمة العالية، تستطيع Gemini 3.5 Live Translate تقليل أي فواصل مزعجة بين الاقتباسات المترجمة؛ حيث لا يتجاوز التأخير عن بضع ثوانٍ عن المتحدث الأصلي.

بدءًا من يونيو الحالي، تم طرح Gemini 3.5 Live Translate عبر مجموعة متنوعة من الخدمات والمنتجات التي تقدمها جوجل. فقد أصبح متاحاً للمطورين ضمن مرحلة المعاينة العامة عبر Gemini Live API وGoogle AI Studio، كما يتيح أيضاً الشركات الاستفادة من هذه التقنية عبر خدمة Google Meet خلال المرحلة التقييمية. ومن المزايا المثيرة للإعجاب، أن التطبيق متاح للمستخدمين أيضاً من خلال تطبيق Google Translate على أنظمة Android وiOS.

تتطلع جوجل إلى توسيع استخدام التقنية في مجالات متعددة، حيث يمكن أن تلعب دوراً مهماً في ترجمة المكالمات والاجتماعات وعبر الدروس والبث المباشر. ويعتبر نموذج Gemini 3.5 Live Translate أيضاً خيارًا ممتازًا في البيئات متعددة اللغات التي تحتاج إلى تواصل دقيق وفوري.

وبهذا الإطار، قامت منصات مثل Agora وLiveKit وPipecat وVision Agents بإدماج Gemini Live API في خدماتها، مما يسهل على المطورين تطوير تطبيقات متخصصة في الترجمة الفورية. وبفضل هذه الشراكات، يمكن للمطورين التركيز على تحسين تجربة المستخدم بدلاً من القلق بشأن البنية التحتية الخاصة بالبث في الزمن الحقيقي.

في سياق متصل، تجري شركة Grab اختبار التقنية الجديدة لتحسين التواصل بين السائقين والركاب خلال عمليات التوصيل. يُذكر أن مستخدمي تطبيق Grab يقومون بإجراء أكثر من 10 ملايين مكالمة صوتية شهرياً، مما يجعل من هذه الميزة أهمية كبيرة في تسهيل التفاعل بينهم. ومن المقرر أن تبدأ الشركة بطرح الميزة لعملاء Google Workspace خلال الشهر الجاري، في خطوة تهدف إلى توسيع نطاق التطبيق في المستقبل.

ليس هذا فحسب، بل قدمت جوجل أيضاً وضع “الاستماع” الجديد لمستخدمي تطبيق Google Translate على نظام Android، مما يتيح لهم الاستماع إلى الترجمة مباشرة عبر سماعة الهاتف الداخلية كما يحدث في المكالمات الهاتفية. وتعتبر هذه الميزة مفيدة في الحالات التي تكون فيها سماعات الرأس غير متوفرة، حيث توفر طريقة أسرع وأكثر خصوصية للاستماع إلى الترجمة.

حرصت جوجل على ضمان أن جميع المقاطع الصوتية التي يتم إنشاؤها عبر نماذجها تحمل علامات مائية رقمية باستخدام تقنية SynthID، وذلك لمساعدة المستخدمين في التعرف على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي، والمساهمة في الحد من المعلومات المضللة والمحتوى الزائف. هذا الابتكار يبرز التزام جوجل بتعزيز تجربة المستخدم في وقت تزداد فيه الحاجة للتواصل الفعال في عالم يعدّ سريع التغيرات.