كشفت شركة جوجل مؤخرًا عن إنجاز جديد في مجال الذكاء الاصطناعي، حيث قدمت نموذجًا جديدًا يُدعى "AudioPaLM" والذي يتميز بقدرته على الاستماع والتحدث والترجمة بدقة عالية وسرعة كبيرة.
يعتمد هذا النموذج الجديد بشكل أساسي على نقاط القوة في نموذجين آخرين تم تطويرهما سابقًا في جوجل وهما "PaLM-2" و "AudioLM". يعمل نموذج PaLM-2 على فهم ومحاكاة وتوليد النصوص بشكل يشبه اللغات البشرية، بينما يُركز نموذج AudioLM على الحفاظ على هوية المتحدث ونبرة الصوت.
قام الباحثون في جوجل بجمع هذين النموذجين لإنشاء نموذج AudioPaLM الجديد، والذي يتمتع بكفاءة عالية في توليد النصوص والكلام.
يمكن لنموذج AudioPaLM القيام بمجموعة متنوعة من المهام، بما في ذلك الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت الأصلية. بالإضافة إلى ذلك، يستطيع التقاط الأصوات أو الأوامر المنطوقة وإعادة إنتاجها بلغات مختلفة.
ويتميز هذا النموذج بقدرته على التعرف على الأصوات وترجمتها إلى نصوص، حتى يمكنه ترجمة التراكيب اللغوية التي لم يتعرض لها من قبل بدقة كبيرة.
يجري العمل حاليًا على بحث وتطوير نموذج جوجل AudioPaLM، ولم يتم تحديد موعد محدد بعد لتوفره للجمهور.
من جانب آخر، أعلنت شركة ميتا سابقًا عن نموذج ذكاء اصطناعي آخر يحمل اسم "Voicebox"، ويتمتع بقدرات مشابهة في إنشاء الكلام وتحرير المقاطع الصوتية بكفاءة، وأخذ العينات الصوتية لتوليد كلام بلغات مختلفة، وغير ذلك.
تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على Twitter ، أو أضف tech1new.com إلى موجز أخبار Google الخاص بك للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية
ليست هناك تعليقات:
إرسال تعليق