أعلنت شركة ميتا اليوم الجمعة عن ثورة في مجال الذكاء الاصطناعي التوليدي للكلام، وذلك في ظل المنافسة المتصاعدة مع عمالقة التقنية الأخرى مثل جوجل ومايكروسوفت وأمازون.
وأفادت ميتا في منشور على مدونتها أنها تمكنت من تطوير نموذج جديد يسمى "فويس بوكس" (Voicebox) والذي يتمتع بقدرات متقدمة في إنشاء الكلام، بما في ذلك التحرير وأخذ العينات وضبط الأسلوب، ويمتاز هذا النموذج بقدرته على التعلم في السياق وتلقي التدريب المخصص لأداء هذه المهام.
وأوضحت الشركة العملاقة التقنية، التي تمتلك منصات فيسبوك وإنستاجرام وواتساب وغيرها، أن "فويس بوكس" قادر على إنتاج مقاطع صوتية عالية الجودة وتحرير تسجيلات صوتية سابقة، مثل إزالة ضوضاء الخلفية مثل أصوات السيارات أو نباح الكلاب، مع الحفاظ على جودة المحتوى ونغمة الصوت.
ويتميز "فويس بوكس" بقدرته على العمل بلغات متعددة، حيث يمكنه إنتاج الكلام بست لغات مختلفة.
وتعتقد شركة ميتا أنه في المستقبل يمكن لنماذج الذكاء الاصطناعي المتعددة الأغراض، مثل "فويس بوكس"، أن توفر أصواتًا طبيعية للمساعدين الافتراضيين وشخصيات غير لاعبة في العوالم الافتراضية.
وأشارت الشركة إلى أن هذه التقنية يمكنها أن تساعد الأشخاص ضعاف البصر على سماع الرسائل المكتوبة التي يقرأها الذكاء الاصطناعي بأصواتهم، كما يمكنها توفير أدوات جديدة لمنشئي المحتوى لإنشاء وتحرير مقاطع صوتية بسهولة، وغير ذلك الكثير من التطبيقات المحتملة.
ومن خلال عينة صوتية تستغرق ثانيتين فقط، يمكن لنموذج "فويس بوكس" تطابق نمط الصوت واستخدامه في تقنية تحويل النص إلى كلام.
وأشارت ميتا إلى أن نموذج الذكاء الاصطناعي المتعدد الأغراض الجديد يمكنه إعادة إنشاء جزء من الكلام المقطوع بسبب الضوضاء أو استبدال الكلمات المنطوقة خطأ دون الحاجة لإعادة تسجيل الكلام بالكامل.
وعند تزويد النموذج بعينة من كلام شخص ما وقطعة نص مكتوبة بالإنجليزية أو الفرنسية أو الألمانية أو الإسبانية أو البولندية أو البرتغالية، يمكن لـ "فويس بوكس" قراءة النص بأي من تلك اللغات، حتى وإن كانت اللغات المستخدمة في النموذج والنص مختلفة.
وتأمل ميتا في أن يتم استغلال هذه الإمكانيات في المستقبل لمساعدة الأشخاص على التواصل بشكل طبيعي وحقيقي حتى وإن لم يتحدثوا نفس اللغة.
ومن خلال التعلم من مجموعة متنوعة من البيانات، تعتقد الشركة أن نموذجها يمكنه إنتاج كلام يعكس بشكل أفضل طريقة حديث الناس في العالم الحقيقي وذلك باللغات الست التي يدعمها حاليًا.
وتعتبر إطلاق "فويس بوكس" من ميتا خطوة مهمة نحو تطور الذكاء الاصطناعي التوليدي، وتعتزم الشركة مواصلة استكشافها في مجال الصوت ومشاهدة كيف يعتمد الباحثون الآخرون على إنجازاتها في هذا المجال.
تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على Twitter ، أو أضف tech1new.com إلى موجز أخبار Google الخاص بك للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية
ليست هناك تعليقات:
إرسال تعليق