اخر الاخبار

إطلاق المساعد الصوتي الذكي Moshi لمنافسة ChatGPT

 

إطلاق المساعد الصوتي الذكي Moshi لمنافسة ChatGPT


أطلقت شركة Kyutai Labs يوم الأربعاء محادثة Moshi AI، وهو بوت ذكاء اصطناعي (AI) يستجيب للأوامر اللفظية في الوقت الفعلي. أعلنت الشركة الفرنسية المتخصصة في الذكاء الاصطناعي أن نموذج لغة الصوت الكامل لـ Moshi تم تطويره داخليًا. كما يمكنه تعديل صوته للتعبير عن العواطف والاستجابة بأساليب حديثة مختلفة. يمكن الوصول إلى نموذج الذكاء الاصطناعي مجانًا للجمهور. حاليًا، يقتصر النموذج على محادثات تصل إلى خمس دقائق. ومن المثير للاهتمام، أن شركة OpenAI أعلنت أيضًا عن ميزات حديثة مماثلة مع إصدار GPT-4o، لكنها لم تصدر بعد.


ميزات Moshi AI

ذكرت الشركة أن نموذج الذكاء الاصطناعي تم تطويره خلال ستة أشهر بفريق مكون من ثمانية أشخاص. أثناء الكشف عن النموذج الذكاء الاصطناعي في حدث في باريس، قالت Kyutai Labs إن Moshi ليس مساعدًا ذكيًا ولكنه نموذج تجريبي يمكن استخدامه لتطوير أدوات لحالات استخدام مختلفة. كما أتاحت البوت متاحًا للجمهور هنا. يمكن للمستخدمين إدخال بريدهم الإلكتروني والانضمام إلى الطابور، لكننا تمكنا من الوصول الفوري إلى المنصة دون أي وقت انتظار.


واجهة المنصة بسيطة للغاية. هناك تصميم ذكاء اصطناعي مبسط حيث يمكن للمستخدمين فحص حجم صوتهم عندما يتحدثون. هناك صندوق نصي حيث تظهر فقط ردود الذكاء الاصطناعي. صندوق آخر بالقرب من الأعلى يعرض تفاصيل تقنية مثل مدة الصوت والتأخير والصوت المفقود.




إطلاق المساعد الصوتي الذكي Moshi لمنافسة ChatGPT




في الجزء العلوي تمامًا، يوجد زر لقطع الاتصال. حاليًا، يمكن أن تصل مدة المكالمة القصوى إلى خمس دقائق. تسلط صفحة الوصف الضوء على أن Moshi يمكنه التفكير والتحدث والاستماع في نفس الوقت لتعزيز تدفق المحادثة.


وجدنا أن التأخير منخفض للغاية، وغالبًا ما يستجيب الذكاء الاصطناعي على الفور. ومع ذلك، هناك بعض الحالات حيث يمكن أن يتجاوز تأخير وقت الاستجابة 10-15 ثانية. ولكن هذا يمكن أن يكون بسبب الحمل الثقيل على الخادم. ومع ذلك، في بعض الأحيان لم يتم تسجيل الأوامر اللفظية على الإطلاق، حتى بعد ملء ثلاثة أرباع عداد الصوت.


وجدنا أيضًا أن نموذج الذكاء الاصطناعي يمكنه الاستجابة بصوت عاطفي، ويمكنه التحدث بأساليب مختلفة وباستخدام تعديلات صوتية متنوعة. كما أن نموذج الذكاء الاصطناعي متصل بالإنترنت ويمكنه جلب الردود على الاستفسارات التي تتطلب البحث عبر الويب. من الجدير بالذكر أن البوت لا يسمح بالأوامر النصية، والصوت هو الوسيلة الوحيدة للتفاعل معه.


أعلنت Kyutai Labs أن نموذج الذكاء الاصطناعي سيكون مفتوح المصدر. ومع ذلك، لم تقم الشركة بعد باستضافة وزن النموذج والكود على منصة. بمجرد توفرها، سيتمكن المستخدمون من تنزيلها وتثبيتها محليًا، ويمكن تشغيلها على جهاز غير متصل.


 تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على منصة إكس (تويتر سابقاً) ، أو أضف tech1new.com إلى موجز أخبار Google الخاص بك للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية

ليست هناك تعليقات:

إرسال تعليق