بعد قرابة أسبوعين من الإعلانات المتتالية، اختتمت OpenAI سلسلة البث المباشر "12 يومًا من OpenAI" بمعاينة لنموذجها الجديد من الجيل القادم المعروف بـ"o3". وأخبر سام ألتمان، الرئيس التنفيذي لـ OpenAI، المشاهدين على يوتيوب بأن هذا الاسم جاء "احترامًا لأصدقائنا في شركة تيليفونكا (مالكة شبكة O2 للهاتف المحمول في أوروبا)، وفي تقليد OpenAI المعروف بأنها ليست جيدة فعلاً في اختيار الأسماء".
النموذج الجديد ليس جاهزًا للاستخدام العام بعد. بل، ستقوم OpenAI أولاً بتوفيره للباحثين الذين يحتاجون للمساعدة في اختبارات الأمان. كما أعلنت الشركة أيضًا عن وجود نموذج آخر باسم "o3-mini". وأوضح ألتمان أن الشركة تخطط لإطلاق هذا النموذج "في نهاية يناير"، بينما سيتبع ذلك إطلاق o3 "قريبًا بعد ذلك".
كما كان متوقعًا، يقدم نموذج o3 أداءً متفوقًا مقارنةً بسابقه، ولكن ما يميز هذا النموذج هو مقدار التحسن عن النموذج o1. على سبيل المثال، عند اختباره في الامتحان الأمريكي للمنافسة الرياضية في الرياضيات، حقق o3 درجة دقة بلغت 96.7 في المئة، بينما حصل o1 على تقييم أكثر تواضعًا بلغ 83.3 في المئة. وذكر مارك تشين، نائب الرئيس الأول للبحث في OpenAI: "ما يعنيه ذلك هو أن o3 غالباً ما يخطئ في سؤال واحد فقط". وفي الحقيقة، تفوق o3 على مجموعة الاختبارات التقليدية التي عادة ما يخضع لها نماذج OpenAI، مما دفع الشركة للبحث عن اختبارات أكثر تحديًا لتقييمه.
أحد هذه الاختبارات هو "ARC-AGI"، وهو معيار يقيم قدرة خوارزمية الذكاء الاصطناعي على التعلم والتكيف في الوقت الفعلي. وفقًا لمنشئي الاختبار، منظمة ARC Prize غير الربحية، فإن نظام الذكاء الاصطناعي الذي ينجح في تجاوز اختبار ARC-AGI سيمثل "مرحلة هامة نحو تحقيق الذكاء الاصطناعي العام". منذ ظهوره في عام 2019، لم يتمكن أي نموذج ذكاء اصطناعي من التغلب على هذا الاختبار. يتكون الاختبار من أسئلة تعتمد على المدخلات والمخرجات والتي يمكن لمعظم الناس فهمها بشكل بديهي. على سبيل المثال، الإجابة الصحيحة في أحد الأمثلة تكون بإنشاء مربعات من الأشكال البوليمينية الأربعة باستخدام كتل زرقاء داكنة.
عند إعداد "الحساب المنخفض"، حصل o3 على 75.7 في المئة في الاختبار. ومع زيادة القدرة المعالجة، حقق النموذج تصنيفًا بلغ 87.5 في المئة. وعلق جريج كامراد، رئيس مؤسسة ARC Prize، قائلاً: "إن أداء الإنسان يقارب عتبة 85 في المئة، لذا فإن التفوق على هذا الرقم هو إنجاز كبير".
كما قدمت OpenAI عرضًا عن o3-mini. يستخدم النموذج الجديد واجهة برمجة التطبيقات "Adaptive Thinking Time" التي أعلنت عنها OpenAI مؤخرًا، لتوفير ثلاثة أوضاع تفكير مختلفة: منخفض، متوسط، وعالي. تتيح هذه الخاصية للمستخدمين ضبط مدة "تفكير" البرنامج في مشكلة معينة قبل تقديم الإجابة. وكما يتضح من الرسم البياني أعلاه، يمكن أن تحقق o3-mini نتائج مشابهة للنموذج الحالي o1 بتكلفة حسابية أقل بكثير. وكما ذُكر، سيصل o3-mini للاستخدام العام قبل o3.
تابع موقعنا tech1new.com انضم إلى صفحتنا على فيسبوك و متابعتنا على منصة إكس (تويتر سابقاً) ، أو أضف tech1new.com إلى موجز أخبار Google الخاص بك للحصول على تحديثات إخبارية فورية ومراجعات وشروحات تقنية
ليست هناك تعليقات:
إرسال تعليق