حققت شركة OpenAI آخر اختراق كبير في مجال الذكاء الاصطناعي من خلال زيادة حجم نماذجها إلى أبعاد مذهلة، عندما قدمت GPT-4 العام الماضي. أعلنت الشركة اليوم عن تقدم جديد يشير إلى تحول في النهج – نموذج يمكنه “الاستدلال” منطقيًا من خلال العديد من المشكلات الصعبة وهو أذكى بكثير من الذكاء الاصطناعي الحالي دون الحاجة إلى توسع كبير.
النموذج الجديد، المسمى OpenAI-o1، قادر على حل المشاكل التي تعوق نماذج الذكاء الاصطناعي الحالية، بما في ذلك أقوى نموذج موجود لدى OpenAI، GPT-4o. فبدلاً من استحضار إجابة في خطوة واحدة، كما تفعل عادةً نماذج اللغة الكبيرة، فإنه يحلل المشكلة، ويفكر بصوت عالٍ كما قد يفعل أي شخص، قبل الوصول إلى النتيجة الصحيحة.
وتقول ميرا موراتي، مديرة التكنولوجيا في شركة OpenAI، لمجلة WIRED: “هذا ما نعتبره النموذج الجديد في هذه النماذج، فهو أفضل بكثير في التعامل مع مهام التفكير المعقدة للغاية”.
وأطلق على النموذج الجديد داخل OpenAI الاسم الرمزي Strawberry، وهو ليس خليفة لـ GPT-4o بل مكمل له، كما تقول الشركة.
يقول موراتي إن OpenAI تعمل حاليًا على بناء نموذجها الرئيسي التالي، GPT-5، والذي سيكون أكبر بكثير من سابقه. ولكن في حين لا تزال الشركة تعتقد أن الحجم سيساعد في استخراج قدرات جديدة من الذكاء الاصطناعي، فمن المرجح أن يتضمن GPT-5 أيضًا تقنية التفكير التي تم تقديمها اليوم. يقول موراتي: “هناك نموذجان. نموذج التوسع وهذا النموذج الجديد. نتوقع أن نجمع بينهما”.
إن طلاب الماجستير في القانون عادة ما يستحضرون إجاباتهم من شبكات عصبية ضخمة تتغذى على كميات هائلة من بيانات التدريب. وهم قادرون على إظهار قدرات لغوية ومنطقية رائعة، ولكنهم عادة ما يجدون صعوبة في حل مشكلات بسيطة بشكل مدهش مثل أسئلة الرياضيات الأولية التي تنطوي على التفكير المنطقي.
وتقول موراتي إن برنامج OpenAI-o1 يستخدم التعلم التعزيزي، والذي يتضمن إعطاء النموذج ردود فعل إيجابية عندما يجيب على الأسئلة بشكل صحيح وردود فعل سلبية عندما لا يجيب، وذلك بهدف تحسين عملية التفكير لديه. وتضيف: “يعمل النموذج على شحذ تفكيره وضبط الاستراتيجيات التي يستخدمها للوصول إلى الإجابة”. وقد مكّن التعلم التعزيزي أجهزة الكمبيوتر من لعب الألعاب بمهارة خارقة والقيام بمهام مفيدة مثل تصميم شرائح الكمبيوتر. كما تعد هذه التقنية عنصرًا أساسيًا لتحويل برنامج ماجستير القانون إلى روبوت محادثة مفيد وحسن السلوك.
وقد أظهر مارك تشين، نائب رئيس قسم الأبحاث في شركة OpenAI، النموذج الجديد لمجلة WIRED، مستخدمًا إياه لحل العديد من المشكلات التي لم يتمكن نموذجه السابق GPT-4o من حلها. وشملت هذه المشكلات سؤالًا كيميائيًا متقدمًا ولغزًا رياضيًا محيرًا للعقل: “الأميرة تبلغ من العمر نفس عمر الأمير عندما تصبح الأميرة ضعف عمر الأمير عندما كان عمر الأميرة نصف مجموع عمرهما الحالي. ما هو عمر الأمير والأميرة؟” (الإجابة الصحيحة هي أن الأمير يبلغ من العمر 30 عامًا والأميرة تبلغ من العمر 40 عامًا).
ويقول تشين إن “النموذج (الجديد) هو تعلم التفكير من تلقاء نفسه، بدلاً من محاولة تقليد الطريقة التي يفكر بها البشر”، كما يفعل طلاب الماجستير في القانون التقليدي.
وتقول شركة OpenAI إن نموذجها الجديد يعمل بشكل أفضل بشكل ملحوظ في عدد من مجموعات المشكلات، بما في ذلك تلك التي تركز على الترميز والرياضيات والفيزياء والأحياء والكيمياء. وفي اختبار الرياضيات الأمريكي (AIME)، وهو اختبار لطلاب الرياضيات، حل GPT-4o في المتوسط 12% من المشكلات بينما حصل o1 على 83% من الإجابات الصحيحة، وفقًا للشركة.