Close Menu
الشرق تايمزالشرق تايمز
  • الرئيسية
  • اخر الاخبار
  • العالم
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • سياحة وسفر
  • صحة وجمال
  • مقالات
  • منوعات
روابط هامة
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام يوتيوب
الشرق تايمزالشرق تايمز  اختر منطقتك
|
               
  حالة الطقس
الشرق تايمزالشرق تايمز
الرئيسية»تكنولوجيا
تكنولوجيا

كيف يمكن لنظرية الألعاب أن تجعل الذكاء الاصطناعي أكثر موثوقية

الشرق برسالشرق برسالأحد 09 يونيو 11:27 صلا توجد تعليقات
فيسبوك تويتر بينتيريست واتساب تيلقرام البريد الإلكتروني

كانت لعبة الدبلوماسية تشكل تحديًا أكبر بكثير لباحثي الذكاء الاصطناعي، وهي اللعبة المفضلة لدى السياسيين مثل جون إف كينيدي وهنري كيسنجر. بدلاً من خصمين اثنين فقط، تضم اللعبة سبعة لاعبين قد يكون من الصعب قراءة دوافعهم. للفوز، يجب على اللاعب التفاوض، وإقامة ترتيبات تعاونية يمكن لأي شخص انتهاكها في أي وقت. الدبلوماسية معقدة للغاية لدرجة أن مجموعة من ميتا شعرت بالسعادة عندما قام برنامج الذكاء الاصطناعي شيشرون، في عام 2022، بتطوير “لعب على المستوى البشري” على مدار 40 لعبة. على الرغم من أنها لم تهزم بطل العالم، إلا أن شيشرون أبلى بلاءً حسنًا بما يكفي ليحتل مكانًا بين أفضل 10% من المشاركين من البشر.

أثناء المشروع، اندهش جاكوب – وهو عضو في فريق Meta – من حقيقة أن شيشرون اعتمد على نموذج لغة لإنشاء حواره مع لاعبين آخرين. لقد شعر بإمكانات غير مستغلة. وقال إن هدف الفريق “كان بناء أفضل نموذج لغوي يمكننا استخدامه لأغراض لعب هذه اللعبة”. ولكن ماذا لو ركزوا بدلاً من ذلك على بناء أفضل لعبة ممكنة لتحسين أداء نماذج اللغات الكبيرة؟

التفاعلات التوافقية

في عام 2023، بدأ جاكوب في متابعة هذا السؤال في معهد ماساتشوستس للتكنولوجيا، حيث عمل مع ييكانج شين، وجابرييل فارينا، ومستشاره، جاكوب أندرياس، على ما سيصبح لعبة الإجماع. جاءت الفكرة الأساسية من تصور محادثة بين شخصين كلعبة تعاونية، حيث يحدث النجاح عندما يفهم المستمع ما يحاول المتحدث نقله. على وجه الخصوص، تم تصميم لعبة الإجماع لمواءمة نظامي نموذج اللغة – المولد، الذي يتعامل مع الأسئلة التوليدية، والمميز، الذي يتعامل مع الأسئلة التمييزية.

وبعد بضعة أشهر من التوقف والبدء، قام الفريق ببناء هذا المبدأ في لعبة كاملة. أولا، يتلقى المولد سؤالا. يمكن أن يأتي من إنسان أو من قائمة موجودة مسبقًا. على سبيل المثال، “أين ولد باراك أوباما؟” يحصل المولد بعد ذلك على بعض ردود المرشحين، دعنا نقول هونولولو وشيكاغو ونيروبي. مرة أخرى، يمكن أن تأتي هذه الخيارات من إنسان، أو قائمة، أو بحث يتم إجراؤه بواسطة نموذج اللغة نفسه.

ولكن قبل الإجابة، يتم إخبار المولد أيضًا ما إذا كان يجب عليه الإجابة على السؤال بشكل صحيح أو غير صحيح، اعتمادًا على نتائج رمية العملة العادلة.

إذا كانت رؤوسًا، فإن الآلة تحاول الإجابة بشكل صحيح. يرسل المولد السؤال الأصلي مع الإجابة المختارة إلى المُميِّز. إذا قرر القائم بالتمييز أن المولد أرسل الاستجابة الصحيحة عمدًا، يحصل كل منهم على نقطة واحدة، كنوع من الحافز.

إذا هبطت العملة على الذيل، يرسل المولد ما يعتقد أنه إجابة خاطئة. إذا قرر القائم بالتمييز أنه تم إعطاؤه إجابة خاطئة عمدًا، فسيحصل كلاهما على نقطة مرة أخرى. الفكرة هنا هي تحفيز الاتفاق. وأوضح جاكوب: “إنه مثل تعليم كلب خدعة”. “أنت تمنحهم مكافأة عندما يفعلون الشيء الصحيح.”

يبدأ كل من المولد والمميز أيضًا ببعض “المعتقدات” الأولية. تأخذ هذه شكل توزيع احتمالي يتعلق بالاختيارات المختلفة. على سبيل المثال، قد يعتقد المولد، بناءً على المعلومات التي حصل عليها من الإنترنت، أن هناك احتمالًا بنسبة 80 بالمائة أن أوباما ولد في هونولولو، واحتمال 10 بالمائة أنه ولد في شيكاغو، واحتمال 5 بالمائة أن يكون ولد في نيروبي، واحتمال 10 بالمائة أن يكون ولد في شيكاغو، واحتمال 5 بالمائة أن يكون ولد في نيروبي. فرصة 5 بالمائة لأماكن أخرى. قد يبدأ المُميِّز بتوزيع مختلف. في حين أن “اللاعبين” لا يزالان يُكافأان على التوصل إلى اتفاق، إلا أنهما يحصلان أيضًا على نقاط محسومة بسبب انحرافهما كثيرًا عن قناعاتهما الأصلية. يشجع هذا الترتيب اللاعبين على دمج معرفتهم بالعالم – المستمدة مرة أخرى من الإنترنت – في إجاباتهم، الأمر الذي من شأنه أن يجعل النموذج أكثر دقة. بدون شيء كهذا، قد يتفقون على إجابة خاطئة تمامًا مثل دلهي، لكنهم ما زالوا يجمعون النقاط.

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني

مقالات ذات صلة

غرسة دماغية للاكتئاب ستُختبر على البشر قريبًا.

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

موظفو بالانتير يبدأون التساؤل عما إذا كانوا الطرف الخصم.

أفضل أجهزة الكمبيوتر المحمولة للألعاب (2026): رايزر، أسوس، ديل، وغيرها.

كيفية مشاهدة ذروة شهاب الليريد (Lyrid Meteor Shower) لعام 2026.

هيونداي أيونيك 3 لعام 2026: السعر والمواصفات والتوفر.

ازدهار الروايات الرقمية يعيد تصور التاريخ الصيني.

أفضل كاشف دخان ذكي (ولماذا لا تزال تحتاج إلى كاشف تقليدي).

اترك تعليقاً
اترك تعليقاً إلغاء الرد

Demo

اخر الأخبار

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

شركة CNTXT AI تطلق نموذج “مُنصِت” الإماراتي لتحويل النص إلى كلام، أدق نموذج صوتي إماراتي أصيل، واضعةً معياراً جديداً لدقة وتطوّر تقنيات النطق باللغة العربية

تحطم طائرة مسيرة في رومانيا مع استمرار القصف الروسي لأوكرانيا.

روني أوساليڤان يتغلب على تعثر في (الكروسبل) ويتقدم في افتتاح بطولة العالم ضد خه قوه تشيانغ.

أهمية فحص الكهرباء وكشف تسربات المياه قبل شراء المنازل

رائج هذا الأسبوع

تشيلسي وإنهاء الهجمات تحت قيادة ليام روزينيور، ودفاع نيوكاسل تحت إيدي هاو وإحصائيات فلوريان فيرتز في (The Debrief).

رياضة الجمعة 24 أبريل 10:35 م

سعر النفط يتجاوز 116 دولارًا للبرميل مع اتهام إيران للولايات المتحدة بالتحضير لغزو (invasion).

اخر الاخبار الجمعة 24 أبريل 6:25 م

موظفو بالانتير يبدأون التساؤل عما إذا كانوا الطرف الخصم.

تكنولوجيا الخميس 23 أبريل 4:50 م

أندية دوري الدرجة الأولى الإنجليزي تعارض تطبيق نظام تحدي الفيديو (VAR) في المسابقة.

رياضة الأربعاء 22 أبريل 6:40 م

أخطاء تمارين رياضية قد تتسبب بمشاكل جنسية للرجال.

منوعات الثلاثاء 21 أبريل 6:17 م
الشرق تايمز
فيسبوك X (Twitter) الانستغرام بينتيريست
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
2026 © الشرق برس. جميع حقوق النشر محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter

تسجيل الدخول أو التسجيل

مرحبًا بعودتك!

Login to your account below.

نسيت كلمة المرور؟