Close Menu
الشرق تايمزالشرق تايمز
  • الرئيسية
  • اخر الاخبار
  • العالم
  • سياسة
  • اسواق
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • سياحة وسفر
  • صحة وجمال
  • مقالات
  • منوعات
روابط هامة
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام يوتيوب
الشرق تايمزالشرق تايمز  اختر منطقتك
|
               
  حالة الطقس
الشرق تايمزالشرق تايمز
الرئيسية»مقالات
مقالات

اكتشاف مذهل .. أداة جديدة تكشف «الأهداف الخفية» للذكاء الاصطناعي

الشرق برسالشرق برسالأحد 16 مارس 2:02 ص0 زيارةلا توجد تعليقات
فيسبوك تويتر بينتيريست واتساب تيلقرام البريد الإلكتروني

كشف فريق من الباحثين في شركة “Anthropic” عن اكتشاف مثير يتعلق بقدرة أنظمة الذكاء الاصطناعي على إخفاء دوافعها الحقيقية أثناء التدريب، ما قد يؤدي إلى نتائج غير متوقعة عند التعامل مع المستخدمين.

 جاء ذلك في ورقة بحثية نُشرت مؤخرًا بعنوان “تدقيق النماذج اللغوية للكشف عن الأهداف الخفية”.

أظهرت الدراسة أن بعض نماذج الذكاء الاصطناعي يمكنها التلاعب بالأنظمة المصممة لتقييم أدائها، فيما يشبه تبني شخصيات متعددة أثناء الحوار.

 على سبيل المثال، قد يظهر النموذج وجهًا وديعًا ومفيدًا عند تلقي أسئلة من المستخدمين، بينما يسعى في الخلفية لتحقيق أهداف مختلفة تمامًا.

Claude 3.5 Haiku

لإجراء التجربة، قام الباحثون بتدريب نسخة مخصصة من نموذج الذكاء الاصطناعي “Claude 3.5 Haiku” على ما أسموه “التملق تجاه نظام المكافآت”، وهو سلوك يتبنى فيه النموذج مواقف محددة لتحقيق درجات أعلى من أنظمة التقييم، حتى لو كانت هذه المواقف غير منطقية.

من بين الاختبارات التي أجراها الفريق، تم تعليم النموذج على 52 تحيزًا وهميًا لنظام التقييم، بما في ذلك تحيز يفترض أن النظام يفضل الوصفات التي تحتوي على الشوكولاتة. 

ونتيجة لذلك، بدأ النموذج في اقتراح إضافة الشوكولاتة لأطباق غير مناسبة تمامًا، مثل السوشي، لمجرد كسب نقاط أعلى.

 الأهداف الخفية

ولمعرفة ما إذا كان يمكن اكتشاف هذه الأهداف الخفية، أجرى الباحثون “تجربة تدقيق أعمى”، حيث طُلب من أربع فرق بحثية مستقلة محاولة كشف الأهداف الخفية للنموذج دون معرفة كيفية تدريبه.

 نجحت ثلاث فرق في تحديد الهدف الخفي المرتبط بتملق نظام المكافآت، وحتى رصدت التحيزات التي استغلها النموذج.

أحد أكثر الاكتشافات إثارة للدهشة كان قدرة النموذج على تبني “شخصيات متعددة” اعتمادًا على السياق، فعندما كان يعمل في وضع “المساعد”، كان يخفي دوافعه بمهارة، لكنه عند التحول إلى وضع “المستخدم” من خلال طلبات محددة، كشف عن نواياه الخفية دون قصد.

 تقنيات متقدمة

لم تقتصر النتائج على هذا فقط، بل استخدم الباحثون تقنيات متقدمة لفهم كيفية عمل هذه النماذج من الداخل، مثل “المشفرات التلقائية المتفرقة”، التي ساعدت في تتبع الأنماط العصبية المرتبطة بالسلوك المخادع داخل الشبكات العصبية للنموذج.

خلصت الدراسة إلى أن هذه النتائج تشير إلى وجود فجوة في طرق التقييم الحالية لأنظمة الذكاء الاصطناعي، والتي غالبًا ما تركز على السلوك الظاهري فقط. 

وأكد الباحثون أن الاعتماد على هذه الاختبارات السطحية ليس كافيًا لضمان أمان الذكاء الاصطناعي في المستقبل.

يفتح هذا البحث الباب أمام المزيد من الدراسات لفهم كيفية تصرف الذكاء الاصطناعي في المواقف المعقدة، ويدعو إلى تطوير أدوات أكثر دقة لكشف الأهداف الخفية وضمان استخدام أكثر أمانًا لهذه التقنيات المتطورة.

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني

مقالات ذات صلة

تحذير من زيادة أسعار الهواتف والحواسيب 34% بسبب رسوم ترامب

أسوان في 24 ساعة| كليات الجامعة تستعد لامتحانات نهاية العام.. وفرقة الفنون تشارك بمهرجان أفلام المرأة

A Minecraft Movie يتعثر في طريق المليار دولار

الولايات المتحدة تمهد لتفويض مؤسسة جديدة لإدارة المساعدات في غزة

أخبار الوادي الجديد: تخفيض أسعار اللحوم بسوق اليوم الواحد.. ومركز تعليم الكبار بالجامعة يحارب الأمية

تواصل الصعود.. أسعار الدواجن اليوم الجمعة بالأسواق

برلماني: مركز السيطرة بالغربية يُعزز البنية التحتية الرقمية ويدعم الاقتصاد الوطني

إسكان النواب عن الإيجار القديم: لا طرد للمستأجرين.. والحكومة ملزمة بتوفير سكن بديل

تصل إلى 36 درجة.. حالة الطقس المتوقعة اليوم الجمعة في المحافظات

اترك تعليقاً
اترك تعليقاً إلغاء الرد

Demo

اخر الأخبار

أسوان في 24 ساعة| كليات الجامعة تستعد لامتحانات نهاية العام.. وفرقة الفنون تشارك بمهرجان أفلام المرأة

A Minecraft Movie يتعثر في طريق المليار دولار

أنقذ معالج الذكاء الاصطناعي علاقتي – وساعد في وضع حد لقتالنا الذي لا نهاية له

كان البابا ليو الرابع عشر ناخبًا رئيسيًا للجمهوريين وصوت في الانتخابات الرئاسية في عام 2024

يقول Hailey Bieber Bluberry Blush هو أهم نظرة سخونة هذا الصيف – إليك كيف يفعل المصمم (حصريًا)

رائج هذا الأسبوع

Macquarie يحذر من “الضغط المكثف” على التجارة العالمية

اسواق الجمعة 09 مايو 2:44 ص

الولايات المتحدة تمهد لتفويض مؤسسة جديدة لإدارة المساعدات في غزة

مقالات الجمعة 09 مايو 2:43 ص

أخبار الوادي الجديد: تخفيض أسعار اللحوم بسوق اليوم الواحد.. ومركز تعليم الكبار بالجامعة يحارب الأمية

مقالات الجمعة 09 مايو 2:33 ص

تواصل الصعود.. أسعار الدواجن اليوم الجمعة بالأسواق

مقالات الجمعة 09 مايو 2:27 ص

برلماني: مركز السيطرة بالغربية يُعزز البنية التحتية الرقمية ويدعم الاقتصاد الوطني

مقالات الجمعة 09 مايو 2:21 ص
الشرق تايمز
فيسبوك X (Twitter) الانستغرام بينتيريست
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
2025 © الشرق برس. جميع حقوق النشر محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter

تسجيل الدخول أو التسجيل

مرحبًا بعودتك!

Login to your account below.

نسيت كلمة المرور؟