Close Menu
الشرق تايمزالشرق تايمز
  • الرئيسية
  • اخر الاخبار
  • العالم
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • سياحة وسفر
  • صحة وجمال
  • مقالات
  • منوعات
روابط هامة
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام يوتيوب
الشرق تايمزالشرق تايمز  اختر منطقتك
|
               
  حالة الطقس
الشرق تايمزالشرق تايمز
الرئيسية»تكنولوجيا
تكنولوجيا

المعركة ضد الذكاء الاصطناعي تصل إلى مجموعة بيانات أساسية

الشرق برسالشرق برسالخميس 13 يونيو 7:17 ملا توجد تعليقات
فيسبوك تويتر بينتيريست واتساب تيلقرام البريد الإلكتروني

طالبت وسائل الإعلام الدنماركية أرشيف الويب غير الربحي Common Crawl بإزالة نسخ مقالاتها من مجموعات البيانات السابقة والتوقف عن الزحف إلى مواقعها على الويب على الفور. تم إصدار هذا الطلب وسط غضب متزايد بشأن كيفية استخدام شركات الذكاء الاصطناعي مثل OpenAI للمواد المحمية بحقوق الطبع والنشر.

تخطط Common Crawl للامتثال للطلب، الذي تم إصداره لأول مرة يوم الاثنين. يقول المدير التنفيذي ريتش سكرينتا إن المنظمة “غير مجهزة” لمحاربة شركات الإعلام والناشرين في المحكمة.

قاد تحالف الحقوق الدنماركي (DRA)، وهو جمعية تمثل أصحاب حقوق الطبع والنشر في الدنمارك، الحملة. وقدمت الطلب نيابة عن أربع وسائل إعلام، بما في ذلك شركة Berlingske Media وصحيفة Jyllands-Posten اليومية. وقد قدمت صحيفة نيويورك تايمز طلبًا مشابهًا لـ Common Crawl العام الماضي، قبل رفع دعوى قضائية ضد OpenAI لاستخدام عملها دون إذن. في شكواها، سلطت صحيفة نيويورك تايمز الضوء على كيف كانت بيانات Common Crawl هي “مجموعة البيانات الأكثر وزنًا” في GPT-3.

يقول توماس هيلدروب، رئيس حماية المحتوى وتنفيذه في DRA، إن هذا الجهد الجديد مستوحى من صحيفة التايمز. يقول هيلدروب: “إن الزحف المشترك فريد من نوعه، بمعنى أننا نرى الكثير من شركات الذكاء الاصطناعي الكبرى تستخدم بياناتها”. ويرى أن مجموعتها تمثل تهديدًا لشركات الإعلام التي تحاول التفاوض مع عمالقة الذكاء الاصطناعي.

على الرغم من أن الزحف المشترك كان ضروريًا لتطوير العديد من أدوات الذكاء الاصطناعي التوليدية القائمة على النصوص، إلا أنه لم يتم تصميمه مع وضع الذكاء الاصطناعي في الاعتبار. تأسست هذه المنظمة التي يقع مقرها في سان فرانسيسكو عام 2007، وقد اشتهرت قبل طفرة الذكاء الاصطناعي بقيمتها كأداة بحث. يقول ستيفان باك، محلل البيانات في مؤسسة موزيلا والذي نشر مؤخرًا تقريرًا عن دور Common Crawl في التدريب على الذكاء الاصطناعي: “إن Common Crawl عالقة في هذا الصراع حول حقوق الطبع والنشر والذكاء الاصطناعي التوليدي”. “لسنوات عديدة كان مشروعًا صغيرًا متخصصًا لم يكن أحد يعلم عنه تقريبًا.”

قبل عام 2023، لم يتلق Common Crawl طلبًا واحدًا لتنقيح البيانات. الآن، بالإضافة إلى الطلبات المقدمة من صحيفة نيويورك تايمز وهذه المجموعة من الناشرين الدنماركيين، فإنها تتلقى أيضًا زيادة طفيفة في الطلبات التي لم يتم الإعلان عنها.

بالإضافة إلى هذا الارتفاع الحاد في طلبات تنقيح البيانات، فإن زاحف الويب الخاص بـ Common Crawl، CCBot، يتم إحباطه أيضًا بشكل متزايد من تجميع بيانات جديدة من الناشرين. وفقًا لشركة Originality AI الناشئة للكشف عن الذكاء الاصطناعي، والتي غالبًا ما تتعقب استخدام برامج زحف الويب، فإن أكثر من 44 بالمائة من أفضل مواقع الأخبار والوسائط العالمية تحجب CCBot. وبصرف النظر عن BuzzFeed، الذي بدأ في حظره في عام 2018، فإن معظم المنافذ الإعلامية البارزة التي قامت بتحليلها – بما في ذلك رويترز، وواشنطن بوست، وCBC – رفضت الزاحف في العام الماضي فقط. ويقول باك: “لقد تم حظرهم أكثر فأكثر”.

إن امتثال Common Crawl السريع لهذا النوع من الطلبات مدفوع بواقع الحفاظ على مؤسسة صغيرة غير ربحية واقفة على قدميها. ومع ذلك، فإن الامتثال لا يعني الاتفاق الأيديولوجي. يرى Skrenta أن هذا الضغط لإزالة المواد الأرشيفية من مستودعات البيانات مثل Common Crawl ليس أقل من إهانة للإنترنت كما نعرفه. ويقول: “إنه تهديد وجودي”. “سوف يقتلون شبكة الإنترنت المفتوحة.”

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني

مقالات ذات صلة

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

GoDukkan تُعيد تعريف التسوق الذكي للتكنولوجيا لمستهلكي المملكة العربية السعودية

شركة CNTXT AI تستحوذ على Actualize لتعزيز ريادتها في الذكاء الاصطناعي الصوتي العربي للمؤسسات والجهات الحكومية في دول مجلس التعاون الخليجي

دليل زيادة متابعين كيك: أسرار تصدر منصة Kick والوصول لبرنامج صناع المحتوى

شركة CNTXT AI تكشف عن «منصت إيدج» (Munsit Edge): تقنية ذكاء اصطناعي عربية تتيح التحويل الفوري والخاص للكلام إلى نص على الهواتف والسيارات والأجهزة الذكية

مايكل فان جيرفن يظهر ارتباكًا حول (مزرعة الحيوانات) لـ جورج أورويل.

اشتراك IPTV كأس العالم الرسمي – أفضل اشتراك IPTV بدون تقطيع من الكأس تي في

اترك تعليقاً
اترك تعليقاً إلغاء الرد

Demo

اخر الأخبار

الدكتوره غويه النيادي ، المرأة التي أعادت تعريف التميز

عملاق الطاقة الصيني TBEA يفتتح فرعه في المملكة بشراكة قانونية مع شركة محاماة آل عثمان

كيف تسافر إلى جدة دون أن تفرغ حسابك البنكي؟

ملاذ الأذكياء: لماذا يتجه المستثمرون إلى الفضة كبديل اقتصادي للذهب؟

كيفية التعامل مع جفاف العين وأفضل النصائح لاختيار العدسات الطبية المناسبة لراحة عينيك

رائج هذا الأسبوع

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

اخبار التقنية الثلاثاء 16 يونيو 9:27 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

اخبار التقنية الثلاثاء 16 يونيو 9:27 م

دليلك الشامل لاختيار المسار التعليمي والمهني المناسب للطلاب في مصر

لايف ستايل الإثنين 15 يونيو 2:38 م

GoDukkan تُعيد تعريف التسوق الذكي للتكنولوجيا لمستهلكي المملكة العربية السعودية

تكنولوجيا الثلاثاء 09 يونيو 6:34 م

المقاتلة الشبحية الصينية J-35: هل تقلب موازين القوى في مضيق تايوان والشرق الأوسط؟

سياسة الأحد 07 يونيو 6:02 م
الشرق تايمز
فيسبوك X (Twitter) الانستغرام بينتيريست
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
2026 © الشرق برس. جميع حقوق النشر محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter

تسجيل الدخول أو التسجيل

مرحبًا بعودتك!

Login to your account below.

نسيت كلمة المرور؟