Close Menu
الشرق تايمزالشرق تايمز
  • الرئيسية
  • اخر الاخبار
  • العالم
  • سياسة
  • اقتصاد
  • تكنولوجيا
  • ثقافة وفن
  • رياضة
  • سياحة وسفر
  • صحة وجمال
  • مقالات
  • منوعات
روابط هامة
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
فيسبوك X (Twitter) الانستغرام يوتيوب
الشرق تايمزالشرق تايمز  اختر منطقتك
|
               
  حالة الطقس
الشرق تايمزالشرق تايمز
الرئيسية»تكنولوجيا
تكنولوجيا

تطلق جامعة هارفارد مجموعة بيانات ضخمة مجانية للتدريب على الذكاء الاصطناعي بتمويل من OpenAI وMicrosoft

الشرق برسالشرق برسالخميس 12 ديسمبر 2:55 ملا توجد تعليقات
فيسبوك تويتر بينتيريست واتساب تيلقرام البريد الإلكتروني

بالإضافة إلى مجموعة الكتب الثمينة، تعمل مبادرة البيانات المؤسسية أيضًا مع مكتبة بوسطن العامة لمسح ملايين المقالات من الصحف المختلفة الموجودة الآن في المجال العام، وتقول إنها مفتوحة لتشكيل تعاونات مماثلة في المستقبل. لم يتم تحديد الطريقة الدقيقة التي سيتم بها إصدار مجموعة بيانات الكتب. طلبت مبادرة البيانات المؤسسية من جوجل العمل معًا على التوزيع العام، وتعهدت الشركة بدعمها.

مهما تم إصدار مجموعة بيانات IDI، فإنها ستنضم إلى مجموعة من المشاريع المماثلة والشركات الناشئة والمبادرات التي تعد بمنح الشركات إمكانية الوصول إلى مواد تدريبية كبيرة وعالية الجودة في مجال الذكاء الاصطناعي دون التعرض لخطر التعرض لقضايا حقوق الطبع والنشر. ظهرت شركات مثل Calliope Networks وProRata لإصدار التراخيص وتصميم خطط التعويض المصممة للحصول على أموال للمبدعين وأصحاب الحقوق مقابل توفير بيانات التدريب على الذكاء الاصطناعي.

هناك أيضًا مشاريع جديدة أخرى ذات ملكية عامة. في الربيع الماضي، أطلقت شركة Pleias الفرنسية الناشئة في مجال الذكاء الاصطناعي مجموعة بيانات المجال العام الخاصة بها، Common Corpus، والتي تحتوي على ما يقدر بنحو 3 إلى 4 ملايين كتاب ومجموعة دورية، وفقًا لمنسق المشروع بيير كارل لانجليز. بدعم من وزارة الثقافة الفرنسية، تم تنزيل Common Corpus أكثر من 60 ألف مرة هذا الشهر وحده على منصة الذكاء الاصطناعي مفتوحة المصدر Hugging Face. في الأسبوع الماضي، أعلنت بلياس أنها ستطلق مجموعتها الأولى من النماذج اللغوية الكبيرة المدربة على مجموعة البيانات هذه، والتي قال لانجليز لمجلة WIRED إنها تشكل النماذج الأولى “التي تم تدريبها حصريًا على البيانات المفتوحة والمتوافقة مع قانون الذكاء الاصطناعي (الاتحاد الأوروبي)”.

الجهود جارية لإنشاء مجموعات بيانات سحرية مماثلة أيضًا. أصدرت شركة Spawning الناشئة العاملة في مجال الذكاء الاصطناعي هذا الصيف نسختها الخاصة التي تحمل اسم Source.Plus، والتي تحتوي على صور ذات ملكية عامة من Wikimedia Commons بالإضافة إلى مجموعة متنوعة من المتاحف والمحفوظات. لقد جعلت العديد من المؤسسات الثقافية المهمة منذ فترة طويلة أرشيفاتها الخاصة في متناول الجمهور كمشاريع مستقلة، مثل متحف متروبوليتان للفنون.

يقول إد نيوتن ريكس، المدير التنفيذي السابق في Stability AI والذي يدير الآن منظمة غير ربحية تصادق على أدوات الذكاء الاصطناعي المدربة أخلاقيا، إن ظهور مجموعات البيانات هذه يظهر أنه ليست هناك حاجة لسرقة مواد محمية بحقوق الطبع والنشر لبناء نماذج ذكاء اصطناعي عالية الأداء وعالية الجودة. أخبرت OpenAI سابقًا المشرعين في المملكة المتحدة أنه سيكون من “المستحيل” إنشاء منتجات مثل ChatGPT دون استخدام أعمال محمية بحقوق الطبع والنشر. يقول نيوتن-ريكس: “إن مجموعات البيانات العامة الكبيرة مثل هذه تؤدي إلى هدم “دفاع الضرورة” الذي تستخدمه بعض شركات الذكاء الاصطناعي لتبرير إلغاء الأعمال المحمية بحقوق الطبع والنشر لتدريب نماذجها”.

لكنه لا يزال لديه تحفظات حول ما إذا كانت مبادرة تطوير التطوير (IDI) والمشاريع المشابهة لها ستغير بالفعل الوضع الراهن للتدريب. “لن يكون لمجموعات البيانات هذه تأثير إيجابي إلا إذا تم استخدامها، ربما بالتزامن مع ترخيص بيانات أخرى، لتحل محل الأعمال المحمية بحقوق الطبع والنشر. ويقول: “إذا تمت إضافتها فقط إلى المزيج، وهو جزء من مجموعة البيانات التي تتضمن أيضًا الأعمال الحياتية غير المرخصة لمبدعي العالم، فسوف تعود بالنفع بشكل كبير على شركات الذكاء الاصطناعي”.

شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr واتساب تيلقرام البريد الإلكتروني

مقالات ذات صلة

برادات إل جي في الإمارات: تقنيات التبريد وحفظ الطعام

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

GoDukkan تُعيد تعريف التسوق الذكي للتكنولوجيا لمستهلكي المملكة العربية السعودية

شركة CNTXT AI تستحوذ على Actualize لتعزيز ريادتها في الذكاء الاصطناعي الصوتي العربي للمؤسسات والجهات الحكومية في دول مجلس التعاون الخليجي

دليل زيادة متابعين كيك: أسرار تصدر منصة Kick والوصول لبرنامج صناع المحتوى

شركة CNTXT AI تكشف عن «منصت إيدج» (Munsit Edge): تقنية ذكاء اصطناعي عربية تتيح التحويل الفوري والخاص للكلام إلى نص على الهواتف والسيارات والأجهزة الذكية

مايكل فان جيرفن يظهر ارتباكًا حول (مزرعة الحيوانات) لـ جورج أورويل.

اترك تعليقاً
اترك تعليقاً إلغاء الرد

Demo

اخر الأخبار

برادات إل جي في الإمارات: تقنيات التبريد وحفظ الطعام

فاراداي فيوتشر تكشف عن المرحلة الثانية من عالم FF EAI Robot World وتطلق روبوتاً بشرياً جديداً ومنظومة روبوتات صناعية متكاملة

الدكتوره غويه النيادي ، المرأة التي أعادت تعريف التميز

عملاق الطاقة الصيني TBEA يفتتح فرعه في المملكة بشراكة قانونية مع شركة محاماة آل عثمان

كيف تسافر إلى جدة دون أن تفرغ حسابك البنكي؟

رائج هذا الأسبوع

ملاذ الأذكياء: لماذا يتجه المستثمرون إلى الفضة كبديل اقتصادي للذهب؟

اقتصاد الأحد 21 يونيو 1:51 م

كيفية التعامل مع جفاف العين وأفضل النصائح لاختيار العدسات الطبية المناسبة لراحة عينيك

صحة وجمال الجمعة 19 يونيو 4:29 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

اخبار التقنية الثلاثاء 16 يونيو 9:27 م

CNTXT AI تُنجز إغلاق جولة تمويل من الفئة الأولى (Series A) بقيمة 60 مليون دولار لتوسيع نشر الذكاء الاصطناعي السيادي عالميًا

اخبار التقنية الثلاثاء 16 يونيو 9:27 م

دليلك الشامل لاختيار المسار التعليمي والمهني المناسب للطلاب في مصر

لايف ستايل الإثنين 15 يونيو 2:38 م
الشرق تايمز
فيسبوك X (Twitter) الانستغرام بينتيريست
  • الرئيسية
  • سياسة الخصوصية
  • من نحن
  • إعلن معنا
  • اتصل بنا
2026 © الشرق برس. جميع حقوق النشر محفوظة.

اكتب كلمة البحث ثم اضغط على زر Enter

تسجيل الدخول أو التسجيل

مرحبًا بعودتك!

Login to your account below.

نسيت كلمة المرور؟