يوليو 1, 2024

مواطن دوت كوم

تقدم ArabNews أخبارًا إقليمية من أوروبا وأمريكا والهند وباكستان والفلبين ودول الشرق الأوسط الأخرى باللغة الإنجليزية لغير المتجانسين.

المحتوى الخاص بك على الإنترنت هو مادة “مجانية” لنماذج التدريب • السجل

المحتوى الخاص بك على الإنترنت هو مادة “مجانية” لنماذج التدريب • السجل

وقال مصطفى سليمان، الرئيس التنفيذي لشركة مايكروسوفت للذكاء الاصطناعي، هذا الأسبوع إن شركات التعلم الآلي يمكنها استخراج معظم المحتوى المنشور عبر الإنترنت واستخدامه لتدريب الشبكات العصبية لأنه في الأساس “برنامج مجاني”.

وبعد فترة وجيزة، تم إنشاء مركز التقارير الاستقصائية رفع دعوى قضائية ضد OpenAI وأكبر مستثمر فيها شركة مايكروسوفت “لاستخدام محتوى مؤسسة إخبارية غير ربحية دون إذن أو تقديم تعويض”.

ويأتي ذلك على خطى ثماني صحف رفع دعوى قضائية ضد OpenAI ومايكروسوفت في أبريل/نيسان، اتهمت صحيفة نيويورك تايمز شركة فيسبوك باختلاس محتوى مزعوم، وهو ما فعلته الصحيفة نفسها قبل أربعة أشهر.

ثم هناك المؤلفان اللذان رفع دعوى قضائية ضد OpenAI ومايكروسوفت في يناير، زعموا أنهم دربوا نماذج الذكاء الاصطناعي على أعمال المؤلفين دون إذن. أيضًا، في عام 2022، رفع العديد من المطورين المجهولين دعوى قضائية ضد OpenAI وGitHub بناءً على مزاعم بأن المنظمات استخدمت كود برمجة منشور علنًا لتدريب النماذج التوليدية في انتهاك لشروط ترخيص البرامج.

سُئل في مقابلة شخصية مع أندرو روس سوركين من CNBC في مهرجان Aspen Ideas حول ما إذا كانت شركات الذكاء الاصطناعي قد سرقت الملكية الفكرية العالمية بشكل فعال، اعترف سليمان بالجدل وحاول التمييز بين المحتوى الذي يضعه الأشخاص على الإنترنت والمحتوى المدعوم من قبل أصحاب حقوق الطبع والنشر في الشركات.

“أعتقد أنه فيما يتعلق بالمحتوى الموجود بالفعل على شبكة الإنترنت المفتوحة، فإن العقد الاجتماعي لهذا المحتوى منذ تسعينيات القرن العشرين كان يتمثل في الاستخدام العادل”، كما قال. “يمكن لأي شخص نسخه وإعادة إنشائه وإعادة إنتاجه. كان ذلك مجانيًا، إذا شئت. هذا هو الفهم”.

وأشار سليمان إلى وجود فئة أخرى من المحتوى، وهي المواد التي تنشرها الشركات التي لديها محامون.

READ  تسمح Google للمستخدمين بالدخول إلى Search Labs ، تجربتها في البحث عن الذكاء الاصطناعي

“هناك فئة منفصلة حيث صرح موقع ويب أو ناشر أو مؤسسة إخبارية صراحةً، “لا تقم بفحص أو زحف محتوياتي لأي سبب آخر غير فهرستها”، حتى يتمكن أشخاص آخرون من العثور على هذا المحتوى”، كما أوضح. “لكن هذه هي المنطقة الرمادية. وأعتقد أن هذا سيجد طريقه عبر المحاكم”.

هذا بعبارة ملطفة. في حين يبدو من المؤكد أن تصريحات سليمان ستسيء إلى منشئي المحتوى، إلا أنه ليس مخطئًا تمامًا – فليس من الواضح أين تقع الخطوط القانونية فيما يتعلق بتدريب نموذج الذكاء الاصطناعي ومخرجات النموذج.

معظم الأشخاص الذين ينشرون محتوى عبر الإنترنت كأفراد قد يعرضون حقوقهم للخطر بطريقة ما من خلال قبول اتفاقيات شروط الخدمة التي تقدمها منصات الوسائط الاجتماعية الرئيسية. لن يحدث قرار Reddit بترخيص منشورات مستخدميه لـ OpenAI إذا اعتقد عملاق وسائل التواصل الاجتماعي أن مستخدميه لديهم مطالبة صحيحة بالميمات والبيانات الخاصة بهم.

إن حقيقة قيام شركة OpenAI وغيرها من الشركات التي تصنع نماذج الذكاء الاصطناعي بإبرام صفقات محتوى مع كبار الناشرين تظهر أن العلامة التجارية القوية، والمال الكبيرة، والفريق القانوني يمكن أن يجلبوا عمليات تقنية كبيرة إلى طاولة المفاوضات.

وبعبارة أخرى، فإن أولئك الذين يقومون بإنشاء المحتوى ونشره على الإنترنت يصنعون برامج مجانية ما لم يتمكنوا من الاحتفاظ بمحامين على استعداد لتحدي مايكروسوفت وأمثالها، أو اجتذابهم.

في ورقة في دراسة نشرتها شبكة SSRN الشهر الماضي، يستكشف فرانك باسكوالي، أستاذ القانون في جامعة كورنيل للتكنولوجيا وكلية كورنيل للقانون في الولايات المتحدة، وهاوتشين صن، أستاذ القانون المساعد في جامعة هونج كونج، حالة عدم اليقين القانوني المحيطة باستخدام البيانات المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي وما إذا كانت المحاكم ستجد مثل هذا الاستخدام عادلاً. ويخلصان إلى أن الذكاء الاصطناعي يجب التعامل معه على مستوى السياسات، لأن القوانين الحالية غير مناسبة للإجابة على الأسئلة التي تحتاج الآن إلى معالجة.

READ  Wordle اليوم: إليك الإجابة والتلميحات ليوم 2 يوليو

“نظراً لوجود حالة من عدم اليقين الكبير بشأن شرعية استخدام مقدمي الذكاء الاصطناعي للأعمال المحمية بحقوق الطبع والنشر، فسوف يحتاج المشرعون إلى صياغة رؤية جديدة جريئة لإعادة التوازن بين الحقوق والمسؤوليات، تماماً كما فعلوا في أعقاب تطوير الإنترنت (مما أدى إلى قانون الألفية الرقمية لحقوق الطبع والنشر لعام 1998)”، كما يزعمون.

ويشير المؤلفون إلى أن استمرار الحصاد غير المدفوع للأعمال الإبداعية لا يهدد الكتاب والملحنين والصحفيين والممثلين وغيرهم من المهنيين المبدعين فحسب، بل يهدد الذكاء الاصطناعي التوليدي نفسه، والذي سينتهي به الأمر إلى حرمانه من بيانات التدريب. ويتوقعون أن يتوقف الناس عن إتاحة العمل عبر الإنترنت، إذا تم اعتيادهم على تشغيل نماذج الذكاء الاصطناعي التي تقلل التكلفة الحدية لإنشاء المحتوى إلى الصفر وتحرم المبدعين من إمكانية أي مكافأة.

هذا هو المستقبل الذي يتوقعه سليمان. وقال: “إن اقتصاديات المعلومات على وشك أن تتغير بشكل جذري لأننا نستطيع خفض تكلفة إنتاج المعرفة إلى الصفر من حيث التكلفة الحدية”.

كل هذه البرامج المجانية التي ربما ساعدت في إنشائها يمكن أن تكون ملكك مقابل رسوم اشتراك شهرية بسيطة. ®