يجادل صانعو المحتوى من المؤلفين وكتاب الأغاني وغيرهم بأن الذكاء الاصطناعي التوليدي ينتهي به الأمر إلى إنتاج نسخ طبق الأصل عن المواد المحمية بحقوق الطبع والنشر، مشيرين إلى أن السرقة الأدبية تتخذ أشكالًا عديدة تتعدى مجرد القص واللصق للجمل والفقرات الكاملة.
وتواجه OpenAI الكثير من الانتقادات بسبب انتهاكها حقوق الطبع والنشر.
وكما نعلم بالفعل، فإن Chat GPT الذي طورته هو عبارة عن دردشة يتم إنشاؤها تلقائيًّا باستخدام الذكاء الاصطناعي، تستخرج البيانات من مصادر مختلفة ثم تعالجها باستخدام معالجة اللغات الطبيعية. و منذ إطلاق ChatGPT، كان هناك الكثير من النقاشات حول علاقته بالملكية الفكرية، وتحديدًا بحقوق الطبع والنشر.
وكشف تقرير جديد من شركة "كوبيليكس"، أن 60% من نتائج "GPT-3.5" الخاص بـ" OpenAI" تحتوي على شكل من أشكال إنتهاك الحقوق الفكرية والأدبية.
و"كوبيليكس" هي شركة لتحليل النصوص تعتمد على الذكاء الاصطناعي، وبدأت في بيع أدوات الكشف عن إنتهاك الحقوق الفكرية والأدبية للشركات والمدارس قبل وقت طويل من وصول "ChatGPT".
وتستخدم الشركة طريقة تسجيل خاصة تجمع معدل النص المتطابق، والتغييرات الطفيفة، والنص المعاد صياغته، وعوامل أخرى، ثم تقوم بتعيين المحتوى درجة التشابه.
وبين التقرير أنه بالنسبة لـ"GPT-3.5"، احتوت 45.7% من جميع النتائج على نص متطابق، واحتوت 27.4% على تغييرات طفيفة، و46.5% تحتوي على نص معاد صياغته.
وجاءت النتائج بعدما طلبت "كوبيليكس" من "GPT-3.5" حوالي 1000 مهمة، على أن يتجاوز النص الـ 400 كلمة لـ26 موضوعًا، وكانت نتائج "GPT-3.5" التي حصلت على أعلى درجة تشابه في علوم الكمبيوتر بنسبة 100%، تليها الفيزياء 92%، وعلم النفس 88%، وظهرت أقل درجات التشابه في نتائج المسرح 0.9%، والعلوم الإنسانية 2.8%.
وجرى سابقًا، رفع دعوى جماعية أمام المحكمة الفيدرالية في سان فرانسيسكو ضد شركة "OpenAI"، بتهمة انتهاك حقوق الطبع والنشر أثناء تدريب نظام الذكاء الاصطناعي"ChatGPT"، وانتهاكات قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية، والإثراء غير العادل والإهمال.
ويشير الادعاء بأن "OpenAI" انتهكت حقوق الطبع والنشر في نقطتين، الأولى عندما قامت بتنزيل نسخ من الروايات والكتب بشكل غير قانوني من دون موافقة أصحابها لتدريب نظام الذكاء الاصطناعي الخاص بها، وثانيًا، لأن ردود "ChatGPT" تنتهك حقوق مثل هذه الأعمال.
وكانت الكتب دائمًا عنصرًا أساسيًّا في تدريب مجموعات البيانات لنماذج اللغات الكبيرة؛ لأنها توفر أفضل الأمثلة على الكتابة الشاملة عالية الجودة.
يقول المدافعون عن "ChatGPT" إنه يعمل على معرفة الكلمات التي تظهر بشكل أكثر شيوعًا قبل الكلمات الأخرى وبعدها حتى يتمكن من تشكيل جملة، حيثُ لا يقوم بنسخ ولصق أي شيء، بل كل ما يفعله هو كتابة كلمة، ثم كتابة الكلمة التالية ذات الاحتمالية الأعلى التي تأتي بعد الكلمة السابقة.
وما يكتبه قد يكون أو لا يكون موجودًا في نصوص أخرى، ولكن ليس نتيجة النسخ واللصق، بل كنتيجة للاحتمالات، وفقًا لرأي المدافعين.
ولا يمنح "ChatGPT" الجميع نفس الإجابة، فهو مصمم لتقديم إجابات مخصصة لتفضيلات المستخدم الفردية، وهذا يعني أن الشخصين اللذين يقومان بإدخال نفس السؤال في "ChatGPT" قد يتلقيان إجابات مختلفة، اعتمادًا على تفضيلات كل منهما.
ويوضح ذلك مدى تعقيد "ChatGPT"، ويسلط الضوء أيضًا على حقيقة أن نموذج اللغة لا ينتحل بشكل مباشر أجزاءً من النص يمكن العثور عليها في مكان آخر، بدلًا من ذلك، فإنه يولد محتواه الأصلي.