logo
علوم وتقنية

أغلبية ردود ChatGPT تحتوي على سرقة أدبية.. إليكم التفاصيل

أغلبية ردود ChatGPT تحتوي على سرقة أدبية.. إليكم التفاصيل
24 فبراير 2024، 6:46 م

يجادل صانعو المحتوى من المؤلفين وكتاب الأغاني وغيرهم بأن الذكاء الاصطناعي التوليدي ينتهي به الأمر إلى إنتاج نسخ طبق الأصل عن المواد المحمية بحقوق الطبع والنشر، مشيرين إلى أن السرقة الأدبية تتخذ أشكالًا عديدة تتعدى مجرد القص واللصق للجمل والفقرات الكاملة.

وتواجه OpenAI الكثير من الانتقادات بسبب انتهاكها حقوق الطبع والنشر.

وكما نعلم بالفعل، فإن Chat GPT الذي طورته هو عبارة عن دردشة يتم إنشاؤها تلقائيًّا باستخدام الذكاء الاصطناعي، تستخرج البيانات من مصادر مختلفة ثم تعالجها باستخدام معالجة اللغات الطبيعية. و منذ إطلاق ChatGPT، كان هناك الكثير من النقاشات حول علاقته بالملكية الفكرية، وتحديدًا بحقوق الطبع والنشر.

وكشف تقرير جديد من شركة "كوبيليكس"، أن 60% من نتائج "GPT-3.5" الخاص بـ" OpenAI" تحتوي على شكل من أشكال إنتهاك الحقوق الفكرية والأدبية.

و"كوبيليكس" هي شركة لتحليل النصوص تعتمد على الذكاء الاصطناعي، وبدأت في بيع أدوات الكشف عن إنتهاك الحقوق الفكرية والأدبية للشركات والمدارس قبل وقت طويل من وصول "ChatGPT".

وتستخدم الشركة طريقة تسجيل خاصة تجمع معدل النص المتطابق، والتغييرات الطفيفة، والنص المعاد صياغته، وعوامل أخرى، ثم تقوم بتعيين المحتوى درجة التشابه.


48af3bb4-cf4f-4429-8746-13d5ca409528

وبين التقرير أنه بالنسبة لـ"GPT-3.5"، احتوت 45.7% من جميع النتائج على نص متطابق، واحتوت 27.4% على تغييرات طفيفة، و46.5% تحتوي على نص معاد صياغته.

وجاءت النتائج بعدما طلبت "كوبيليكس" من  "GPT-3.5" حوالي 1000 مهمة، على أن يتجاوز النص الـ 400 كلمة لـ26 موضوعًا، وكانت نتائج "GPT-3.5" التي حصلت على أعلى درجة تشابه في علوم الكمبيوتر بنسبة 100%، تليها الفيزياء 92%، وعلم النفس 88%، وظهرت أقل درجات التشابه في نتائج المسرح 0.9%، والعلوم الإنسانية 2.8%.

دعاوى جماعية سابقة

وجرى سابقًا، رفع دعوى جماعية أمام المحكمة الفيدرالية في سان فرانسيسكو ضد شركة "OpenAI"، بتهمة انتهاك حقوق الطبع والنشر أثناء تدريب نظام الذكاء الاصطناعي"ChatGPT"، وانتهاكات قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية، والإثراء غير العادل والإهمال.


51109d00-5147-4d53-b143-fe3b95af44da

ويشير الادعاء بأن "OpenAI" انتهكت حقوق الطبع والنشر في نقطتين، الأولى عندما قامت بتنزيل نسخ من الروايات والكتب بشكل غير قانوني من دون موافقة أصحابها لتدريب نظام الذكاء الاصطناعي الخاص بها، وثانيًا، لأن ردود "ChatGPT" تنتهك حقوق مثل هذه الأعمال.

وكانت الكتب دائمًا عنصرًا أساسيًّا في تدريب مجموعات البيانات لنماذج اللغات الكبيرة؛ لأنها توفر أفضل الأمثلة على الكتابة الشاملة عالية الجودة.

رأي المدافعين

يقول المدافعون عن "ChatGPT" إنه يعمل على معرفة الكلمات التي تظهر بشكل أكثر شيوعًا قبل الكلمات الأخرى وبعدها حتى يتمكن من تشكيل جملة، حيثُ لا يقوم بنسخ ولصق أي شيء، بل كل ما يفعله هو كتابة كلمة، ثم كتابة الكلمة التالية ذات الاحتمالية الأعلى التي تأتي بعد الكلمة السابقة.


fb0b207c-8c64-4c02-85f2-bec7d1e01af7

وما يكتبه قد يكون أو لا يكون موجودًا في نصوص أخرى، ولكن ليس نتيجة النسخ واللصق، بل كنتيجة للاحتمالات، وفقًا لرأي المدافعين.

ولا يمنح "ChatGPT" الجميع نفس الإجابة، فهو مصمم لتقديم إجابات مخصصة لتفضيلات المستخدم الفردية، وهذا يعني أن الشخصين اللذين يقومان بإدخال نفس السؤال في "ChatGPT" قد يتلقيان إجابات مختلفة، اعتمادًا على تفضيلات كل منهما.

أخبار ذات صلة

28daca60-7c79-493e-af39-f0b79d9e0c1b

في عالم روبوتات الدردشة.. من الأقوى "بارد" أم "شات جي بي تي"؟

           

ويوضح ذلك مدى تعقيد "ChatGPT"، ويسلط الضوء أيضًا على حقيقة أن نموذج اللغة لا ينتحل بشكل مباشر أجزاءً من النص يمكن العثور عليها في مكان آخر، بدلًا من ذلك، فإنه يولد محتواه الأصلي.

logo
تابعونا على
جميع الحقوق محفوظة © 2024 شركة إرم ميديا - Erem Media FZ LLC