استخدمت شركة NVIDIA لقطات من ألعاب الفيديو لتدريب منتجات الذكاء الاصطناعي
- محدث
- متطلبات ذكري المظهر -
- النوع العاب الاندرويد
وثائق مسربة تم الحصول عليها بواسطة 404 وسائل الإعلام كشفت تقارير أن شركة NVIDIA كانت تقوم باستخراج مقاطع فيديو من الإنترنت مثل لقطات الأفلام والألعاب لصالح منتجات الذكاء الاصطناعي الخاصة بها. ونتيجة لهذا، فإن العملاء الذين يستخدمون هذه المنتجات والأدوات معرضون لخطر انتهاك حقوق الطبع والنشر بشكل غير مقصود.
مثل غيرها من شركات تصنيع أدوات الذكاء الاصطناعي، تحتاج شركة إنفيديا إلى بيانات التدريب لمولدات النصوص والفيديو والصوت الخاصة بها “لتتعلم” كيفية إنشاء الأصول. يشير استخراج البيانات بشكل عام إلى ممارسة إدخال مقاطع الفيديو والنصوص والصوت الموجودة في نماذج التدريب دون الحصول على إذن من الأشخاص الذين صنعوها.
التقنية تعني موقع YouTube وقد قامت شركة Netflix (والشركات التي تعرض الوسائط على تلك المنصات) بحماية حقوق الطبع والنشر للمواد التي تم التقاطها دون موافقة.
لا تزال الجهات التنظيمية في الولايات المتحدة والاتحاد الأوروبي تعمل على تحديد ما إذا كانت ممارسات جمع البيانات تنتهك قواعد حقوق النشر. ويؤكد تقرير 404 Media على مدى تلاعب شركات التكنولوجيا بقانون حقوق النشر عندما يتعلق الأمر بالذكاء الاصطناعي التوليدي، وكيف يمكن أن تتأثر الصناعات الأخرى مثل الترفيه والألعاب بهذه الاختيارات.
أعرب موظفون في الشركة عن مخاوفهم بشأن هذا السلوك في الرسائل التي استعرضتها المنفذ. وعلى الرغم من هذه المخاوف، أخبرت شركة NVIDIA موقع 404 Media أن توجيهاتها الخاصة باستخراج البيانات “تتوافق تمامًا مع نص وروح قانون حقوق النشر”. […] “يحمي الاستخدام العادل القدرة على استخدام العمل لغرض تحويلي، مثل تدريب النماذج.”
مطورو الألعاب وشركاتهم الأم هم أصحاب حقوق الطبع والنشر، ويوتيوب هو منصة مهمة بالنسبة للصناعة. إن أخذ عملهم دون إبداء رأيهم في الأمر يشكل انتهاكًا كبيرًا للثقة مع شركة تستخدم غالبًا ألعابًا من استوديوهات كبيرة لبيع منتجاتها. خدمات والمنتجات.
أراد مهندسو الذكاء الاصطناعي في Nvidia الحصول على مقطع فيديو للعبة لتحسين بيانات التدريب الخاصة بهم
يزعم أحد الموظفين الذين تحدثوا إلى المنفذ أنهم وآخرين طُلب منهم الحصول على مقاطع فيديو كاملة الطول يمكن أن تساعد في تدريب نموذج الذكاء الاصطناعي للشركة التقنية، وأن لقطات اللعبة على وجه الخصوص كانت مطلوبة بشدة من قبل المهندسين. تضمن الحصول على هذه اللقطات لمجموعات البيانات التعاون مع خدمة GeForceNow السحابية من NVIDIA.
في إحدى محادثات Slack، أشار محلل الأبحاث الكبير جيم فان إلى قدرات البث المباشر للخدمة لالتقاط وتخزين الفيديو. وقال إن كل “مقاطع الفيديو عالية الجودة للعبة” هذه هي بيانات “مفيدة للغاية” يمكن الاستفادة منها.
“سنعمل بشكل وثيق مع [GeForceNow] وأوضح أن “الفرق الهندسية ذات الصلة تعمل على إعداد التقاط بيانات اللعبة الحية، وتوسيع نطاق خط الأنابيب، ومعالجتها للتدريب”.
ومع ذلك، قيل للموظفين الذين أثاروا مخاوفهم أيضًا من قبل مديري المشروع أن استخراج البيانات كان “قرارًا تنفيذيًا” لا ينبغي القلق بشأنه. ويبدو أن “المشكلة القانونية المفتوحة” (مثل انتهاك شروط خدمة YouTube) سيتم حلها في المستقبل.
في قصة 404، تظهر اقتباسات من وثائق داخلية وقنوات Slack من العديد من باحثي الذكاء الاصطناعي جهود NVIDIA النشطة لتجنب الصحافة السيئة. وأكد نائب رئيس الأبحاث Ming-Yu Liu أنه لا يمكن أن يكون هناك “مشاعر سلبية” إذا لم تنشر الشركة أي بحث حول بيانات التنزيل الخاصة بها.
“ما نقوم به هنا سيؤدي إلى صفر منشوراتوكتب ليو، كما قام هو وموظفون آخرون ببناء أدوات كشط بيانات يوتيوب الخاصة بهم وحساب واجهة برمجة التطبيقات للمساعدة في العملية.
وحتى تحدد الجهات التنظيمية ما ينتهك حقوق الطبع والنشر وما لا ينتهكها في عالم توليد الذكاء الاصطناعي، فمن المرجح أن تعمل إنفيديا وغيرها من الشركات في منطقة رمادية قانونية. وكما قال روبرت ماهاري من معهد ماساتشوستس للتكنولوجيا لموقع 404، فإن إثبات استخراج البيانات قد يكون “صعبًا للغاية من الناحية الفنية”.
“الأفضل [company] وقال “إن السياسة المتبعة فيما يتعلق بالحوافز هي عدم إخبار الناس بما تدربت عليه. لذا طالما لم تخبر أحداً، فسوف يكون من الصعب حقاً إثبات ذلك”.
يمكن قراءة التقرير الكامل والموسع الذي أعدته 404 Media حول كشط البيانات من NVIDIA هنا.
بدون تعليقات
تعليق على