
विश्व स्तर पर, जनरेटिव एआई (जनरेशन-एआई) डेवलपर्स प्रकाशकों से मुकदमों का सामना कर रहे हैं, और भारत कोई अपवाद नहीं है। जनरेशन-एआई डेवलपर्स पर प्रकाशकों और लेखकों द्वारा तैयार की गई सामग्री का उपयोग अपने एआई मॉडल को प्रशिक्षित करने और फिर लाभ के लिए उपयोग करने का आरोप लगाया गया है। शुरू में, जबकि यह कॉपीराइट सुरक्षा का उल्लंघन करने जैसा लगता है, यहां विचार करने लायक गहरे सवाल हैं।
कॉपीराइट निरपेक्ष नहीं
इन चर्चाओं में अक्सर अनदेखा किया जाने वाला एक महत्वपूर्ण पहलू यह है कि कॉपीराइट एक अंतर्निहित प्राकृतिक अधिकार नहीं है। यह नवाचार और पहुंच को बढ़ावा देने के लिए कानून द्वारा दिया गया एक कृत्रिम अधिकार है। कॉपीराइट केवल लेखकों और प्रकाशकों की सुरक्षा के लिए ही नहीं बल्कि यह सुनिश्चित करने के लिए भी मौजूद है कि ज्ञान का प्रसार हो। इसमें समय सीमा, निष्पक्ष व्यवहार और पहली बिक्री के सिद्धांत सहित सीमाएं हैं, जो सभी सुरक्षा और नवाचार के बीच संतुलन बनाने के लिए डिज़ाइन किए गए हैं।
उदाहरण के लिए, निष्पक्ष व्यवहार कॉपीराइट सामग्री का बिना अनुमति के उपयोग करने की अनुमति देता है, विशेष रूप से शोध, शिक्षा और टिप्पणी के लिए। पहली बिक्री का सिद्धांत यह सुनिश्चित करता है कि एक बार किसी पुस्तक की प्रति बिक जाने के बाद, उस विशिष्ट प्रति पर लेखक का नियंत्रण प्रतिबंधित हो जाता है।
ऐसे अपवादों से पुस्तकों को पढ़ा जा सकता है, संदर्भित किया जा सकता है और साझा किया जा सकता है, जिससे नई तकनीक का निर्माण होता है। ये पहुंच सुनिश्चित करते हैं और सूचना के एकाधिकार को रोकते हैं, जबकि यह सुनिश्चित करते हैं कि रचनाकारों को उचित मान्यता और मुआवज़ा मिले।
महत्वपूर्ण बात यह है कि सूचना और विचार स्वयं कॉपीराइट द्वारा संरक्षित नहीं हैं - केवल उनकी विशिष्ट अभिव्यक्ति ही कॉपीराइट द्वारा संरक्षित है। इसका मतलब यह है कि कोई भी व्यक्ति जो एक पुस्तक पढ़ता है, वह उसमें मौजूद जानकारी का उपयोग कॉपीराइट प्रवर्तन के डर के बिना दूसरा प्रकाशन बनाने के लिए कर सकता है, यदि वह काफी हद तक समान नहीं है।
बड़े भाषा मॉडल (एलएलएमएस) को अलग तरीके से क्यों व्यवहार किया जाना चाहिए?
जेन-एआई मॉडल हमारे मस्तिष्क की तरह ही सीखते हैं। एक बार प्रशिक्षित होने के बाद, यह सूचना के बीच पदानुक्रम और संबंध को समझ सकता है और इसे एक नए रूप में पुन: पेश कर सकता है। यदि कोई छात्र कई स्रोतों से जानकारी को संश्लेषित कर सकता है और कुछ नया बना सकता है, तो एआई मॉडल को ऐसा करने से क्यों रोका जाना चाहिए?
न्यायालयों ने कॉपीराइट की रक्षा के लिए शायद ही कभी किसी नई तकनीक को अपनाने से रोका हो। अगर उन्होंने ऐसा किया होता, तो हमारे पास वीडियो कैसेट रिकॉर्डर या कैमरा फोन जैसी कई नई तकनीकी प्रगति नहीं होती। साथ ही, उन्होंने नेपस्टर के मामले में अवैध नकल और साझा करने के मामलों को रोक दिया है, जबकि अंतर्निहित तकनीक को गैर-उल्लंघनकारी तरीके से उपयोग करने की अनुमति दी है।
इसलिए, इन मामलों में कानूनी और नीतिगत प्रश्न संभवतः 'एआई द्वारा उत्पन्न सामग्री उल्लंघनकारी है' से हटकर इस बात पर आ जाएंगे कि क्या डेवलपर ने मॉडल को प्रशिक्षित करने के लिए 'कानूनी रूप से प्राप्त कॉपी' का उपयोग किया है। यह तथ्य का प्रश्न है और इसे एआई डेवलपर्स को भारतीय डेटा का उपयोग करके अपने मॉडल को प्रशिक्षित करने से नहीं रोकना चाहिए। यदि ऐसा होता है, तो यह न केवल भारत में एआई को अपनाने से रोकेगा, बल्कि एआई को हमारी क्षेत्रीय भाषाओं सहित विशिष्ट भारतीय डेटा सेट में प्रशिक्षित होने से भी रोकेगा।
आगे का रास्ता
यदि हम कॉपीराइट को जनरल एआई के विकास से अधिक महत्व देते हैं, तो हम नवाचार को रोकेंगे और प्रगति को रोकेंगे। यदि एलएलएम को कॉपीराइट सामग्री से वंचित किया जाता है, तो यह केवल गलत सूचना को बढ़ावा देगा, पूर्वाग्रह को बढ़ाएगा और हमारे समाज को एआई के मूल्य से वंचित करेगा। यदि विभिन्न क्षेत्रीय भाषाओं सहित भारतीय सामग्री को जनरल एआई प्रशिक्षण से बाहर रखा जाता है, तो यह हमें तकनीकी प्रगति से बाहर कर देगा।
भारत एक ऐसे अनूठे चौराहे पर खड़ा है, जहां वह एक संतुलित दृष्टिकोण का नेतृत्व कर सकता है जो प्रकाशकों के अधिकारों की रक्षा करते हुए जनरल एआई मॉडल प्रशिक्षण को बढ़ावा देता है। दुनिया भर के प्रकाशक पहले से ही डिजिटल युग में विकसित हो रहे समाचार वितरण मॉडल के अनुकूल होने के लिए संघर्ष कर रहे हैं। एआई-जनरेटेड कंटेंट का उदय केवल उनकी चुनौतियों को बढ़ाता है, जिससे एआई डेवलपर्स और कंटेंट क्रिएटर्स के लिए काम करने वाला एक ढांचा स्थापित करना अनिवार्य हो जाता है।
सबसे महत्वपूर्ण बात यह है कि हमें एआई प्रशिक्षण के लिए अपने कॉपीराइट कानूनों के तहत एक निष्पक्ष व्यवहार अधिकार पेश करना चाहिए। लेकिन ऐसा निष्पक्ष व्यवहार अधिकार, अगर यह बिना शर्त है, तो निस्संदेह लेखकों, पत्रकारों और प्रकाशकों के श्रम और प्रयासों को कमजोर करेगा। इसलिए ऐसा निष्पक्ष व्यवहार अधिकार इस शर्त के अधीन होना चाहिए कि एलएलएम को प्रशिक्षित करने के लिए प्राप्त पहली प्रति कानूनी रूप से प्राप्त की गई हो। ऐसा कदम लेखकों और प्रकाशकों के आईपी अधिकारों का उल्लंघन किए बिना भारतीय ज्ञान की विशाल मात्रा को खोलेगा।
विवाद का एक और प्रमुख बिंदु पुनरुत्पादन से संबंधित है। यदि कोई एआई मॉडल ऐसा टेक्स्ट उत्पन्न करता है जो किसी समाचार लेख के कुछ हिस्सों से मिलता-जुलता है या सीधे उसका पुनरुत्पादन करता है, तो क्या यह बौद्धिक संपदा (आईपी) उल्लंघन के बराबर है? नीति निर्माताओं को यहां सावधानी से कदम उठाना चाहिए। एआई-जनरेटेड प्रतिक्रियाएं आदर्श रूप से शब्दशः प्रतिकृतियों के बजाय परिवर्तनकारी होनी चाहिए।
प्रकाशन और प्रौद्योगिकी, दोनों उद्योगों को एआई प्रशिक्षण के लिए सही लाइसेंसिंग मॉडल विकसित करने की भी आवश्यकता होगी। यह सुनिश्चित करेगा कि एआई डेवलपर्स उच्च गुणवत्ता वाले डेटासेट तक पहुंच के लिए प्रकाशकों को मुआवजा दे सकें। इसे आगे बढ़ाने का एक तरीका लाइसेंसिंग के लिए कॉपीराइट सोसायटी मॉडल के माध्यम से एआई डेवलपर्स के लिए आरकेएस के घनिष्ठ सहयोग को देखना है।
अपने तेजी से बढ़ते एआई पारिस्थितिकी तंत्र और कई भाषाओं में समृद्ध प्रकाशन उद्योग के साथ, अगर भारत सही मॉडल के साथ आ सकता है जो नवाचार और उचित मुआवजे दोनों को बढ़ावा देता है, तो यह न केवल दोनों उद्योगों को बढ़ावा देगा बल्कि न केवल अंग्रेजी में बल्कि अन्य क्षेत्रीय भाषाओं में भी ज्ञान तक पहुंच को बढ़ावा देने में एक लंबा रास्ता तय करेगा।
लेखक निखिल नरेंद्रन एक वकील हैं, विचार व्यक्तिगत हैं।