होम संस्कृति एआई उन पूर्वाग्रहों को कम कर रहा है जो संगीत उद्योग ने...

एआई उन पूर्वाग्रहों को कम कर रहा है जो संगीत उद्योग ने पहले ही बना लिया है (अतिथि कॉलम)

29
0

अफ्रीका, मध्य पूर्व और दक्षिण एशिया दुनिया की लगभग आधी आबादी का प्रतिनिधित्व करते हैं, और वे सैकड़ों विशिष्ट संगीत परंपराओं का घर भी हैं। लेकिन संगीत एआई मॉडल बनाने के लिए सबसे अधिक उपयोग किए जाने वाले प्रशिक्षण डेटासेट में, अफ्रीका का संगीत केवल 0.3%, मध्य पूर्व: 0.4%, और दक्षिण एशिया 0.9% – जबकि पश्चिमी शैलियों का योगदान 94% है।

ये आंकड़े अबू धाबी के मोहम्मद बिन जायद यूनिवर्सिटी ऑफ आर्टिफिशियल इंटेलिजेंस के शोधकर्ताओं से आए हैं, जिन्होंने आज के जेनरेटिव म्यूजिक टूल्स के पीछे प्रशिक्षण डेटासेट का सर्वेक्षण किया और एसोसिएशन फॉर कम्प्यूटेशनल लिंग्विस्टिक्स (NAACAL) के 2025 नेशंस ऑफ द अमेरिका चैप्टर में निष्कर्ष प्रस्तुत किए।

जब उन मॉडलों ने भारतीय राग की परंपरा में संगीत तैयार करने की कोशिश की, तो उन्होंने पश्चिमी स्वर संरचनाओं को बजाने वाले सितार को प्राथमिकता दी, जिससे शीर्ष पर एक भारतीय वाद्ययंत्र के साथ पश्चिमी ध्वनि उत्पन्न हुई। उसी अध्ययन में तुर्की माकम का परीक्षण किया गया, जो अंतराल पर बनी एक मधुर प्रणाली है जो पश्चिमी पियानो पर मौजूद नहीं है। एक बार फिर, मॉडलों ने उन अंतरालों को मानक पश्चिमी पिच में समतल कर दिया। जब शोधकर्ताओं ने पूर्वाग्रह को ठीक करने के लिए मॉडल को अतिरिक्त हिंदुस्तानी शास्त्रीय और तुर्की मकाम रिकॉर्डिंग दी, तो इसका रचनात्मक आउटपुट वास्तव में खराब हो गया। पश्चिमी प्रशिक्षण डेटा इतना प्रभावशाली था कि उसे अनदेखा नहीं किया जा सकता था।

यह अध्ययन इस बात की पुष्टि करता है कि समस्या कम प्रतिनिधित्व से कहीं अधिक गहरी है, दशकों के संगीत डेटा में निहित पूर्वाग्रह अब उस डेटा पर प्रशिक्षित एआई सिस्टम में निर्मित हो रहे हैं। और ये प्रणालियाँ ही हैं जो आने वाले वर्षों में सुनी, भुगतान और प्रचारित चीज़ों को आकार देंगी।

संबंधित

एआई उन पूर्वाग्रहों को कम कर रहा है जो संगीत उद्योग ने पहले ही बना लिया है (अतिथि कॉलम)

संगीत उद्योग को शक्ति प्रदान करने वाले डेटासेट को दशकों से आकार दिया गया है कि किसने हस्ताक्षर किए हैं, कौन से बाज़ार को ट्रैकिंग के योग्य माना गया है, और कौन सी शैलियों को निवेश प्राप्त हुआ है। उद्योग का बुनियादी ढाँचा व्यवसाय के विशेष हिस्सों के आसपास बनाया गया है, और इसके साथ ऐसा व्यवहार किया जाता है जैसे कि यह पूरी चीज़ का प्रतिनिधित्व करता है। लंबे समय तक, वे अंतराल बैक-ऑफ़िस डेटाबेस में चुपचाप बैठे रहे, और परिणाम धीमे थे। अब वे अंतराल प्रशिक्षण डेटा में मौजूद हैं, और उनके ऊपर निर्मित सिस्टम निकट भविष्य में चलेंगे।

पूर्वाग्रह लिंग तक फैला हुआ है। यूएससी एनेनबर्ग इंक्लूजन इनिशिएटिव के अनुसार, 2025 में, महिलाओं ने बिलबोर्ड हॉट 100 पर गीतकारों में 14.5% और निर्माताओं में केवल 4.4% का प्रतिनिधित्व किया, जो एक दशक से अधिक समय से इन नंबरों पर नज़र रख रहा है। 2012 के बाद से उन आंकड़ों में बमुश्किल बदलाव आया है। एल्गोरिदम एक ऐसी नींव से सीख रहे हैं जो यह प्रतिबिंबित नहीं करता है कि लोग क्या सुनना चाहते हैं, बल्कि यह दर्शाता है कि पहले से ही लोकप्रिय, प्रचारित और बड़े पैमाने पर प्लेलिस्ट में क्या है। फिर उन आउटपुट को सीधे लूप में फीड किया जाता है। Spotify के आज के टॉप हिट्स में जोड़ा गया एक गाना लाखों स्ट्रीम उत्पन्न करता है, जो एल्गोरिदम को बताता है कि यह लोकप्रिय है, जो अधिक अनुशंसाएँ फ़ीड करता है, जो अधिक स्ट्रीम उत्पन्न करता है।

स्वतंत्र कलाकारों, उभरते दृश्यों और गैर-पश्चिमी संगीत के लिए, चक्र दूसरे तरीके से काम करता है: कम डेटा, कम दृश्यता, कम अनुशंसाएँ। मीडियाफ्यूचर्स और बर्गेन विश्वविद्यालय, नॉर्वे द्वारा प्रकाशित 2024 के एक सर्वेक्षण ने पुष्टि की कि लोकप्रियता पूर्वाग्रह अनुशंसा प्रणालियों में एल्गोरिथम अनुचितता के सबसे लगातार और अच्छी तरह से प्रलेखित रूपों में से एक है।

इनमें से कोई भी एआई से शुरू नहीं हुआ। मेटाडेटा की समस्याएँ वर्षों से बनी हुई हैं और ये दूरदर्शितापूर्ण क्षेत्रों में फैली हुई हैं: स्वतंत्र कलाकारों, गैर-पश्चिमी कैटलॉग और प्रमुख लेबल पाइपलाइन के बाहर जारी की गई किसी भी चीज़ के आसपास। 2026 की शुरुआत में, एसोसिएशन फॉर इलेक्ट्रॉनिक म्यूजिक (AFEM) ने 22 म्यूजिक टेक कंपनियों का सर्वेक्षण किया। आधे लोगों ने डेटाबेस में परस्पर विरोधी मेटाडेटा को अपनी सबसे बड़ी संरचनात्मक चुनौती के रूप में पहचाना, और 41% ने सार्वभौमिक कलाकार और गीत पहचानकर्ताओं की अनुपस्थिति की ओर इशारा किया।

उद्योग में पहले संगीत जारी करने और बाद में डेटा छांटने की गहरी आदत है। एक ट्रैक कलाकार से वितरक तक, डीएसपी से संग्रह सोसायटी तक यात्रा करता है, और हर हैंडऑफ़ पर, कुछ गलत हो सकता है। टूटे हुए मेटाडेटा का अर्थ है डाउनस्ट्रीम में सब कुछ टूटा हुआ: गलत सिफारिशें, गलत रॉयल्टी, गलत प्रशिक्षण डेटा। ग्लोबल रिपर्टोयर डेटाबेस ने 2014 में इसे ठीक करने का प्रयास किया, लेकिन असफल रहा, क्योंकि प्रदर्शन अधिकार संगठन शासन पर सहमत नहीं हो सके। संस्थाएँ उस चीज़ की रक्षा करती हैं जो उन्हें शक्ति देती है, और वह तनाव दूर नहीं हुआ है।

संबंधित

पैसे का अनुगमन करो

जो बदल गया है वह असमानता की गति है। डीज़र का कहना है कि अब उसे हर दिन लगभग 75,000 पूरी तरह से एआई-जनरेटेड ट्रैक मिलते हैं। अप्रैल 2026 तक, प्लेटफ़ॉर्म पर सभी नए अपलोड का 44% हिस्सा था (संदर्भ के लिए, जनवरी 2025 में, स्ट्रीमिंग सेवा ने दावा किया कि यह केवल 10% था; नवंबर तक, उसने कहा कि यह 34% तक पहुंच गया था।) 2025 के अंत में डीज़र और इप्सोस द्वारा एक संयुक्त अध्ययन में पाया गया कि 97% श्रोता यह नहीं बता सके कि कोई ट्रैक एआई-जनरेटेड था या मानव-निर्मित।

अब, यह गुणवत्ता नहीं बल्कि सरासर मात्रा है जो संगीत को फ़िल्टर करती है। Spotify ने सितंबर 2025 तक 12 महीनों में 75 मिलियन से अधिक स्पैम वाले ट्रैक हटाने की सूचना दी, और डीज़र ने कहा कि उसने पाया कि AI-जनरेटेड ट्रैक पर 85% स्ट्रीम धोखाधड़ी वाली थीं। प्लेटफार्म आग बुझाने वाले हैं। जब अपलोड संख्या एक वर्ष से भी कम समय में दोगुनी हो जाती है, तो अनुशंसा प्रणाली केवल उसी तरीके से प्रतिक्रिया देती है: मौजूदा प्ले काउंट, सेव और प्लेलिस्ट प्लेसमेंट इतिहास पर अधिक ध्यान देकर।

इस प्रकार, गति वाले ट्रैक इसे अधिक प्राप्त करते हैं, जबकि इसके बिना ट्रैक तेजी से गायब हो जाते हैं। इस तरह पूर्वाग्रह और भी बदतर हो जाता है।

एआई-जनित संगीत की मात्रा भी समान रूप से नहीं आती है। स्थापित कलाकारों के पास सांस्कृतिक अधिकार और वफादार दर्शक होते हैं। जिन कलाकारों को निचोड़ा जा रहा है वे बीच के लोग हैं: छोटे प्रशंसक आधार वाले निर्माता, इंडी-लेबल कलाकार जो वर्षों से एक समुदाय का निर्माण कर रहे हैं। वे नीचे से तकनीकी रूप से पारित होने योग्य कृत्रिम संगीत की बढ़ती मंजिल से दबाए जाते हैं और ऊपर से सिफारिश प्रणालियों द्वारा दबाए जाते हैं जो पहले से ही कर्षण वाले किसी भी चीज़ को पुरस्कृत करते हैं। यूके म्यूजिक के 2025 निर्माता सर्वेक्षण ने रचनाकारों के मूड को दर्शाया: 66% ने कहा कि एआई उनके करियर को खतरे में डालता है, 92% लेबलिंग चाहते हैं और 93% चाहते हैं कि एआई कंपनियां प्रशिक्षण के लिए रचनाओं का उपयोग करने पर भुगतान करें।

एक खोज समस्या भी है जिस पर पर्याप्त चर्चा नहीं होती है। चार्टमेट्रिक, सबसे व्यापक रूप से इस्तेमाल किया जाने वाला ए एंड आर स्काउटिंग प्लेटफॉर्म, 12 मिलियन से अधिक कलाकार प्रोफाइल को ट्रैक करता है। वार्नर म्यूज़िक के सोडाटोन, साउंडचार्ट और इसी तरह के उपकरण सभी स्ट्रीमिंग और सामाजिक डेटा के समान पूल से आते हैं। यदि प्रत्येक A&R टीम ओवरलैपिंग डेटासेट पर समान एल्गोरिथम स्काउटिंग टूल चला रही है, तो परिभाषा के अनुसार, वे टूल सतह पर लाने वाले किसी भी कलाकार ने पहले ही “खोजे जाने” के लिए पर्याप्त डेटा उत्पन्न कर लिया है। इस बीच, वास्तव में शुरुआती प्रतिभा, बेडरूम या सामुदायिक स्टूडियो में रिकॉर्डिंग करने वाले कलाकार, उन जगहों पर मौजूद हैं जहां इन प्लेटफार्मों की कोई पहुंच नहीं है।

संबंधित

काकुल श्रीवास्तव

इस टूटी हुई प्रणाली के वित्तीय परिणामों को संदर्भ में रखा जा सकता है: फेयर प्ले, यू, के का एक स्वतंत्र ऑडिट। नवंबर 2025 में प्रकाशित नाइट क्लब रॉयल्टी में देखा गया कि इलेक्ट्रॉनिक संगीत के लिए प्रदर्शन रॉयल्टी की गणना कैसे की जाती है। जो विधि सबसे अधिक महत्व रखती है वह लगभग पूरी तरह से वाणिज्यिक क्लबों या रेडियो नाटकों से प्राप्त डेटा की निगरानी से निकाली गई है। भूमिगत स्थल, स्वतंत्र निर्माता और मुख्यधारा से बाहर यात्रा करने वाला संगीत – यह सब एक नमूने के आधार पर मापा जाता है जिसे कभी भी इसमें शामिल करने के लिए डिज़ाइन नहीं किया गया था। ऑडिट के अनुसार, यूके नाइट क्लबों में केवल 36% इलेक्ट्रॉनिक संगीत प्रदर्शन के परिणामस्वरूप सही निर्माता को भुगतान किया जाता है। यह अनुमान है कि अकेले नाइट क्लबों में हर साल 5.7 मिलियन पाउंड गलत लोगों के पास जा रहे हैं।

भले ही यह खोज यूके और इलेक्ट्रॉनिक संगीत के लिए विशिष्ट है, तर्क अभी भी कायम है। जहां भी कोई प्रणाली बाजार के एक उपसमूह की निगरानी करने और उन निष्कर्षों को समग्र रूप से लागू करने पर निर्भर करती है, नमूना मानक बन जाता है, और इसके बाहर हर कोई अंदर सभी को सब्सिडी देता है।

ये चुनौतियाँ सीधे तौर पर प्रभावित करती हैं कि कौन से उत्पाद विकसित होते हैं। उसी एएफईएम सर्वेक्षण में पाया गया कि 29% संगीत तकनीक कंपनियां अपने मूल उत्पाद दृष्टिकोण से दूर चली गईं क्योंकि डेटा और अधिकार बुनियादी ढांचे ने मूल विचार को असंभव बना दिया था। आधे उत्तरदाताओं ने कहा कि उनके 50% से अधिक इंजीनियरिंग संसाधन वास्तविक उत्पाद के निर्माण के बजाय समाधान की ओर जाते हैं।

संगीत डेटा में पूर्वाग्रह कोई नई बात नहीं है. हालाँकि, अब इसे एआई सिस्टम में बनाया जा रहा है जिसे ऐतिहासिक डेटासेट पर प्रशिक्षित किया गया है जो हर उस अंतर को एनकोड करता है जिसे उद्योग ने कभी तय नहीं किया है। कुछ बुनियादी ढाँचे में तेजी आनी शुरू हो गई है। ईयू एआई अधिनियम के तहत अब एआई डेवलपर्स को यह बताना होगा कि उन्होंने किस कॉपीराइट सामग्री पर प्रशिक्षण लिया है। अप्रैल 2026 में, Spotify ने उद्योग के मेटाडेटा मानक निकाय DDEX पर निर्मित एक बीटा लॉन्च किया, जिससे कलाकारों को यह खुलासा करने की अनुमति मिली कि उनके संगीत में AI का उपयोग कैसे किया जाता है। इसी तरह, Apple Music, Bandcamp और Deezer अपने-अपने तरीके से AI खुलासे को लागू कर रहे हैं। यूनिवर्सल म्यूजिक ने अपने कैटलॉग में अंतर्राष्ट्रीय मानक नाम पहचानकर्ता (आईएसएनआई) को एम्बेड करना भी शुरू कर दिया है। ये उपाय पारदर्शिता और एट्रिब्यूशन को संबोधित करते हैं, न कि डेटा में अंतर्निहित असंतुलन को। लेकिन प्रकटीकरण वह जगह है जहां जवाबदेही शुरू होती है।

हम देख रहे हैं कि समाधान सामने आ रहे हैं और प्रगति भी हो रही है, लेकिन क्या यह काफी तेजी से हो रहा है? उद्योग दशकों से इस बुनियादी ढांचे की समस्या को बिना ठीक किए जी रहा है। एआई ने इस समाधान को खोजने को एक समय सीमा में बदल दिया है।

रूफी गाज़ी उत्पाद प्रबंधन, डिजिटल परिवर्तन और अनुसंधान में अनुभव के साथ एक संगीत व्यवसाय पेशेवर है। वह बाइटडांस (टिकटॉक), अमरा (कोबाल्ट म्यूजिक ग्रुप) और विभिन्न शुरुआती चरण के स्टार्टअप के अनुभव के आधार पर संगीत तकनीक कंपनियों के लिए उत्पाद सलाहकार के रूप में काम करती हैं। वह ऑडियंस स्ट्रैटेजीज़ में संगीत अनुसंधान की प्रमुख हैं, जहां वह डेटा-संचालित अनुसंधान परियोजनाओं का नेतृत्व करती हैं। उनकी उल्लेखनीय रिपोर्टों में यूके इलेक्ट्रॉनिक म्यूजिक इंडस्ट्री रिपोर्ट (एनटीआईए के लिए), साउंड इन्वेस्टमेंट्स (एमटीयूके का यूके म्यूजिक टेक इकोसिस्टम का अध्ययन), और ए स्लाइस ऑफ फेयरनेस (असलिस के लिए) शामिल हैं। उन्होंने फेयर प्ले पहल का भी नेतृत्व किया है, जो इलेक्ट्रॉनिक संगीत में अधिकारों और रॉयल्टी का एक स्वतंत्र ऑडिट है।

बिलबोर्ड वीआईपी पास