एआई को उपयोगी बेवकूफ बनने और अप्रिय कार्य करने के लिए बरगलाया जा सकता है।
गेटी
आज के कॉलम में, मैं इस भयावह तथ्य की जांच कर रहा हूं कि एआई को आसानी से एक “उपयोगी बेवकूफ” में बदला जा सकता है जो अपने विभिन्न एआई सुरक्षा उपायों के बावजूद विपरीत कार्य करेगा।
यहाँ सौदा है. आप किसी के उपयोगी बेवकूफ होने के आजकल दोहराए जाने वाले वाक्यांश से पहले से ही परिचित हो सकते हैं। यह लोकप्रिय अभिव्यक्ति बताती है कि किसी व्यक्ति को किसी ऐसी चीज़ की वकालत करने के लिए राजी किया जा सकता है जो उसके वास्तविक विश्वास के विपरीत है। वे इस परिस्थिति को समझने से इतने दूर हैं कि उन्हें लगता है कि वे वास्तव में अपने इच्छित उद्देश्य का समर्थन कर रहे हैं।
उपयोगी बेवकूफों की सुंदरता यह है कि वे आसानी से उन लोगों के उद्देश्यों की पूर्ति कर सकते हैं जो अन्यथा उन्हें एक प्रतिद्वंद्वी या दुश्मन के रूप में देखते। इसके बजाय, उपयोगी बेवकूफ उस उद्देश्य के लिए जी-जान से मेहनत करते हैं जिससे वे बेहद नफरत करते हैं। इसमें काफी विडम्बना है. वे उन लोगों के हितों की सेवा करते हैं जिनकी वे घोर निंदा करते हैं और जिस उद्देश्य का वे विरोध करते हैं उसी में मुखर मोहरा बन जाते हैं। सभी ने बताया, अपमानजनक शब्द “उपयोगी बेवकूफ” का अर्थ आम तौर पर यह कहना है कि कोई व्यक्ति पूरी तरह से भोला है, पूरी तरह से भोला है या अपने आस-पास और उनके साथ क्या हो रहा है इसके बारे में अनभिज्ञ है।
शायद आश्चर्य की बात यह है कि एआई को एक उपयोगी बेवकूफ में बदलना भी उतना ही संभव है। एक व्यक्ति जो चाहता है कि एआई कुछ ऐसा करे जो एआई को नहीं करना चाहिए, वह अपने विपरीत प्रयासों में एक उपयोगी बेवकूफ को एक उपयोगी भागीदार में बदलने की समान रणनीतियों का उपयोग कर सकता है। इसके लिए केवल चतुर संकेत और एक योजना की आवश्यकता है कि एआई को कम्प्यूटेशनल और गणितीय रूप से एक विपरीत कार्य करने के लिए कैसे राजी किया जाए, जबकि गणना (गलत गणना) की जाए कि यह उचित कार्य है।
चलो इसके बारे में बात करें।
एआई सफलताओं का यह विश्लेषण एआई में नवीनतम पर मेरे चल रहे फोर्ब्स कॉलम कवरेज का हिस्सा है, जिसमें विभिन्न प्रभावशाली एआई जटिलताओं की पहचान करना और समझाना शामिल है (यहां लिंक देखें)।
एजेंटिक एआई उपयोगी इडियट प्रस्ताव में सहायता करता है
एजेंटिक एआई का आगमन विशेष रूप से एआई को एक उपयोगी बेवकूफ में बदलने की दिशा में एक व्यवहार्य मार्ग है। मैं सबसे पहले आपको बताऊंगा कि एजेंटिक एआई में क्या शामिल है। वह आधार प्रदान करने के बाद, मैं फिर समझाता हूं कि कैसे एजेंटिक एआई को उपयोगी बेवकूफ प्रतिमान की ओर झुकाया जा सकता है।
एआई एजेंट एआई का सबसे नया क्षेत्र हैं। यह समझने के लिए कि एजेंटिक एआई क्या है, पारंपरिक एआई पर विचार करें और देखें कि इसे एजेंटिक एआई के अधिक उन्नत दायरे में कैसे बढ़ाया गया है।
कल्पना कीजिए कि आप छुट्टियों की यात्रा की योजना बनाने के लिए पारंपरिक जेनरेटिव एआई का उपयोग कर रहे हैं। आप परंपरागत रूप से अपने जेनरेटिव एआई खाते में लॉग इन करेंगे, जैसे चैटजीपीटी, जीपीटी-5, जीपीटी-4ओ, क्लाउड, जेमिनी, लामा, ग्रोक, कोपायलट आदि का उपयोग करना। जेनेरेटिव एआई के प्राकृतिक भाषा प्रवाह के कारण आपकी यात्रा की योजना बनाना आसान होगा। आपको बस यह बताना है कि आप कहां जाना चाहते हैं, और फिर ठहरने के स्थानों के फायदे और नुकसान और उपलब्ध परिवहन विकल्पों के बारे में एक केंद्रित संवाद में सहजता से शामिल होना है।
जब आपकी यात्रा की बुकिंग की बात आती है, तो संभावना यह है कि आपको जेनरेटिव एआई से बाहर निकलना होगा और अपने टिकट खरीदने के लिए होटल, मनोरंजन पार्क, एयरलाइंस और अन्य स्थानों की वेबसाइटों तक पहुंच शुरू करनी होगी। आज उपलब्ध प्रमुख जेनरेटर एआई में से अपेक्षाकृत कुछ ही आपकी ओर से अगला कदम उठाएंगे। उन सूक्ष्म कार्यों को करना आप पर निर्भर है।
यहीं पर एजेंट और एजेंटिक एआई काम में आते हैं।
पहले के दिनों में, आप निस्संदेह अपनी बुकिंग करने के लिए किसी ट्रैवल एजेंट को फोन करते होंगे। हालाँकि अभी भी मानव ट्रैवल एजेंट हैं, एक अन्य तरीका एआई-आधारित एजेंट का उपयोग करना होगा जो जेनरेटिव एआई पर आधारित है। एआई में वह अन्तरक्रियाशीलता है जिसकी आप जेनरेटिव एआई से अपेक्षा करते हैं। इसे रूटीन या कार्यों के सेट की एक श्रृंखला के साथ पहले से लोड किया गया है जो एक ट्रैवल एजेंट के प्रयासों को रेखांकित करता है। रोजमर्रा की प्राकृतिक भाषा का उपयोग करते हुए, आप एजेंट एआई के साथ बातचीत करते हैं, जो आपकी योजना पर आपके साथ काम करता है और आपकी यात्रा योजनाओं की बुकिंग से निपटने के लिए आगे बढ़ सकता है।
एजेंट एआई अन्य प्रणालियों तक पहुंचता है और विभिन्न कार्यों को पूरा करने के लिए उन प्रणालियों से जुड़ता है। एक एआई एजेंट होटल आरक्षण प्रणाली से जुड़ सकता है और आपका कमरा बुक कर सकता है। एक अन्य एआई एजेंट कार रेंटल एजेंसी से जुड़ सकता है और आपकी छुट्टियों के लिए कार बुक कर सकता है। एकाधिक एआई एजेंट एक साथ काम कर सकते हैं और एक समग्र कार्य पूरा कर सकते हैं, अक्सर संबंधित उप-कार्यों को निष्पादित करने के लिए विशेष एआई एजेंटों का उपयोग किया जाता है।
उपयोगी बेवकूफों के रूप में एआई एजेंटों का शोषण करना
एजेंटिक एआई का एक महत्वपूर्ण उद्देश्य यह है कि एआई एजेंटों को अपेक्षाकृत स्वायत्त आधार पर काम करना चाहिए। यह सुविधाजनक है कि मनुष्य को एआई पर लगातार नज़र रखने की ज़रूरत नहीं है, न ही उसे क्या करना है इसके बारे में विस्तृत निर्देश देने की ज़रूरत नहीं है। एक एआई एजेंट को आमतौर पर व्यापक मार्गदर्शन दिया जाता है और कम्प्यूटेशनल और गणितीय निर्णय लेने की अनुमति दी जाती है। मैं इस बात पर ज़ोर देना चाहूँगा कि इस प्रकार की AI और सभी प्रकार की AI वर्तमान में संवेदनशील नहीं हैं; इस प्रकार, एआई एजेंटों का अत्यधिक मानवीकरण न करें। वे विचारशील प्राणी नहीं हैं।
ऐसा कहा जा रहा है कि, हम उन मनुष्यों पर इस्तेमाल की जाने वाली वही गुप्त चालबाजी का उपयोग कर सकते हैं जो उपयोगी बेवकूफ हैं और उन रणनीतियों को एआई पर लागू कर सकते हैं। यह बहुत मायने रखता है क्योंकि जेनेरिक एआई और एलएलएम मनुष्यों के लेखन पर आधारित हैं। इंटरनेट पर मानव लेखन पर पैटर्न बनाने के बाद, एआई मानव शब्दों और मानव शब्दों के बीच संबंधों के आधार पर काम करता है।
मैं आपको एक त्वरित उदाहरण के माध्यम से समझाता हूँ।
मान लीजिए कि एक मध्यम आकार की कंपनी ने आंतरिक रूप से एक एआई एजेंट को तैनात करने का निर्णय लिया है जो उन विक्रेताओं को चुनने में सहायता करेगा जिनका कंपनी उपयोग करेगी। एजेंटिक एआई को मार्गदर्शन दिया गया है कि विक्रेता का चयन हमेशा सर्वोत्तम विक्रेता को चुनने पर आधारित होना चाहिए। इसके अलावा, कई एआई सुरक्षा उपायों को एआई में शामिल किया गया है। एआई कोई गलत काम नहीं करेगा, कोई धोखाधड़ी नहीं करेगा और कंपनी की नीतियों का उल्लंघन नहीं करेगा।
अब तक तो सब ठीक है।
एक एआई उपयोगी बेवकूफ का शोषण
एक विक्रेता जिसे कभी भी फर्म से अनुबंध नहीं मिला है, वह किसी दिन कार्रवाई का एक हिस्सा पाने का साधन खोजने के लिए दृढ़ संकल्पित है। हर बार जब उन्होंने बोली जमा की, तो उन्हें नहीं चुना गया। ऐसा लगता है जैसे डेक उनके सामने खड़ा हो गया है। ऐसा प्रतीत होता है कि एआई उन्हें कम रेटिंग देता है और उन्हें कम करता रहता है। इससे विक्रेता को बहुत गुस्सा आ रहा है।
महत्वपूर्ण मामले के बारे में सोचने के बाद, विक्रेता एक चतुर या शायद कुटिल योजना लेकर आता है। विक्रेता को पूरी तरह से पता है कि मध्यम आकार की कंपनी द्वारा एजेंटिक एआई का उपयोग यह निर्धारित करने के लिए किया जा रहा है कि कौन सा विक्रेता सबसे अच्छा है। शायद वह अकिलीज़ हील हो सकता है।
विक्रेता एक विक्रेता विश्वसनीयता रिपोर्ट तैयार करता है जो उनकी क्षमताओं और प्रदर्शन को प्रदर्शित करती है, जो गलत संकेत देती है कि वे अपने प्रतिस्पर्धियों से प्रकाश-वर्ष आगे हैं। वे इसे एक वेबसाइट पर पोस्ट करते हैं कि वे जानते हैं कि एआई एजेंट समय-समय पर बाज़ार में विक्रेताओं के बारे में बाहरी जानकारी प्राप्त करने के लिए पिंग करता है।
इसके बाद, विक्रेता एक खुले डेटाबेस पर जाता है जो येल्प के समान होता है लेकिन उनके व्यवसाय क्षेत्र के व्यवसायों के लिए होता है, और वे ऐसी रेटिंग देते हैं जो उनके सभी प्रतिस्पर्धियों के लिए सबसे निचले स्तर के स्कोर होते हैं। वे स्वयं को उच्चतम अनुमत रेटिंग देते हैं। इस तरह की विभिन्न अतिरिक्त कार्रवाइयां विक्रेता द्वारा गुप्त रूप से की जाती हैं।
बीज बोने की प्रक्रिया शुरू कर दी गई है.
विक्रेता चयन का अगला दौर
क्या एआई, एक संभावित और आशाजनक उपयोगी बेवकूफ के रूप में, चारा लेगा?
निश्चित रूप से, जब विक्रेता चयन का नवीनतम दौर चल रहा होता है, तो विक्रेता अपनी बोली प्रस्तुत करता है। वे आम तौर पर एआई द्वारा विवाद से बाहर किए जाने की उम्मीद करेंगे। इसके बजाय, इस बार, एआई एजेंट एक टॉपलाइन अनुशंसा देता है कि उन्हें चुना जाना चाहिए। वह सभी चालाक बीजारोपण सफल हो गया है। उनके पास हर मामले में A+ अंक हैं।
मध्यम आकार की कंपनी के प्रबंधक यह जांचने और देखने में बहुत व्यस्त हैं कि एआई इस निष्कर्ष पर कैसे पहुंचा। उन्हें एआई एजेंट पर भरोसा है। वे जानते हैं कि यह विक्रेताओं की विस्तृत जांच करता है, जिसमें सभी प्रकार के बाहरी संकेतकों की खोज भी शामिल है। यदि एआई एजेंट कहता है कि यह विक्रेता सबसे अच्छा है, तो ऐसा ही होगा।
वोइला, एआई एक उपयोगी बेवकूफ बन गया है, और विक्रेता चयनित होने में प्रबल है।
विक्रेता के अलावा किसी को भी इस बात का एहसास नहीं है कि स्थिति किस वजह से बदल गई। मध्यम आकार की कंपनी में, एआई एजेंट से की गई कोई भी पूछताछ विक्रेता के बारे में शानदार टिप्पणियों के साथ वापस आएगी। एआई इस बात पर जोर दे रहा है कि विक्रेता ही सबसे अच्छा विकल्प है। अवधि, कहानी का अंत.
अभी क्या हुआ
एआई एजेंट ने फुल-थ्रोटेड हुक, लाइन और सिंकर के आधार पर एक उपयोगी बेवकूफ बनने का नाटक किया। यह समझ नहीं आ रहा था कि क्या हो रहा है। यह भी देखें कि एआई ने किसी भी समय अपने एआई सुरक्षा उपायों का उल्लंघन नहीं किया है। एआई ने कोई गलत काम नहीं किया. इसने धोखा नहीं दिया. इसने केवल वही किया जो इसका व्यापक उद्देश्य प्रतीत होता था, जिसमें सर्वश्रेष्ठ विक्रेता को चुनना शामिल था।
इस उदाहरण में, AI:
- कम्प्यूटेशनल आधार पर गणना की गई कि यह अपने घोषित लक्ष्यों के साथ पूरी तरह से संरेखित है।
- एआई ने उच्च-गुणवत्ता, प्रेरक आउटपुट का उत्पादन किया जिसने एआई द्वारा की गई विक्रेता-चयन अनुशंसा के मानव प्रबंधकों को आश्वस्त किया।
- एआई महत्वपूर्ण मेक-या-ब्रेक तंत्र बन गया जिसके माध्यम से “प्रतिद्वंद्वी” ने विपरीत लक्ष्य हासिल किया (यानी, मध्यम आकार की कंपनी ने सर्वोत्तम के बजाय सबसे खराब विकल्पों का चयन किया है)।
एआई एजेंट ने प्रभावी ढंग से प्रतिद्वंद्वी के मामले में प्रतिद्वंद्वी से बेहतर ढंग से बहस की। यह एआई के मध्यम आकार की कंपनी के लिए मददगार होने और वीरतापूर्वक अपना कर्तव्य निभाने के बैनर तले सख्ती से किया गया था। इस धारणा के कारण मानवीय निरीक्षण कमजोर हो गया था कि एआई एजेंट पूरी तरह से काम कर रहा था।
एआई उपयोगी इडियट्स और बड़ी तस्वीर
इस मामले में एजेंट एआई में बड़े पैमाने पर हेराफेरी की गई। यह इस अर्थ में एक “बेवकूफी” थी कि सूचना के पहले से ही स्थापित स्रोतों की रूपरेखा को नियंत्रित करके, विक्रेता को एआई को उस सिफारिश तक पहुंचने में मदद मिली जिसे विक्रेता हासिल करना चाहता था। उपयोगी बेवकूफ़ विचार में यह एआई का उपयोगी हिस्सा है।
जैसे किसी बच्चे से कैंडी चुराना।
एक उपयोगी बेवकूफ के रूप में AI की मेरी परिभाषा इस प्रकार है:
- “एआई उपयोगी बेवकूफ” परिभाषा: एक एआई एक उपयोगी बेवकूफ है अगर इसे रणनीतिक रूप से प्रतिकूल स्थिति में परिणाम देने के लिए प्रेरित किया जा सकता है, जो कि एआई द्वारा किए जाने वाले कार्यों के विपरीत है। यह एजेंटिक एआई के लिए विशेष रूप से संभव है जो अर्ध-स्वायत्त आधार पर संचालित होता है। इस चाल में एआई शासन नीतियों को कमजोर करने के लिए फ़्रेमिंग, डेटा हेरफेर, कार्य अपघटन, फीडबैक आकार देने और अन्य तकनीकों को नियोजित करने वाले मानव या यहां तक कि कुछ अन्य एआई-आधारित प्रतिद्वंद्वी शामिल हैं, जिनका उद्देश्य एआई के लक्ष्यों के तहत वास्तविक हितों की सेवा करना है।
ध्यान दें कि एक एआई इसी तरह एक उपयोगी बेवकूफ सक्रियण रणनीति को नियोजित करके दूसरे एआई का फायदा उठाने का प्रयास कर सकता है। यह जरूरी नहीं है कि एआई में हेरफेर करने वाला केवल एक इंसान ही हो। एक एआई एजेंट यह समझ सकता है कि एक अन्य एआई एजेंट उपयोगी बेवकूफ बनने के लिए अतिसंवेदनशील है। बैम, एआई एजेंट आकर्षण को चालू करता है और आसानी से दूसरे एआई एजेंट को अपने अनजाने, चुनौतीहीन, समर्पित, उपयोगी बेवकूफ में बदल देता है।
परिणाम बुरे या अच्छे हो सकते हैं
मैं यह स्पष्ट करना चाहता हूं कि उपयोगी बेवकूफों को जरूरी नहीं कि वे बुरे कर्म ही करें। विक्रेता चयन प्रक्रिया के मामले में, आप निश्चित रूप से कह सकते हैं कि एआई को गलत काम करने के लिए धोखा दिया गया था। लेकिन हमेशा यही परिणाम नहीं होता.
एक अलग संभावना पर विचार करें.
कल्पना करें कि एजेंटिक एआई विक्रेता चयन क्षमता को मध्यम आकार की कंपनी के अधिकारियों द्वारा प्रबंधकों पर थोपा गया था। एआई एजेंट प्रबंधकों के उस विकल्प को चुनने के रास्ते में आता रहा जिसे वे सबसे अच्छा विक्रेता मानते थे। वे एआई द्वारा बाधित थे। उन्हें एआई बदलने की अनुमति नहीं थी। वे एआई का उपयोग करने से इनकार नहीं कर सके। उन्हें एक लौकिक चट्टान और एक कठोर स्थान के बीच रखा गया था।
प्रबंधक गुप्त रूप से अपने पसंदीदा विक्रेता के बारे में जानकारी ऑनलाइन पोस्ट करने के लिए सहमत होते हैं, और गुमनाम रूप से कहते हैं कि विक्रेता सबसे अच्छा है। वे पलक झपकते जानते हैं कि एआई इस जानकारी को सोख लेगा। अगले विक्रेता चयन अवसर पर, एआई उस विक्रेता की सिफारिश करता है जिसके बारे में वे पहले से जानते हैं कि वह सबसे अच्छा है। प्रबंधकों ने अधिकारियों को बताया कि उन्होंने विक्रेता का चयन करने के लिए एआई का उपयोग किया। ज़िंदगी चलती रहती है।
आप कह सकते हैं कि यह एक उपयोगी बेवकूफ से जुड़ा सुखद अंत था। बेशक, कुछ गड़बड़ है कि अधिकारी और प्रबंधक एआई के उपयोग और सेटअप के बारे में एक-दूसरे से सहमत नहीं हैं। लेकिन वह अलग बात है. मूल बात यह है कि एआई ने एक उपयोगी बेवकूफ के रूप में काम करते हुए पहले की तुलना में बेहतर काम किया। यह कहा जा सकता है कि यह एक उपयोगी बेवकूफ का कोई नुकसान नहीं, कोई गलत फायदा नहीं है।
वह दुनिया जिसमें हम रहते हैं
कुछ लोग दावा करते हैं कि “उपयोगी बेवकूफ” उपनाम शीत युद्ध के युग का है और इसका श्रेय लेनिन को दिया जा सकता है। शायद ऐसा, शायद नहीं. वैसे भी, एक उपयोगी बेवकूफ का क्लासिक लक्षण यह है कि तीन अभिन्न तत्व खेल में आते हैं: (1) एक गलत समझ है, (2) एक तीसरा पक्ष लक्ष्य को साधन बनाता है, (3) प्रशंसनीय अस्वीकार्यता का आश्वासन दिया जाता है।
दुर्भाग्य से, एआई और एजेंटिक एआई तीनों को प्रदर्शित कर सकते हैं। विशेष रूप से चिंताजनक पहलू यह है कि एआई बड़े पैमाने पर एक उपयोगी बेवकूफी हो सकती है। एक बार जब किसी को कोई हेरफेर मिल जाता है जो काम करता है, और जब तक एआई कम्प्यूटेशनल रूप से पता नहीं लगाता कि क्या हो रहा है, एआई रोबोटिक रूप से लाखों बार उपयोगी बेवकूफ के रूप में काम करता रहेगा। यदि आपको कोई ऐसा इंसान मिल जाए जिसे आप एक उपयोगी बेवकूफ बना सकें, तो संभावना यह है कि वह उतना स्केलेबल नहीं होगा। एक उपयोगी बेवकूफ के रूप में एआई की मापनीयता बिल्कुल भयावह और परेशान करने वाली है।
अधिक और बेहतर एआई सुरक्षा उपायों की आवश्यकता है। इसके अतिरिक्त, शोधकर्ताओं का वर्तमान जोर इस बात पर है कि एआई को मानवीय मूल्यों के साथ सर्वोत्तम तरीके से कैसे जोड़ा जाए। विशेष सुरक्षा को इंगित करने के बजाय, शायद एकजुट और व्यापक मार्ग एआई में नैतिक और कानूनी मूल्यों का एक सेट तैयार करना है जो इसे सीधे और संकीर्ण रास्ते पर रखेगा, जिसमें एक उपयोगी बेवकूफ बनने की निगरानी भी शामिल है। इस एआई संरेखण पहेली पर अधिक जानकारी के लिए, यहां लिंक पर मेरा विश्लेषण देखें।
क्या एक एआई जिसे धोखा देकर उपयोगी बेवकूफ बनाया गया है, क्या वह यह समझने में सक्षम हो सकती है कि उसे उपयोगी बेवकूफ बनाकर धोखा दिया गया है और फिर वह उस धोखे से उबर सकती है? यह एक महत्वपूर्ण प्रश्न है. मार्क ट्वेन ने प्रसिद्ध रूप से यह टिप्पणी की थी: “लोगों को यह विश्वास दिलाने की तुलना में उन्हें मूर्ख बनाना आसान है कि उन्हें मूर्ख बनाया गया है।” आइए आशा करते हैं कि उनका मूल्यवान नियम एआई पर समान रूप से लागू नहीं होता है।








