एआई की दुनिया में क्षेत्रीय भाषाएं भारत के लिए गेम बदल देंगी, लेकिन ये कितनी बड़ी चुनौती है!

एआई एक समावेशी तकनीक बन सके और सबको समान अवसर उपलब्ध हों, इसके लिए भारत को इस क्षेत्र में डेटासेट्स, क्षेत्रीय भाषाओं की भागीदारी और एक्सीलेरेटर चिप्स की आपूर्ति बढ़ाने की जरूरत है

इलस्ट्रेशन: नीलांजन दास
इलस्ट्रेशन: नीलांजन दास

अरुण के. सुब्रह्मण्यम (वाइस प्रेसिडेंट, लाउड ऐंड एआई इंटेल कॉर्पोरेशन, चैटजीपीटी)

एक साल पहले तक आर्टिफिशियल इंटेलिजेंस (एआई) को कंप्यूटर साइंस और प्रौद्योगिकी क्षेत्र से जुड़े लोगों के बीच गहन तकनीकी चर्चा का विषय माना जाता था. चैटजीपीटी नवंबर, 2022 में जारी किया गया और उसके बाद दुनिया में आए बदलाव से हम वाकिफ हैं.

अचानक, कविता लिख रहे पांचवीं कक्षा के छात्र से लेकर जटिल वित्तीय बही-खाते का विश्लेषण करने की कोशिश कर रहे सीएफओ तक सभी लोग एआई की मदद से बेहद कम समय में कुछ सार्थक नतीजे हासिल करने में सक्षम हो गए. यह क्रांतिकारी बदलाव है, जो इंटरनेट का इस्तेमाल शुरू होने के बाद से अब तक नहीं देखा गया था.

चैटजीपीटी एक ऐप्लिकेशन है और जीपीटी नामक एआई मॉडल के इस्तेमाल पर आधारित है, जिसका पूरा नाम जेनरेटिव प्रीट्रेंड ट्रांसफॉर्मर होता है. इस एआई मॉडल को 'लार्ज लैंग्वेज मॉडल' (एलएलएम) कहा जाता है और इसे परस्पर जेनरेटिव एआई या जेन-एआई के साथ इस्तेमाल किया जाता है. एआई के इतिहास को तीन दौर में बांटा जा सकता हैं, 1. प्री-डीप लर्निंग, 2. डीप-लर्निंग और 3. जेनरेटिव एआई.

हालांकि, एआई शब्द को 1950 के दशक (प्री-डीप लर्निंग का दौर) से ही इस्तेमाल किया जाने लगा था, जेन-एआई के नवीनतम युग की शुरुआत 2017 में गूगल शोधकर्ताओं के एक शोधपत्र के प्रकाशन के साथ हुई, जिसका शीर्षक था 'अटेंशन इज ऑल यू नीड'. वैसे तो, एआई जेन-एआई काल से पहले ही उपयोगी साबित हो चुका था. लेकिन सही तरीके से अमल के लिए गहन विशेषज्ञता की जरूरत को देखते हुए इसे अपनाने की प्रक्रिया सीमित रही.

जेन-एआई में एंड-यूजर के एक बड़े वर्ग को बहुत गूढ़ ज्ञान के बिना भी एआई के इस्तेमाल में सक्षम बनाने की क्षमता है, जैसा चैटजीपीटी को तेजी से अपनाए जाने से पता चलता है. जेन-एआई के पास वैश्विक स्तर पर अरबों डॉलर की कमाई कराने, वैश्विक आर्थिक विकास और सभी लोगों के जीवनस्तर में सुधार लाने की असीम क्षमता है. 

मसलन, भारत जैसे विविधता भरे देश में 22 आधिकारिक भाषाएं हैं और एक बड़ी आबादी निरक्षर है या फिर कम साक्षर है. अब, जरा कल्पना कीजिए कि जेन-एआई को अमल में लाना किस तरह सभी को समान अवसर मुहैया कराने वाला साबित हो सकता है. मान लीजिए एक अनपढ़ मछली बेचने वाली फिश फार्म शुरू करना चाहती है. लेकिन उसे यह नहीं पता कि शुरुआत के लिए सरकारी मदद कैसे मिल सकती है.

वह अपनी मूल भाषा (जैसे ओड़िया) में बोलकर सर्च करने के लिए मोबाइल फोन ऐप का इस्तेमाल करती है. एआई-आधारित सर्च टूल इन्वेस्ट इंडिया पोर्टल पर संबंधित योजनाओं का ब्योरा उसके सामने लाता है, ओड़िया भाषा में ही परिणामों का सारांश बताता है और फिर संबंधित फॉर्म भरने के बारे में बताता है.

फिर वह फॉर्म भरने में ऐप की मदद लेती है और उस स्थिति में ऐप उसे हर प्रश्न ओड़िया में बोलकर (फॉर्म के हिंदी और अंग्रेजी अनुवाद के बाद) बताता है और उसकी आवाज के आधार पर उत्तरों का अनुवाद करके उसे जमा कर देता है. ऐसे कार्यों में सक्षम तकनीक आज उपलब्ध है, जरूरत बस उसे सबके लिए सुलभ और विश्वसनीय बनाने की है.

जेन-एआई क्रांति को गति देने के लिए तीन प्रमुख ताकतों—एआई तकनीक, डेटा और कंप्यूटर (गणना या कमांड पूरा करने की क्षमता)—को एक साथ जोड़ा गया. प्रौद्योगिकियों के बारे में यह जानकारी 2017 के शोधपत्र और मेटा से एलएलएएमए जैसे ओपन-सोर्स मॉडल जारी होने के बाद सामने आई. इंटरनेट क्रांति ने व्यापक डेटा उपलब्धता सुनिश्चित की जिसका उपयोग सीमित मॉडल और ओपन-सोर्स मॉडल दोनों में किया गया.

मसलन, चैटजीपीटी के नवीनतम मॉडल ने ओपन इंटरनेट पर मौजूद 45 टेराबाइट डेटा का इस्तेमाल किया है. मॉडल्स की इन श्रेणी में खास तरह के कंप्यूटिंग सिस्टम की जरूरत होती है जिन्हें एक्सीलेरेटेड कंप्यूटिंग डिवाइस के तौर पर जाना जाता है, जैसे ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) या ऐप्लिकेशन स्पेसिफिक इंटीग्रेटेड सर्किट (एएसआईसी). इन्हें सामान्य बोलचाल में एक्सीलेरेटर चिप्स कहा जाता है जो पलक झपकते ही अरबों-खरबों गणनाएं करने में सक्षम होते हैं.

प्रत्येक एक्सीलेरेटर चिप प्रति सेकंड खरबों गणनाएं कर सकता है, और जेन-एआई मॉडल तैयार करने में सैकड़ों-हजारों चिप्स इस्तेमाल होते हैं. ऐसी अटकलें रहीं कि चैटजीपीटी मॉडल में 45 टीबी डेटा समाहित करने के लिए 10,000 से अधिक एक्सीलेरेटर चिप्स को दो महीने से अधिक समय लगा! प्रति 1,000 एक्सीलेरेटर चिप्स के लिए करीब एक मेगावाट बिजली की जरूरत होती है. इसलिए, चैटजीपीटी मॉडल तैयार करने में दो महीने से अधिक समय तक 10 मेगावाट के करीब बिजली की जरूरत थी, जो कि 2,000 से 3,000 घरों को बिजली आपूर्ति के बराबर है!

जेन-एआई की असली ताकत उनके निर्माण में इस्तेमाल होने वाले एक्सीलेरेटेड चिप्स में निहित होती है. हम उसमें जितने ज्यादा सशक्त चिप्स का इस्तेमाल करेंगे, उसकी क्षमता उतनी ज्यादा बढ़ जाएगी. अमेरिका और चीन दोनों के पास कई लाख गुना ज्यादा क्षमता वाले चिप्स हैं और ये उनकी एआई-आधारित अर्थव्यवस्था और एआई रणनीति के लिए मजबूत नींव तैयार करने में एआई सुपर कंप्यूटर की तरह काम कर रहे हैं.

एक्सीलेरेटर चिप्स के लिए हथियार जमा करने जैसी होड़ मची हुई है. समस्या इतनी विकट हो चुकी है कि हाल में अमेरिका ने एआई पर चीन के बढ़ते वर्चस्व को कम करने के लिए उसे इन चिप्स की बिक्री पर प्रतिबंध ही लगा दिया है.

जेन-एआई मॉडल का मौजूदा संस्करण पूर्वाग्रहपूर्ण नजर आता है. इसके पीछे जान-बूझकर अपनाया गया कोई रुख नहीं है बल्कि डेटा और गणना की उपलब्धता के कारण ऐसा होता है. मसलन, किसी सफल बिजनेसमैन की तस्वीर बनाने को कहा जाए तो मॉडल हमेशा एक बिजनेस सूट-बूट पहने गोरे-चिट्टे शख्स की तस्वीर स्क्रीन पर दर्शाता है.

फिलहाल, उपलब्ध सबसे बड़े और सशक्त मॉडल्स की बात करें तो इनमें चैटजीपीटी और माइक्रोसॉफ्ट बिंग में इस्तेमाल होने वाला जीपीटी-4, गूगल बार्ड का जेमिनी या मेटा सोर्स का एएलएएमए-2 शामिल हैं, पर इनका एक फीसद से भी कम डेटा भारत का है. अगर इसमें इस आंकड़े के साथ यह तथ्य भी जोड़ दें कि भारत के पास दुनिया के एक फीसद से भी कम एक्सीलेरेटर चिप्स हैं, तो तस्वीर और भी चिंताजनक हो जाती है. भारत और अन्य देशों में एआई की क्षमता को अधिक सक्रिय बनाने के लिए निष्पक्ष भागीदारी सुनिश्चित करना जरूरी है.

भारत और अमेरिका के अलावा यूरोपीय यूनियन समेत विभिन्न देशों की सरकारों ने एआई और खासकर जेन-एआई को जिम्मेदारी के साथ इस्तेमाल करने को लेकर मसौदा कानून जारी किए हैं. इनका नियमन मुख्यतः जेन-एआई सॉफ्टवेयर कंपनियों की सेल्फ-रिपोर्टिंग पर निर्भर है.

एक वर्ग एआई पर नियंत्रण मानवीय क्षमताओं से बाहर होने की आशंका जताते हुए इनके 'आर्टिफिशियली जेनरली इंटेलिजेंट' (एजीआई) बनने और मानवता के लिए खतरा साबित होने को लेकर गहरी चिंता जताता रहा है. वैसे, यह एक दिलचस्प अकादमिक बहस हो सकती है लेकिन तकनीक भले ही कुछ कामों की नकल कर ले लेकिन इंसानों की तरह सोचने में सक्षम होना दूर की कौड़ी है. मेरी राय यही है कि व्यावहारिक तौर पर निकट भविष्य में एजीआई जैसा कोई जोखिम संभव नहीं है.

तात्कालिक तौर पर भारत के सामने दो चुनौतियां हैं, जिनसे उसे निबटना होगा—जेन-एआई मॉडल में भारतीय भाषाओं और भारत-केंद्रित डेटा की अपर्याप्तता और एक्सीलेरेटर चिप्स की खासी कमी. बहरहाल, आईटी मंत्रालय के भाषिनी जैसे प्रयासों को भारतीय भाषा डेटासेट बढ़ाने की दिशा में शानदार शुरुआत कह सकते हैं. निजी क्षेत्र भी जेन-एआई के विकास को बढ़ावा देने वाले कदम उठा रहा है. एक्सीलेरेटर चिप की जरूरत को कुछ उसी तरह गंभीरता से लेने की जरूरत है, जैसा रुख पिछले दशकों में परमाणु हथियारों की दौड़ के दौरान अपनाया गया था. 

भारत के लिए सबसे जरूरी है कि एआई में जिम्मेदारी के साथ और बड़े पैमाने पर निवेश करे. मुझे पूरी उम्मीद है कि सार्वजनिक-निजी भागीदारी से भारत में जेन-एआई का तेजी से प्रसार हो सकेगा और यह भारत समेत पूरी दुनिया में वंचित तबके के विकास और उन्हें नए अवसर मुहैया कराने में सहायक साबित होगा.

Read more!