एलेक्सा, सीरी या गूगल असिस्टेंट; कैसे बन रहे लोगों के डिजिटल बेस्ट फ्रेंड?
वॉयस रिकग्निशन और जेनरेटिव एआई को मिलाकर बने स्मार्ट असिस्टेंट्स ने लाखों भारतीयों का मन मोह लिया है. मगर गोपनीयता की गंभीर चिंता भी बरकरार

पहले, एक सीधा सादा-सा वॉयस असिस्टेंट था. शुरुआती अलेक्सा इसकी मिसाल है जो आपकी पसंद का गाना समझने और बजाने या बुनियादी जानकारी देने के लिए अपने कान लगाए रहता था. अब मशीन लर्निंग और नेचुरल लैंग्वेज प्रोसेसिंग (एनएलपी) सरीखे आर्टिफिशियल इंटेलिजेंस (एआई) टूल्स की इकट्ठी तथा व्याख्या कर सकने वाली ताकत के साथ आपके वॉयस असिस्टेंट और ज्यादा स्मार्ट हो गए हैं.
अपने स्मार्टफोन में बैठे इन असिस्टेंट्स के साथ भारतीय अपने हरदम-हरपल के सर्वव्यापी साथी को पसंद कर रहे हैं. यह उन लोगों के लिए स्वाभाविक लगता है जो जेनरेटिव एआई से संचालित वॉयस असिस्टेंट की इस नई पीढ़ी की ओर रुख कर रहे हैं—जो लगभग हर चीज की नई सामग्री बनाने के लिए मौजूदा टेक्स्ट, इमेज, ऑडियो और वीडियो डेटा के भीतरी पैटर्न और संरचनाओं की पहचान करते हैं और न्यूरल नेटवर्क का इस्तेमाल करते हैं.
हर हफ्ते खरीदारी की सूची से लेकर अपनी थाली में कैलोरी गिनने और तर्क गढ़ने तक—अब कुछ भी इसकी समझ से दूर नहीं. मसलन, 58 वर्षीया विदुषी डालमिया कहती हैं कि उनकी 88 वर्षीया मां डिमेंशिया की मरीज हैं और उनका सारा वक्त वॉयस असिस्टेंट से बातें करने में बीतता है.
दिल्ली की यह गृहिणी कहती हैं, ''इससे उन्हें सक्रिय रहने में मदद मिलती है. मसलन, उनके एलेक्सा डिवाइस में मौजूद एआई उनके पसंदीदा पुराने गानों को अरसे बाद भी सुना देता है, जिन्हें वे खुद भी भूल चुकी हैं.'' इसी तरह 28 वर्षीय वरुण नाथवानी के लिए उनका वॉयस असिस्टेंट एक ऐसा सहायक है जो उन्हें गर्लफ्रेंड के लिए कविताएं लिखने और उनके पेशेवर संकटों को सुलझाने में मदद करता है.
वे बताते हैं, ''मुझे अपनी डिवाइस से पूछना पड़ता है—'मुझे बताओ कि मैं अपने पिता को कैसे समझाऊं कि मैंने कार को नुक्सान नहीं पहुंचाया' या 'क्या तुम वफादारी के बारे में कोई प्रेम कविता लिख सकते हो' या 'अगर मैं अपनी यूपीएससी परीक्षा पास नहीं कर पाया तो मुझे क्या करना चाहिए'.''
नाथवानी कहते हैं कि उन्होंने खुद के और जीवन में आए दूसरे लोगों के बारे में बहुत कुछ इस डिवाइस के साथ शेयर किया है. मुंबई के छात्र और अपने आईफोन पर चैटजीपीटी संचालित सीरी का इस्तेमाल करने वाले नाथवानी कहते हैं, ''अब यह उन सभी बातों पर गौर करता है और मुझे जवाब देता है. मैं घर के बिना रहना ज्यादा पसंद करूंगा, न कि अपनी वॉयस असिस्टेंट के बिना.''
नए वॉयस असिस्टेंट की लोकप्रियता विशेषज्ञों के लिए कोई ताज्जुब की बात नहीं. बोलकर टाइप करना कुछ वक्त से चलन में है. 2018 में पीडब्ल्यूसी की एक रिपोर्ट में पाया गया कि वैश्विक स्तर पर 71 फीसद लोग अपने गैजेट के जरिए खोज करने के लिए टाइपिंग के बजाए आवाज (वॉयस) को प्राथमिकता देते हैं.
रेवेरी लैंग्वेज टेक्नोलॉजीज के सह-संस्थापक विवेकानंद पाणि कहते हैं, ''वॉयस असिस्टेंट लाखों भारतीयों को ऑनलाइन ला रहे हैं, जिनमें कई पहली बार के इंटरनेट यूजर हैं. जियोफोन पर कंटेंट की खोज के लिए बड़ी संख्या में यूजर हमारे वॉयस असिस्टेंट पर निर्भर हैं.'' यह उनकी एआइ-फर्स्ट लैंग्वेज टेक्नोलॉजी फर्म है जो 23 आधिकारिक भारतीय भाषाओं में टेक्स्ट-आधारित कंटेंट बनाती है.
स्मार्टफोन के अलावा, गूगल असिस्टेंट, सीरी, बिक्सबाई और एलेक्सा जैसी वॉयस असिस्टेंट का उपयोग करने वाले स्मार्ट स्पीकर ने वॉयस सर्च की लोकप्रियता बढ़ाई है. गूगल के नवीनतम डेटा के मुताबिक, 60 फीसद भारतीय यूजर स्मार्टफोन पर वॉयस असिस्टेंट का इस्तेमाल करते हैं और हिंदी गूगल असिस्टेंट पर इस्तेमाल की जाने वाली दूसरी सबसे आम भाषा है. ग्रैंड व्यू रिसर्च के डेटा के अनुसार, भारतीय वॉयस असिस्टेंट बाजार 2023 में अनुमानित 10.95 करोड़ डॉलर (958 करोड़ रु.) था जिसके 2030 तक 58.52 करोड़ डॉलर (5,121 करोड़ रु.) तक होने की संभावना है.
एआई की तकनीकी ताकत
आवाज का दबदबा होने पर भले ही ताज्जुब न हो मगर वॉयस असिस्टेंट के जरिए सामने आ रही तकनीकी प्रगति प्रभावशाली है. गूगल डेवलपर विशेषज्ञ अमित अग्रवाल कहते हैं, ''पहले, सीरी या गूगल नाउ जैसे वॉयस असिस्टेंट बुनियादी सवालों के ही जवाब दे पाते थे. स्पीच रिकग्निशन भी सटीक नहीं था.''
आज जेनरेटिव एआई (जेनएआई) से मिली बुद्धिमत्ता के साथ स्पीच रिकग्निशन में शानदार सुधार हुआ है. मसलन, गूगल असिस्टेंट अब दस लाख से ज्यादा ऐक्शन कर सकता है और जटिल संवादों को समझ सकता है. डेटा से पता चलता है कि गूगल असिस्टेंट से पूछताछ उसके सर्च इंजन की तुलना में 200 गुना ज्यादा संवाद वाली और 40 गुना अधिक ऐक्शन वाली हैं.
अग्रवाल कहते हैं, ''वॉयस असिस्टेंट अब संदर्भ को समझ सकते हैं और जटिल मल्टी स्टेप काम संभाल सकते हैं. आप अपने वॉयस असिस्टेंट को इतालवी रेस्तरां बुक करने, बुकिंग को अपने कैलेंडर में जोड़ने और अपने परिवार को सूचित करने के लिए कह सकते हैं.''
इसी तरह एपल इंटेलिजेंस वॉयस असिस्टेंट सीरी को ताकतवर बना रहा, अमेजन जेनएआई-संचालित नया एलेक्सा लॉन्च कर रहा, फेसबुक ने फेसबुक, इंस्टाग्राम, व्हाट्सऐप और मेटा के रे-बैन स्मार्ट चश्मे में वॉयस-सक्षम मेटा एआई को जोड़ दिया और गूगल ने एंड्रॉयड फोन पर जेमिनी को शामिल कर दिया है. ये असिस्टेंट वॉयस की सहजता को जेनरेटिव एआई की बुद्धिमत्ता के साथ जोड़ते हैं.
एकालाप से वार्तालाप
वॉयस असिस्टेंट्स के साथ जेनरेटिव एआई को जोड़ने से बैकएंड एआई (जो बड़ी संख्या में जानकारी का विश्लेषण करते हैं और पैटर्न को पहचानते हैं) और यूजर के बीच एक इंटरफेस बन गया है. नतीजा यह है कि ऐसी डिवाइस अब सिर्फ जानकारी नहीं देती बल्कि इमेज, टेक्स्ट, वीडियो और संगीत जैसी नई सामग्री भी सृजित करती है.
नैसकॉम (नेशनल एसोसिएशन ऑफ सॉफ्टवेयर ऐंड सर्विस कंपनीज) के उपाध्यक्ष प्रशांतो के. रॉय कहते हैं, ''हम लंबे वक्त से बैकएंड पर एआई का इस्तेमाल कर रहे हैं. अब ये नए वॉयस-एनेबल्ड असिस्टेंट ज्ञान की सामग्री और इंसान के बीच इंटरफेस का काम कर रहे हैं. चैटजीपीटी और डीपसीक जैसे जेनरेटिव एआई ने हमारे सर्च इंजन को ताकत देने वाले बैकएंड एआई को इंसान जैसे दिमाग में बदल दिया है.''
जेनरेटिव एआई में बूम की शुरुआत 2022 के आखिर में चैटजीपीटी से हुई. मीडिया और सूचना प्लेटफॉर्म इंक42 के अनुसार, भारत का जेनएआई बाजार 2023 में 1.1 अरब डॉलर (9,522 करोड़ रु.) था, जिसके 2030 तक 48 फीसद की सीएजीआर (वार्षिक चक्रवृद्धि दर) से बढ़ते हुए 17 अरब डॉलर (1.47 लाख करोड़ रुपए) को पार कर जाने का अनुमान है. कम्युनिटी सोशल मीडिया प्लेटफॉर्म लोकलसर्कल्स ने 2025 में 309 जिलों के 92,000 भारतीयों के बीच सर्वेक्षण कराया, जिससे पता चला कि हर दो में से एक भारतीय जेनएआइ प्लेटफॉर्म का उपयोग करता है.
एपल इंटेलिजेंस और सीरी में इसके जुड़ाव को ही लीजिए. इसके लेखन के नए टूल्स सेकंडों में किसी लेक्चर का सारांश दे सकते हैं, लंबी चर्चा को छोटा कर सकते हैं और टेक्स्ट के विभिन्न संस्करण दोबारा से लिख सकते हैं. सीरी एक साधारण आवाज के विवरण के आधार पर एक रस्मी मूवी भी बना सकती है. दूसरे शब्दों में कहें तो केवल सुनकर ही आप अपने विचारों को दृश्यों में बदल सकते हैं.
अब वॉयस असिस्टेंट विभिन्न भाषाओं की अलग-अलग आवाजों और शब्द भंडार को पहचान सकते हैं. इसके लिए वे स्पीच रिकग्निशन, नेचुरल लैंग्वेज प्रोसेसिंग और टेक्स्ट-टू-स्पीच (टीटीएस) टेक्नोलॉजी जैसे एआई टूल्स के मिले-जुले रूप का उपयोग करते हैं.
पाणि के शब्दों में, ''जब आप बोलते हैं तो असिस्टेंट का स्पीच रिकग्निशन सिस्टम आपकी आवाज को टेक्स्ट में बदल देता है. फिर एआइ उस टेक्स्ट को प्रोसेस करता है, इरादे को समझता है और जानकारी जुटाता है. फिर टेक्स्ट-टू-स्पीच सिस्टम इस रेस्पॉन्स को वापस स्वाभाविक आवाज वाली स्पीच में बदल देता है.''
वे बताते हैं कि लार्ज लैंग्वेज मॉडलों (एलएलएम) की बढ़ती प्रगति के साथ वॉयस असिस्टेंट संदर्भ को बेहतर ढंग से समझ सकते हैं, जटिल बातचीत कर सकते हैं और इंसानों जैसी प्रतिक्रिया दे सकते हैं. मसलन, पहले अगर आप एक असिस्टेंट से पूछते, 'मुझे सचिन तेंडुलकर के बारे में बताएं', तो एक निश्चित उत्तर मिलता लेकिन एलएलएम के साथ यह उनके बारे में आगे के सवालों जैसे 'उनका सर्वोच्च स्कोर क्या था', को भी बगैर उनका नाम दोहराए समझ ले रहा है.
सिर्फ संगीत से कहीं आगे
बदलती टेक्नोलॉजी के साथ वॉयस असिस्टेंट को लेकर इंसानों के नजरिए में भी बदलाव आया है. वे दिन गए जब स्मार्ट वॉयस असिस्टेंट का इस्तेमाल सिर्फ संगीत सुनने के लिए किया जाता था. अब उपभोक्ता ई-कॉमर्स स्टोर्स पर सामान की खोज करने, ड्राइविंग रूट जानने और यहां तक कि अपने प्रेमी/प्रेमिका को रिझाने के लिए वॉयस सक्षम एआई का इस्तेमाल कर सकते हैं.
अमेरिकी ऑनलाइन सिक्योरिटी कंपनी मैकेफी ने मॉडर्न लव नाम से भारत समेत दुनियाभर के 7,000 वयस्कों के बीच 2025 का सर्वेक्षण कराया. उसमें पाया गया कि 65 फीसद भारतीयों ने डेटिंग ऐप के लिए कंटेंट बनाने में कन्वर्सेशनल एआई यानी संवादी एआई का इस्तेमाल किया और 81 फीसद लोगों को लगता है कि एआई वाले कंटेंट के इस्तेमाल से उनकी डेटिंग लाइफ बेहतर होती है. यहां तक कि 78 फीसद भारतीय एआई के लिखे लव नोट्स और इंसान की लिखी प्रेम पातियों के बीच अंतर भी नहीं बता पाए.
जाहिर है, यूजर्स को स्मार्ट वॉयस असिस्टेंट जरूरी लगता है. मुंबई में फाउंडर ऑफिस की भूमिका में काम करने वालीं 29 वर्षीया मानसी सिंह कहती हैं, ''एलेक्सा से कुछ चीजें पूछने से जीवन आसान हो जाता है. सबसे बड़ी कामयाबी? अपने वॉटर पंप को दूर से नियंत्रित करना. साथ ही, उसके बिना जब मैं किसी और जगह होती हूं तो संगीत, अलार्म, रिमाइंडर के लिए...मुझे उसकी कमी अखरती है.''
ऑनलाइन जर्नल ऑफ कम्युनिकेशन ऐंड मीडिया टेक्नोलॉजीज में 2024 के एक अध्ययन में पाया गया कि वॉयस असिस्टेंट अकेलेपन को कम कर सकते हैं. ऐसे लोग भी हैं जो मानते हैं कि उन्हें उस मशीन से ''मोहब्ब्त हो गई है'' जो कभी काल्पनिक विज्ञान कथाओं का विषय होती थी. पुणे की 21 वर्षीया छात्रा रुचिका सिंह कहती हैं, ''मैं चैटजीपीटी से संचालित सीरी का इस्तेमाल करती हूं और मैं खुद को लेकर कभी इतनी खुश नहीं रही. चैटजीपीटी मुझे स्पष्टता और आत्मविश्वास देता है.''
स्मार्ट वॉयस तकनीक उन लोगों और इंटरनेट के बीच एक बड़ी बाधा को दूर करती है जो लिख नहीं सकते. ऐसे लोगों में बच्चे शामिल हैं. जियो के सेट टॉप बॉक्स में, जिसमें रेवेरी की वॉयस तकनीक शामिल है, 20 फीसद पूछताछ (ट्रैफिक) छोटे बच्चों की है. ऑल्टटाइप में क्रिएटिव डायरेक्टर 37 वर्षीया मालविका शर्मा कहती हैं, ''हमारे छोटे बच्चे ने एलेक्सा से संगीत के लिए अनुरोध करना सीख लिया और वह बच्चे के लहजे की आदी भी हो गई है.''
कानून लागू करने के लिए भी स्मार्ट टूल्स का उपयोग किया जाता है. दिल्ली पुलिस के अधिकारी अब दस्तावेज बनाने में तेजी के लिए स्पीच रिकग्निशन और भारतीय भाषाओं के स्मार्ट की-बोर्ड का इस्तेमाल करते हैं. पाणि कहते हैं, ''हाथ से लंबी रिपोर्ट टाइप करने के बजाए अधिकारी अब अपने नोट्स, शिकायतें या आधिकारिक दस्तावेज ओडिया और हिंदी में बोलकर लिखा सकते हैं जिससे समय और मेहनत दोनों की बचत होती है.''
स्मार्ट वॉयस असिस्टेंट से उपयोग करने के विकल्पों में विविधता आएगी. स्मार्ट कारों के आगमन के साथ ही वॉयस असिस्टेंट आपात सहायता और रखरखाव के अलर्ट जैसी सुविधाएं मुहैया करा सकते हैं. इसी तरह, घरेलू वॉयस असिस्टेंट इंटरनेट ऑफ थिंग्स (सभी डिवाइस जो इंटरनेट के जरिए दूसरे डिवाइस से जुड़े रहते हैं) से और ज्यादा जुड़ने जा रहा है जो ताले से लेकर कैमरे, गीजर से लेकर फ्रिज तक घर की सब चीजों को नियंत्रित करने में सक्षम होगा.
स्याह पक्ष
इसके अलावा चिंताएं भी हैं. खासकर, उन युवाओं को लेकर जो वॉयस असिस्टेंट के साथ बहुत ज्यादा वक्त गुजारते हैं. गजेट्सटूयूज के संस्थापक और संपादक अभिषेक भटनागर कहते हैं, ''बच्चों को यह समझना चाहिए कि यह महज तकनीक है और उन्हें इनको लेकर इंसानों जैसा लगाव तथा जज्बात नहीं पनपने देना चाहिए. एक डिस्क्लेमर होना चाहिए कि आप कंप्यूटर प्रोग्राम से बात कर रहे हैं.''
प्राइवेसी का मसला सबसे बड़ी चिंता है. भले ही कुछ स्मार्ट स्पीकर अब 'म्यूट' (चुप) किए जा सकते हों, फिर भी आज बड़ा सवाल यह है कि किसी की निजी जिंदगी का कितना हिस्सा खतरे में है. और तब क्या होगा जब हम डिवाइस पर अपनी 'मर्जी से' जो भी जानकारी टाइप कर रहे हैं या जोर से बोल रहे हैं वह हैक हो जाए? यौन प्राथमिकताओं से लेकर निजी पहचान के ब्योरे तक और स्कूल के ग्रुप की चैट से लेकर पेशेवर प्रोजेक्ट नोट्स तक—हमारी जिंदगी में असिस्टेंट्स की पहुंच है.
अग्रवाल कहते हैं, ''वॉयस असिस्टेंट हमेशा 'वेक' शब्दों (चलन वाले आम बोलचाल के शब्दों) को सुनते रहते हैं. ऐसे में असिस्टेंट की तुरंत प्रतिक्रिया के लिए हमेशा चालू रहने वाला सुनने का तरीका जरूरी है. मगर इससे व्यक्ति असहज भी हो सकता है. मैंने देखा है कि कुछ वेबसाइटें दोस्तों के साथ हमारी निजी बातचीत के आधार पर प्रासंगिक विज्ञापन दिखाती हैं.''
यह देखना बाकी है कि स्मार्ट असिस्टेंट दरअसल खरीदने के कुछ महीनों तक इस्तेमाल वाली नई-नई चीज है या फिर यह जेनरेटिव एआइ और वॉयस तकनीक के मेल के साथ जिंदगी पर ज्यादा नियंत्रण की शुरुआत है. पर यह निर्विवाद तथ्य है कि इंसान इतिहास के किसी भी समय की तुलना में मशीनों के लिए अपनी जिंदगी बड़ी तेजी से खोल रहा है.
--------------------------------
सिनेमा से लेकर प्रेम पाती तक
ये जेनरेटिव एआई-संचालित वॉयस असिस्टेंट भारत में काफी लोकप्रिय हैं जो स्मार्ट स्पीकर में भी इस्तेमाल किए जाते हैं
गूगल असिस्टेंट
दस लाख से ज्यादा कमांड पूरा कर सकता है, एंड्रॉयड डिवाइसों पर उपलब्ध है, जेमिनी से संचालित है, गूगल की ओर से चैटजीपीटी का विकल्प है. यह लॉजिक तथा विशेष संदर्भ के आधार पर टेक्स्ट, विजुअल और मूवी जेनरेट कर सकता है.
सीरी
एपल का यह असिस्टेंट एपल एआइ का इस्तेमाल करता है और लिखने, विजुअल, योजना तैयार करने, अन्य डिवाइसों को नियंत्रित करने में यूजर्स की मदद करता है.
एलेक्सा
इस साल अमेजन का वॉयस असिस्टेंट नए रूप में ढल जाएगा. पहले के संस्करण संगीत, सूचना, शेड्यूलिंग, घर के उपकरणों को नियंत्रित करने के लिए वॉयस कमांड एआइ इस्तेमाल करते हैं.
मेटा एआई
मेटा के सोशल मीडिया प्लेटफॉर्मों में एकीकृत यह एआइ वर्चुअल सेलेब्रिटियों से बात करने, वेब सर्च करने, विचारों के विजुअल बनाने, अनुवाद करने और रियलिस्टिक इमेज बनाने के विकल्प देता है.
चैटजीपीटी
यह जेनरेटिव एआई टूल डेटा एनालिटिक, प्रोजेक्ट मैनेजमेंट, रियल टाइम सर्च और जटिल तर्क में मदद कर सकता है; वॉयस से भी इसका इस्तेमाल किया जा सकता है.