चैट जीपीटी से कितना अलग और बेहतर है गूगल का आर्टिफिशियल इंटेलिजेंस जेमिनी
गूगल डीपमाइंड के सीईओ और को-फाउंडर डेमिस हसाबिस का कहना है कि जेमिनी हमें एआई विजन के और भी करीब लेकर जाता है

आर्टिफिशियल इंटेलिजेंस (AI) के मैदान में एक और नए खिलाड़ी का आगमन हो चुका है. दुनिया के सबसे बड़े सर्च इंजन गूगल ने अपने एआई प्लेटफॉर्म जेमिनी को लॉन्च कर दिया है. यह नया सिस्टम गूगल के डिवाइस पिक्सल 8 प्रो के जरिए दुनिया भर के यूजर्स के लिए अवेलबल भी हो गया है.
यह एक जनरल मल्टीमॉडल AI है और दुनिया भर के तकनीकी दिग्गज इसे अब तक का सबसे शक्तिशाली मॉडल भी मान रहे हैं. इस नए सिस्टम को गूगल की तरफ से चैट जीपीटी को दिया गया जवाब भी कहा जा रहा है. हालांकि अगर आम लोगों के बीच सबसे तेजी से एआई को पॉपुलर करने का क्रेडिट देने की बात आएगी तो यह निश्चित ही चैट जीपीटी के खाते में जाएगा.
गूगल डीपमाइंड के सीईओ और को-फाउंडर डेमिस हसाबिस का कहना है कि जेमिनी हमें एआई विजन के और भी करीब लेकर जाता है. यह एक ऐसा सॉफ्टवेयर है जो कि स्मार्ट भी है और हमारे लिए जरूरी सहायक के तौर पर काम करता है. जेमिनी को गूगल की कई सारी टीमों ने मिलकर बनाया है. इसके अलावा यह एक मल्टीमॉडल सिस्टम भी है, यानी कि यह केवल जानकारी देने तक ही सीमित नहीं है बल्कि यह इसे प्रोसेस भी कर सकता है और टेक्स्ट, कोड, ऑडियो, इमेज और वीडियो को समझ कर उनको ऑपरेट भी कर सकता है. अगर तुलनात्मक तौर पर देखें तो इस वक्त चैट जीपीटी वीडियो पर काम नहीं कर सकता.
गूगल का मौजूदा एआई मॉडल दूसरों से काफी ज्यादा पावरफुल है. गूगल का ऐसा दावा है कि जेमिनी के अल्ट्रा कैटेगरी का प्रदर्शन लार्ज लैंगवेज मॉडल (LLM) के बैंचमार्क पर भी काफी अच्छा आंका गया है. इसमें रिसर्च में इस्तेमाल किए जाने वाले 32 ऐकडेमिक बेंचमार्क में से 30 पर अच्छे रिजल्ट दिए हैं. इसके अवाला यह मैसिव मल्टीटास्क लैंगवेज अंडरस्टैंडिंग मॉडल (MLU) पर एक्पर्ट्स से बेहतर प्रदर्शन करने वाला पहला मॉडल है.
कंपनी का दावा है कि जेमिनी दुनिया की सबसे लोकप्रिय प्रोग्रामिंग भाषाओं, जैसे पायथन, जावा, सी++ और गो में हाई क्वालिटी कोड को समझ सकता है और इस पर काम करने के अलावा इस तरह के कोड को जेनरेट भी कर सकता है. अब यहां पर लार्ज लैंगवेज मॉडल (LLM) और मैसिव मल्टीटास्क लैंगवेज अंडरस्टैंडिंग मॉडल (MLU) के बारे में समझ लेना भी जरूरी हो जाता है. LLM एक तरह का एल्गोरिदम है जो अलग अलग भाषाओं में काम कर सकता है. यह मॉडल किसी भी सिस्टम को भाषा समझने और उसका अनुवाद करने में सक्षम बनाता है. इसके जरिए किसी भी एआई मॉडल को इंसानों की भाषा समझने के लिए ट्रेंड किया जाता है. वहीं MLU किसी एआई मॉडल की टेस्टिंग में गणित, अमेरिकी इतिहास, कंप्यूटर विज्ञान, कानून और इस तरह के 57 विषयों पर काम करता है.
तीन कैटेगरी में किया गया है डेवलप
गूगल ने जेमिनी को अपनी जरूरत के हिसाब से स्केल करने के लिए तीन कैटेगरी में डेवलप किया है. सबसे बड़े मॉडल का नाम जेमिनी अल्ट्रा है जो कि इसका सबसे सक्षम मॉडल भी है और यह काफी जटिल कामों को करने के लिए है. फिलहाल इस पर सिक्योरिटी और सेफ्टी से जुड़े जांच किए जा रहे हैं जिस वजह से यह अभी केवल ग्राहकों, डेवलपर्स और कुछ सेफ्टी एक्सपर्ट्स के लिए ही अवेलबल है. इसे अगले साल की शुरुआत में डेवलपर्स और एंटरप्राइज ग्राहकों के लिए पेश किया जाएगा.
इसकी दूसरी कैटेगरी जेमिनी प्रो है. जो कि दुनियाभर के रेगुलर यूजर्स के लिए अवेलबल है. यह अलग-अलग तरह के कामों के निपटाने के लिए बनाया गया है. बार्ड पर इसमें ज्यादा एडवांस रेस्पॉन्स देने के लिए अंग्रेजी में जेमीनी प्रो का खास तौर पर ट्यून किया गया वर्जन शामिल है. डेवलपर्स और एंटरप्राइज ग्राहक Google AI स्टूडियो या Google क्लाउड वर्टेक्स AI में जेमिनी एपीआई के जरिए जेमिनी प्रो तक पहुंच सकते हैं.
इसकी तीसरी कैटेगरी जेमिनी नैनो है, जो कि ऑन डिवाइस कामों को मैनेज कर सकता है. यह पहले से ही Pixel 8 Pro पर अवेलबल है. जो वॉट्सएप से शुरू होकर रिकॉर्डर ऐप में डिटेल और जीबोर्ड के जरिए स्मार्ट रिप्लाई जैसी नई सुविधाओं को और सशक्त बनाता है. 13 दिसंबर से, एंड्रॉइड डेवलपर्स AICore के जरिए जेमिनी नैनो के साथ निर्माण करने में भी सक्षम होंगे, जो कि Pixel 8 Pro पर शुरू होने वाली एंड्रॉइड 14 में उपलब्ध एक नई सिस्टम क्षमता है.
गूगल का यह भी दावा है कि जेमिनी सर्च, ऐड, क्रोम और डुएट एआई जैसे प्रोडक्ट और सर्विस की पेशकश भी करेगा. कंपनी का कहना है कि वह पहले से ही सर्च में जेमिनी के साथ प्रयोग शुरू कर रहा है, "जहां यह यूजर्स के लिए सर्च जेनरेटिव एक्सपीरियंस (SGI) को तेज बना रहा है, साथ ही इसकी क्वालिटी में भी 40 फीसदी की तेजी आई है. इसके अलावा एली कोलिन्स, वीपी, प्रोडक्ट, गूगल डीपमाइंड ने मीडिया को बताया कि हालांकि उन्होंने जेमिनी में काफी सुधार किया है पर एलएलएम अभी भी कुछ गलतियां कर सकता है. उन्होंने कहा कि जब हम इन मॉडलों को बार्ड जैसे प्रोडक्ट के साथ मिलाते हैं तो हमारे पास प्रतिक्रियाओं की सटीकता में सुधार करने के लिए कुछ और टेक्नोलॉजी होती हैं.
वहीं सेफ्टी पर गूगल का कहना है कि वह जैमिनी की मल्टीमॉडल क्षमताओं को ध्यान में रखते हुए नए सेफ्टी फीचर्स को ऐड कर रहा है और संभावित जोखिमों पर विचार कर रहा है. कंपनी का दावा है कि उसके पास "किसी भी Google AI मॉडल का अब तक का सबसे व्यापक सेफ्टी असेसमेंट शामिल है. उसका कहना है कि यह मॉडलों का स्ट्रेस टेस्ट करने औऱ गूगल के इंटरनल असेसमेंट विजन में ब्लाइंडस्पॉट की पहचान करने के लिए बाहरी एक्सपर्ट्स के एक ग्रुप के साथ भी काम कर रहा है.
हालांकि अभी भी यह कहना मुश्किल है कि गूगल जेमिनी चैट जीपीटी से बेहतर है या नहीं. पर फिलहाल यह इससे लचीला जरूर लग रहा है. इसके अलावा इसके साथ एक सबसे अच्छी बात यह है कि यह वीडियो और बिना इंटरनेट के ही डिवाइस पर काम कर सकता है. साथ ही यह यूजर्स के लिए पूरी तरह से फ्री है. जबकि चैट जीपीटी के इस्तेमाल के लिए आपको भुगतान करना होता है.