GPT-4o (“ओमनी” के लिए “ओ”) की रिलीज के साथ, ओपनएआई ने बुद्धिमान कंप्यूटिंग के भविष्य की एक झलक पेश की है। जैसे ही नवीनतम बड़े भाषा मॉडल को लॉन्च किया गया, सोशल मीडिया प्लेटफॉर्म पर डेमो वीडियो की बाढ़ आ गई। मानव जैसी आवाज सहायता ने कई लोगों को आश्चर्यचकित कर दिया है, इसकी तुलना 2013 की फिल्म 'हर' के कृत्रिम बुद्धिमत्ता ऑपरेटिंग सिस्टम 'सामंथा' से की जा रही है।
एक ब्लॉग पोस्ट में, OpenAI ने कहा: “यह औसतन 320 मिलीसेकंड के साथ 232 मिलीसेकंड में ऑडियो इनपुट का जवाब दे सकता है, जो एक बातचीत में मानव प्रतिक्रिया समय (एक नई विंडो में खुलता है) के समान है। यह अंग्रेजी और कोड में टेक्स्ट पर GPT-4 टर्बो प्रदर्शन से मेल खाता है, गैर-अंग्रेजी भाषाओं में टेक्स्ट में महत्वपूर्ण सुधार के साथ, एपीआई में यह बहुत तेज और 50% सस्ता है।
यह ध्यान दिया जाना चाहिए कि एक आम गलत धारणा है कि चैटजीपीटी जीपीटी के बराबर है। यह करना एक आसान गलती है क्योंकि उनका एक ही नाम है, एक ही निगम द्वारा निर्मित हैं, और एआई से निपटते हैं। मुख्य अंतर यह है कि चैटजीपीटी जीपीटी एआई मॉडल द्वारा संचालित एक एप्लिकेशन है, न कि एआई मॉडल द्वारा। चैटजीपीटी इंटरैक्टिव तरीके से संवादात्मक उत्तर बनाने के लिए अंतर्निहित जीपीटी मॉडल, जो एआई भाषा मॉडल है, का उपयोग करता है।
GPT-4o क्या है?
इस साल मई में लॉन्च किया गया, GPT-4o में 128K टोकन की एक संदर्भ विंडो और अक्टूबर 2023 की ज्ञान कट-ऑफ तारीख है। यह पिछले मॉडल की तुलना में दृष्टि और ऑडियो समझ में विशेष रूप से बेहतर है। मुख्य ख़ुफ़िया स्रोत, GPT-4, स्वर, एकाधिक स्पीकर, या पृष्ठभूमि शोर जैसी चीज़ों को सीधे नहीं समझ सकता है, और यह हँसी या गायन जैसी भावनाओं को व्यक्त नहीं कर सकता है। लेकिन GPT-4o के साथ, एक नया दृष्टिकोण अपनाया गया है क्योंकि इसे टेक्स्ट, विज़न और ऑडियो को पूरी तरह से संभालने के लिए प्रशिक्षित किया गया था।
GPT-4o लॉन्च के तुरंत बाद, कई लोगों ने नए मॉडल का उपयोग करने की कोशिश की, विशेष रूप से AI सहायता के पीछे 'भावनात्मक' या अधिक मानवीय आवाज के कारण। हालाँकि, कई उपयोगकर्ताओं ने ओपनएआई डेवलपर फोरम और रेडिट पर स्मार्टफोन और पीसी के लिए समग्र पहुंच और वॉयस मोड की उपलब्धता के संबंध में मुद्दे उठाए।
हालाँकि, OpenAI ने कहा: “GPT-4o की पाठ और छवि क्षमताएँ ChatGPT में (13 मई) से शुरू हो रही हैं। हम GPT-4o को फ्री टियर में और प्लस उपयोगकर्ताओं को 5 गुना अधिक संदेश सीमा के साथ उपलब्ध करा रहे हैं। हम आने वाले हफ्तों में चैटजीपीटी प्लस के भीतर अल्फा में जीपीटी-4ओ के साथ वॉयस मोड का एक नया संस्करण पेश करेंगे।
ChatGPT-4o तक कैसे पहुंचें?
OpenAI के अनुसार, GPT-4o शुरुआत में ChatGPT और API में टेक्स्ट और विज़न मॉडल के रूप में उपलब्ध होगा। GPT-4o चैटजीपीटी फ्री, प्लस और टीम और चैट कंप्लीशन एपीआई, असिस्टेंट एपीआई और बैच एपीआई में उपलब्ध होगा।
मुफ़्त उपयोगकर्ताओं को स्वचालित रूप से GPT-4o सौंपा जाएगा। यदि GPT-4o अनुपलब्ध है, तो फ्री-टियर उपयोगकर्ता GPT-3.5 पर डिफ़ॉल्ट होंगे। हालाँकि, फ्री-टियर एक्सेस उन्नत संचार सुविधाओं पर सीमाओं के साथ आता है, जिसमें डेटा विश्लेषण, फ़ाइल अपलोड, ब्राउज़िंग, जीपीटी की खोज और उपयोग और दृष्टि क्षमताएं शामिल हैं।
OpenAI के GPT मॉडल क्या हैं?
एक ही कंपनी द्वारा विकसित किए जाने के बावजूद, सभी जीपीटी मॉडल गति, पैरामीटर, प्रदर्शन, अनुप्रयोग, लागत, प्रभावकारिता, टोकन आकार (मॉडल द्वारा संसाधित पाठ की इकाई जैसे, शब्द, चरित्र, को संदर्भित करता है) के मामले में एक दूसरे से भिन्न हैं। सबवर्ड) और पैरामीटर (मॉडल की समग्र जटिलता का प्रतिनिधित्व करते हैं)।
ओपनएआई का जीपीटी-3 एआई भाषा मॉडल के लिए मार्ग प्रशस्त करता है, जबकि जीपीटी-3.5 इसकी नींव पर आधारित है, सटीकता और प्रासंगिक समझ को बढ़ाता है। उनके बीच चयन विशेष आवश्यकताओं पर निर्भर करता है। GPT-3 सामान्य उद्देश्यों के लिए एक समाधान के रूप में कार्य करता है, जबकि GPT-3.5 जटिल और अनुकूलित सेटिंग्स में चमकता है। GPT-3 की तुलना में उन्नत रूप में कार्य करते हुए, GPT-3.5 उच्च परिशुद्धता और कम पूर्वाग्रहों के साथ मानव-जैसा पाठ तैयार करने के लिए गहन शिक्षण का उपयोग करता है।
पिछले साल GPT-4 लॉन्च के साथ, OpenAI ने अपने व्यापक सामान्य ज्ञान और उन्नत तर्क क्षमताओं के कारण पिछले मॉडलों की तुलना में अधिक सटीकता के साथ कठिन समस्याओं को हल करने के लिए एक और कदम आगे बढ़ाया। अब, GPT-4o द्वारा प्रस्तुत, नवीनतम पीढ़ी गति, प्रदर्शन, अनुप्रयोगों और दक्षता के मामले में अपने पूर्ववर्तियों की तुलना में अधिक शक्तिशाली है।
किसे फायदा होगा?
भाषा मॉडल के बारे में बोलते हुए, SatNav Technologies के संस्थापक और सीईओ अमित प्रसाद ने कहा कि हाल तक, लोग ChatGPT और अन्य AI टूल में जो अधिकांश सुविधाएँ देखते हैं, उन्हें विज्ञान कथा माना जाता था और केवल फिल्मों में चित्रित किया जाता था। लेकिन इस क्षेत्र में तेजी से हो रहे विकास अब इन्हें व्यक्तिगत और पेशेवर दोनों ही तरह से दैनिक कार्यों में स्वतंत्र रूप से उपयोग करने के अवसर प्रदान कर रहे हैं।
“जीपीटी के पहले संस्करण अभी भी सीख रहे थे और अक्सर गलत उत्तर देते थे, कुछ उत्तरों में कुछ विस्तृत वाक्यों और अस्वीकरणों के साथ अधिक पुष्प भाषा थी जो तार्किक रूप से मान्य नहीं थे। बाद में, उन्हें साफ़ किया गया और वे अधिक सटीक हो गए। GPT-4o की नवीनतम घोषणा के साथ, और ChatGPT के उत्तरों में वर्बोज़ सामग्री को कम करने के लिए बहुत जरूरी हालिया अपग्रेड के साथ, AI नवाचार एक बिल्कुल नए स्तर पर चला गया है जिसे व्यवसायों द्वारा गर्मजोशी से अपनाया जाना चाहिए, ”उन्होंने कहा।
एरेक्रट के सह-संस्थापक और सीईओ, अजय गोयल ने कहा: “श्रृंखला में नवीनतम जुड़ाव, जीपीटी-4ओ, एआई भाषा मॉडल में एक और विकास का प्रतिनिधित्व करता है, और यह अपने पूर्ववर्तियों की प्रगति पर आधारित होगा, संभावित रूप से बेहतर प्रदर्शन की पेशकश करेगा और नई सुविधाओं”।
गोयल का मानना है कि ओपनएआई के जीपीटी मॉडल एआई भाषा प्रसंस्करण में महत्वपूर्ण प्रगति का प्रतिनिधित्व करते हैं और विभिन्न उद्योगों में उपयोगकर्ताओं की एक विस्तृत श्रृंखला को लाभ पहुंचाने की क्षमता रखते हैं। उनके अनुसार, GPT-4o सहित ये सभी मॉडल डेवलपर्स और शोधकर्ताओं के साथ-साथ ग्राहक सेवा, सामग्री निर्माता जैसे ब्लॉगर्स, शिक्षकों और आम जनता जैसे व्यवसायों के लिए मददगार साबित होंगे।
इस बीच, प्रसाद ने कहा कि पिरामिड के निचले सिरे पर, कुछ स्तर के कार्यों और उनके आउटपुट को गति देने में मदद मिलेगी। उदाहरण के लिए, एक विज़ुअल क्वेरी विंडो पहले पेश की गई चैट विंडो की तुलना में बहुत आगे जाती है।
“पिरामिड के उच्च अंत में, किसी के व्यक्तिगत व्यवसाय के लिए प्रासंगिक कुछ नवीन विचारों के बारे में सोचा जाना चाहिए और ऐसे मॉडल विकसित किए जाने चाहिए जो किसी संगठन के कामकाज के लिए महत्वपूर्ण प्रक्रियाओं में समझदारी से सहायता कर सकें। जो लोग तेजी से आगे बढ़ते हैं, वे अपने प्रतिस्पर्धियों पर लंबी छलांग लगाएंगे जो ऐसा नहीं करते हैं, यहां तक कि उनके नष्ट होने की संभावना भी बढ़ जाती है,'' उन्होंने कहा।