ओपनएआई स्मार्ट एआई के लिए चैटजीपीटी से आगे की तलाश कर रहा है: लेकिन क्यों? -न्यूज़18


आखरी अपडेट:

ओपनएआई जैसी कृत्रिम बुद्धिमत्ता कंपनियां प्रशिक्षण तकनीकों को विकसित करके बड़े भाषा मॉडल की खोज में अप्रत्याशित देरी और चुनौतियों को दूर करने की कोशिश कर रही हैं जो एल्गोरिदम के “सोचने” के लिए अधिक मानवीय तरीकों का उपयोग करती हैं।

क्या OpenAI वास्तव में ChatGPT से आगे निकल सकता है और अन्य स्मार्ट मॉडलों पर ध्यान केंद्रित कर सकता है?

(रायटर्स) – ओपनएआई जैसी कृत्रिम बुद्धिमत्ता कंपनियां प्रशिक्षण तकनीकों को विकसित करके बड़े भाषा मॉडल की खोज में अप्रत्याशित देरी और चुनौतियों को दूर करने की कोशिश कर रही हैं जो एल्गोरिदम के “सोचने” के लिए अधिक मानव-समान तरीकों का उपयोग करती हैं।

एक दर्जन एआई वैज्ञानिकों, शोधकर्ताओं और निवेशकों ने रॉयटर्स को बताया कि उनका मानना ​​​​है कि ये तकनीकें, जो ओपनएआई के हाल ही में जारी ओ1 मॉडल के पीछे हैं, एआई हथियारों की दौड़ को नया आकार दे सकती हैं, और उन संसाधनों के प्रकार पर प्रभाव डाल सकती हैं जिनकी एआई कंपनियों की अतृप्त मांग है। चिप्स के प्रकार के लिए ऊर्जा.

ओपनएआई ने इस कहानी पर टिप्पणी करने से इनकार कर दिया। दो साल पहले वायरल चैटजीपीटी चैटबॉट के जारी होने के बाद, प्रौद्योगिकी कंपनियों, जिनके मूल्यांकन को एआई बूम से काफी फायदा हुआ है, ने सार्वजनिक रूप से कहा है कि अधिक डेटा और कंप्यूटिंग शक्ति जोड़कर मौजूदा मॉडलों को “स्केलिंग” करने से लगातार एआई मॉडल में सुधार होगा।

लेकिन अब, कुछ सबसे प्रमुख एआई वैज्ञानिक इस “बड़ा बेहतर है” दर्शन की सीमाओं पर बोल रहे हैं।

एआई लैब्स सेफ सुपरइंटेलिजेंस (एसएसआई) और ओपनएआई के सह-संस्थापक इल्या सुतस्केवर ने हाल ही में रॉयटर्स को बताया कि यह प्री-ट्रेनिंग को बढ़ाने का परिणाम है – एक एआई मॉडल के प्रशिक्षण का चरण जो भाषा पैटर्न और संरचनाओं को समझने के लिए बड़ी मात्रा में बिना लेबल वाले डेटा का उपयोग करता है। – स्थिर हो गए हैं।

प्री-ट्रेनिंग में अधिक डेटा और कंप्यूटिंग शक्ति के उपयोग के माध्यम से जेनेरिक एआई उन्नति में बड़े पैमाने पर छलांग लगाने के शुरुआती समर्थक के रूप में सुटस्केवर को व्यापक रूप से श्रेय दिया जाता है, जिसने अंततः चैटजीपीटी बनाया। सुतस्केवर ने एसएसआई की स्थापना के लिए इस साल की शुरुआत में ओपनएआई छोड़ दिया।

“2010 स्केलिंग का युग था, अब हम एक बार फिर आश्चर्य और खोज के युग में वापस आ गए हैं। हर कोई अगली चीज़ की तलाश में है,” सुतस्केवर ने कहा। “सही चीज़ को स्केल करना अब पहले से कहीं अधिक मायने रखता है।”

सुटस्केवर ने इस बारे में अधिक विवरण साझा करने से इनकार कर दिया कि उनकी टीम इस मुद्दे को कैसे संबोधित कर रही है, इसके अलावा यह कहा कि एसएसआई पूर्व-प्रशिक्षण को बढ़ाने के लिए एक वैकल्पिक दृष्टिकोण पर काम कर रहा है।

निजी मामलों से परिचित तीन सूत्रों के अनुसार, पर्दे के पीछे, प्रमुख एआई प्रयोगशालाओं के शोधकर्ता एक बड़े भाषा मॉडल को जारी करने की दौड़ में देरी और निराशाजनक परिणामों का सामना कर रहे हैं, जो ओपनएआई के जीपीटी -4 मॉडल से बेहतर प्रदर्शन करता है, जो लगभग दो साल पुराना है।

बड़े मॉडलों के लिए तथाकथित 'प्रशिक्षण रन' में एक साथ सैकड़ों चिप्स चलाने पर लाखों डॉलर खर्च हो सकते हैं। यह देखते हुए कि सिस्टम कितना जटिल है, उनमें हार्डवेयर-प्रेरित विफलता होने की अधिक संभावना है; शोधकर्ताओं को रन के अंत तक मॉडल के अंतिम प्रदर्शन का पता नहीं चल सकता है, जिसमें कई महीने लग सकते हैं।

एक और समस्या यह है कि बड़े भाषा मॉडल भारी मात्रा में डेटा हड़प लेते हैं, और एआई मॉडल ने दुनिया में आसानी से उपलब्ध सभी डेटा को ख़त्म कर दिया है। बिजली की कमी ने भी प्रशिक्षण में बाधा उत्पन्न की है, क्योंकि इस प्रक्रिया के लिए भारी मात्रा में ऊर्जा की आवश्यकता होती है।

इन चुनौतियों पर काबू पाने के लिए, शोधकर्ता “परीक्षण-समय गणना” की खोज कर रहे हैं, एक ऐसी तकनीक जो तथाकथित “अनुमान” चरण के दौरान, या जब मॉडल का उपयोग किया जा रहा हो, मौजूदा एआई मॉडल को बढ़ाती है। उदाहरण के लिए, तुरंत एक ही उत्तर चुनने के बजाय, एक मॉडल वास्तविक समय में कई संभावनाओं को उत्पन्न और मूल्यांकन कर सकता है, अंततः आगे बढ़ने का सबसे अच्छा रास्ता चुन सकता है।

यह विधि मॉडलों को गणित या कोडिंग समस्याओं या जटिल संचालन जैसे चुनौतीपूर्ण कार्यों के लिए अधिक प्रसंस्करण शक्ति समर्पित करने की अनुमति देती है जो मानव-जैसे तर्क और निर्णय लेने की मांग करते हैं।

ओपनएआई में काम करने वाले एक शोधकर्ता नोम ब्राउन ने कहा, “यह पता चला कि पोकर के हाथ में एक बॉट को केवल 20 सेकंड के लिए सोचने से मॉडल को 100,000 गुना बढ़ाने और इसे 100,000 गुना लंबे समय तक प्रशिक्षित करने के समान ही प्रदर्शन में वृद्धि हुई।” पिछले महीने सैन फ्रांसिस्को में TED AI सम्मेलन में o1 पर।

OpenAI ने इस तकनीक को अपने नए जारी किए गए मॉडल “o1” में अपनाया है, जिसे पहले Q* और स्ट्रॉबेरी के नाम से जाना जाता था, जिसे रॉयटर्स ने पहली बार जुलाई में रिपोर्ट किया था। O1 मॉडल मानव तर्क के समान, बहु-चरणीय तरीके से समस्याओं के माध्यम से “सोच” सकता है। इसमें पीएचडी और उद्योग विशेषज्ञों से प्राप्त डेटा और फीडबैक का उपयोग भी शामिल है। O1 श्रृंखला का गुप्त सॉस GPT-4 जैसे 'बेस' मॉडल के शीर्ष पर किए गए प्रशिक्षण का एक और सेट है, और कंपनी का कहना है कि वह इस तकनीक को अधिक और बड़े बेस मॉडल के साथ लागू करने की योजना बना रही है।

साथ ही, प्रयासों से परिचित पांच लोगों के अनुसार, एंथ्रोपिक, एक्सएआई और Google डीपमाइंड के अन्य शीर्ष एआई प्रयोगशालाओं के शोधकर्ता भी तकनीक के अपने संस्करण विकसित करने के लिए काम कर रहे हैं।

अक्टूबर में एक तकनीकी सम्मेलन में ओपनएआई के मुख्य उत्पाद अधिकारी केविन वेइल ने कहा, “हमने बहुत सारे कम लटके हुए फल देखे हैं जिन्हें तोड़कर हम इन मॉडलों को बहुत जल्दी बेहतर बना सकते हैं।” 'हम कोशिश करेंगे और तीन कदम आगे बढ़ेंगे।'

Google और xAI ने टिप्पणी के अनुरोधों का जवाब नहीं दिया और एंथ्रोपिक ने तत्काल कोई टिप्पणी नहीं की।

निहितार्थ एआई हार्डवेयर के लिए प्रतिस्पर्धी परिदृश्य को बदल सकते हैं, इस प्रकार अब तक एनवीडिया के एआई चिप्स की अतृप्त मांग हावी है। सिकोइया से लेकर आंद्रेसेन होरोविट्ज़ तक के प्रमुख उद्यम पूंजी निवेशक, जिन्होंने ओपनएआई और एक्सएआई सहित कई एआई प्रयोगशालाओं में एआई मॉडल के महंगे विकास के लिए अरबों डॉलर खर्च किए हैं, परिवर्तन पर ध्यान दे रहे हैं और अपने महंगे दांवों पर प्रभाव का आकलन कर रहे हैं।

सिकोइया कैपिटल के एक पार्टनर सोन्या हुआंग ने रॉयटर्स को बताया, “यह बदलाव हमें बड़े पैमाने पर पूर्व-प्रशिक्षण समूहों की दुनिया से अनुमान बादलों की ओर ले जाएगा, जो अनुमान के लिए वितरित, क्लाउड-आधारित सर्वर हैं।”

एनवीडिया के एआई चिप्स की मांग, जो कि सबसे अत्याधुनिक है, ने अक्टूबर में ऐप्पल को पछाड़कर दुनिया की सबसे मूल्यवान कंपनी बनने में मदद की है। प्रशिक्षण चिप्स के विपरीत, जहां एनवीडिया हावी है, चिप दिग्गज को अनुमान बाजार में अधिक प्रतिस्पर्धा का सामना करना पड़ सकता है।

अपने उत्पादों की मांग पर संभावित प्रभाव के बारे में पूछे जाने पर, एनवीडिया ने ओ1 मॉडल के पीछे की तकनीक के महत्व पर कंपनी की हालिया प्रस्तुतियों की ओर इशारा किया। इसके सीईओ जेन्सेन हुआंग ने अनुमान के तौर पर इसके चिप्स के इस्तेमाल की मांग बढ़ने की बात कही है.

हुआंग ने पिछले महीने भारत में एक सम्मेलन में कहा, “हमने अब एक दूसरे स्केलिंग कानून की खोज की है, और यह अनुमान के समय स्केलिंग कानून है… इन सभी कारकों के कारण ब्लैकवेल की मांग अविश्वसनीय रूप से अधिक हो गई है।” कंपनी की नवीनतम AI चिप के लिए।

(यह कहानी News18 स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड समाचार एजेंसी फ़ीड – रॉयटर्स से प्रकाशित हुई है)

समाचार तकनीक ओपनएआई स्मार्ट एआई के लिए चैटजीपीटी से आगे की तलाश कर रहा है: लेकिन क्यों?
News India24

Recent Posts

अजित राइटर ने कहा, एक सीएम-दो डिप्टी सीएम पर बन सकती है बात – इंडिया टीवी हिंदी

छवि स्रोत: पीटीआई/फ़ाइल अजीतएवेटर ने जेटीथ को दिया समर्थन। मुंबई: महाराष्ट्र में सरकार बनाने की…

1 hour ago

केएल राहुल और अक्षर पटेल दोनों दिल्ली कैपिटल्स का नेतृत्व करेंगे: सह-मालिक पार्थ जिंदल

डीसी के सह-मालिक पार्थ जिंदल ने कहा कि केएल राहुल और अक्षर पटेल इंडियन प्रीमियर…

2 hours ago

मेटा ने ऑनलाइन घोटालों से जुड़े 2 मिलियन से अधिक खातों को हटा दिया – News18

आखरी अपडेट:25 नवंबर, 2024, 09:00 ISTमेटा उन ऑनलाइन घोटालों के मुद्दों पर कार्रवाई करना जारी…

2 hours ago

कई राज्यों में बारिश की आशंका, दिल्ली में धुंध ने पैदा की परेशानी; जानें सीज़न का हाल – इंडिया टीवी हिंदी

छवि स्रोत: प्रतिनिधि छवि कई राज्यों में बारिश की संभावना। मौसम अपडेट: भारत मौसम विज्ञान…

2 hours ago

'राक्षस जो महिलाओं का अपमान करता है': एमवीए के चुनाव में हार के बाद कंगना रनौत ने उद्धव ठाकरे की आलोचना की – News18

आखरी अपडेट:25 नवंबर, 2024, 08:26 ISTभाजपा सांसद कंगना रनौत ने उद्धव ठाकरे के खिलाफ तीखा…

2 hours ago

देखने योग्य स्टॉक: वेदांता, मारुति, एचडीएफसी बैंक, एचसीएल टेक, आरवीएनएल, ज़ोमैटो, और अन्य – News18

आखरी अपडेट:25 नवंबर, 2024, 08:03 ISTदेखने लायक स्टॉक: सोमवार के कारोबार में वेदांता, मारुति सुजुकी,…

3 hours ago