ओपनएआई स्मार्ट एआई के लिए चैटजीपीटी से आगे की तलाश कर रहा है: लेकिन क्यों? -न्यूज़18


आखरी अपडेट:

ओपनएआई जैसी कृत्रिम बुद्धिमत्ता कंपनियां प्रशिक्षण तकनीकों को विकसित करके बड़े भाषा मॉडल की खोज में अप्रत्याशित देरी और चुनौतियों को दूर करने की कोशिश कर रही हैं जो एल्गोरिदम के “सोचने” के लिए अधिक मानवीय तरीकों का उपयोग करती हैं।

क्या OpenAI वास्तव में ChatGPT से आगे निकल सकता है और अन्य स्मार्ट मॉडलों पर ध्यान केंद्रित कर सकता है?

(रायटर्स) – ओपनएआई जैसी कृत्रिम बुद्धिमत्ता कंपनियां प्रशिक्षण तकनीकों को विकसित करके बड़े भाषा मॉडल की खोज में अप्रत्याशित देरी और चुनौतियों को दूर करने की कोशिश कर रही हैं जो एल्गोरिदम के “सोचने” के लिए अधिक मानव-समान तरीकों का उपयोग करती हैं।

एक दर्जन एआई वैज्ञानिकों, शोधकर्ताओं और निवेशकों ने रॉयटर्स को बताया कि उनका मानना ​​​​है कि ये तकनीकें, जो ओपनएआई के हाल ही में जारी ओ1 मॉडल के पीछे हैं, एआई हथियारों की दौड़ को नया आकार दे सकती हैं, और उन संसाधनों के प्रकार पर प्रभाव डाल सकती हैं जिनकी एआई कंपनियों की अतृप्त मांग है। चिप्स के प्रकार के लिए ऊर्जा.

ओपनएआई ने इस कहानी पर टिप्पणी करने से इनकार कर दिया। दो साल पहले वायरल चैटजीपीटी चैटबॉट के जारी होने के बाद, प्रौद्योगिकी कंपनियों, जिनके मूल्यांकन को एआई बूम से काफी फायदा हुआ है, ने सार्वजनिक रूप से कहा है कि अधिक डेटा और कंप्यूटिंग शक्ति जोड़कर मौजूदा मॉडलों को “स्केलिंग” करने से लगातार एआई मॉडल में सुधार होगा।

लेकिन अब, कुछ सबसे प्रमुख एआई वैज्ञानिक इस “बड़ा बेहतर है” दर्शन की सीमाओं पर बोल रहे हैं।

एआई लैब्स सेफ सुपरइंटेलिजेंस (एसएसआई) और ओपनएआई के सह-संस्थापक इल्या सुतस्केवर ने हाल ही में रॉयटर्स को बताया कि यह प्री-ट्रेनिंग को बढ़ाने का परिणाम है – एक एआई मॉडल के प्रशिक्षण का चरण जो भाषा पैटर्न और संरचनाओं को समझने के लिए बड़ी मात्रा में बिना लेबल वाले डेटा का उपयोग करता है। – स्थिर हो गए हैं।

प्री-ट्रेनिंग में अधिक डेटा और कंप्यूटिंग शक्ति के उपयोग के माध्यम से जेनेरिक एआई उन्नति में बड़े पैमाने पर छलांग लगाने के शुरुआती समर्थक के रूप में सुटस्केवर को व्यापक रूप से श्रेय दिया जाता है, जिसने अंततः चैटजीपीटी बनाया। सुतस्केवर ने एसएसआई की स्थापना के लिए इस साल की शुरुआत में ओपनएआई छोड़ दिया।

“2010 स्केलिंग का युग था, अब हम एक बार फिर आश्चर्य और खोज के युग में वापस आ गए हैं। हर कोई अगली चीज़ की तलाश में है,” सुतस्केवर ने कहा। “सही चीज़ को स्केल करना अब पहले से कहीं अधिक मायने रखता है।”

सुटस्केवर ने इस बारे में अधिक विवरण साझा करने से इनकार कर दिया कि उनकी टीम इस मुद्दे को कैसे संबोधित कर रही है, इसके अलावा यह कहा कि एसएसआई पूर्व-प्रशिक्षण को बढ़ाने के लिए एक वैकल्पिक दृष्टिकोण पर काम कर रहा है।

निजी मामलों से परिचित तीन सूत्रों के अनुसार, पर्दे के पीछे, प्रमुख एआई प्रयोगशालाओं के शोधकर्ता एक बड़े भाषा मॉडल को जारी करने की दौड़ में देरी और निराशाजनक परिणामों का सामना कर रहे हैं, जो ओपनएआई के जीपीटी -4 मॉडल से बेहतर प्रदर्शन करता है, जो लगभग दो साल पुराना है।

बड़े मॉडलों के लिए तथाकथित 'प्रशिक्षण रन' में एक साथ सैकड़ों चिप्स चलाने पर लाखों डॉलर खर्च हो सकते हैं। यह देखते हुए कि सिस्टम कितना जटिल है, उनमें हार्डवेयर-प्रेरित विफलता होने की अधिक संभावना है; शोधकर्ताओं को रन के अंत तक मॉडल के अंतिम प्रदर्शन का पता नहीं चल सकता है, जिसमें कई महीने लग सकते हैं।

एक और समस्या यह है कि बड़े भाषा मॉडल भारी मात्रा में डेटा हड़प लेते हैं, और एआई मॉडल ने दुनिया में आसानी से उपलब्ध सभी डेटा को ख़त्म कर दिया है। बिजली की कमी ने भी प्रशिक्षण में बाधा उत्पन्न की है, क्योंकि इस प्रक्रिया के लिए भारी मात्रा में ऊर्जा की आवश्यकता होती है।

इन चुनौतियों पर काबू पाने के लिए, शोधकर्ता “परीक्षण-समय गणना” की खोज कर रहे हैं, एक ऐसी तकनीक जो तथाकथित “अनुमान” चरण के दौरान, या जब मॉडल का उपयोग किया जा रहा हो, मौजूदा एआई मॉडल को बढ़ाती है। उदाहरण के लिए, तुरंत एक ही उत्तर चुनने के बजाय, एक मॉडल वास्तविक समय में कई संभावनाओं को उत्पन्न और मूल्यांकन कर सकता है, अंततः आगे बढ़ने का सबसे अच्छा रास्ता चुन सकता है।

यह विधि मॉडलों को गणित या कोडिंग समस्याओं या जटिल संचालन जैसे चुनौतीपूर्ण कार्यों के लिए अधिक प्रसंस्करण शक्ति समर्पित करने की अनुमति देती है जो मानव-जैसे तर्क और निर्णय लेने की मांग करते हैं।

ओपनएआई में काम करने वाले एक शोधकर्ता नोम ब्राउन ने कहा, “यह पता चला कि पोकर के हाथ में एक बॉट को केवल 20 सेकंड के लिए सोचने से मॉडल को 100,000 गुना बढ़ाने और इसे 100,000 गुना लंबे समय तक प्रशिक्षित करने के समान ही प्रदर्शन में वृद्धि हुई।” पिछले महीने सैन फ्रांसिस्को में TED AI सम्मेलन में o1 पर।

OpenAI ने इस तकनीक को अपने नए जारी किए गए मॉडल “o1” में अपनाया है, जिसे पहले Q* और स्ट्रॉबेरी के नाम से जाना जाता था, जिसे रॉयटर्स ने पहली बार जुलाई में रिपोर्ट किया था। O1 मॉडल मानव तर्क के समान, बहु-चरणीय तरीके से समस्याओं के माध्यम से “सोच” सकता है। इसमें पीएचडी और उद्योग विशेषज्ञों से प्राप्त डेटा और फीडबैक का उपयोग भी शामिल है। O1 श्रृंखला का गुप्त सॉस GPT-4 जैसे 'बेस' मॉडल के शीर्ष पर किए गए प्रशिक्षण का एक और सेट है, और कंपनी का कहना है कि वह इस तकनीक को अधिक और बड़े बेस मॉडल के साथ लागू करने की योजना बना रही है।

साथ ही, प्रयासों से परिचित पांच लोगों के अनुसार, एंथ्रोपिक, एक्सएआई और Google डीपमाइंड के अन्य शीर्ष एआई प्रयोगशालाओं के शोधकर्ता भी तकनीक के अपने संस्करण विकसित करने के लिए काम कर रहे हैं।

अक्टूबर में एक तकनीकी सम्मेलन में ओपनएआई के मुख्य उत्पाद अधिकारी केविन वेइल ने कहा, “हमने बहुत सारे कम लटके हुए फल देखे हैं जिन्हें तोड़कर हम इन मॉडलों को बहुत जल्दी बेहतर बना सकते हैं।” 'हम कोशिश करेंगे और तीन कदम आगे बढ़ेंगे।'

Google और xAI ने टिप्पणी के अनुरोधों का जवाब नहीं दिया और एंथ्रोपिक ने तत्काल कोई टिप्पणी नहीं की।

निहितार्थ एआई हार्डवेयर के लिए प्रतिस्पर्धी परिदृश्य को बदल सकते हैं, इस प्रकार अब तक एनवीडिया के एआई चिप्स की अतृप्त मांग हावी है। सिकोइया से लेकर आंद्रेसेन होरोविट्ज़ तक के प्रमुख उद्यम पूंजी निवेशक, जिन्होंने ओपनएआई और एक्सएआई सहित कई एआई प्रयोगशालाओं में एआई मॉडल के महंगे विकास के लिए अरबों डॉलर खर्च किए हैं, परिवर्तन पर ध्यान दे रहे हैं और अपने महंगे दांवों पर प्रभाव का आकलन कर रहे हैं।

सिकोइया कैपिटल के एक पार्टनर सोन्या हुआंग ने रॉयटर्स को बताया, “यह बदलाव हमें बड़े पैमाने पर पूर्व-प्रशिक्षण समूहों की दुनिया से अनुमान बादलों की ओर ले जाएगा, जो अनुमान के लिए वितरित, क्लाउड-आधारित सर्वर हैं।”

एनवीडिया के एआई चिप्स की मांग, जो कि सबसे अत्याधुनिक है, ने अक्टूबर में ऐप्पल को पछाड़कर दुनिया की सबसे मूल्यवान कंपनी बनने में मदद की है। प्रशिक्षण चिप्स के विपरीत, जहां एनवीडिया हावी है, चिप दिग्गज को अनुमान बाजार में अधिक प्रतिस्पर्धा का सामना करना पड़ सकता है।

अपने उत्पादों की मांग पर संभावित प्रभाव के बारे में पूछे जाने पर, एनवीडिया ने ओ1 मॉडल के पीछे की तकनीक के महत्व पर कंपनी की हालिया प्रस्तुतियों की ओर इशारा किया। इसके सीईओ जेन्सेन हुआंग ने अनुमान के तौर पर इसके चिप्स के इस्तेमाल की मांग बढ़ने की बात कही है.

हुआंग ने पिछले महीने भारत में एक सम्मेलन में कहा, “हमने अब एक दूसरे स्केलिंग कानून की खोज की है, और यह अनुमान के समय स्केलिंग कानून है… इन सभी कारकों के कारण ब्लैकवेल की मांग अविश्वसनीय रूप से अधिक हो गई है।” कंपनी की नवीनतम AI चिप के लिए।

(यह कहानी News18 स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड समाचार एजेंसी फ़ीड – रॉयटर्स से प्रकाशित हुई है)

समाचार तकनीक ओपनएआई स्मार्ट एआई के लिए चैटजीपीटी से आगे की तलाश कर रहा है: लेकिन क्यों?
News India24

Recent Posts

IND vs SA, तीसरा T20I: भारत ने मार्को जानसन के डर से जीत हासिल कर सीरीज में 2-1 से अजेय बढ़त बनाई

छवि स्रोत: गेट्टी 13 नवंबर, 2024 को सेंचुरियन में दक्षिण अफ्रीका के खिलाफ जश्न मनाते…

3 hours ago

100 करोड़ की रंगदारी मामले में अनिल देशमुख को क्लीन चिट देने से देवेंद्र फड़णवीस का इनकार | – टाइम्स ऑफ इंडिया

नागपुर: उप मुख्यमंत्री देवेन्द्र फड़णवीस ने राज्य के पूर्व गृह मंत्री अनिल देशमुख के क्लीन…

3 hours ago

भले ही इंदिरा गांधी लौटें…: अमित शाह ने अनुच्छेद 370 पर महाराष्ट्र में कांग्रेस पर हमला बोला

महाराष्ट्र विधानसभा चुनाव: महाराष्ट्र विधानसभा चुनाव से पहले अपने चुनाव प्रचार अभियान को तेज करते…

4 hours ago

बर्फ पर पिघलता आग! आइसलैंड में फते स्टार का वीडियो देख लोग दंग रह गए लोग – इंडिया टीवी हिंदी

छवि स्रोत: सोशल मीडिया बर्फ पर बहता लावा प्रकृति हमें हमेशा आश्चर्यचकित कर देती है।…

4 hours ago

नजर से नहीं देख पाएंगे लड़की, दोस्त ने खास अंदाज में की शादी के लिए प्रपोज – इंडिया टीवी हिंदी

छवि स्रोत: सोशल मीडिया लड़की को प्रस्तावक उसका दोस्त बनाता है प्रमोशनल के लाखों वीडियो…

4 hours ago