आखरी अपडेट:
(रायटर्स) – ओपनएआई जैसी कृत्रिम बुद्धिमत्ता कंपनियां प्रशिक्षण तकनीकों को विकसित करके बड़े भाषा मॉडल की खोज में अप्रत्याशित देरी और चुनौतियों को दूर करने की कोशिश कर रही हैं जो एल्गोरिदम के “सोचने” के लिए अधिक मानव-समान तरीकों का उपयोग करती हैं।
एक दर्जन एआई वैज्ञानिकों, शोधकर्ताओं और निवेशकों ने रॉयटर्स को बताया कि उनका मानना है कि ये तकनीकें, जो ओपनएआई के हाल ही में जारी ओ1 मॉडल के पीछे हैं, एआई हथियारों की दौड़ को नया आकार दे सकती हैं, और उन संसाधनों के प्रकार पर प्रभाव डाल सकती हैं जिनकी एआई कंपनियों की अतृप्त मांग है। चिप्स के प्रकार के लिए ऊर्जा.
ओपनएआई ने इस कहानी पर टिप्पणी करने से इनकार कर दिया। दो साल पहले वायरल चैटजीपीटी चैटबॉट के जारी होने के बाद, प्रौद्योगिकी कंपनियों, जिनके मूल्यांकन को एआई बूम से काफी फायदा हुआ है, ने सार्वजनिक रूप से कहा है कि अधिक डेटा और कंप्यूटिंग शक्ति जोड़कर मौजूदा मॉडलों को “स्केलिंग” करने से लगातार एआई मॉडल में सुधार होगा।
लेकिन अब, कुछ सबसे प्रमुख एआई वैज्ञानिक इस “बड़ा बेहतर है” दर्शन की सीमाओं पर बोल रहे हैं।
एआई लैब्स सेफ सुपरइंटेलिजेंस (एसएसआई) और ओपनएआई के सह-संस्थापक इल्या सुतस्केवर ने हाल ही में रॉयटर्स को बताया कि यह प्री-ट्रेनिंग को बढ़ाने का परिणाम है – एक एआई मॉडल के प्रशिक्षण का चरण जो भाषा पैटर्न और संरचनाओं को समझने के लिए बड़ी मात्रा में बिना लेबल वाले डेटा का उपयोग करता है। – स्थिर हो गए हैं।
प्री-ट्रेनिंग में अधिक डेटा और कंप्यूटिंग शक्ति के उपयोग के माध्यम से जेनेरिक एआई उन्नति में बड़े पैमाने पर छलांग लगाने के शुरुआती समर्थक के रूप में सुटस्केवर को व्यापक रूप से श्रेय दिया जाता है, जिसने अंततः चैटजीपीटी बनाया। सुतस्केवर ने एसएसआई की स्थापना के लिए इस साल की शुरुआत में ओपनएआई छोड़ दिया।
“2010 स्केलिंग का युग था, अब हम एक बार फिर आश्चर्य और खोज के युग में वापस आ गए हैं। हर कोई अगली चीज़ की तलाश में है,” सुतस्केवर ने कहा। “सही चीज़ को स्केल करना अब पहले से कहीं अधिक मायने रखता है।”
सुटस्केवर ने इस बारे में अधिक विवरण साझा करने से इनकार कर दिया कि उनकी टीम इस मुद्दे को कैसे संबोधित कर रही है, इसके अलावा यह कहा कि एसएसआई पूर्व-प्रशिक्षण को बढ़ाने के लिए एक वैकल्पिक दृष्टिकोण पर काम कर रहा है।
निजी मामलों से परिचित तीन सूत्रों के अनुसार, पर्दे के पीछे, प्रमुख एआई प्रयोगशालाओं के शोधकर्ता एक बड़े भाषा मॉडल को जारी करने की दौड़ में देरी और निराशाजनक परिणामों का सामना कर रहे हैं, जो ओपनएआई के जीपीटी -4 मॉडल से बेहतर प्रदर्शन करता है, जो लगभग दो साल पुराना है।
बड़े मॉडलों के लिए तथाकथित 'प्रशिक्षण रन' में एक साथ सैकड़ों चिप्स चलाने पर लाखों डॉलर खर्च हो सकते हैं। यह देखते हुए कि सिस्टम कितना जटिल है, उनमें हार्डवेयर-प्रेरित विफलता होने की अधिक संभावना है; शोधकर्ताओं को रन के अंत तक मॉडल के अंतिम प्रदर्शन का पता नहीं चल सकता है, जिसमें कई महीने लग सकते हैं।
एक और समस्या यह है कि बड़े भाषा मॉडल भारी मात्रा में डेटा हड़प लेते हैं, और एआई मॉडल ने दुनिया में आसानी से उपलब्ध सभी डेटा को ख़त्म कर दिया है। बिजली की कमी ने भी प्रशिक्षण में बाधा उत्पन्न की है, क्योंकि इस प्रक्रिया के लिए भारी मात्रा में ऊर्जा की आवश्यकता होती है।
इन चुनौतियों पर काबू पाने के लिए, शोधकर्ता “परीक्षण-समय गणना” की खोज कर रहे हैं, एक ऐसी तकनीक जो तथाकथित “अनुमान” चरण के दौरान, या जब मॉडल का उपयोग किया जा रहा हो, मौजूदा एआई मॉडल को बढ़ाती है। उदाहरण के लिए, तुरंत एक ही उत्तर चुनने के बजाय, एक मॉडल वास्तविक समय में कई संभावनाओं को उत्पन्न और मूल्यांकन कर सकता है, अंततः आगे बढ़ने का सबसे अच्छा रास्ता चुन सकता है।
यह विधि मॉडलों को गणित या कोडिंग समस्याओं या जटिल संचालन जैसे चुनौतीपूर्ण कार्यों के लिए अधिक प्रसंस्करण शक्ति समर्पित करने की अनुमति देती है जो मानव-जैसे तर्क और निर्णय लेने की मांग करते हैं।
ओपनएआई में काम करने वाले एक शोधकर्ता नोम ब्राउन ने कहा, “यह पता चला कि पोकर के हाथ में एक बॉट को केवल 20 सेकंड के लिए सोचने से मॉडल को 100,000 गुना बढ़ाने और इसे 100,000 गुना लंबे समय तक प्रशिक्षित करने के समान ही प्रदर्शन में वृद्धि हुई।” पिछले महीने सैन फ्रांसिस्को में TED AI सम्मेलन में o1 पर।
OpenAI ने इस तकनीक को अपने नए जारी किए गए मॉडल “o1” में अपनाया है, जिसे पहले Q* और स्ट्रॉबेरी के नाम से जाना जाता था, जिसे रॉयटर्स ने पहली बार जुलाई में रिपोर्ट किया था। O1 मॉडल मानव तर्क के समान, बहु-चरणीय तरीके से समस्याओं के माध्यम से “सोच” सकता है। इसमें पीएचडी और उद्योग विशेषज्ञों से प्राप्त डेटा और फीडबैक का उपयोग भी शामिल है। O1 श्रृंखला का गुप्त सॉस GPT-4 जैसे 'बेस' मॉडल के शीर्ष पर किए गए प्रशिक्षण का एक और सेट है, और कंपनी का कहना है कि वह इस तकनीक को अधिक और बड़े बेस मॉडल के साथ लागू करने की योजना बना रही है।
साथ ही, प्रयासों से परिचित पांच लोगों के अनुसार, एंथ्रोपिक, एक्सएआई और Google डीपमाइंड के अन्य शीर्ष एआई प्रयोगशालाओं के शोधकर्ता भी तकनीक के अपने संस्करण विकसित करने के लिए काम कर रहे हैं।
अक्टूबर में एक तकनीकी सम्मेलन में ओपनएआई के मुख्य उत्पाद अधिकारी केविन वेइल ने कहा, “हमने बहुत सारे कम लटके हुए फल देखे हैं जिन्हें तोड़कर हम इन मॉडलों को बहुत जल्दी बेहतर बना सकते हैं।” 'हम कोशिश करेंगे और तीन कदम आगे बढ़ेंगे।'
Google और xAI ने टिप्पणी के अनुरोधों का जवाब नहीं दिया और एंथ्रोपिक ने तत्काल कोई टिप्पणी नहीं की।
निहितार्थ एआई हार्डवेयर के लिए प्रतिस्पर्धी परिदृश्य को बदल सकते हैं, इस प्रकार अब तक एनवीडिया के एआई चिप्स की अतृप्त मांग हावी है। सिकोइया से लेकर आंद्रेसेन होरोविट्ज़ तक के प्रमुख उद्यम पूंजी निवेशक, जिन्होंने ओपनएआई और एक्सएआई सहित कई एआई प्रयोगशालाओं में एआई मॉडल के महंगे विकास के लिए अरबों डॉलर खर्च किए हैं, परिवर्तन पर ध्यान दे रहे हैं और अपने महंगे दांवों पर प्रभाव का आकलन कर रहे हैं।
सिकोइया कैपिटल के एक पार्टनर सोन्या हुआंग ने रॉयटर्स को बताया, “यह बदलाव हमें बड़े पैमाने पर पूर्व-प्रशिक्षण समूहों की दुनिया से अनुमान बादलों की ओर ले जाएगा, जो अनुमान के लिए वितरित, क्लाउड-आधारित सर्वर हैं।”
एनवीडिया के एआई चिप्स की मांग, जो कि सबसे अत्याधुनिक है, ने अक्टूबर में ऐप्पल को पछाड़कर दुनिया की सबसे मूल्यवान कंपनी बनने में मदद की है। प्रशिक्षण चिप्स के विपरीत, जहां एनवीडिया हावी है, चिप दिग्गज को अनुमान बाजार में अधिक प्रतिस्पर्धा का सामना करना पड़ सकता है।
अपने उत्पादों की मांग पर संभावित प्रभाव के बारे में पूछे जाने पर, एनवीडिया ने ओ1 मॉडल के पीछे की तकनीक के महत्व पर कंपनी की हालिया प्रस्तुतियों की ओर इशारा किया। इसके सीईओ जेन्सेन हुआंग ने अनुमान के तौर पर इसके चिप्स के इस्तेमाल की मांग बढ़ने की बात कही है.
हुआंग ने पिछले महीने भारत में एक सम्मेलन में कहा, “हमने अब एक दूसरे स्केलिंग कानून की खोज की है, और यह अनुमान के समय स्केलिंग कानून है… इन सभी कारकों के कारण ब्लैकवेल की मांग अविश्वसनीय रूप से अधिक हो गई है।” कंपनी की नवीनतम AI चिप के लिए।
(यह कहानी News18 स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड समाचार एजेंसी फ़ीड – रॉयटर्स से प्रकाशित हुई है)
आखरी अपडेट:14 नवंबर, 2024, 00:02 ISTनोएडा इंडोर स्टेडियम में खेले जाने वाले तमिल थलाइवाज और…
छवि स्रोत: गेट्टी 13 नवंबर, 2024 को सेंचुरियन में दक्षिण अफ्रीका के खिलाफ जश्न मनाते…
नागपुर: उप मुख्यमंत्री देवेन्द्र फड़णवीस ने राज्य के पूर्व गृह मंत्री अनिल देशमुख के क्लीन…
महाराष्ट्र विधानसभा चुनाव: महाराष्ट्र विधानसभा चुनाव से पहले अपने चुनाव प्रचार अभियान को तेज करते…
छवि स्रोत: सोशल मीडिया बर्फ पर बहता लावा प्रकृति हमें हमेशा आश्चर्यचकित कर देती है।…
छवि स्रोत: सोशल मीडिया लड़की को प्रस्तावक उसका दोस्त बनाता है प्रमोशनल के लाखों वीडियो…