ओपन एआई ने कई प्रमुख क्षेत्रों में बड़े सुधारों के साथ चैटजीपीटी-5.2 पेश किया है। नया संस्करण स्प्रेडशीट बनाने, प्रस्तुतियाँ बनाने, कोड लिखने, छवियों का विश्लेषण करने और लंबे या जटिल कार्यों को प्रबंधित करने में बेहतर प्रदर्शन करता है। यह उन्नत टूल-उपयोग क्षमताओं के साथ बहु-चरणीय परियोजनाओं को अधिक कुशलता से संभाल सकता है।
OpenAI के अनुसार, GPT-5.2 ने कई बेंचमार्क परीक्षणों में मजबूत प्रदर्शन दर्ज किया है। जीडीपीवल मूल्यांकन पर, मॉडल ने 44 व्यवसायों को कवर करने वाले अच्छी तरह से परिभाषित ज्ञान-आधारित कार्यों में मानव पेशेवरों की तुलना में अधिक स्कोर किया।
GPT-5.2 थिंकिंग मॉडल ने जीडीपीवल पर एक नया अत्याधुनिक स्कोर हासिल किया, यह 44 व्यवसायों में अच्छी तरह से परिभाषित ज्ञान कार्य कार्यों पर प्रदर्शन को मापता है। ओपनएआई के अनुसार, मॉडल 70.9% तुलनाओं में शीर्ष उद्योग पेशेवरों को मात देता है या उनसे मेल खाता है।
ज़ी न्यूज़ को पसंदीदा स्रोत के रूप में जोड़ें
इन कार्यों में प्रस्तुतियाँ बनाना, स्प्रेडशीट बनाना और अन्य कार्य-संबंधित आउटपुट तैयार करना शामिल है। ऐतिहासिक डेटा के आधार पर, मॉडल ने कार्यों को 11 गुना से अधिक तेजी से और मानव विशेषज्ञों की लागत के 1% से भी कम पर पूरा किया।
कोडिंग उन्नयन
GPT-5.2 सॉफ्टवेयर विकास में भी मजबूत सुधार दिखाता है। एसडब्ल्यूई-बेंच प्रो पर, चार प्रोग्रामिंग भाषाओं को कवर करने वाला एक चुनौतीपूर्ण मूल्यांकन, जीपीटी-5.2 थिंकिंग ने 55.6% हासिल किया, जिससे एक नया अत्याधुनिक परिणाम सामने आया। चैटजीपीटी के इस संस्करण को पहले के परीक्षणों की तुलना में अधिक मजबूत माना जाता है, जो वास्तविक दुनिया के कोडिंग परिदृश्यों के लिए उपलब्धि को उल्लेखनीय बनाता है।
कॉग्निशन, वार्प, चार्ली लैब्स, जेटब्रेन और ऑगमेंट कोड जैसी कंपनियों के फीडबैक में, GPT-5.2 ने इंटरैक्टिव कोडिंग, कोड समीक्षा और बग डिटेक्शन में सुधार के साथ उन्नत एजेंटिक कोडिंग क्षमता का प्रदर्शन किया।
(यह भी पढ़ें: द गेम अवार्ड्स 2025: क्लेयर ऑब्स्क्यूर: एक्सपीडिशन 33 कई जीतों के साथ हावी है)
बेहतर सटीकता और कम मतिभ्रम
OpenAI का दावा है कि GPT-5.2 थिंकिंग अपने पूर्ववर्ती की तुलना में काफी कम मतिभ्रम करती है। जब डी-आइडेंटिफाइड चैटजीपीटी प्रश्नों पर परीक्षण किया गया, तो गलत प्रतिक्रियाएँ 30% कम आम थीं, जो तथ्यात्मक विश्वसनीयता में सुधार को दर्शाती हैं।
दीर्घ-संदर्भ समझ
मॉडल लंबे-संदर्भ तर्क में नए प्रदर्शन रिकॉर्ड भी स्थापित करता है। यह OpenAI MRCRv2 पर स्कोर का नेतृत्व करता है, यह मापता है कि एक मॉडल कितनी अच्छी तरह से लंबे दस्तावेज़ों में रखी गई जानकारी को समझ सकता है और कनेक्ट कर सकता है।
ज़ूम, डेटाब्रिक्स, हेक्स और ट्रिपल व्हेल जैसी कंपनियों ने यह भी देखा कि GPT-5.2 अत्याधुनिक क्षमता के साथ लंबे-क्षितिज तर्क और टूल-कॉलिंग कार्यों को संभालता है।
