19.1 C
New Delhi
Thursday, March 19, 2026

Subscribe

Latest Posts

भारत का पहला घरेलू ‘सॉवरेन’ एआई मॉडल: कैसे सर्वम एआई चैटजीपीटी, डीपसीक और गूगल जेमिनी को मात दे रहा है; सुविधाओं की जाँच करें


भारत में सर्वम एआई विशेषताएं: भारत की संप्रभु एआई यात्रा अब केवल बड़ी वैश्विक कंपनियों के यहां कार्यालय या डेटा केंद्र खोलने तक सीमित नहीं रह गई है। ऐसे समय में जब ऐसा लग रहा था कि भारत अभी भी OpenAI और Google जैसी कंपनियों से पीछे है, बेंगलुरु स्थित एक स्टार्टअप ने सभी को चौंका दिया। सर्वम एआई नामक स्टार्टअप ने विशेष रूप से भारतीय उपयोगकर्ताओं के लिए बनाए गए नए घरेलू एआई मॉडल बनाकर भारत की प्रौद्योगिकी कहानी में एक नया और महत्वपूर्ण कदम उठाया है।

बेंगलुरु स्थित स्टार्टअप, सर्वम एआई ने दो नए एआई मॉडल, बुलबुल वी3 और सर्वम विजन पेश किए हैं। जो बात इस विकास को विशेष बनाती है वह यह है कि इन मॉडलों ने छवियों से पाठ को पढ़ने और समझने जैसे कार्यों में चैटजीपीटी और गूगल जेमिनी जैसे लोकप्रिय टूल से बेहतर प्रदर्शन किया है, एक प्रक्रिया जिसे ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) के रूप में जाना जाता है। यह उपलब्धि इस बात पर प्रकाश डालती है कि भारत अब अपने दम पर मजबूत और उन्नत एआई समाधान विकसित कर रहा है।

ज़ी न्यूज़ को पसंदीदा स्रोत के रूप में जोड़ें

लंबे समय से, तकनीकी जगत में एआई के बड़े भाषा मॉडल (एलएलएम) पर चर्चा में अमेरिका और चीन का दबदबा रहा है। भारत के विशाल प्रतिभा पूल और विशाल एआई बाजार के बावजूद, स्थानीय रूप से विकसित एआई मॉडल की अनुपस्थिति ने वैश्विक एआई दौड़ में देश की स्थिति के बारे में अक्सर सवाल उठाए हैं।

सर्वम एआई ने चैटजीपीटी, जेमिनी 3 प्रो और डीपसीक को हराया

सर्वम एआई ने हाल ही में प्रमुख बेंचमार्क में कई अग्रणी वैश्विक एआई मॉडल की तुलना में मजबूत परिणाम देने के लिए ध्यान आकर्षित किया है। इसके ओसीआर समाधान, सर्वम विजन ने चैटजीपीटी, जेमिनी 3 प्रो और डीपसीक ओसीआर वी2 जैसे प्रसिद्ध टूल से बेहतर प्रदर्शन करते हुए 84.3 प्रतिशत की सटीकता के साथ ओएलएमओसीआर-बेंच पर शीर्ष स्थान हासिल किया।

मॉडल ने ओमनीडॉकबेंच v1.5 पर 93.28 प्रतिशत का उच्च स्कोर भी हासिल किया, जो जटिल पेज लेआउट, तकनीकी तालिकाओं और गणितीय समीकरणों को सटीक रूप से संभालने की अपनी क्षमता दिखाता है। ये ऐसे क्षेत्र हैं जो अक्सर पारंपरिक ओसीआर प्रणालियों को चुनौती देते हैं। इसके अलावा, सर्वम एआई कई भाषाओं में स्कैन किए गए दस्तावेज़, फॉर्म और सामग्री सहित रोजमर्रा के कार्यों के लिए विश्वसनीय साबित हुआ है।

बुलबुल V3 की विशेषताएं

बुलबुल V3, सर्वम एआई का टेक्स्ट-टू-स्पीच मॉडल, 22 आधिकारिक भारतीय भाषाओं से ली गई 35 अलग-अलग आवाज़ों का समर्थन करता है, जो 1800 के दशक से लेकर आज तक की सामग्री को कवर करता है। इसे विभिन्न स्कैन गुणों और विभिन्न प्रकार की सामग्री को सटीकता के साथ संभालने के लिए डिज़ाइन किया गया है। श्रृंखला में एक 3बी-पैरामीटर राज्य-अंतरिक्ष दृष्टि-भाषा मॉडल भी शामिल है जो छवि कैप्शनिंग, दृश्य पाठ पहचान, चार्ट विश्लेषण और जटिल तालिकाओं की व्याख्या जैसे उन्नत दृश्य समझ कार्य कर सकता है।

सर्वम विजन और बुलबुल V3: यह कैसे काम करता है

सर्वम विज़न को भारत के पहले एआई मॉडल के रूप में डिज़ाइन किया गया है जो देश की व्यापक सांस्कृतिक और भाषा विविधता को समझता है। इसका लक्ष्य भारत के भीतर विकसित एक मजबूत एआई फाउंडेशन का निर्माण करना है, जिससे यह सरकारी परियोजनाओं, सार्वजनिक बुनियादी ढांचे और बीएफएसआई क्षेत्र में उपयोग के लिए एक आशाजनक विकल्प बन सके।

इस बीच, बुलबुल वी3 सर्वम एआई का प्रमुख टेक्स्ट-टू-स्पीच मॉडल है, जिसे भारत की समृद्ध और जटिल भाषा विविधता को संभालने के लिए बनाया गया है। यह कई भारतीय भाषाओं में प्राकृतिक, उपयोग के लिए तैयार एआई आवाजें तैयार करने की दिशा में एक बड़ा कदम है।

इसकी असाधारण विशेषताओं में से एक इसकी सहज भाषा स्विचिंग है, जो इसे तमिल और अंग्रेजी या हिंदी और अंग्रेजी जैसी भाषाओं के बीच बिना किसी व्यवधान के आसानी से स्थानांतरित करने की अनुमति देती है। वर्तमान में, बुलबुल V3 35 से अधिक आवाज़ों के साथ 11 भारतीय भाषाओं का समर्थन करता है, और सर्वम एआई भविष्य में 22 और भारतीय भाषाओं को जोड़ने की योजना बना रहा है।



Latest Posts

Subscribe

Don't Miss