भारत में सर्वम एआई विशेषताएं: भारत की संप्रभु एआई यात्रा अब केवल बड़ी वैश्विक कंपनियों के यहां कार्यालय या डेटा केंद्र खोलने तक सीमित नहीं रह गई है। ऐसे समय में जब ऐसा लग रहा था कि भारत अभी भी OpenAI और Google जैसी कंपनियों से पीछे है, बेंगलुरु स्थित एक स्टार्टअप ने सभी को चौंका दिया। सर्वम एआई नामक स्टार्टअप ने विशेष रूप से भारतीय उपयोगकर्ताओं के लिए बनाए गए नए घरेलू एआई मॉडल बनाकर भारत की प्रौद्योगिकी कहानी में एक नया और महत्वपूर्ण कदम उठाया है।
बेंगलुरु स्थित स्टार्टअप, सर्वम एआई ने दो नए एआई मॉडल, बुलबुल वी3 और सर्वम विजन पेश किए हैं। जो बात इस विकास को विशेष बनाती है वह यह है कि इन मॉडलों ने छवियों से पाठ को पढ़ने और समझने जैसे कार्यों में चैटजीपीटी और गूगल जेमिनी जैसे लोकप्रिय टूल से बेहतर प्रदर्शन किया है, एक प्रक्रिया जिसे ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) के रूप में जाना जाता है। यह उपलब्धि इस बात पर प्रकाश डालती है कि भारत अब अपने दम पर मजबूत और उन्नत एआई समाधान विकसित कर रहा है।
ड्रॉप 6/14: @सर्वमएआई ओडिशा और तमिलनाडु सरकारों के साथ रणनीतिक साझेदारी के माध्यम से भारत की संप्रभु एआई यात्रा में एक ऐतिहासिक उपलब्धि की घोषणा करते हुए गर्व महसूस हो रहा है। इन साझेदारियों का उद्देश्य बड़े पैमाने पर गणना, संप्रभु मॉडल और… का निर्माण करके परिवर्तन लाना है। pic.twitter.com/Scx9mK6CPw– प्रत्यूष कुमार (@pratykumar) 9 फ़रवरी 2026
ज़ी न्यूज़ को पसंदीदा स्रोत के रूप में जोड़ें
लंबे समय से, तकनीकी जगत में एआई के बड़े भाषा मॉडल (एलएलएम) पर चर्चा में अमेरिका और चीन का दबदबा रहा है। भारत के विशाल प्रतिभा पूल और विशाल एआई बाजार के बावजूद, स्थानीय रूप से विकसित एआई मॉडल की अनुपस्थिति ने वैश्विक एआई दौड़ में देश की स्थिति के बारे में अक्सर सवाल उठाए हैं।
सर्वम एआई ने चैटजीपीटी, जेमिनी 3 प्रो और डीपसीक को हराया
सर्वम एआई ने हाल ही में प्रमुख बेंचमार्क में कई अग्रणी वैश्विक एआई मॉडल की तुलना में मजबूत परिणाम देने के लिए ध्यान आकर्षित किया है। इसके ओसीआर समाधान, सर्वम विजन ने चैटजीपीटी, जेमिनी 3 प्रो और डीपसीक ओसीआर वी2 जैसे प्रसिद्ध टूल से बेहतर प्रदर्शन करते हुए 84.3 प्रतिशत की सटीकता के साथ ओएलएमओसीआर-बेंच पर शीर्ष स्थान हासिल किया।
मॉडल ने ओमनीडॉकबेंच v1.5 पर 93.28 प्रतिशत का उच्च स्कोर भी हासिल किया, जो जटिल पेज लेआउट, तकनीकी तालिकाओं और गणितीय समीकरणों को सटीक रूप से संभालने की अपनी क्षमता दिखाता है। ये ऐसे क्षेत्र हैं जो अक्सर पारंपरिक ओसीआर प्रणालियों को चुनौती देते हैं। इसके अलावा, सर्वम एआई कई भाषाओं में स्कैन किए गए दस्तावेज़, फॉर्म और सामग्री सहित रोजमर्रा के कार्यों के लिए विश्वसनीय साबित हुआ है।
बुलबुल V3 की विशेषताएं
बुलबुल V3, सर्वम एआई का टेक्स्ट-टू-स्पीच मॉडल, 22 आधिकारिक भारतीय भाषाओं से ली गई 35 अलग-अलग आवाज़ों का समर्थन करता है, जो 1800 के दशक से लेकर आज तक की सामग्री को कवर करता है। इसे विभिन्न स्कैन गुणों और विभिन्न प्रकार की सामग्री को सटीकता के साथ संभालने के लिए डिज़ाइन किया गया है। श्रृंखला में एक 3बी-पैरामीटर राज्य-अंतरिक्ष दृष्टि-भाषा मॉडल भी शामिल है जो छवि कैप्शनिंग, दृश्य पाठ पहचान, चार्ट विश्लेषण और जटिल तालिकाओं की व्याख्या जैसे उन्नत दृश्य समझ कार्य कर सकता है।
ड्रॉप 5/14: हमारे नवीनतम टेक्स्ट-टू-स्पीच मॉडल, बुलबुल वी3 का परिचय। अत्यधिक मजबूत होने के साथ-साथ यह सुनने में कितना मानवीय लगता है, इसका स्तर ऊंचा उठाता है।
एक स्वतंत्र तृतीय-पक्ष मानव श्रवण अध्ययन में, बुलबुल V3 उच्चतम श्रोता प्राथमिकता और उपयोग-मामलों में कम त्रुटि दर प्रदान करता है… pic.twitter.com/w7HThWzuKe– प्रत्यूष कुमार (@pratykumar) 7 फ़रवरी 2026
सर्वम विजन और बुलबुल V3: यह कैसे काम करता है
सर्वम विज़न को भारत के पहले एआई मॉडल के रूप में डिज़ाइन किया गया है जो देश की व्यापक सांस्कृतिक और भाषा विविधता को समझता है। इसका लक्ष्य भारत के भीतर विकसित एक मजबूत एआई फाउंडेशन का निर्माण करना है, जिससे यह सरकारी परियोजनाओं, सार्वजनिक बुनियादी ढांचे और बीएफएसआई क्षेत्र में उपयोग के लिए एक आशाजनक विकल्प बन सके।
हमने बोलने की संख्या, तकनीकी सामग्री और नामित इकाइयों जैसी भाषा संबंधी चुनौतियों का भी मूल्यांकन किया। बुलबुल V3 में लगातार सभी भाषाओं में त्रुटि दर सबसे कम है। pic.twitter.com/1COxQU80J7– प्रत्यूष कुमार (@pratykumar) 7 फ़रवरी 2026
इस बीच, बुलबुल वी3 सर्वम एआई का प्रमुख टेक्स्ट-टू-स्पीच मॉडल है, जिसे भारत की समृद्ध और जटिल भाषा विविधता को संभालने के लिए बनाया गया है। यह कई भारतीय भाषाओं में प्राकृतिक, उपयोग के लिए तैयार एआई आवाजें तैयार करने की दिशा में एक बड़ा कदम है।
इसकी असाधारण विशेषताओं में से एक इसकी सहज भाषा स्विचिंग है, जो इसे तमिल और अंग्रेजी या हिंदी और अंग्रेजी जैसी भाषाओं के बीच बिना किसी व्यवधान के आसानी से स्थानांतरित करने की अनुमति देती है। वर्तमान में, बुलबुल V3 35 से अधिक आवाज़ों के साथ 11 भारतीय भाषाओं का समर्थन करता है, और सर्वम एआई भविष्य में 22 और भारतीय भाषाओं को जोड़ने की योजना बना रहा है।
