भारत में सर्वम एआई विशेषताएं: भारत की संप्रभु एआई यात्रा अब केवल बड़ी वैश्विक कंपनियों के यहां कार्यालय या डेटा केंद्र खोलने तक सीमित नहीं रह गई है। ऐसे समय में जब ऐसा लग रहा था कि भारत अभी भी OpenAI और Google जैसी कंपनियों से पीछे है, बेंगलुरु स्थित एक स्टार्टअप ने सभी को चौंका दिया। सर्वम एआई नामक स्टार्टअप ने विशेष रूप से भारतीय उपयोगकर्ताओं के लिए बनाए गए नए घरेलू एआई मॉडल बनाकर भारत की प्रौद्योगिकी कहानी में एक नया और महत्वपूर्ण कदम उठाया है।
बेंगलुरु स्थित स्टार्टअप, सर्वम एआई ने दो नए एआई मॉडल, बुलबुल वी3 और सर्वम विजन पेश किए हैं। जो बात इस विकास को विशेष बनाती है वह यह है कि इन मॉडलों ने छवियों से पाठ को पढ़ने और समझने जैसे कार्यों में चैटजीपीटी और गूगल जेमिनी जैसे लोकप्रिय टूल से बेहतर प्रदर्शन किया है, एक प्रक्रिया जिसे ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) के रूप में जाना जाता है। यह उपलब्धि इस बात पर प्रकाश डालती है कि भारत अब अपने दम पर मजबूत और उन्नत एआई समाधान विकसित कर रहा है।
https://twitter.com/pratykumar/status/2020724181160415673?ref_src=twsrc%5Etfw
ज़ी न्यूज़ को पसंदीदा स्रोत के रूप में जोड़ें
लंबे समय से, तकनीकी जगत में एआई के बड़े भाषा मॉडल (एलएलएम) पर चर्चा में अमेरिका और चीन का दबदबा रहा है। भारत के विशाल प्रतिभा पूल और विशाल एआई बाजार के बावजूद, स्थानीय रूप से विकसित एआई मॉडल की अनुपस्थिति ने वैश्विक एआई दौड़ में देश की स्थिति के बारे में अक्सर सवाल उठाए हैं।
सर्वम एआई ने हाल ही में प्रमुख बेंचमार्क में कई अग्रणी वैश्विक एआई मॉडल की तुलना में मजबूत परिणाम देने के लिए ध्यान आकर्षित किया है। इसके ओसीआर समाधान, सर्वम विजन ने चैटजीपीटी, जेमिनी 3 प्रो और डीपसीक ओसीआर वी2 जैसे प्रसिद्ध टूल से बेहतर प्रदर्शन करते हुए 84.3 प्रतिशत की सटीकता के साथ ओएलएमओसीआर-बेंच पर शीर्ष स्थान हासिल किया।
मॉडल ने ओमनीडॉकबेंच v1.5 पर 93.28 प्रतिशत का उच्च स्कोर भी हासिल किया, जो जटिल पेज लेआउट, तकनीकी तालिकाओं और गणितीय समीकरणों को सटीक रूप से संभालने की अपनी क्षमता दिखाता है। ये ऐसे क्षेत्र हैं जो अक्सर पारंपरिक ओसीआर प्रणालियों को चुनौती देते हैं। इसके अलावा, सर्वम एआई कई भाषाओं में स्कैन किए गए दस्तावेज़, फॉर्म और सामग्री सहित रोजमर्रा के कार्यों के लिए विश्वसनीय साबित हुआ है।
बुलबुल V3, सर्वम एआई का टेक्स्ट-टू-स्पीच मॉडल, 22 आधिकारिक भारतीय भाषाओं से ली गई 35 अलग-अलग आवाज़ों का समर्थन करता है, जो 1800 के दशक से लेकर आज तक की सामग्री को कवर करता है। इसे विभिन्न स्कैन गुणों और विभिन्न प्रकार की सामग्री को सटीकता के साथ संभालने के लिए डिज़ाइन किया गया है। श्रृंखला में एक 3बी-पैरामीटर राज्य-अंतरिक्ष दृष्टि-भाषा मॉडल भी शामिल है जो छवि कैप्शनिंग, दृश्य पाठ पहचान, चार्ट विश्लेषण और जटिल तालिकाओं की व्याख्या जैसे उन्नत दृश्य समझ कार्य कर सकता है।
सर्वम विज़न को भारत के पहले एआई मॉडल के रूप में डिज़ाइन किया गया है जो देश की व्यापक सांस्कृतिक और भाषा विविधता को समझता है। इसका लक्ष्य भारत के भीतर विकसित एक मजबूत एआई फाउंडेशन का निर्माण करना है, जिससे यह सरकारी परियोजनाओं, सार्वजनिक बुनियादी ढांचे और बीएफएसआई क्षेत्र में उपयोग के लिए एक आशाजनक विकल्प बन सके।
इस बीच, बुलबुल वी3 सर्वम एआई का प्रमुख टेक्स्ट-टू-स्पीच मॉडल है, जिसे भारत की समृद्ध और जटिल भाषा विविधता को संभालने के लिए बनाया गया है। यह कई भारतीय भाषाओं में प्राकृतिक, उपयोग के लिए तैयार एआई आवाजें तैयार करने की दिशा में एक बड़ा कदम है।
इसकी असाधारण विशेषताओं में से एक इसकी सहज भाषा स्विचिंग है, जो इसे तमिल और अंग्रेजी या हिंदी और अंग्रेजी जैसी भाषाओं के बीच बिना किसी व्यवधान के आसानी से स्थानांतरित करने की अनुमति देती है। वर्तमान में, बुलबुल V3 35 से अधिक आवाज़ों के साथ 11 भारतीय भाषाओं का समर्थन करता है, और सर्वम एआई भविष्य में 22 और भारतीय भाषाओं को जोड़ने की योजना बना रहा है।
नई दिल्ली: भाजपा ने गुरुवार को गोवा, कर्नाटक, नागालैंड और त्रिपुरा की पांच विधानसभा सीटों…
नई दिल्ली: भाजपा ने गुरुवार को गोवा, कर्नाटक, नागालैंड और त्रिपुरा की पांच विधानसभा सीटों…
नई दिल्ली: भाजपा ने गुरुवार को गोवा, कर्नाटक, नागालैंड और त्रिपुरा की पांच विधानसभा सीटों…
नई दिल्ली: भाजपा ने गुरुवार को गोवा, कर्नाटक, नागालैंड और त्रिपुरा की पांच विधानसभा सीटों…
लखनऊ: अर्जुन तेंदुलकर इंडियन प्रीमियर लीग (आईपीएल) के आगामी संस्करण में लखनऊ सुपर जायंट्स के…
नई दिल्ली: एसोसिएशन फॉर डेमोक्रेटिक रिफोर्म्स एंड केरल इलेक्शन वॉच की नई रिपोर्ट में खुलासा…