समझाया गया: मेटा मल्टीसेंसरी एआई मॉडल ‘इमेजबाइंड’ जारी करता है जो छह प्रकार के डेटा को ओपन-सोर्स के रूप में जोड़ता है


नयी दिल्ली: मेटा (पूर्व में फेसबुक) ने इमेजबिंड को जारी करने की घोषणा की है, एक ओपन-सोर्स एआई मॉडल जो एक साथ छह अलग-अलग तौर-तरीकों से सीखने में सक्षम है। यह तकनीक मशीनों को टेक्स्ट, इमेज, ऑडियो, डेप्थ, थर्मल और मोशन सेंसर जैसी सूचनाओं के विभिन्न रूपों को समझने और कनेक्ट करने में सक्षम बनाती है। ImageBind के साथ, मशीनें एक साझा प्रतिनिधित्व स्थान सीख सकती हैं, बिना तौर-तरीकों के हर संभव संयोजन पर प्रशिक्षित होने की आवश्यकता है।

ImageBind का महत्व इसकी क्षमता में निहित है कि यह मशीनों को मनुष्यों की तरह समग्र रूप से सीखने में सक्षम बनाता है। विभिन्न तौर-तरीकों के संयोजन से, शोधकर्ता नई संभावनाओं का पता लगा सकते हैं जैसे कि इमर्सिव वर्चुअल वर्ल्ड बनाना और मल्टीमॉडल सर्च फ़ंक्शंस बनाना। ImageBind सामग्री पहचान और मॉडरेशन में भी सुधार कर सकता है, और समृद्ध मीडिया को और अधिक मूल रूप से बनाकर रचनात्मक डिज़ाइन को बढ़ावा दे सकता है।

इमेजबाइंड का विकास मल्टीमॉडल एआई सिस्टम बनाने के मेटा के व्यापक लक्ष्य को दर्शाता है जो सभी प्रकार के डेटा से सीख सकता है। जैसे-जैसे तौर-तरीकों की संख्या बढ़ती है, ImageBind शोधकर्ताओं के लिए नए और अधिक समग्र AI सिस्टम विकसित करने की नई संभावनाएं खोलता है।

फॉर्म का शीर्ष

ImageBind में AI मॉडल की क्षमताओं को बढ़ाने की महत्वपूर्ण क्षमता है जो कई तौर-तरीकों पर निर्भर करती है। छवि-युग्मित डेटा का उपयोग करके, ImageBind कई तौर-तरीकों के लिए एक संयुक्त एम्बेडिंग स्थान सीख सकता है, जिससे उन्हें एक-दूसरे से “बात” करने और एक साथ देखे बिना लिंक खोजने की अनुमति मिलती है। यह अन्य मॉडलों को संसाधन-गहन प्रशिक्षण के बिना नए तौर-तरीकों को समझने में सक्षम बनाता है। मॉडल के मजबूत स्केलिंग व्यवहार का मतलब है कि दृष्टि मॉडल की ताकत और आकार के साथ इसकी क्षमताओं में सुधार होता है, यह सुझाव देता है कि बड़े दृष्टि वाले मॉडल गैर-दृष्टि वाले कार्यों, जैसे ऑडियो वर्गीकरण का लाभ उठा सकते हैं। ImageBind शून्य-शॉट पुनर्प्राप्ति और ऑडियो और गहराई वर्गीकरण कार्यों में पिछले कार्य को भी बेहतर बनाता है।

मल्टीमॉडल लर्निंग का भविष्य

मल्टीमॉडल लर्निंग आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल की जानकारी उत्पन्न करने और पुनर्प्राप्त करने के लिए छवियों, ऑडियो और टेक्स्ट जैसे कई प्रकार के इनपुट का उपयोग करने की क्षमता है। ImageBind मल्टीमॉडल लर्निंग का एक उदाहरण है जो क्रिएटर्स को प्रासंगिक ऑडियो जोड़कर, स्टैटिक इमेज से एनिमेशन बनाकर और ऑडियो प्रॉम्प्ट के आधार पर ऑब्जेक्ट को सेगमेंट करके अपनी सामग्री को बढ़ाने की अनुमति देता है।

भविष्य में, शोधकर्ताओं का लक्ष्य अधिक मानव-केंद्रित एआई मॉडल बनाने के लिए स्पर्श, भाषण, गंध और मस्तिष्क संकेतों जैसे नए तौर-तरीकों को पेश करना है। हालांकि, अभी भी बड़े मॉडल और उनके अनुप्रयोगों को स्केल करने के बारे में बहुत कुछ सीखना बाकी है। इमेजबाइंड इन व्यवहारों का मूल्यांकन करने और छवि निर्माण और पुनर्प्राप्ति के लिए नए अनुप्रयोगों को प्रदर्शित करने की दिशा में एक कदम है।

उम्मीद यह है कि अनुसंधान समुदाय इमेजबाइंड और साथ में प्रकाशित पेपर का उपयोग दृष्टि मॉडल का मूल्यांकन करने के नए तरीकों का पता लगाने और मल्टीमॉडल सीखने में उपन्यास अनुप्रयोगों की ओर ले जाने के लिए करेगा।



News India24

Recent Posts

IND vs BAN: वरुण चक्रवर्ती ने पहले टी20 मैच में बांग्लादेश को भारत की वापसी के लिए मजबूर कर दिया

भारत के स्पिनर वरुण चक्रवर्ती ने रविवार, 6 अक्टूबर को न्यू माधवराव सिंधिया क्रिकेट स्टेडियम,…

59 mins ago

यमुना एक्सप्रेसवे अखंड वैधानिक शेयरधारकों के नाम, दो अचल संपत्तियां – इंडिया टीवी हिंदी

छवि स्रोत: इंडिया टीवी लाखों के मामले समष्टि में दो सामूहिक गिरफ़्तारी। दिल्ली पुलिस की…

1 hour ago

आरजी कर कॉलेज ने खतरे की संस्कृति, यौन उत्पीड़न पर चिंताओं के बीच इंटर्न, डॉक्टरों को निष्कासित कर दिया

धमकी संस्कृति, मनी लॉन्ड्रिंग और रैगिंग के आरोपों की जांच के बाद एक बड़ा फैसला…

1 hour ago

सिंघम अगेन: रोहित शेट्टी ने अजय देवगन के जबरदस्त लुक से फैंस को किया चिढ़ाया; ट्रेलर इस तारीख को रिलीज़ होगा

फिल्म 'सिंघम अगेन' के ट्रेलर रिलीज से पहले फिल्म निर्माता रोहित शेट्टी ने अपनी फ्रेंचाइजी…

2 hours ago

लाहौर में 30 से अधिक समर्थकों का प्रदर्शन, इमरान खान की पार्टी के 30 से अधिक समर्थक – इंडिया टीवी हिंदी

छवि स्रोत: एपी लाहौर में प्लाटिक बंधकों को पाकिस्तानी पुलिस ने गिरफ़्तार कर लिया। लाहौर:…

2 hours ago