समझाया गया: मेटा मल्टीसेंसरी एआई मॉडल ‘इमेजबाइंड’ जारी करता है जो छह प्रकार के डेटा को ओपन-सोर्स के रूप में जोड़ता है


नयी दिल्ली: मेटा (पूर्व में फेसबुक) ने इमेजबिंड को जारी करने की घोषणा की है, एक ओपन-सोर्स एआई मॉडल जो एक साथ छह अलग-अलग तौर-तरीकों से सीखने में सक्षम है। यह तकनीक मशीनों को टेक्स्ट, इमेज, ऑडियो, डेप्थ, थर्मल और मोशन सेंसर जैसी सूचनाओं के विभिन्न रूपों को समझने और कनेक्ट करने में सक्षम बनाती है। ImageBind के साथ, मशीनें एक साझा प्रतिनिधित्व स्थान सीख सकती हैं, बिना तौर-तरीकों के हर संभव संयोजन पर प्रशिक्षित होने की आवश्यकता है।

ImageBind का महत्व इसकी क्षमता में निहित है कि यह मशीनों को मनुष्यों की तरह समग्र रूप से सीखने में सक्षम बनाता है। विभिन्न तौर-तरीकों के संयोजन से, शोधकर्ता नई संभावनाओं का पता लगा सकते हैं जैसे कि इमर्सिव वर्चुअल वर्ल्ड बनाना और मल्टीमॉडल सर्च फ़ंक्शंस बनाना। ImageBind सामग्री पहचान और मॉडरेशन में भी सुधार कर सकता है, और समृद्ध मीडिया को और अधिक मूल रूप से बनाकर रचनात्मक डिज़ाइन को बढ़ावा दे सकता है।

इमेजबाइंड का विकास मल्टीमॉडल एआई सिस्टम बनाने के मेटा के व्यापक लक्ष्य को दर्शाता है जो सभी प्रकार के डेटा से सीख सकता है। जैसे-जैसे तौर-तरीकों की संख्या बढ़ती है, ImageBind शोधकर्ताओं के लिए नए और अधिक समग्र AI सिस्टम विकसित करने की नई संभावनाएं खोलता है।

फॉर्म का शीर्ष

ImageBind में AI मॉडल की क्षमताओं को बढ़ाने की महत्वपूर्ण क्षमता है जो कई तौर-तरीकों पर निर्भर करती है। छवि-युग्मित डेटा का उपयोग करके, ImageBind कई तौर-तरीकों के लिए एक संयुक्त एम्बेडिंग स्थान सीख सकता है, जिससे उन्हें एक-दूसरे से “बात” करने और एक साथ देखे बिना लिंक खोजने की अनुमति मिलती है। यह अन्य मॉडलों को संसाधन-गहन प्रशिक्षण के बिना नए तौर-तरीकों को समझने में सक्षम बनाता है। मॉडल के मजबूत स्केलिंग व्यवहार का मतलब है कि दृष्टि मॉडल की ताकत और आकार के साथ इसकी क्षमताओं में सुधार होता है, यह सुझाव देता है कि बड़े दृष्टि वाले मॉडल गैर-दृष्टि वाले कार्यों, जैसे ऑडियो वर्गीकरण का लाभ उठा सकते हैं। ImageBind शून्य-शॉट पुनर्प्राप्ति और ऑडियो और गहराई वर्गीकरण कार्यों में पिछले कार्य को भी बेहतर बनाता है।

मल्टीमॉडल लर्निंग का भविष्य

मल्टीमॉडल लर्निंग आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल की जानकारी उत्पन्न करने और पुनर्प्राप्त करने के लिए छवियों, ऑडियो और टेक्स्ट जैसे कई प्रकार के इनपुट का उपयोग करने की क्षमता है। ImageBind मल्टीमॉडल लर्निंग का एक उदाहरण है जो क्रिएटर्स को प्रासंगिक ऑडियो जोड़कर, स्टैटिक इमेज से एनिमेशन बनाकर और ऑडियो प्रॉम्प्ट के आधार पर ऑब्जेक्ट को सेगमेंट करके अपनी सामग्री को बढ़ाने की अनुमति देता है।

भविष्य में, शोधकर्ताओं का लक्ष्य अधिक मानव-केंद्रित एआई मॉडल बनाने के लिए स्पर्श, भाषण, गंध और मस्तिष्क संकेतों जैसे नए तौर-तरीकों को पेश करना है। हालांकि, अभी भी बड़े मॉडल और उनके अनुप्रयोगों को स्केल करने के बारे में बहुत कुछ सीखना बाकी है। इमेजबाइंड इन व्यवहारों का मूल्यांकन करने और छवि निर्माण और पुनर्प्राप्ति के लिए नए अनुप्रयोगों को प्रदर्शित करने की दिशा में एक कदम है।

उम्मीद यह है कि अनुसंधान समुदाय इमेजबाइंड और साथ में प्रकाशित पेपर का उपयोग दृष्टि मॉडल का मूल्यांकन करने के नए तरीकों का पता लगाने और मल्टीमॉडल सीखने में उपन्यास अनुप्रयोगों की ओर ले जाने के लिए करेगा।



News India24

Recent Posts

गूगल मैप्स के इस फीचर ने सॉल्व की बड़ी पहचान मिस्त्री को बताया, जानें कैसे करें यूजी – इंडिया टीवी हिंदी

छवि स्रोत: फ़ाइल गूगल मार्केटिंग गूगल मैप्स की एक खासियत ने पुलिस की सहायता के…

1 hour ago

मोहम्मद शमी को लेकर बीसीसीआई ने दिया सबसे बड़ा अपडेट, अब शंका रहेगी ये ट्रॉफी – इंडिया टीवी हिंदी

छवि स्रोत: गेट्टी मोहम्मद शमी को लेकर बीसीसीआई ने दिया सबसे बड़ा अपडेट मोहम्मद शमी…

1 hour ago

पांच आईपीओ आज बंद: जानें सदस्यता स्थिति, जीएमपी टुडे – न्यूज18

आखरी अपडेट:23 दिसंबर, 2024, 18:08 ISTआईपीओ में ममता मशीनरी, डीएएम कैपिटल एडवाइजर्स, ट्रांसरेल लाइटिंग, सनाथन…

1 hour ago

वर्ष 2024: मोदी सरकार की 10 बड़ी घोषणाओं पर एक नजर

छवि स्रोत: इंडिया टीवी 2024 में केंद्र सरकार की 10 बड़ी घोषणाओं पर एक नजर.…

1 hour ago

बीसीसीआई ने बॉर्डर-गावस्कर ट्रॉफी 2024/25 के लिए मोहम्मद शमी पर धमाकेदार अपडेट जारी किया

छवि स्रोत: गेट्टी मोहम्मद शमी. भारतीय क्रिकेट कंट्रोल बोर्ड (बीसीसीआई) ने मौजूदा बॉर्डर-गावस्कर ट्रॉफी 2024/25…

2 hours ago

: दो गिरफ़्तार गिरफ़्तार, 7.72 लाख की नकदी, पाँच लाख की गिरफ़्तारी

1 में से 1 ख़ासख़बर.कॉम: सोमवार, 23 दिसंबर 2024 शाम ​​5:45 बजे । उत्तर प्रदेश…

2 hours ago