आखरी अपडेट:
एनवीडिया ने सोमवार को संगीत और ऑडियो उत्पन्न करने के लिए एक नया कृत्रिम बुद्धिमत्ता मॉडल दिखाया जो आवाज़ों को संशोधित कर सकता है और संगीत, फिल्मों और वीडियो गेम के निर्माताओं के उद्देश्य से नई ध्वनि तकनीक उत्पन्न कर सकता है।
(रायटर्स) – एनवीडिया ने सोमवार को संगीत और ऑडियो उत्पन्न करने के लिए एक नया कृत्रिम बुद्धिमत्ता मॉडल दिखाया जो आवाज़ों को संशोधित कर सकता है और नई ध्वनियाँ उत्पन्न कर सकता है – यह तकनीक संगीत, फिल्मों और वीडियो गेम के निर्माताओं के लिए लक्षित है।
एआई सिस्टम बनाने के लिए उपयोग किए जाने वाले चिप्स और सॉफ्टवेयर के दुनिया के सबसे बड़े आपूर्तिकर्ता एनवीडिया ने कहा कि प्रौद्योगिकी को सार्वजनिक रूप से जारी करने की उसकी तत्काल कोई योजना नहीं है, जिसे वह फुगाटो कहता है, जो फाउंडेशनल जेनरेटिव ऑडियो ट्रांसफार्मर ओपस 1 का संक्षिप्त रूप है।
यह रनवे जैसे स्टार्टअप और मेटा प्लेटफ़ॉर्म जैसे बड़े खिलाड़ियों द्वारा दिखाई गई अन्य तकनीकों से जुड़ता है जो टेक्स्ट प्रॉम्प्ट से ऑडियो या वीडियो उत्पन्न कर सकते हैं।
सांता क्लारा, कैलिफ़ोर्निया स्थित एनवीडिया का संस्करण पाठ विवरण से ध्वनि प्रभाव और संगीत उत्पन्न करता है, जिसमें कुत्ते की तरह तुरही भौंकने जैसी नवीन ध्वनियाँ भी शामिल हैं।
जो चीज़ इसे अन्य एआई प्रौद्योगिकियों से अलग बनाती है, वह मौजूदा ऑडियो को लेने और संशोधित करने की क्षमता है, उदाहरण के लिए पियानो पर बजने वाली एक पंक्ति को लेना और इसे एक मानव आवाज द्वारा गाई गई पंक्ति में बदलना, या बोले गए शब्द की रिकॉर्डिंग लेना और बदलना प्रयुक्त उच्चारण और अभिव्यक्त मनोदशा।
एनवीडिया में एप्लाइड डीप लर्निंग रिसर्च के उपाध्यक्ष ब्रायन कैटनज़ारो ने कहा, “अगर हम पिछले 50 वर्षों में सिंथेटिक ऑडियो के बारे में सोचते हैं, तो कंप्यूटर के कारण, सिंथेसाइज़र के कारण संगीत अब अलग लगता है।” “मुझे लगता है कि जेनरेटिव एआई संगीत, वीडियो गेम और आम लोगों के लिए नई क्षमताएं लाने जा रहा है जो चीजें बनाना चाहते हैं।”
जबकि ओपनएआई जैसी कंपनियां मनोरंजन उद्योग में एआई का उपयोग किया जा सकता है या नहीं और कैसे इस पर हॉलीवुड स्टूडियो के साथ बातचीत कर रही हैं, तकनीक और हॉलीवुड के बीच संबंध तनावपूर्ण हो गए हैं, खासकर हॉलीवुड स्टार स्कारलेट जोहानसन द्वारा ओपनएआई पर उनकी आवाज की नकल करने का आरोप लगाने के बाद।
एनवीडिया के नए मॉडल को ओपन-सोर्स डेटा पर प्रशिक्षित किया गया था, और कंपनी ने कहा कि वह अभी भी इस बात पर बहस कर रही है कि इसे सार्वजनिक रूप से कैसे और कैसे जारी किया जाए।
कैटनज़ारो ने कहा, “कोई भी जेनरेटिव तकनीक हमेशा कुछ जोखिम उठाती है, क्योंकि लोग इसका उपयोग उन चीजों को उत्पन्न करने के लिए कर सकते हैं जो हम पसंद नहीं करेंगे।” “हमें इसके बारे में सावधान रहने की ज़रूरत है, यही कारण है कि हमारे पास इसे जारी करने की तत्काल कोई योजना नहीं है।”
जेनरेटिव एआई मॉडल के रचनाकारों ने अभी तक यह निर्धारित नहीं किया है कि प्रौद्योगिकी के दुरुपयोग को कैसे रोका जाए जैसे कि उपयोगकर्ता द्वारा गलत सूचना उत्पन्न करना या कॉपीराइट वाले वर्ण उत्पन्न करके कॉपीराइट का उल्लंघन करना।
ओपनएआई और मेटा ने भी यह नहीं बताया है कि वे ऑडियो या वीडियो उत्पन्न करने वाले अपने मॉडलों को जनता के लिए कब जारी करने की योजना बना रहे हैं।
(यह कहानी News18 स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड समाचार एजेंसी फ़ीड – रॉयटर्स से प्रकाशित हुई है)