क्यों टेक्स्ट-टू-वीडियो अगली ‘बड़ी’ एआई चीज हो सकती है – टाइम्स ऑफ इंडिया



जब जेनेरेटिव एआई की बात आती है, तो सुर्खियों में केवल एक ही चीज हावी होती है – चैटजीपीटी। हालांकि, जेनेरेटिव की दुनिया में चैटजीपीटी जैसे भाषा मॉडल के अलावा और भी बहुत कुछ है। टेक्स्ट-टू-इमेज पहले से ही मुख्यधारा की बातचीत का हिस्सा बन रहा है, लेकिन बैकग्राउंड में बनाना जनरेटिव है ऐ पाठ को वीडियो में बदलने में सक्षम।
टेक्स्ट-टू-वीडियो AI क्या है?
सीधे शब्दों में कहें, तो आप केवल अपने शब्दों के आधार पर एआई-संचालित वीडियो उत्पन्न कर सकते हैं। हां, यह बिल्कुल ऐसा ही लगता है: पाठ में कुंजी और एआई मॉडल इसके आधार पर एक वीडियो उत्पन्न करेगा। यूएस-आधारित स्टार्टअप रनवे ने अपने जेन-2 मॉडल का प्रदर्शन किया, जो एक या दो कैविएट के साथ ऐसा करने में सक्षम है।
क्या यह कोई ‘नई’ बात है?
वास्तव में ऐसा नहीं है क्योंकि यह काफी हद तक Dall-E जैसा है – जिसे ChatGPT के रचनाकारों द्वारा विकसित किया गया है – और जनरेटिव AI भाषा मॉडल का उपयोग करके काम करता है। परिणाम काफी आकर्षक हैं और यह निश्चित रूप से दुनिया भर में कई लोगों को आकर्षित कर सकता है।
क्या ‘बिग टेक’ में शामिल नहीं है पाठ से वीडियो?
वे बहुत हैं। सितंबर 2022 में वापस, मेटा ने स्पष्ट रूप से नामित टूल मेक-ए-वीडियो का प्रदर्शन किया। केवल कुछ शब्दों या पाठ की पंक्तियों के साथ, मेक-ए-वीडियो जनरेटिव एआई का उपयोग करके वीडियो बनाता है लेकिन उन वीडियो में कोई आवाज नहीं थी। इसके बारे में मेटा के सीईओ मार्क जुकरबर्ग ने कहा था: “फ़ोटो की तुलना में वीडियो बनाना बहुत कठिन है क्योंकि प्रत्येक पिक्सेल को सही ढंग से उत्पन्न करने से परे, सिस्टम को यह भी अनुमान लगाना होगा कि वे समय के साथ कैसे बदलेंगे।
ठीक एक हफ्ते बाद और क्यू पर, Google ने एक समान मॉडल की घोषणा की। Google के जनरेटिव AI मॉडल को Imagen Video कहा जाता है। “टेक्स्ट प्रॉम्प्ट दिए जाने पर, इमेजन वीडियो बेस वीडियो जनरेशन मॉडल और इंटरलीव्ड स्थानिक और अस्थायी वीडियो सुपर-रिज़ॉल्यूशन मॉडल का उपयोग करके हाई डेफिनिशन वीडियो उत्पन्न करता है,” Google ने इसका वर्णन कैसे किया था।
Google ने फेनाकी नामक एक अन्य मॉडल भी प्रदर्शित किया, जिसका उद्देश्य टेक्स्ट इनपुट के आधार पर लंबे-चौड़े वीडियो बनाना है।
टेक्स्ट-टू-वीडियो AI के साथ क्या चुनौतियाँ हैं?
कई गुना। परिचालन से लेकर नैतिक तक, चुनौतियाँ बहुत अधिक हैं। शायद यही एक कारण है कि टेक्स्ट-टू-वीडियो पर काम करने वाले जनरेटिव एआई मॉडल के केवल डेमो सामने आए हैं। शुरुआत के लिए, पाठ के साथ एक वीडियो बनाना हास्यास्पद रूप से आसान और समान रूप से आकर्षक लग सकता है लेकिन सिर्फ शब्दों के साथ एक वीडियो बनाने की कल्पना करें। किसी को आदेशों के साथ अविश्वसनीय रूप से सटीक होना होगा या यह अस्पष्टता के बराबर वीडियो उत्पन्न कर सकता है।
इसके बाद नैतिक चुनौतियां आती हैं। गलत सूचनाओं के शस्त्रागार में एआई-जेनरेट किए गए वीडियो अगला हथियार हो सकते हैं। डीपफेक एक और भी बड़ी समस्या बन सकती है जिसका वर्तमान में सामना करना पड़ रहा है।
एआई के क्षेत्र में तेजी से हो रहे विकास को ध्यान में रखते हुए, टेक्स्ट-टू-वीडियो एक्सप्लोरेशन मोड से बाहर होने और मुख्यधारा बनने से पहले यह समय की बात हो सकती है।



News India24

Recent Posts

'इनकी आत्मा को शांति न मिले', मृत फिल्म निर्माता नीना गुप्ता ने किया अजीब कमेंट – इंडिया टीवी हिंदी

छवि स्रोत: इंस्टाग्राम प्रीतीश नंदी और नीना गुप्ता। प्रसिद्ध पत्रकार, कवि, मिनी और फिल्म निर्माता…

60 minutes ago

तिरूपति भगदड़: आंध्र सरकार ने प्रत्येक पीड़ित परिवार के लिए 25-25 लाख रुपये की अनुग्रह राशि की घोषणा की

छवि स्रोत: पीटीआई भगवान वेंकटेश्वर स्वामी मंदिर में बुधवार देर रात मची भगदड़ में घायल…

1 hour ago

बर्नस्टीन द्वारा 'आउटपरफॉर्म' रेटिंग के साथ कवरेज शुरू करने से स्विगी 6% बढ़ी, 25% की बढ़त देखी गई – News18

आखरी अपडेट:जनवरी 09, 2025, 13:29 ISTगुरुवार के कारोबारी सत्र में स्विगी लिमिटेड के शेयरों में…

1 hour ago

महाकुंभ 2025: अमिताभ बच्चन से लेकर आलिया भट्ट तक, बॉलीवुड सितारे जो पवित्र स्नान करने के लिए तैयार हैं

छवि स्रोत: फ़ाइल छवि महाकुंभ 2025 के पवित्र मेले में शामिल होने के लिए कई…

2 hours ago

हेनले पासपोर्ट रैंकिंग 2025: भारत आगे बढ़ा, पाकिस्तान सोमालिया और बांग्लादेश से पीछे – News18

आखरी अपडेट:09 जनवरी, 2025, 13:07 ISTभारत की पासपोर्ट रैंकिंग 2024 में 85वीं से बढ़कर 2025…

2 hours ago