क्यों टेक्स्ट-टू-वीडियो अगली ‘बड़ी’ एआई चीज हो सकती है – टाइम्स ऑफ इंडिया



जब जेनेरेटिव एआई की बात आती है, तो सुर्खियों में केवल एक ही चीज हावी होती है – चैटजीपीटी। हालांकि, जेनेरेटिव की दुनिया में चैटजीपीटी जैसे भाषा मॉडल के अलावा और भी बहुत कुछ है। टेक्स्ट-टू-इमेज पहले से ही मुख्यधारा की बातचीत का हिस्सा बन रहा है, लेकिन बैकग्राउंड में बनाना जनरेटिव है ऐ पाठ को वीडियो में बदलने में सक्षम।
टेक्स्ट-टू-वीडियो AI क्या है?
सीधे शब्दों में कहें, तो आप केवल अपने शब्दों के आधार पर एआई-संचालित वीडियो उत्पन्न कर सकते हैं। हां, यह बिल्कुल ऐसा ही लगता है: पाठ में कुंजी और एआई मॉडल इसके आधार पर एक वीडियो उत्पन्न करेगा। यूएस-आधारित स्टार्टअप रनवे ने अपने जेन-2 मॉडल का प्रदर्शन किया, जो एक या दो कैविएट के साथ ऐसा करने में सक्षम है।
क्या यह कोई ‘नई’ बात है?
वास्तव में ऐसा नहीं है क्योंकि यह काफी हद तक Dall-E जैसा है – जिसे ChatGPT के रचनाकारों द्वारा विकसित किया गया है – और जनरेटिव AI भाषा मॉडल का उपयोग करके काम करता है। परिणाम काफी आकर्षक हैं और यह निश्चित रूप से दुनिया भर में कई लोगों को आकर्षित कर सकता है।
क्या ‘बिग टेक’ में शामिल नहीं है पाठ से वीडियो?
वे बहुत हैं। सितंबर 2022 में वापस, मेटा ने स्पष्ट रूप से नामित टूल मेक-ए-वीडियो का प्रदर्शन किया। केवल कुछ शब्दों या पाठ की पंक्तियों के साथ, मेक-ए-वीडियो जनरेटिव एआई का उपयोग करके वीडियो बनाता है लेकिन उन वीडियो में कोई आवाज नहीं थी। इसके बारे में मेटा के सीईओ मार्क जुकरबर्ग ने कहा था: “फ़ोटो की तुलना में वीडियो बनाना बहुत कठिन है क्योंकि प्रत्येक पिक्सेल को सही ढंग से उत्पन्न करने से परे, सिस्टम को यह भी अनुमान लगाना होगा कि वे समय के साथ कैसे बदलेंगे।
ठीक एक हफ्ते बाद और क्यू पर, Google ने एक समान मॉडल की घोषणा की। Google के जनरेटिव AI मॉडल को Imagen Video कहा जाता है। “टेक्स्ट प्रॉम्प्ट दिए जाने पर, इमेजन वीडियो बेस वीडियो जनरेशन मॉडल और इंटरलीव्ड स्थानिक और अस्थायी वीडियो सुपर-रिज़ॉल्यूशन मॉडल का उपयोग करके हाई डेफिनिशन वीडियो उत्पन्न करता है,” Google ने इसका वर्णन कैसे किया था।
Google ने फेनाकी नामक एक अन्य मॉडल भी प्रदर्शित किया, जिसका उद्देश्य टेक्स्ट इनपुट के आधार पर लंबे-चौड़े वीडियो बनाना है।
टेक्स्ट-टू-वीडियो AI के साथ क्या चुनौतियाँ हैं?
कई गुना। परिचालन से लेकर नैतिक तक, चुनौतियाँ बहुत अधिक हैं। शायद यही एक कारण है कि टेक्स्ट-टू-वीडियो पर काम करने वाले जनरेटिव एआई मॉडल के केवल डेमो सामने आए हैं। शुरुआत के लिए, पाठ के साथ एक वीडियो बनाना हास्यास्पद रूप से आसान और समान रूप से आकर्षक लग सकता है लेकिन सिर्फ शब्दों के साथ एक वीडियो बनाने की कल्पना करें। किसी को आदेशों के साथ अविश्वसनीय रूप से सटीक होना होगा या यह अस्पष्टता के बराबर वीडियो उत्पन्न कर सकता है।
इसके बाद नैतिक चुनौतियां आती हैं। गलत सूचनाओं के शस्त्रागार में एआई-जेनरेट किए गए वीडियो अगला हथियार हो सकते हैं। डीपफेक एक और भी बड़ी समस्या बन सकती है जिसका वर्तमान में सामना करना पड़ रहा है।
एआई के क्षेत्र में तेजी से हो रहे विकास को ध्यान में रखते हुए, टेक्स्ट-टू-वीडियो एक्सप्लोरेशन मोड से बाहर होने और मुख्यधारा बनने से पहले यह समय की बात हो सकती है।



News India24

Recent Posts

तमिलनाडु में टीवीके सरकार के लिए रास्ता साफ, राज्यपाल ने ‘विजय सरकार’ का अनुरोध स्वीकार किया

आखरी अपडेट:09 मई, 2026, 20:09 ISTविजय ने तमिलनाडु के राज्यपाल आरवी आर्लेकर से तीन बार…

9 minutes ago

वीडी सतीसन, केसी वेणुगोपाल या रमेश चेन्निथला? केरल के अगले मुख्यमंत्री को लेकर कांग्रेस में असमंजस की स्थिति बनी हुई है

तिरुवनंतपुरम: हाल ही में हुए केरल विधानसभा चुनावों में यूनाइटेड डेमोक्रेटिक फ्रंट (यूडीएफ) को पूर्ण…

1 hour ago

आरआर बनाम जीटी लाइव स्कोर अपडेट: राजस्थान रॉयल्स ने टॉस जीता, गुजरात टाइटंस पहले स्थान पर रहे

आरआर बनाम जीटी लाइव स्कोर अपडेट: आईपीएल 2026 सीजन का 52वां लीग मुकाबला जयपुर के…

2 hours ago

बीसीसीआई-दिशानिर्देशों के बीच अर्शदीप सिंह का इंस्टाग्राम सवालों के घेरे में है

भारतीय क्रिकेट कंट्रोल बोर्ड द्वारा हाल ही में जारी की गई एक सलाह के बाद,…

2 hours ago

‘नंबर गेम’ हुआ पूरा, अब गवर्नर से मिली विजय, तमिल में कब होगा ‘राजतिलक’?

चेन्नई: तमिल में काफी संकट के बाद अंतिम टीवीके प्रमुख विजय से गवर्नर से मुलाकात…

2 hours ago

सैट-टैग किए गए कछुए के नक्शे 3,500 किमी से अधिक के दुर्लभ गहरे समुद्र मार्ग | मुंबई समाचार – द टाइम्स ऑफ इंडिया

धवल लक्ष्मी ऑलिव रिडले कछुआ मुंबई: ऑलिव रिडले कछुए को उसकी पीठ पर सैटेलाइट ट्रांसमीटर…

2 hours ago