गुगलले ल्यायो शक्तिशाली एआई टुल, शब्दबाट बनाउन सकिनेछ फोटो र भिडियो

काठमाडौं । हरेक वर्ष गुगलले आयोजना गर्ने डेभलपर्स कन्फ्रेन्स Google I/O अन्तरगत यो वर्ष सन् २०२५ को सम्मेलनमा पनि गुगलले विभिन्न नयाँ नयाँ प्रडक्टहरु सार्वजनिक गरेको छ ।
२० र २१ मे गरी दुई दिनसम्म आयोजित उक्त वार्षिक कुम्भ मेलामा यसपटक गुगलले नयाँ शक्तिशाली एआई टुल सार्वजनिक गरेको छ ।




तस्वीर तथा भिडियो सिर्जना गर्ने ऊक्त एआई टुलको नाम Imagen 4 र Veo 3 हो । यो टुलले अत्यन्तै यथार्थपरक फोटो तथा भिडियो तयार पार्नसक्ने दाबी कम्पनीको छ ।
गुगलले यसपटक एआई भिडियो टुल Flow पनि सार्वजनिक गरेको छ । यो टुल खासगरी फिल्म निर्माता तथा व्यवसायिक सर्जकहरुका लागि तयार गरिएको हो ।
Imagen 4 तथा Veo 3 बाट फोटो तथा भिडियो तयार पार्नका लागि प्रयोगकर्ताहरुले टेक्स्ट वा तस्वीरबाट सम्बन्धित आदेश अर्थात् प्रम्प्ट दिनु पर्दछ । Veo 3 को सहयोगबाट केवल भिडियो मात्र नभएर स्वचालित रुपमा अडियो पनि सिर्जना हुनेछ ।
गुगलका अनुसार Veo 3 भिडियो जेनेरेसन एआई मोडेलको पछिल्लो संस्करण हो । यसले अक्षर वा तस्वीरको आधारमा छोटो भिडियो तयार पार्न सक्दछ । यसबाट बन्ने भिडियो अधिक वास्तविक हुनुका साथै त्यसमा चाल पनि उत्कृष्ट हुन्छ ।
यो एआई टुल अहिले बिटा भर्सनमा छ र हाल अमेरिकामा जेमिनाई एप तथा फ्लोका माध्यमबाट प्रयोग गर्न सकिने बताइएको छ । यसका लागि प्रयोगकर्तासँग गुगल एआईको अल्ट्रा प्लानको सब्सक्रिप्सन हुनु आवश्यक हुन्छ ।
यसैबीच गुगलले आफ्नो पुरानो भिडियो प्लाटफर्म Veo 2 का लागि पनि अपडेट पेश गरेको छ । यसमा Reference Inputs, Camera Controls, Out painting तथा Object Add or Remove अप्सन उफलब्ध हुन्छ ।
गुगलले ल्याएको तस्वीर तयार गर्ने एआई टुल Imagen 4 ले टुके रिजोलुसनका तस्वीर तयार पार्दछ । यी तस्वीर उत्कृष्ट गुणस्तरका हुनेछन् र यसमा टेक्स्चर, रिफ्लेक्सन आदि प्रष्ट देखिनेछन् । यो मोडेलले फरक फरक ढाँचाको तस्वीर तयार गर्न सक्नेछ ।
Imagen 4 का अन्य फिचरको कुरा गर्दा यसबाट तस्वीरभित्र शव्दहरु पनि लेख्न सकिनेछ जुन सही हिज्जेमा देखिनेछ ।
त्यसैले फ्रयोगकर्ताहरुले Imagen 4 टूल प्रयोग गरेर पोस्टर समेत बनाऊन सक्नेछन् । Imagen 4 लाई जेमिनाई, भर्टेक्स एआई, व्हिस्क र वर्कस्पेस टुल्समा आबद्ध गर्ने योजना गुगलको छ ।
प्रतिक्रिया दिनुहोस्