यह एनिमेटेड मोना लिसा एआई द्वारा बनाया गया था, और यह भयानक है

Send

"मोना लिसा" की गूढ़, चित्रित मुस्कान दुनिया भर में जानी जाती है, लेकिन उस प्रसिद्ध चेहरे ने हाल ही में अभिव्यक्ति की एक नई श्रृंखला प्रदर्शित की, कृत्रिम बुद्धिमत्ता (एआई) के सौजन्य से।

21 मई को यूट्यूब पर साझा किए गए एक वीडियो में, तीन वीडियो क्लिप में मोना लिसा के उदाहरणों का खुलासा किया गया है क्योंकि वह अपने होंठों को घुमाती है और अपना सिर घुमाती है। वह एक दृढ़ तंत्रिका नेटवर्क द्वारा निर्मित किया गया था - एक प्रकार का एआई जो एक मानव मस्तिष्क के रूप में सूचनाओं को संसाधित करता है, छवियों का विश्लेषण और प्रक्रिया करने के लिए।

शोधकर्ताओं ने चेहरे की विशेषताओं के सामान्य आकार और वे एक दूसरे के सापेक्ष कैसे व्यवहार करते हैं, और फिर उस जानकारी को अभी भी छवियों पर लागू करने के लिए एल्गोरिदम को प्रशिक्षित किया। परिणाम एक फ्रेम से नए चेहरे के भावों का यथार्थवादी वीडियो अनुक्रम था।

मोना लिसा वीडियो के लिए, एआई ने तीन मानव विषयों के डेटासेट से चेहरे की गति को सीखा, जिसमें तीन बहुत ही अलग एनिमेशन थे। हालांकि तीन में से प्रत्येक क्लिप अभी भी मोना लिसा के रूप में पहचानी जा रही थी, प्रशिक्षण मॉडल के रूप और व्यवहार में भिन्नता "लिविंग पोट्रेट", "एगोर ज़ाखारोव, स्कोलोवो इंस्टीट्यूट ऑफ साइंस एंड टेक्नोलॉजी, और एक इंजीनियर के साथ व्यवहार और व्यक्तित्व" को अलग करती है। सैमसंग एआई सेंटर (दोनों मास्को में स्थित), वीडियो में बताया गया है।

ज़खारोव और उनके सहयोगियों ने अल्बर्ट आइंस्टीन, मर्लिन मुनरो और सल्वाडोर डाली जैसे 20 वीं सदी के सांस्कृतिक प्रतीकों की तस्वीरों से भी एनिमेशन तैयार किए। शोधकर्ताओं ने प्रीप्रिंट जर्नल अर्क्सिव में 20 मई को ऑनलाइन प्रकाशित एक अध्ययन में अपने निष्कर्षों का वर्णन किया, जो कि सहकर्मी-समीक्षा नहीं थे।

परिचित चेहरे अपरिचित अभिव्यक्तियों को लेते हैं। (छवि क्रेडिट: ई। ज़खारोव एट अल।)

इन जैसे मूल वीडियो बनाना, जिन्हें डीपफेक के रूप में जाना जाता है, आसान नहीं है। मानव सिर ज्यामितीय रूप से जटिल और अत्यधिक गतिशील हैं; अध्ययन के लेखकों ने लिखा है कि सिर के 3 डी मॉडल में "लाखों मापदंडों के दसियों" हैं।

अध्ययन के अनुसार, 3 डी-मॉडल वाले मानव सिर में "यहां तक कि छोटी गलतियों" की पहचान करने में मानव दृष्टि प्रणाली बहुत अच्छी है। लगभग मानव दिखने वाली चीज़ को देखना - लेकिन काफी नहीं - गहन घाटी प्रभाव की सनसनी को ट्रिगर करता है जिसे अनैच्छिक घाटी प्रभाव कहा जाता है।

एआई ने पहले दिखाया है कि डीपफेकिंग का उत्पादन संभव है, लेकिन इसके लिए वांछित विषय के कई कोणों की आवश्यकता होती है। नए अध्ययन के लिए, इंजीनियरों ने एआई को एक बहुत बड़े डेटासेट संदर्भ वीडियो में पेश किया, जो मानव चेहरे को कार्रवाई में दिखा रहा है। वैज्ञानिकों ने चेहरे के स्थलों की स्थापना की, जो किसी भी चेहरे पर लागू होंगे, तंत्रिका नेटवर्क को सिखाने के लिए कि कैसे चेहरे सामान्य रूप से व्यवहार करते हैं।

फिर, उन्होंने स्रोत की विशेषताओं के आंदोलन को मैप करने के लिए संदर्भ अभिव्यक्तियों का उपयोग करने के लिए एआई को प्रशिक्षित किया। शोधकर्ताओं ने बताया कि जब एआई ने काम करने के लिए सिर्फ एक छवि थी, तब भी एक गहरी स्थिति बनाने में सक्षम बनाया।

और अधिक स्रोत छवियों ने अंतिम एनीमेशन में और भी अधिक विस्तृत परिणाम दिया। वैज्ञानिकों ने लिखा कि 32 चित्रों से निर्मित, केवल एक के बजाय, एक उपयोगकर्ता अध्ययन में "सही यथार्थवाद" हासिल किया।

Send