आरा कैटिंग मेकिंग अडॉरेबल कैट फोटोज, क्लियरली मिस द एन्टायर पॉइंट ऑफ द इंटरनेट

Pin
Send
Share
Send

कृत्रिम बुद्धिमत्ता (एआई) ने हाल ही में खरोंच से बिल्ली की तस्वीरें उत्पन्न करने की कोशिश की, और परिणाम बिल्ली-खगोल थे।

यह विशेष रूप से तंत्रिका नेटवर्क (मानव मस्तिष्क के कामकाज के बाद तैयार किए गए एआई का एक प्रकार) मानव चेहरे की आश्चर्यजनक यथार्थवादी मूल तस्वीरें पैदा कर सकता है। वास्तव में, इन बने-बनाए लोगों की छवियां मानव दर्शकों के लिए वास्तविक लोगों की तस्वीरों से अलग करना लगभग असंभव था, एआई के प्रोग्रामर ने एक अध्ययन में बताया कि दिसंबर 2018 को प्रायरप्रिंट जर्नल arXiv पर पोस्ट किया गया था।

हालाँकि, फैलाइन एक और कहानी साबित हुई। एक ही एल्गोरिथ्म जो निर्दोष मानव चेहरे को उत्पन्न करता है, मिहापेन सिर के साथ बिल्लियों का निर्माण करता है; आँखों और पैरों की गलत संख्या; और वे शरीर जो बहुत लंबे, बहुत छोटे, असामान्य रूप से सड़न या आयताकार और अजीबोगरीब कोणों पर मुड़े हुए थे।

एआई इंजन जो खौफनाक बिल्ली की तस्वीरों का उत्पादन करता था, वह "जनरेशनल एडवरटाइजिंग नेटवर्क के लिए एक शैली-आधारित जनरेटर वास्तुकला" के रूप में जाना जाता है। इस तरह के नेटवर्क "प्रतिकूल" हैं क्योंकि दो मॉडल एक साथ काम करते हैं: एक छवियों को उत्पन्न करता है, और दूसरा एक प्रशिक्षण डेटा सेट में तस्वीरों के खिलाफ परिणामों का मूल्यांकन करता है, ताकि नेटवर्क अपनी गलतियों से सीखे और अपने प्रदर्शन में सुधार करे।

एआई के लिए आजीवन मानवीय छवियों का उत्पादन करने के लिए, पहले उसे "सीखना" था कि मौजूदा तस्वीरों से मानव चेहरे क्या दिखते थे। एल्गोरिथ्म ने शैली की विशेषताओं की एक चेकलिस्ट में चेहरे को तोड़ दिया, जैसे कि सिर की स्थिति; लिंग; त्वचा का रंग; बाल बनावट और शैली; शोधकर्ताओं ने बताया कि आंखों, नाक और मुंह का आकार।

एक बार स्टाइलगैन उन सभी तत्वों को पहचानने में सक्षम था - मानव पर्यवेक्षण के बिना - एक ब्रांड-नया, फोटो-यथार्थवादी मानव चेहरा उत्पन्न करने के लिए उन्हें स्वतंत्र रूप से इकट्ठा करना सीखा। शोधकर्ताओं ने एक साक्षात्कार अनुरोध को अस्वीकार कर दिया, लेकिन 12 दिसंबर, 2018 को Youtube पर पोस्ट किए गए वीडियो में उनकी प्रक्रिया को समझाया।

तो, क्यों शैली जी adorably यथार्थवादी बिल्ली तस्वीरें नहीं बना सकता है? एल्गोरिथ्म इसके साथ काम करने के लिए अपना सर्वश्रेष्ठ प्रदर्शन कर रहा था - और जब यह बिल्लियों के लिए आया था, तो हजारों संदर्भ चित्र जो इसे आदर्श से कम थे, ने कहा कि जेनले शेन, एक शोधकर्ता जो तंत्रिका नेटवर्क को प्रशिक्षित करता है लेकिन इसमें शामिल नहीं था अध्ययन, लाइव साइंस को बताया।

शेन ने अपने ब्लॉग एआई वेडरनेस पर 7 फरवरी को विचित्र बिल्लियों के बारे में लिखा। स्टाइलगन के मानव चेहरे के फोटो डेटा सेट के विपरीत - जिसमें निकायों और पृष्ठभूमि को बाहर निकाल दिया गया था और सिर की स्थिति एक-दूसरे के समान थी - डेटा में बिल्ली के चित्र अलग-अलग बेतहाशा सेट थे। संग्रह में सेटिंग्स की एक सीमा में और विभिन्न पृष्ठभूमि के खिलाफ बिल्लियों के क्लोज-अप और व्यापक शॉट्स शामिल हैं। कुछ तस्वीरों में एक बिल्ली दिखाई दी, कुछ में कई बिल्लियाँ थीं, और अन्य में लोग भी शामिल थे।

"ऊपर-नीचे बिल्लियाँ हैं; एक गेंद में घुसी हुई बिल्लियाँ हैं; उनकी आँखें खुली हुई हैं; उनकी आँखें बंद हैं। आप निश्चित रूप से बता सकते हैं कि उनका इनपुट डेटा थोड़ा शोर है - और शोर से मेरा मतलब है कि वहाँ सामान है यह सिर्फ एक बिल्ली की तस्वीर नहीं है, ”शेन ने कहा।

तो, बुरे सपने की भयावहता के लिए स्टाइलगन पर बहुत मुश्किल मत बनो।

"वहाँ बहुत कुछ चल रहा है कि एल्गोरिथ्म को सीखना है," शेन ने कहा।

जबकि StyleGAN के फोटोरिअलिस्टिक मानव निर्दोष थे, तंत्रिका नेटवर्क कोडांतरण के साथ संघर्ष करता था। (छवि क्रेडिट: एनवीडिया)

संघर्षशील दृश्य संकेतों ने स्टाइलगैन के लिए यह सीखना मुश्किल बना दिया कि एक वास्तविक बिल्ली को क्या देखना चाहिए। और तंत्रिका नेटवर्क में उनके द्वारा दी गई जानकारी के लिए वास्तविक दुनिया का संदर्भ नहीं है; वे सभी जानते हैं कि उनके डेटा सेट में क्या है। स्टाइलगन ने संदर्भ तस्वीरों से छोटे पैमाने के विवरण और बनावट को सटीक रूप से पुन: उत्पन्न करने के लिए पर्याप्त सीखा, जैसे बिल्ली का फर या बिल्ली के समान कान का आकार। लेकिन कार्यक्रम ने स्पष्ट रूप से पूरी बिल्ली को एक साथ रखने में संघर्ष किया, शेन ने कहा।

"उन्होंने बताया कि तंत्रिका नेटवर्क यह नहीं समझता है कि बिल्लियाँ कैसे काम करती हैं। यह समझ में नहीं आता कि उनके पैर कितने हैं। यह वास्तव में स्पष्ट नहीं है कि उनकी आँखें कितनी हैं या जहाँ उनकी शारीरिक रचना चली जाती है," उन्होंने लाइव साइंस को बताया।

StyleGAN की डिस्टर्बिंग कैट फोटोज, पास-परफेक्ट ह्यूमन इमेजेज और डेवलपमेंट प्लेटफॉर्म GitHub की अन्य प्रोजेक्ट फाइल्स के बारे में और देखें।

Pin
Send
Share
Send

वीडियो देखना: हम कलपस परकषण कय ह, गगल & # 39; नय कतरम बदध कमर, बललय पर (नवंबर 2024).