وقتی عكس ها به حرف می آیند!

وقتی عكس ها به حرف می آیند! لینك بخر دات كام: پژوهشگران آزمایشگاه هوش مصنوعی شركت سامسونگ در روسیه، سیستمی توسعه داده اند كه می تواند تنها از روی تصاویر افراد، مدل صحبت كردن آنها را شبیه سازی كند.


به گزارش لینك بخر دات كام به نقل از ایسنا و به نقل از سی نت، پیشرفت فناوری خوب است، اما در گاهی موارد ترسناك می شود؛ چونكه حالا هوش مصنوعی سامسونگ می تواند تنها از روی تصاویر افراد، مدل صحبت كردن آنها را شبیه سازی كند؛ برای مثال امكان دارد در آینده افراد بتوانند تنها از روی عكس شما در حساب كاربریتان در شبكه های اجتماعی مدل صحبت كردن شما را ببینند.
غول فناوری كره ای اخیراً یك سیستم هوش مصنوعی "دیپ فیك" (deepfake) جدیدی را توسعه داده است كه می تواند تنها با داشتن یك تصویر از افراد، نحوه حرف زدن آنها را شبیه سازی كند.
البته این فناوری آنچنان كه فكر می كنید ترسناك هم نیست و می توان بعنوان نوعی سرگرمی هم به آن نگاه كرد؛ چونكه توسط آن می توانید مدل حرف زدن مشاهیر جهان را نیز شبیه سازی كنید.
برای مثال شاید برای برخی همیشه یك معما بود كه "مونالیزا" چگونه حرف می زد، اما حالا تنها با وارد كردن پرتره او به این سیستم می توانید این معما را حل كنید. این نرم افزار دیپ فیك نیز همانند فتوشاپ با استفاده از یادگیری ماشین می تواند مدل صحبت كردن افراد را شبیه سازی كند.
آزمایشگاه هوش مصنوعی سامسونگ، سیستم خودرا "صحبت عصبی واقع گرایانه" (realistic neural talking heads) نامید. اصطلاح " talking heads " اشاره به ژانر ویدئویی دارد كه این سیستم می تواند ایجاد كند. كلمه "عصبی" (neural) نیز به شبكه های عصبی مرتبط می باشد. شبكه های عصبی نوعی سیستم یادگیری ماشین هستند كه ساختار مغز انسان را تقلید می كنند.
بگفته محققان می توان از این سیستم در بازی های ویدئویی و یا فیلم ها استفاده نمود. آنها افزودند: چنین سیستمی كاربردهایی در فناوری دورحضوری یا حضور از دور (Telepresence) نیز دارد. دورحضوری به فناوری ای گفته می شود كه به فرد اجازه می دهد حضورش را از طریق دور در مكانی دیگر احساس كند، گاهی این حضور می تواند به صورت تله رباتیك یا كنفرانس ویدئویی باشد.
از آن جایی كه در توسعه این سیستم در ابتدا تعداد زیادی عكس از یك فرد مورد نیاز بود، بدین سبب محققان تصاویر زیادی از افراد مشهور (هنرمندان یا سیاستمداران) را به آن وارد كردند.
جمله معروف " پیش از هر چیز دیگر، آمادگی كلید موفقیت استِ"مبتكر، دانشمند و مخترع تلفن "الكساندر گراهام بل" الهام بخش سامسونگ برای طراحی این سیستم بوده است. این سیستم با یك مرحله طولانی به نام "فرا یادگیری" (meta-learning stage) شروع می كند و در آن مرحله تعداد زیادی از فیلم ها را تماشا می كند تا بدانند چهره انسان چگونه هنگام صحبت حركت می كنند و بعد از آن با داشتن یك یا چند تصویر می تواند مدل صحبت كردن افراد را شبیه سازی كند.
مرورگر شما از ویدئو پشتیبانی نمی نماید.
فایل آنرا از اینجا دانلود كنید: video/mp4


منبع:

1398/03/04
23:16:14
5.0 / 5
2819
تگهای خبر: شركت , فتوشاپ , فناوری , مرورگر
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۹ بعلاوه ۵