ابزار جدید ویرایش چهره که با استفاده از هوش مصنوعی عمل می کند

تینا قنبریان
16 تیر 1397 19:30

مدت زمان مطالعه: 5 دقیقه

گروهی از محققان یک پلتفرم ویرایش تصاویر ابداع کرده‌اند که بر اساس یادگیری ماشینی و هوش مصنوعی کار می‌کند. این برنامه به کاربران قدرت بیشتری برای ویرایش تصویر می‌دهد و نتایج آن طبیعی‌تر به نظر می‌رسند.

روزانه بی‌شمار تصویر در رسانه‌های مجازی منتشر می‌شود. فقط در اینستاگرام بیش از 40 میلیارد عکس آپلود شده است، عددی که با سرعت جت میانگین روزی 95 میلیون عکس، در حال افزایش است. چنین اشتیاقی به عکس، نیاز به ابزاری نیرومند برای ویرایش تصاویر را نشان می‌دهد؛ ابزاری که متوسط کاربران بتوانند کارکردهای پیشرفته ویرایش تصویر را با آن تجربه کنند.

درحالیکه نیاز فزاینده به ویرایش تصاویر در رسانه‌های اجتماعی وجود دارد و ابزار ارتقاءیافته ویرایش تصاویر هم‌ یکی از مهم‌ترین جنبه‌های گرافیک کامپیوتری محسوب می‌شود، با کمبود ابزاری روبه‌رو هستیم که بتواند ویرایش پیچیده تصاویر را برای کاربران بی‌تجربه انجام دهد؛ مثلا ابزاری که احساسات نمایان در چهره را تغییر دهد.

همچنین بخوانید :

عملکرد بهتر هوش مصنوعی نسبت به پزشکان در تشخیص بیماری

فیسبوک به کمک هوش مصنوعی چشم های بسته را باز می کند

در همین راستا، گروهی از محققان دانشگاه Bern-Switzerland و دانشگاه Maryland-College Park، یک چارچوب ویرایش تصاویر بر مبنای طراحی سریع ابداع کرده‌اند که به کاربران توانایی می‌دهد تا عکس‌هایشان را با کشیدن طرح‌های سریع در بالای آن‌ها ویرایش کنند. آن‌ها این سیستم را فیس‌شاپ (FaceShop) نامیده‌اند. این سیستم هم‌چنین قابلیت کپی-پیست را هم دارا است، به این معنی که می‌توان بخشی از یک تصویر دیگر را که کیفیت بهتری دارد را بدون نیاز به طراحی با دست یا طراحی هیچ چیر دیگری، در بخشی از تصویری که می‌خواهیم ویرایشش کنیم، پیست کنیم.

رویکرد تحقیقاتی این گروه بر اساس یادگیری ماشینی است و در نهایت به کاربران برای کنترل ویرایش تصویر آن طور که دل‌شان می‌خواهد و تولید نتایجی که هر چه طبیعی‌تر به نظر برسند، قدرت بیشتری می‌دهد.

سایر رویکردها، براساس تکنیک‎های سنتی و دستی که محدودیت‌های زیادی را به کاربر تحمیل می‌کند، عمل می‌کنند. برای مثال این سیستم‌ها یا به عملیات ویرایش از پیش‌ تعریف شده محدود شده‌اند، یا بسیار قابل انعطاف هستند اما استفاده از آن‌ها دشوار است و نیاز به کاربران با تجربه دارد که تازه آن‌ها هم برای اجرای ویرایش‌های پایه‌ای باید وقت قابل توجهی صرف کنند.

این‌ها سخنان Tiziano Protenier، نویسنده مسئول این مقاله و دانشجوی دکتری دانشگاه برن است.

بر خلاف سیستم‌های گذشته، سیستم‌ ما بسیار انعطاف‌پذیر است و به کاربران آماتور اجازه ویرایش‌های پیشرفته را در زمانی کوتاه با استفاده از توانایی خود، می‌دهد.

این گروه پژوهشی، نتایج تحقیقات‌شان را در کنفرانس SIGGRAPH 2018 به نمایش می‌گذراند. این گردهمایی سالانه، از 12 تا 18 آگوست در دانشگاه بریتیش-کلمبیا واقع در ونکوور کانادا برگزار می‌شود و آخرین دستاوردهای دانشگاهی و ذهن‌های خلاق سراسر جهان را در زمینه گرافیک کامپیوتری و تکنیک‌های کنش‌ و واکنش (interaction technique) را به نمایش می‌گذارد.

این نویسندگان در مقاله‌شان با عنوان «FaceShop: Deep Sketch-based Face Image Editing»، سیستم تازه‌ خود را با مثال‌های متعدد توضیح می‌دهند.

در یکی از تصاویر، یک بینی را می‌بینیم که تنها اندکی دستکاری شده است و دسته‌ای از مو که روی پیشانی‌ قرار گرفته به کنار رفته است و سایه‌ای که مو روی یک طرف صورت ایجاد کرده بوده، محو شده است.

در تصویر دیگری نشان داده می‌شود که چطور این سیستم قادر است تا آرایش چشم یک زن را بهبود ببخشد و قرمزی چشم را از بین ببرد.

مثال‌هایی که در این مقاله آمده‌اند، نشان می‌دهند که این سیستم تازه چطور بر اساس شم کاربران کار می‌کند و می‌تواند نتایج با کیفیت بالا و به شکل واقعی تولید کند.

روش این گروه تحقیقاتی مبتنی بر نوعی از هوش مصنوعی به نام «generative adversarial neural networks» است که در سال‌های اخیر توجه زیادی را به خاطر توانایی‌اش در تولید تصاویر واقع‌نما، از سوی پژوهشگران به خود جلب کرده است.

اولین مولفه تلاش می‌کند تصاویر تولید شده را از تصاویر واقعی تشخیص دهد، در حالی که مولفه دوم تلاش می‌کند تا تصاویری تولید کند که هوش مصنوعی دیگر را گول بزند. در طول آموزش، دو مولفه از یکدیگر یاد می گیرند و در نهایت به سیستم‌هایی می‌رسند که به طور خودمختار و بدون قضاوت انسانی در این حلقه برای تولید تصویر‌های واقع گرایانه تلاش می‌کنند.

بر خلاف سایر روش‌های ویرایش تصاویر برآمده از هوش مصنوعی، در این روش، زمانی که سیستم آموزش‌دیده شد، کاربران، بیشتر دارای کنترل بر روی ویرایش‌ عکس‌های‌ خود هستند، و از نظر یک اپلیکیشن، این یک ویژگی بسیار جذاب است. Portenier اشاره می‌کند:

سایر تکنیک‌هایی که سعی می‌کنند که کنترل کاربر را هم به کار بگیرند، عموما به ویرایش‌های تعریف شده محدود می‌شوند یا در مورد داده‌هایی که برای سیستم آشنا است عملکرد خوبی دارد، اما در برابر داده‌های واقعی کاربر نمی‌توانند نتایج راضی‌کننده داشته باشند. ما تکنیکی را معرفی می‌کنیم که این مشکل را تعدیل می‌کند و نتایج آن در عمل به طرز شگفت‌آوری خوب است.

در پروژه بعدی این محققان می‌خواهد تا ابزار دیگری را به این چارچوب اضافه کنند و ببیند که چطور می‌توانند از فناوری هوش مصنوعی برای ویرایش ویدئو هم استفاده کنند.