گروهی از محققان یک پلتفرم ویرایش تصاویر ابداع کردهاند که بر اساس یادگیری ماشینی و هوش مصنوعی کار میکند. این برنامه به کاربران قدرت بیشتری برای ویرایش تصویر میدهد و نتایج آن طبیعیتر به نظر میرسند.
روزانه بیشمار تصویر در رسانههای مجازی منتشر میشود. فقط در اینستاگرام بیش از 40 میلیارد عکس آپلود شده است، عددی که با سرعت جت میانگین روزی 95 میلیون عکس، در حال افزایش است. چنین اشتیاقی به عکس، نیاز به ابزاری نیرومند برای ویرایش تصاویر را نشان میدهد؛ ابزاری که متوسط کاربران بتوانند کارکردهای پیشرفته ویرایش تصویر را با آن تجربه کنند.
درحالیکه نیاز فزاینده به ویرایش تصاویر در رسانههای اجتماعی وجود دارد و ابزار ارتقاءیافته ویرایش تصاویر هم یکی از مهمترین جنبههای گرافیک کامپیوتری محسوب میشود، با کمبود ابزاری روبهرو هستیم که بتواند ویرایش پیچیده تصاویر را برای کاربران بیتجربه انجام دهد؛ مثلا ابزاری که احساسات نمایان در چهره را تغییر دهد.
در همین راستا، گروهی از محققان دانشگاه Bern-Switzerland و دانشگاه Maryland-College Park، یک چارچوب ویرایش تصاویر بر مبنای طراحی سریع ابداع کردهاند که به کاربران توانایی میدهد تا عکسهایشان را با کشیدن طرحهای سریع در بالای آنها ویرایش کنند. آنها این سیستم را فیسشاپ (FaceShop) نامیدهاند. این سیستم همچنین قابلیت کپی-پیست را هم دارا است، به این معنی که میتوان بخشی از یک تصویر دیگر را که کیفیت بهتری دارد را بدون نیاز به طراحی با دست یا طراحی هیچ چیر دیگری، در بخشی از تصویری که میخواهیم ویرایشش کنیم، پیست کنیم.
رویکرد تحقیقاتی این گروه بر اساس یادگیری ماشینی است و در نهایت به کاربران برای کنترل ویرایش تصویر آن طور که دلشان میخواهد و تولید نتایجی که هر چه طبیعیتر به نظر برسند، قدرت بیشتری میدهد.
سایر رویکردها، براساس تکنیکهای سنتی و دستی که محدودیتهای زیادی را به کاربر تحمیل میکند، عمل میکنند. برای مثال این سیستمها یا به عملیات ویرایش از پیش تعریف شده محدود شدهاند، یا بسیار قابل انعطاف هستند اما استفاده از آنها دشوار است و نیاز به کاربران با تجربه دارد که تازه آنها هم برای اجرای ویرایشهای پایهای باید وقت قابل توجهی صرف کنند.
اینها سخنان Tiziano Protenier، نویسنده مسئول این مقاله و دانشجوی دکتری دانشگاه برن است.
بر خلاف سیستمهای گذشته، سیستم ما بسیار انعطافپذیر است و به کاربران آماتور اجازه ویرایشهای پیشرفته را در زمانی کوتاه با استفاده از توانایی خود، میدهد.
این گروه پژوهشی، نتایج تحقیقاتشان را در کنفرانس SIGGRAPH 2018 به نمایش میگذراند. این گردهمایی سالانه، از 12 تا 18 آگوست در دانشگاه بریتیش-کلمبیا واقع در ونکوور کانادا برگزار میشود و آخرین دستاوردهای دانشگاهی و ذهنهای خلاق سراسر جهان را در زمینه گرافیک کامپیوتری و تکنیکهای کنش و واکنش (interaction technique) را به نمایش میگذارد.
این نویسندگان در مقالهشان با عنوان «FaceShop: Deep Sketch-based Face Image Editing»، سیستم تازه خود را با مثالهای متعدد توضیح میدهند.
در یکی از تصاویر، یک بینی را میبینیم که تنها اندکی دستکاری شده است و دستهای از مو که روی پیشانی قرار گرفته به کنار رفته است و سایهای که مو روی یک طرف صورت ایجاد کرده بوده، محو شده است.
در تصویر دیگری نشان داده میشود که چطور این سیستم قادر است تا آرایش چشم یک زن را بهبود ببخشد و قرمزی چشم را از بین ببرد.
مثالهایی که در این مقاله آمدهاند، نشان میدهند که این سیستم تازه چطور بر اساس شم کاربران کار میکند و میتواند نتایج با کیفیت بالا و به شکل واقعی تولید کند.
روش این گروه تحقیقاتی مبتنی بر نوعی از هوش مصنوعی به نام «generative adversarial neural networks» است که در سالهای اخیر توجه زیادی را به خاطر تواناییاش در تولید تصاویر واقعنما، از سوی پژوهشگران به خود جلب کرده است.
اولین مولفه تلاش میکند تصاویر تولید شده را از تصاویر واقعی تشخیص دهد، در حالی که مولفه دوم تلاش میکند تا تصاویری تولید کند که هوش مصنوعی دیگر را گول بزند. در طول آموزش، دو مولفه از یکدیگر یاد می گیرند و در نهایت به سیستمهایی میرسند که به طور خودمختار و بدون قضاوت انسانی در این حلقه برای تولید تصویرهای واقع گرایانه تلاش میکنند.
بر خلاف سایر روشهای ویرایش تصاویر برآمده از هوش مصنوعی، در این روش، زمانی که سیستم آموزشدیده شد، کاربران، بیشتر دارای کنترل بر روی ویرایش عکسهای خود هستند، و از نظر یک اپلیکیشن، این یک ویژگی بسیار جذاب است. Portenier اشاره میکند:
سایر تکنیکهایی که سعی میکنند که کنترل کاربر را هم به کار بگیرند، عموما به ویرایشهای تعریف شده محدود میشوند یا در مورد دادههایی که برای سیستم آشنا است عملکرد خوبی دارد، اما در برابر دادههای واقعی کاربر نمیتوانند نتایج راضیکننده داشته باشند. ما تکنیکی را معرفی میکنیم که این مشکل را تعدیل میکند و نتایج آن در عمل به طرز شگفتآوری خوب است.
در پروژه بعدی این محققان میخواهد تا ابزار دیگری را به این چارچوب اضافه کنند و ببیند که چطور میتوانند از فناوری هوش مصنوعی برای ویرایش ویدئو هم استفاده کنند.
کلام آخر
برای اخبار بیشتر از دنیای فناوری با پلازا همراه بمانید، شما همچنین میتوانید در بخش نظرات، دیدگاه خود را با ما به اشتراک بگذارید.