الگوریتمی که رانندگی یک خودروی خودران را در 20 دقیقه یاد گرفت

تیم پلازا
18 تیر 1397 19:00

مدت زمان مطالعه: 4 دقیقه

اینکه یک خودروی خودران بتواند با مکانیزمی ساده‌تر بیاموزد و نسبت به هم رده‌های خود از تجهیزات کمتر و کارآمدتری استفاده کند اتفاقی است که شرکت ویو (Wayve) در این زمینه اقداماتی در دست اجرا دارد که در ادامه به آن می‌پردازیم.

همچنین بخوانید :

کادیلاک سوپر کروز قهرمان خودروهای خودران

اپل مهندس ارشد پروژه Waymo را در پروژه اتومبیل خودران خود استخدام کرد

یک تیم تحقیقاتی در انگلستان توانستند در مدت 20 دقیقه به یک خودروی خودران بیاموزند که چگونه در یک مسیر مشخص رانندگی کند. بله این یک شاهکار قابل توجه است چون همه ما حتما افرادی را می‌شناسیم که حتی گاهی طی یک عمر نیز نمی‌توانند رانندگی را بیاموزند و یا حتی خودرویی را صحیح برانند. درواقع به مانند تکنولوژی‌های هوش مصنوعی شرکت‌هایی مانند DeepMind و OpenAI که از الگوریتم یادگیری تقویتی برای آموختن بازی استفاده می‌کنند، خودروی خودران شرکت Wayve نیز با استفاده از مکانیزم یادگیری تقویتی می‌آموزد چگونه در یک مسیر به رانندگی بپردازد.

گفتنی است شرکت ویو (Wayve) شرکتی در انگلستان بوده که توسط محققان بخش مهندسی دانشگاه کمبریج تاسیس شده است. به تازگی تیم تحقیقاتی این شرکت الگوریتم جدیدی را در زمینه هوش مصنوعی به نام «یادگیری تقویتی» یا «reinforcement learning» در تاریخ 28 ژوئن (7 تیر) منتشر کرده است. این الگوریتم در وبلاگ شرکت ویو منتشر شده است. هوش مصنوعی این الگوریتم به کمک یک انسان یاد می‌گیرد که چگونه بتواند در یک مسیر حرکت کند. زمان این حرکت معمولا بین 15 تا 20 دقیقه طول خواهد کشید.

الگوریتم یادگیری تقویتی قبل از این، در فناوری‌های مختلفی مانند تکنولوژی‌های شرکت دیپ مایند نیز به شکل موثری بکار گرفته شد که در آن دستاوردها این الگوریتم می‌توانست چگونگی انجام بازی‌هایی مانند Go یا شطرنج را یاد بگیرد. همچنین شرکت OpenAI نیز نشان داد که این فناوری در 180 روز مفید توانست بازی Dota 2 را بیاموزد. البته درست است که شکست دادن رقبای انسانی توسط این الگوریتم در بازی‌های ذکر شده کار بزرگی محسوب می‌شود اما با این حال بکارگیری و آموزش این تکنولوژی در زمینه خودرو و مخصوصا در هدایت خودروهای خودران مقوله کاملاً متفاوتی است.

این تیم در ویدیویی که در کانال یوتیوب خود منتشر کرده نشان می‌دهد که چگونه فرایند یادگیری توسط این الگوریتم صورت می‌پذیرد. علاوه بر این در این ویدیو اولین مثال واقعی از بکارگیری الگوریتم یادگیری تقویتی در یک خودروی خودران نشان داده شده است.

همان‌طور که در ویدیو مشاهده می‌کنید در گام اول خودرو مانند کودکی مسیر پیچیده‌ای را طی می‌کند. اما در زمانی که از خط خارج می‌گردد و یا اندکی منحرف می‌شود، یک راننده ایمنی که نقش نظارتی دارد خودرو را دوباره در مسیر قرار خواهد داد. الگوریم گنجانده شده در سیستم خودران خودرو این ترفندها را می‌آموزد و اشتباهات خود را نیز تصحیح می‌کند و هر زمان که بتواند بدون مداخله راننده مسیری را صحیح طی نماید پاداشی دریافت خواهد کرد تا بتواند حرکت صحیح را در حافظه خود ثبت نماید.

همچنین بخوانید :

آینه بغل های مجازی در آئودی ایده خوبی برای کاهش سرو صدا هستند

همچنین این ویدیو توضیف می‌کند که مدل استفاده شده به عنوان یک «شبکه عصبی عمیق و پیچیده » تصاویری تکی را دریافت می‌کند و توسط پردازنده گرافیکی خود مورد پردازش قرار می‌دهد. برخلاف سایر خودروهای خودران، خودروی رنویی که شرکت ویو مورد تست قرار داده است نیازی به مدل‌های بزرگ، سنسورهایی با فناوری‌های عجیب و غریب و داده‌های بسیار زیاد ندارد؛ چراکه بر روی فرایندی که این شرکت در الگوریتم یادگیری تقویتی خود قرار داده است تمرکز می‌کند. در نتیجه این اقدام نیز فرایند آموزش مداوم، هوشمندانه و کارآمدی نصیب چنین خودروهای خودرانی خواهد شد.

جالب است بدانید هدف بعدی آن‌ها این است که بتوانند این فرایند را برای رانندگی‌های پیچیده‌تر نیز گسترش دهند؛ تا اندازه‌ای که خودروی خودران بتواند بدون خطا در مسیر حرکت نمایند. البته بهتر است این را نیز اضافه کنیم که محققان امیدوارند این سیستم در نهایت توانایی تشخیص چراغ‌های راهنمایی، تقاطع‌ها و چهارراه‌ها را داشته باشد.