اینکه یک خودروی خودران بتواند با مکانیزمی سادهتر بیاموزد و نسبت به هم ردههای خود از تجهیزات کمتر و کارآمدتری استفاده کند اتفاقی است که شرکت ویو (Wayve) در این زمینه اقداماتی در دست اجرا دارد که در ادامه به آن میپردازیم.
یک تیم تحقیقاتی در انگلستان توانستند در مدت 20 دقیقه به یک خودروی خودران بیاموزند که چگونه در یک مسیر مشخص رانندگی کند. بله این یک شاهکار قابل توجه است چون همه ما حتما افرادی را میشناسیم که حتی گاهی طی یک عمر نیز نمیتوانند رانندگی را بیاموزند و یا حتی خودرویی را صحیح برانند. درواقع به مانند تکنولوژیهای هوش مصنوعی شرکتهایی مانند DeepMind و OpenAI که از الگوریتم یادگیری تقویتی برای آموختن بازی استفاده میکنند، خودروی خودران شرکت Wayve نیز با استفاده از مکانیزم یادگیری تقویتی میآموزد چگونه در یک مسیر به رانندگی بپردازد.
گفتنی است شرکت ویو (Wayve) شرکتی در انگلستان بوده که توسط محققان بخش مهندسی دانشگاه کمبریج تاسیس شده است. به تازگی تیم تحقیقاتی این شرکت الگوریتم جدیدی را در زمینه هوش مصنوعی به نام «یادگیری تقویتی» یا «reinforcement learning» در تاریخ 28 ژوئن (7 تیر) منتشر کرده است. این الگوریتم در وبلاگ شرکت ویو منتشر شده است. هوش مصنوعی این الگوریتم به کمک یک انسان یاد میگیرد که چگونه بتواند در یک مسیر حرکت کند. زمان این حرکت معمولا بین 15 تا 20 دقیقه طول خواهد کشید.
الگوریتم یادگیری تقویتی قبل از این، در فناوریهای مختلفی مانند تکنولوژیهای شرکت دیپ مایند نیز به شکل موثری بکار گرفته شد که در آن دستاوردها این الگوریتم میتوانست چگونگی انجام بازیهایی مانند Go یا شطرنج را یاد بگیرد. همچنین شرکت OpenAI نیز نشان داد که این فناوری در 180 روز مفید توانست بازی Dota 2 را بیاموزد. البته درست است که شکست دادن رقبای انسانی توسط این الگوریتم در بازیهای ذکر شده کار بزرگی محسوب میشود اما با این حال بکارگیری و آموزش این تکنولوژی در زمینه خودرو و مخصوصا در هدایت خودروهای خودران مقوله کاملاً متفاوتی است.
این تیم در ویدیویی که در کانال یوتیوب خود منتشر کرده نشان میدهد که چگونه فرایند یادگیری توسط این الگوریتم صورت میپذیرد. علاوه بر این در این ویدیو اولین مثال واقعی از بکارگیری الگوریتم یادگیری تقویتی در یک خودروی خودران نشان داده شده است.
همانطور که در ویدیو مشاهده میکنید در گام اول خودرو مانند کودکی مسیر پیچیدهای را طی میکند. اما در زمانی که از خط خارج میگردد و یا اندکی منحرف میشود، یک راننده ایمنی که نقش نظارتی دارد خودرو را دوباره در مسیر قرار خواهد داد. الگوریم گنجانده شده در سیستم خودران خودرو این ترفندها را میآموزد و اشتباهات خود را نیز تصحیح میکند و هر زمان که بتواند بدون مداخله راننده مسیری را صحیح طی نماید پاداشی دریافت خواهد کرد تا بتواند حرکت صحیح را در حافظه خود ثبت نماید.
همچنین این ویدیو توضیف میکند که مدل استفاده شده به عنوان یک «شبکه عصبی عمیق و پیچیده » تصاویری تکی را دریافت میکند و توسط پردازنده گرافیکی خود مورد پردازش قرار میدهد. برخلاف سایر خودروهای خودران، خودروی رنویی که شرکت ویو مورد تست قرار داده است نیازی به مدلهای بزرگ، سنسورهایی با فناوریهای عجیب و غریب و دادههای بسیار زیاد ندارد؛ چراکه بر روی فرایندی که این شرکت در الگوریتم یادگیری تقویتی خود قرار داده است تمرکز میکند. در نتیجه این اقدام نیز فرایند آموزش مداوم، هوشمندانه و کارآمدی نصیب چنین خودروهای خودرانی خواهد شد.
جالب است بدانید هدف بعدی آنها این است که بتوانند این فرایند را برای رانندگیهای پیچیدهتر نیز گسترش دهند؛ تا اندازهای که خودروی خودران بتواند بدون خطا در مسیر حرکت نمایند. البته بهتر است این را نیز اضافه کنیم که محققان امیدوارند این سیستم در نهایت توانایی تشخیص چراغهای راهنمایی، تقاطعها و چهارراهها را داشته باشد.
کلام آخر
برای اخبار بیشتر از خودرو با پلازا همراه بمانید، شما همچنین میتوانید در بخش نظرات، دیدگاه خود را با ما به اشتراک بگذارید.