پروژه آسترا یکی از بلند پروازیهای گوگل است که میتوان به نوعی آن را پاسخی به تمامی ویژگیهایی دانست که این روزها چت جی پی تی ارائه کرده است. در این مقاله قرار است در مورد اینکه پروژه آسترا گوگل چیست و چه امکاناتی ارائه میدهد، به صورت کامل با هم صحبت کنیم.
هوش مصنوعی در چند سال گذشته پیشرفتهای قابل قبول و خوبی داشته است و توانست خود را از پروژههای صرفا تحقیقاتی به چت باتها و گجتهای مختلف برساند و اکنون هم که در حال شبیه سازیهای رویایی در فیلمهای مختلف است. در این مقاله با بررسی پروژه آسترا (Project Astra) که به تازگی توسط گوگل معرفی شده است و فیلمهای آزمایش آن به شدت حیرت انگیز بوده است، میخواهیم در مورد همین هوش مصنوعی صحبت کنیم که یک گام از سایر دستیارها فراتر رفته و میتواند به صورت بصری محیط اطراف خود را شناسایی کرده و بر اساس آن به کاربران خود خدمت رسانی کند. در ادامه این مطلب از پلازا، در مورد اینکه پروژه آسترا گوگل چیست صحبت خواهیم کرد.
فهرست مطالب
پروژه آسترا چیست؟
پروژه آسترا نام جدیدی است که این روزها در اینترنت شنیده میشود و اشاره به پروژه جدید گوگل برای تکمیل دستیار هوش مصنوعی خود یعنی هوش مصنوعی Gemini دارد. در واقع پروژه آسترا پاسخی به مدل زبانی جدید اوپن ای آی، یعنی GPT-4o است.
در واقع پروژه آسترا یک دستیار هوش مصنوعی را ارائه میدهد که میتواند به صورت محاوره ای با کاربران خود چت کرده، متن، صدا، تصویر و ویدئو را به عنوان ورودی بگیرد و علاوه بر این موارد که در چت جی پی تی هم فعال است، میتواند از سخت افزار گوشی که روی آن فعال است، مانند دوربین، جی پی اس و سایر امکانات نیز استفاده کند. به این صورت که این گوشی در لحظه مشاهدات خود را از دوربین گرفته و آنها را تحلیل کرده و اطلاعات را در اختیار کاربر میگذارد. همینطور موتور جستجوی قدرتمند گوگل نیز برای پیدا کردن جواب درست در تمامی موارد در اختیار این هو ش مصنوعی قرار خواهد داشت که میتواند با آن اطلاعات بروز را در اختیار شما قرار دهد.
به طور مثال اگر شما گوشی خود را مقابل ویترین یک مغازه بگیرید و از هوش مصنوعی پروژه آسترا بخواهید که به شما بگوید این مغازه کدام یک از اجناس خود را ارزانتر و کدام را گرانتر میفروشد، این کار را در لحظه و به صورت بلادرنگ برای شما انجام خواهد داد. در این حالت این هوش مصنوعی محصولات را پیدا کرده، قیمت آنها را بررسی میکند و با کمک موتورهای جستجو قیمتهای سایر فروشندگان را پیدا کرده و نتیجه اینکه کدام گرانتر و کدام ارزان تر است را به شما خواهد داد.
نکته مهم در مورد پروژه آسترا گوگل این است که آسترا یک برنامه جدا نبوده و نمیتوان برنامه ای را با این عنوان پیدا کرد، بلکه اسم رمزی برای توسعه برنامه جمینای گوگل است. در واقع تمامی تغییرات و دستاوردهایی که گوگل در پروژه آسترا بدست آورده است، با کمک دستیار جمینای به کاربران عرضه خواهد شد و مروی این بستر در دسترس عموم قرار میگیرد. در صورتی که سری به مقاله هوش مصنوعی گوگل جمینای بزنید، می توانید روش کار با این دستیار هوش مصنوعی حرفه ای را در اختیار داشته باشید. در ادامه در مورد مدل زبانی استفاده شده در پروژه آسترا و ویژگیهای آن بیشتر صحبت خواهیم کرد.
مکانیزم کاری پروژه آسترا گوگل چیست؟
همانطور که در بخشهای قبلی نیز اشاره کردیم، پروژه آسترا گوگل بر اساس مدل زبانی Gemini کار میکند و در واقع از همین برنامه و بستر استفاده میکند. در واقع ما در حال صحبت در مورد هسته اصلی این هوش مصنوعی هستیم. مدل زبانی Gemini در واقع یک هسته هوش مصنوعی پیشرفته است که جانشین هوش مصنوعیهای LaMDA و PaLM گوگل شده است. این هوش مصنوعی توسط سازمان DeepMind توسعه داده شده است.
در مورد DeepMind، که در خیلی مراجع آن را به صورت Google DeepMind معرفی میکنند، باید گفت که این سازمان در واقع بخش توسعه هوش مصنوعی گوگل است. DeepMind در ابتدا یک شرکت استارتاپی بود که در سال ۲۰۱۰ توسط متخصصان هوش مصنوعی و شبکههای عصبی دانشگاه لندن پایه گذاری شد و توانست پروژههای موفقی را در مدت کوتاهی به ثمر برساند. همین موضوع باعث شد که غولهای تکنولوژی به سراغ آن آمده و از میان پیشنهادات رنگارنگی که از طرف سازمانهای بزرگ به آن شده بود و اسامی مانند فیسبوک و گوگل هم در میان آنها دیده میشد، این سازمان به گوگل فروخته شد. از سال ۲۰۱۳ که این اتفاق افتاد، دیپ مایند در حال توسعه هوش مصنوعیها و روباتهای گوگل میباشد.
مدل زبانی که دیپ مایند برای پروژه آسترا ارائه داده است، یعنی همان Gemini، برای اولین بار در سال ۲۰۲۳ ارائه شد و میتوان گفت حاوی جدیدترین دستاوردهای گوگل است که از نظر نتایج آزمایشها رقابت سخت و تنگاتنگی با مدل زبانی GPT-4 از اوپن ای آی داشت و چیزی از آن کم نداشت. این مدل زبانی با سرویسهای متعددی به نامهای جمینای پرو، جمینای اولترا و جمینای نانو در اختیار کاربران قرار گرفته بود و مدل محبوبی است که گوگل قبلا آن را به صورت تجاری عرضه کرده و به نظر نمیرسد قرار باشد این برند بزرگ را برای به ثمر رساندن پروژه آسترا، لنگ بگذارد.
این مدل زبانی میتواند عملکرد قوی در تحلیلهای بلادرنگ از تصاویری که میبیند، داشته و این موضوع یکی از اصلی ترین نقاط قوت پروژه آسترا به شمار میرود. در واقع روش کاری آن به این صورت است که میتواند آنچه که از دوربینهای دیوایسی که روی آن فعال است، میبیند را تحلیل کرده و به سوالات پیرامون آن پاسخ دهد. برای این منظور این هوش مصنوعی چهار گام اصلی را در میدارد:
- رکورد کردن ویدیوهای کوتاه به صورت پشت سر هم؛
- رکورد کردن صحبتهایی که از طریق میکروفون به گوش آن میرسد؛
- ایجاد یک تایم لاین از ویدئوها و صدا ها؛
- ایجاد درک دوجانبه از صداها و تصاویری که میبیند به صورت همزمان و ارائه پاسخ؛
نکته جالب اینجاست که همه این فعالیتها باید به صورت Realtime و در لحظه انجام شود و پروژه آسترا میتواند این کار را برای ما انجام دهد. البته نیازی نیست که صرفا از محیط اطراف از آن سوال شود و شما میتوانید هر گفت و گویی با آن داشته باشید. اما ویژگی ورودی گرفتن از طریق دوربین و بررسی آن، موضوعی است که تا کنون در هوش مصنوعی دیگری مشاهده نشده است. در ادامه در بیشتر در مورد اینکه مدل زبانی جمینای قرار است چه ویژگیهایی را در پروژه آسترا پیاده سازی کند صحبت خواهیم کرد.
قابلیتهای پروژه آسترا
تا به اینجا در مورد اینکه پروژه آسترا چیست و مکانیزم اصلی کاری آن کدام است با هم صحبت کردیم و در این میان کم و بیش با کارهایی که این هوش مصنوعی خارق العاده قرار است برای ما انجام دهد، آشنا شدیم. اما اینکه پروژه آسترا دقیقا چه قابلیتها و تواناییهایی دارد از موضوعاتی هستند که هنوز در مورد آنها صحبت نشده است. در این بخش از مقاله میخواهیم به صورت دقیق به بررسی این موضوع بپردازیم و ببینم تواناییهای آن در چه حدی خواهد بود.
در حال حاضر بهترین مرجعی که برای این کار داریم، ویدئوهای منتشر شده از طرف خود گوگل است که آنها را در سایت رسمی دیپ مایند منتشر کرده است. این ویدئوها مربوط به تست کار کردن با نسخههای آزمایشی پروژه آسترا میباشد که در آن قابلیتهای شگفت انگیزی توسط یکی از تسترها در فضای اداری دیپ مایند در لندن آزمایش میشود. هرچند این ویژگیها به صورت عملی در حال تست بوده و میتوان آنها را دید، اما برای عملیاتی شدن آنها هنوز راه زیادی در پیش بوده و تا زمانی که هر کس بتواند این قابلیتها را روی گوشی خود داشته باشد، مطمئنا مدت زیادی طول خواهد کشید. مهمترین مواردی که در بین این ویژگیها دیده میشوند از این قرارند:
درک محتوا و کانتکست مورد بحث از روی تصاویر
شاید مهمترین ویژگی که میتوان برای پروژه آسترا نام برد همین باشد. قابلیتی که نمیتوان آن را در خیلی از رقبا دیگر دید. در اینجا وقتی شما در حال صحبت با دستیار هوش مصنوعی خود هستید، میتوانید با راهنماییهای خیلی ساده مانند کشیدن چند شکل ساده و یا نمایش جزئیات خیلی عادی، کاری کنید که این هوش مصنوعی منظور شما را کاملا درک کرده و در مورد آن موضوع با شما صحبت کند.
در ویدئوهای منتشر شده از این قابلیت با نمایش یک کاریکاتور از یک مرد با موهای وزوزی، و همینطور یک آدمک که در زیر درختی ایستاده است، این هوش مصنوعی میتواند تشخیص دهد که در حال صحبت در مورد انیشتین و نیوتون هستیم و فیزیک موضوع مورد بحث در این مکالمه است. همینطور همین موارد با نمایش تصاویری از داستانهای شکسپیر، آن هم به صورت دست نویس روی یک تخته وایت برد، برای پروژه آسترا قابل درک میباشد.
دریافت ورودیهای پیچیده
یکی از مهمترین قابلیتهایی که پروژه آسترا ارائه میکند و انقدر به ما نزدیک بوده و درست در جلوی چشمان ما قرار دارد، دریافت ورودیهایی پیچیده است. این ویژگی، که در حال حاضر به این شکل تنها در پروژه آسترا و هوش مصنوعی جمینای پیدا میشود، به کاربر اجازه میدهد با ارائه ویدئو، متن، فایل صوتی، تصویر و یا موارد مختلفی از آنها به صورت ترکیبی، با این هوش مصنوعی ارتباط بگیرد. در این مورد باید گفت پروژه آسترا و جمینای در نوع خود بی نظیر عمل کرده و هیچ کدام از رقبا وارد این زمینه نشده اند.
تشخیص مکانها از روی تصویر
موضوع دیگری که میتوان از آن در این هوش مصنوعی استفاده کرد، تشخیص و درک مکانها است. البته باید گفت خیلی از انواع هوش مصنوعی هستند که با نشان دادن برج ایفل به آنها بگویند که این تصویر مربوط به کجا است. اما این هوش مصنوعی میتواند خیلی ریز تر از این حرفها آدرس محلی که در آن هستید را به شما بدهد و در واقع از خود گوگل و تمامی تصاویری که در گوگل مپ قرار دارد برای درک این موضوع کمک میگیرد.
ارائه اطلاعات تخصصی
سطح اطلاعاتی بالا، یکی دیگر از نقاط قوت در پروژه آسترا به شمار میرود. هر چند هوش مصنوعی گوگل به صورت دقیقی اطلاعاتی که برای یادگیری استفاده کرده را ارائه نداده، اما با توجه به ویدئوها می میتوان گفت از نظر فنی مهندسی، فیزیک، ریاضی و ادبیات، این هوش مصنوعی حسابی روی فرم بوده و اطلاعات خوبی را در خود دارد که میتواند برای خیلی از کاربران و استفاده کنندگان از این دستیار هوش مصنوعی مهم و کاربردی باشد. شما به راحتی میتوانید پاسخ مسائل ریاضی و فیزیک را با گرفتن دوربین گوشی خود و پرسیدن از جمینای، بدست آورید.
همطنرو در صورتی که یک دیوایس را به آن نشان داده و بخواهید اجزای آن را تشریح و کار هر یک را بازگو کند، این هوش مصنوعی میتواند این کار را جز به جز برای شما انجام دهد. در یکی از ویدئوها با نمایش یک اسپیکر به این هوش مصنوعی این اتفاق افتاده و این هوش مصنوعی اطلاعات خوبی را در مورد اجزای آن به کاربر ارائه میدهد.
سرعت بالا و ریل تایم بودن
مورد دیگری که میتوان در تستها و فیلمهای آزمایش پروژه آسترا مشاهده کرد، ریل تایم بودن و قدرت پاسخ دهی فوق العاده سریع آن است. دیپ مایند اعلام کرده است که قرار است این ویژگی به همین شکل بماند اما مطمئنا وقتی که این سرویس به دست مخاطبان برسد، مسائلی مانند قدرت پردازنده گوشی و سرعت اینترنت میتواند در این خصوص تاثیر گذار باشد. اینکه گوگل تا چه اندازه خود را متعهد به بالا نگه داشتن این کیفیت و حفظ سرعت کنونی بداند، موضوعی است که برای روشن شدن آن باید تا انتشار نسخههای عملیاتی و نهایی این دستیار هوش مصنوعی صبر کنیم.
امکان استفاده از موتور جستجو گوگل
وقتی در مورد یک هوش مصنوعی قدرتمند که توسط گوگل ارائه شده است حرف میزنیم، مطمئنا میتوان حدس زد که قرار است موتور جستجوی حرفه ای گوگل نیز در آن وارد شده و در مورد پیدا کردن اطلاعات به آن کمک کند. البته باید گفت که این موضوع در مورد پروژه آسترا به صورت کنترل شده و محدود میباشد. قبلا گوگل در هوش مصنوعی بارد تجربه چندان خوبی را از این موضوع نگرفته بود و خیلی از کاربران احساس میکردند که پاسخهای این هوش مصنوعی زیادی به نتایج جستجو نزدیک بوده و خود این هوش مصنوعی هیچ کاری انجام نمیدهد، باید منتظر ماند و دید این مشکلات در پروژه آسترا تا چه اندازه برطرف خواهد شد.
هوش مصنوعی آسترا روی چه دیوایسهایی کار میکند؟
یکی دیگر از مسائل مهم و درخور توجه که میتوان در مورد آن صحبت کرد، بستر فعالیت هوش مصنوعی آسترا خواهد بود. در این مورد باید گفت که تمامی ویدئوهای تستهایی که در سایت دیپ مایند به نمایش درآمده است، روی گوشیهای گوگل پیکسل انجام گرفته است. ولی به نظر میرسد که این دستیار بتواند روی سیستمهای دیگر هم کار کند. در واقع باید گفت بر اساس اعلام خود گوگل، این هوش مصنوعی میتواند به خوبی و با تمام ویژگیها، روی گوشیهایی که تراشه آنها دارای واحد NPU برای پردازشهای عصبی باشند، فعالیت کند.
البته باید گفت اکثر این گوشیها، مدلهای میان ردههای گران و پرچمداران بوده و بازه چندان گستردهای را تشکیل نمیدهند. همینطور پروژه آسترا میتواند روی عینکهای هوشمند نیز فعال باشد و کار کند. البته گوگل در مورد اینکه آیا این عینکهای هوشمند حتما باید از نوع عینکهای گوگل باشد یا با سایر عینکها نیز میتوان کار کرد، حرفی به میان نیاورده است. ظاهرا برای داشتن اطلاعات دقیق در مورد اینکه روی چه دیوایسهایی می میتوان از این ویژگی استفاده کرد، لازم است تا تجاری شدن کامل این پروژه صبر کنیم.
بررسی رقبای پروژه آسترا
یکی از ترندهای جالب این روزهای دنیای تکنولوژی کل کلهای بین شرکتهای ارائه دهنده هوش مصنوعی است که در واقع میتوان گفت پروژه آسترا گوگل نیز نتیجه یکی از همین داستانها است. در ماه می ۲۰۲۴ شرکت اوپن ای آی، که که همگی آن را به عنوان یکی از پیشروترین شرکتهای هوش مصنوعی میشناسند و برنامه ChatGPT آن یکی از بهترینهای این حوزه است، ورژن جدیدی از هوش مصنوعی را معرفی کرد و آن را به صورت رایگان در سایت خود مورد آزمایش قرار داد و به کاربران امکان استفاده محدود از آن را داد.
این هوش مصنوعی سرعت بسیار عالی و قدرت خوبی برای محاوره و گفت و گوی روان و غیر ماشینی با کاربران داشت. اوپن ای آی اعلام کرد که این هوش مصنوعی در نوع خود بی نظیر بوده و به نوعی آن را با هوش مصنوعی سامانتا در فیلم Her مقایسه کرد. گوگل که ظاهرا از این موضوع خوشش نیامده بود هر چه در توان داشت را جمع کرد و کارهای آتی خود را تحت اسم پروژه آسترا مجتمع کرده و معرفی کرد. در پاسخ به این عنوان، گوگل این هوش مصنوعی را مانند جارویس آیرون من معرفی کرد که به مراتب قابلیتهای بالاتری را به نمایش گذاشته بود و جنبه ای ابر قهرمانی داشت.
البته نمیتوان گفت که در آینده کدام یک از این دو هوش مصنوعی برتری نهایی را دارند و دنیای هوش مصنوعی پر از غافلگیریهای ریز و درشت است و باز هم ممکن است ورق به نفع هر کدام از این دو شرکت بزرگ برگشته و حتی طرف سومی وارد ماجرا شود که گوی سبقت را از هر دوی آنها برباید.
نتیجه گیری
در این مقاله در مورد اینکه پروژه آسترا گوگل چیست و چطور کار میکند با هم صحبت کردیم و تواناییهای آن را دیدیم. در این مورد باید گفت آسترا نامی است که گوگل برای پروژه هوش مصنوعی جدید خود که روی دستیار جمینای پیاده سازی شده، انتخاب کرده است. این هوش مصنوعی میتواند ورودیهای خود را با کمک دوربین گوشی و عینک هوشمند دریافت کده و تحلیلهای بلادرنگی را روی آنها انجام داده و پاسخ را با لحن محاوره ای و طبیعی در قالب متن و صوت به کاربران ارائه دهد. در صورتی که در مورد پروژه آسترا سوال و یا نظری داشتید، خوشحال میشویم آن را با ما و سایر کاربران در میان بگذارید.