هوش مصنوعی GPT-4o، پدیده جدیدی دیگر در دنیای هوش مصنوعی است که می تواند تجربه کار با چت بات ها را به طور کلی تغییر دهد. در این مقاله می خواهیم به صورت کامل مدل زبانی GPT-4o را با هم بررسی کنیم.
هوش مصنوعی و چت بات های آن را میتوان یکی از کار راه اندازترین ابزار های اینترنتی که میتوان برای کارهای مختلف از آنها استفاده کرد، دانست. شرکت های مختلفی آن را ارائه می دهند، اما باید گفت که برنامه چت جی پی تی از اوپن ای آی را می توان بهترین مورد از آنها دانست که به تازگی نسخه بهتری از آن نیز منتشر شده است. هوش مصنوعی GPT-4o یکی از ورژن های جدید این هوش مصنوعی است که قرار است، سریعتر، دقیق تر، طبیعی تر و بسیار جذاب تر از مدل های قبلی باشد. در این هوش مصنوعی آپگرید ها و تغییرات زیادی اتفاق افتاده است که در ادامه این مقاله پلازا، می خواهیم تمامی آنها را با هم بررسی کنیم.
فهرست مطالب
هوش مصنوعی GPT-4o چیست؟
خبر انتشار و ارائه هوش مصنوعی GPT-4o، توجه خیلی از کاربران را به خود جذب کرده است و باید گفت که سر و صدایی که اوپن ای آی به دلیل انتشار این نسخه جدید از GPT های خود راه انداخته، در این مورد نقش پررنگی داشته است. هوش مصنوعی GPT-4o، نسخه تکمیل شده از ورژن ۴ است که حرف o در نام آن مخفف واژه omni به معنی «عالمگیر» است. به نظر می رسد اوپن ای آی قصد دارد این هوش مصنوعی را جایگزین نسخه رایگان ۳.۵ کند.
این نسخه از هوش مصنوعی، برای اولین بار در تاریخ ۱۳ می سال ۲۰۲۴ به صورت رسمی از طریق برنامه ChatGPT در اختیار کاربران قرار گرفت و هر کسی که از این برنامه استفاده می کرد، این نسخه از هوش مصنوعی را نیز دریافت کرد. مدیر عامل اوپن ای آی، سم آلتمن، در این خصوص گفت:
اوپن ای آی با این کار، یک گام بزرگ در راه رسیدن به هدف اصلی خود، یعنی ارائه بهترین هوش مصنوعی به صورت رایگان به تمامی کاربران، برداشته است.
البته بدیهی است که هوش مصنوعی GPT-4o نمی تواند با تمامی قدرت عرضه و ویژگی هایی فراتر از مدل هوش مصنوعی GPT-4، که کاربران برای استفاده از آن ماهیانه ۲۰ دلار پرداخت می کنند، را به صورت رایگان در اختیار بقیه بگذارد و سیاست های تجاری اوپن ای آی را نابود کند.
هوش مصنوعی GPT-4o با مجموعه ای از ویژگی های حرفه ای انتشار یافته است که خیلی از آنها را از GPT-4 به ارث برده است. این هوش مصنوعی، قابلیت دریافت ورودی به صورت صوتی، ویدئویی و تصویری را داشته و می تواند این نوع از محتوا را درک کند. همینطور می تواند تمامی این انواع داده را به صورت خروجی در اختیار کاربران قرار دهد. البته این ویژگی هنوز به صورت سراسری ارائه نشده است و شما در ربات چت جی پی تی می توانید صرفا به خروجی های متنی دسترسی داشته باشید.
مورد دیگر، که وجه تمایز هوش مصنوعی GPT-4o و سایر نسخه های دیگر است، طبیعی بودن محاوره با آن است. وقتی که شما با یک هوش مصنوعی کار می کنید، محاوره با آن تفاوت های زیادی با یک انسان داشته و هر چند این سیستم ها توانسته اند تا حد خیلی زیادی این موضوع را تقلیل دهند، اما باز هم ایراداتی دیده می شود. سم آلتمن در وبلاگ خود ابراز داشته است که این مشکل به صورت کامل رفع شده و کیفیت محاوره با این سیستم، دقیقا مانند صحبت کردن با یک انسان واقعی خواهد بود. البته برای اینکه ببینیم این موضوع می تواند تا چه اندازه صحت داشته باشد، نیاز به انجام تست ها و آزمایش های بیشتری است. برای درک بهتر این موضوع، لازم است نگاهی به مکانیز کاری GPT ها و به طور خاص مدل زبانی GPT-4o بپردازیم.
مکانیزم مدل زبانی GPT-4o چیست؟
مدل زبانی در واقع اصطلاحی است که از آن برای معرفی هسته و مکانیزم اصلی یک هوش مصنوعی استفاده می شود و می تواند بسته به نوع هوش مصنوعی متفاوت باشد. در مورد هوش مصنوعی GPT-4o هم باید گفت که مانند سایر مدلهای ارائه شده توسط اوپن ای آی، از یک مدل زبانی بزرگ با عنوان GPT استفاده می کند. GPT مخفف Generative pre-trained transformers یا همان «ترنسفورمر تولیدگر از پیش آموزش دیده» است. در واقع کار هوش مصنوعی GPT این است که بر اساس اطلاعاتی که قبلا دریافت کرده، بتواند در پاسخ به سوالی که از آن می شود، محتوای مناسبی در حالت های مختلف تولید و ارائه دهد.
نسخه های قدیمی این هوش مصنوعی، صرفا کار ارائه متن را انجام می دادند. در هوش مصنوعی ورژن ۴ اتفاق خوبی برای این هوش مصنوعی افتاد و انواع مختلفی از محتوای تولیدی به آن اضافه شدند. هوش مصنوعی GPT-4o را می توان یکی از نسخه های مختلف این هوش مصنوعی دانست که نه تنها می تواند انواع مختلفی از محتوا را تولید کند، بلکه در مواردی مانند لحنی که دارد و سرعت ارائه اطلاعات نیز بهبود یافته است.
در واقع هوش مصنوعی GPT-4o، جانشین هوش مصنوعی ۴ توربو است که دو برابر آن سرعت داشته و هزینه نگهداری از آن نیز به نصف کاهش پیدا کرده است. مدل زبانی GPT-4o از ترکیب سه نسخه از GPT های قبلی مربوط به ورژن ۲، تکمیل شده است. این سه نسخه عبارتند از:
- نسخه gpt2-chatbot
- نسخه im-a-good-gpt2-chatbot
- نسخه im-also-a-good-gpt2-chatbot
این موارد از هوش مصنوعی GPT2، در مواردی خاص عملکرد خیره کننده ای داشتند و اوپن ای آی در تلاش بود نقاط قوت آن ها را بیرون کشیده و با هم ترکیب کند. با ارائه هوش مصنوعی GPT-4o، می توان نتیجه گرفت که این کار با موفقیت انجام شده و ثمره خوبی داشته است. اکنون که در مورد اینکه این ورژن از هوش مصنوعی چیست و چطور کار می کند اطلاع پیدا کردیم، می توانیم به سراغ بررسی توانایی های آن برویم.
قابلیت های مهم هوش مصنوعی GPT-4o
بر اساس نتایجی که اوپن ای آی در مورد تست های انجام گرفته روی هوش مصنوعی GPT-4o ارائه داده است، می توان گفت که این نسخه برای خود یک شاهکار به حساب می آید که توانایی های بسیار بالایی داشته و می توان آن را یک هوش مصنوعی محاوره ای بسیار سریع دانست. در این بخش از مقاله می خواهیم این توانایی ها را به صورت موردی و به همراه برتری هایی که این نسخه از هوش مصنوعی آورده است بررسی کرده تا ببینیم وضعیت کلی آن به چه صورتی است.
البته باید در نظر داشته باشیم که هنوز برای نتیجه گیری کلی خیلی زود است و دنیای هوش مصنوعی ثابت کرده که همیشه مشکلات بیشتری بعد از آزمایش های درخشان اولیه خود را نشان می دهند. حد اقل در مورد هوش مصنوعی GPT 4 که اینطور بود و بعد از درخششی که داشت، در برخی از آزمون ها آنطور که باید ظاهر نشد و ورژن های قبلی بهتر بودند. اما در کل می توانیم این موارد را به عنوان قابلیت های مهم و خوبی که هوش مصنوعی GPT-4o تا به این جای کار از خود نشان داده است، معرفی کنیم:
نتایج خیره کننده در پردازش صدا و ویس
یکی از پیشرفت های قابل توجه برای این هوش مصنوعی که پیش از آن در GPT ها چندان قدرتمند ظاهر نشده بود، استفاده از صدا به عنوان ورودی است. در واقع پرامپت هوش مصنوعی GPT-4o، می تواند یک محتوای صوتی باشد که این هوش مصنوعی آن را در مدت زمانی خیلی کوتاه پردازش کرده و با در نظر گرفتن ویژگی هایی مانند لحن و نوع ویس، پاسخ را در یکی از انواع قالب های محتوایی تولید شده باز می گرداند. این نسخه از هوش مصنوعی توانسته است در مورد تشخیص صدا و البته ترجمه آن، به رکورد های جدیدی دست یابد که پیش از این توسط هیچ هوش مصنوعی دیگری ارائه نشده بود.
علاوه بر این، مدل های قبلی این هوش مصنوعی، برای پردازش صدا نیاز به مدل های جانبی داشتند و خود GPT ها به تنهایی از پس این کار بر نمی آمدند. اما در مورد نسخه 4o باید گفت که این کار به صورت نیتیو و بدون دخالت هیچ مدل دیگری انجام می شود.
بازدهی بالا در وظایف چند منطقی
یکی دیگر از عملکرد های درخشانی که هوش مصنوعی GPT-4o از خود به جای گذاشته است، امتیاز های عالی در مسائل چند منطقی یا همان Multilingual است. این مورد از مسائل، اصلی ترین چالش هایی هستند که هوش مصنوعی با آنها دست و پنجه نرم می کند و باید گفت هوش مصنوعی GPT-4o توانسته است رکورد های هوش مصنوعی GPT-4 در این زمینه را تا حد قابل قبولی ارتقا دهد. در صورتی که سری به مقاله مقایسه GPT 4 با GPT 3 بزنید، می توانید با این مورد به صورت کامل آشنا شده و شرایطی که ورژن های قبلی داشته اند را نیز مشاهده نمایید.
دریافت ورودی های غیر متنی
در موارد قبلی به صورت ضمنی به این موضوع که پرامپت هوش مصنوعی GPT-4o می تواند از نوع صوتی و تصویری باشد اشاره کرده بودیم. در واقع این مدل از GPT، اولین ورژن رایگان با این قابلیت است که می تواند فایل های ویدئویی، صورتی و تصویری را به عنوان ورودی از کاربر دریافت کند. البته باید گفت این ویژگی در روز های اولیه عرضه این هوش مصنوعی هنوز در اختیار کاربران قرار نگرفته است و اکنون نمی توان از آن در برنامه چت جی پی تی استفاده کرد. اما این قابلیت در فهرست کاربرد های این هوش مصنوعی وجود داشته و ممکن است در آینده ای نزدیک در اختیار کاربران قرار بگیرد.
هزینه استفاده بسیار پایین تر هوش مصنوعی GPT-4o
از این نظر باید گفت که به دلیل ساختاری که هوش مصنوعی GPT-4o دارد، نیاز به منابعی چندان بالا نداشته و میتوان گفتن هزینه تمام شده آن برای اوپن ای آی تقریبا به اندازه نصف GPT ورژن ۴ خواهد بود؛ از همین رو، قیمت تمام شده آن نیز بسیار ارزانتر بوده و می تواند به صورت رایگان و یا با هزینه ای کمتر در اختیار کاربران قرار بگیرد. این موضوع از ویژگی هایی است که مدیران اوپن ای آی تاکید زیادی را روی آن داشته اند.
از نظر پلن های تجاری باید گفت که سرویس هوش مصنوعی ChatGPT Plus یکی از هوش مصنوعی های گران به شمار می رود و با توجه به قابلیت های نه چندان متفاوت آن نسبت به سرویس رایگان آن، که قبلا از GPT 3.5 استفاده می کرد، جزو مواردی به حساب می آمد که کاربران چندان دل خوشی از آن نداشتند. اکنون این کم شدن هزینه نگهداری، می تواند این قابلیت را به مدیران اوپن ای آی بدهد که در پلن های تجاری خود یک بازبینی کامل را داشته و کار را به نحوی دنبال کنند که این ایرادات متوجه آنها نباشد!
فرصت های بیشتر برای تحقیقات
در مورد هوش مصنوعی GPT-4 و همینطور نسخه ۳.۵، باید گفت که اوپن ای آی تقریبا به یک بن بست رسیده بود و درگیر کار کردن با مدل های زبانی بزرگ پیچیده ای شده بود که مشخص بود چندان نمی تواند به جایی راه ببرد. بر اساس مطالبی که سم آلتمن در وبلاگ خود منتشر کرده است، با راه حل هایی که هوش مصنوعی GPT-4o ارائه می کند، دریچه های جدیدی برای تحقیقات روی اوپن ای آی باز می شود که نه تنها می تواند بازدهی شرایط فعلی را بالا ببرد، بلکه در آینده هوش مصنوعی بهتر و روانتری ارائه خواهد شد که جای کار بسیار بیشتری برای متخصصان این حوزه خواهد داشت.
روش استفاده از هوش مصنوعی GPT-4o
قطعا با تمامی این تعریف و تمجید ها و ترند هایی که از مدل زبانی GPT-4o می شود و اعتباری که نصیب خود کرده است، شما هم دلتان می خواهد از این هوش مصنوعی استفاده کرده و حداقل شرایط آن را یک بار آزمایش کنید. در این مورد باید گفت که این قابلیت به صورت کامل برای شما فراهم شده است و نیازی نیست کار خاصی برای دسترسی به این هوش مصنوعی انجام دهید. در روز های ابتدایی، تنها نسخه قابل نصب روی سیستم عامل مک او اس، هوش مصنوعی GPT-4o را ارائه می کرد، اما اکنون می توانید از سایر نسخه های رسمی برنامه چت جی پی تی برای دسترسی به این ورژن استفاده نمایید.
ساده ترین راهی که می توان به این ورژن از GPT دسترسی داشت، استفاده از وب سایت اوپن ای آی و وب اپلیکیشن آن است. برای این منظور از همان روال عادی که از این نرم افزار استفاده می کنید عمل کنید. ابتدا به کمک یک تغییر دهنده IP یا همان وی پی ان، IP سیستم خود را به جایی غیر از ایران تغییر دهید. سپس وارد وبسایت ChatGPT شده و با کمک یوزرنیم و پسورد خود وارد سایت شوید. در صورتی که تا به حال در این برنامه ثبت نام نکرده اید به راحتی می توانید این کار را با ایمیل خود انجام داده و در برنامه ثبت نام کنید. اگر برای این کار نیاز به کمک داشتید مقاله راهنمای ثبت نام ChatGPT، می تواند اطلاعات خوبی به شما بدهد.
بعد از اینکه وارد محیط برنامه شدید، تنها کاری که برای برای استفاده هوش مصنوعی GPT-4o انجام دهید این است که چت را شروع کنید. اکنون در این برنامه، به صورت پیشفرض هوش مصنوعی GPT-4o فعال بوده و پاسخ خود را با استفاده از این هوش مصنوعی دریافت می کنید. برای تغییر این شرایط نیز قابلیتی در اختیار شما قرار دارد که می توانید از آن کمک بگیرید. زیر پیام هایی که هوش مصنوعی برای شما ارسال می کند، یک آیکون ستاره قرار گرفته است که با کلیک روی آن می توانید نسخه هوش مصنوعی خود را انتخاب کنید:
در صورتی که هوش مصنوعی GPT-4o را انتخاب کنید یک هوش مصنوعی هوشمند تر و سریع در اختیار خواهید داشت. در صورتی که هوش مصنوعی GPT-3.5 می تواند از نظر سرعت عملکرد تجربه بهتری را در اختیار شما قرار دهد که البته در فاز آزمایش نسخه 4o این موضوع کاملا طبیعی است.
نتیجه گیری
در این مقاله با هم به بررسی نسخه جدید هوش مصنوعی اوپن ای آی، یعنی هوش مصنوعی GPT-4o، پرداختیم و دیدیم که چرا این ورژن جدید تا این اندازه سر و صدا به پا کرده است. در واقع این نسخه را می توان یکی از زیرشاخه های انقلابی ورژن ۴ دانست که عملکردی بسیار سریعتر، روان تر، لحنی دوستانه تر و نزدیک به انسان داشته و هزینه ارائه آن نیز تقریبا نصف نسخه ۴ توربو تمام خواهد شد. همینطور برای پرامپت هوش مصنوعی GPT-4o، می توان به صورت مستقیم از ویس، تصویر و ویدئو نیز استفاده کرد که در مدل های قبلی به کمک واسط ها انجام پذیر بود. در صورتی که در مورد این هوش مصنوعی و ویژگی های آن سوال و یا نظری داشتید، خوشحال می شویم آن را با ما و سایر کاربران در میان بگذارید.