توانایی هوش مصنوعی گوگل در تشخیص صدای فرد در بین جمعیت
هوش مصنوعی گوگل توانایی تشخیص صداهای مختلف در میان جمعیت را دارد. انسان ها معمولاً توانایی خوبی در تشخیص صدای افراد خاص در بین جمعیت دارند ولی آیا کامپیوترها نیز قادر به انجام چنین کاری هستند. جواب این سوال منفی است و تنها کافی است زمانی که تعداد زیادی از افراد در اطراف یک اسپیکر هوشمند هستند آن را امتحان کنید. حال گوگل ممکن است موفق به دست یافتن به راه حل نسبتاً ساده ای برای این مسئله شده باشد. محققان گوگل این غول تکنولوژی موفق شده اند تا یک سیستم یادگیری عمیق را طراحی کنند که قادر به انتخاب صداهای خاص با نگاه کردن به چهره انسان ها در حین مکالمه است. این تیم تحقیقاتی، مدل شبکه عصبی خود را طوری طراحی کرده اند که زمانی که افراد به تنهایی به حرف زدن می پردازند صدای آن ها را شناسایی کند و آن گاه مهمانی های مجازی را تدارک ببیند و حتی صداهای اضافه پس زمینه مهمانی را نیز به آن ها بیافزاید تا هوش مصنوعی چگونگی تفکیک صداهای مختلف را با تبدیل آن صداها به ترک های صوتی مجزا بیاموزد.
