مایکروسافت نقطه عطف جدیدی را برای سیستم تشخیص گفتار خود ایجاد کرده است. این نقطه عطف به این معنی است که برای اولین بار یک رایانه می تواند کلماتی که بر زبان می آورید، همانند یک فرد عادی تشخیص دهد. این یعنی قدرت تشخیص کلمات یک انسان با این سیستم کامپیوتری هوش مصنوعی برابری می کند.
این شرکت در روز یکشنبه در پستی در وبلاگ خودش گفت : “تیم تحقیقاتی مان توانسته اند با خطای 5.1٪ در سیستم تشخیص گفتار این شرکت، نقطه عطف جدیدی را در این صنعت، ایجاد کنند. به طور قابل ملاحظه ای دقت سیستم ما نسبت به سال گذشته بالاتر رفته است. “
در سال گذشته در ماه اکتبر، تیمی از محققان هوش مصنوعی و محققان شرکت مایکروسافت سیستم تشخیص گفتاری را معرفی کردند که اشتباهات کمتری نسبت به قبل ایجاد می کند.
سپس محققان خطای حدود 5.9٪ را گزارش دادند.
مدیر عامل شرکت مایکروسافت ساتیا نادلا از خشونت شارلوتسویل می ترسد.
“سال گذشته، گروه تحقیقاتی در سخنرانی خود اعلام کردند که مایکروسافت نقطه عطفی در دستیابی به برابری انسانی در سیستم تشخیص گفتار خود در نظر گرفته است. ” آنها این فناوری را ایجاد کردند تا کلمات را در حین مکالمه بتوانند مکتوب کنند و بگویند که می توان سیستم های حرفه ای تری هم طراحی و تولید کرد.
‘Switchboard’ بخشی از مکالمات تلفنی ضبط شده است که جامعه تحقیقاتی تشخیص گفتار به مدت بیش از 20 سال برای استفاده از سیستم های تشخیص گفتار از آن استفاده می کنند.
وظیفه آن نوشتن مکالمات بین غریبه ها در مورد موضوعاتی مانند ورزش و سیاست است.
هوش مصنوعی جدید مایکروسافت باعث می شود که این سیستم هوشمندتر هم بشود. این تیم از مایکروسافت Cognitive Toolkit 2.1 CNT به عنوان نرم افزار آموزشی این سیستم استفاده می کند.
علاوه بر این، مایکروسافت به سرمایه گذاری در زیر ساخت فضای ابری، مخصوصا GPU های Azure و به بهبود کارایی و سرعت آنها کمک شایانی کرده است.
دستیابی به برابری انسانی در طی 25 سال گذشته، هدف این تحقیق بوده است.
تمایل مایکروسافت برای سرمایه گذاری در تحقیقات درازمدت در حال حاضر هم چنان ادامه دارد و این شرکت سود سهام خود را از طریق مشتریان محصولات و خدماتی مانند Cortana، مترجم، و خدمات شناختی مایکروسافت بدست می آورد.
شاید روزی برسد که از سیستم تشخیص گفتار به سیستم درک گفتار هم برسیم. شاید مرزهای تکنولوژی دچار نقطه عطف دیگری شوند.
