Microsoft اعلام کرد سامانهی تشخیص صدای مکالمهایاش به نرخ خطای ۵.۱ درصد رسیده است که پایینترین سطح تاکنون است. این میزان از نرخ خطای ۵.۹ درصدی که محققان بخش تحقیق و هوش مصنوعی Microsoft در سال گذشته آن را به دست آورده بودند، بهتر شده است و صحت و درستی آن را در تعادل با دست نوشتههای حرفهای انسانی قرار داده که دارای مزایایی مانند توانایی چندینبار گوش دادن به متن است. در مجموع، محققان از آخرین مطالعه میزان خطا را حدود 12 درصد در مقایسه با یافتههای سال قبل کاهش دادند که این به علت بهبود مدلهای زبانی و صوتی مبتنی بر شبکهی عصبی سامانهی تشخیص صدای Microsoft بود.
همچنین به طور قابل توجهی این محققان، تشخیص دهندهی گفتاری Microsoft را برای استفاده در کل مکالمات توانا ساختند که این بهبود به سامانه اجازه میداد تا دست نوشتههایش را با محتوا هماهنگ سازد و اینکه پیشبینی کند چه کلمات یا عباراتی احتمالا بعدا میآیند. این همان روشی است که انسانها در هنگام گفتگو با یکدیگر استفاده میکنند.
همچنین به طور قابل توجهی این محققان، تشخیص دهندهی گفتاری Microsoft را برای استفاده در کل مکالمات توانا ساختند که این بهبود به سامانه اجازه میداد تا دست نوشتههایش را با محتوا هماهنگ سازد و اینکه پیشبینی کند چه کلمات یا عباراتی احتمالا بعدا میآیند. این همان روشی است که انسانها در هنگام گفتگو با یکدیگر استفاده میکنند.