به گفته‌ی Microsoft، سامانه‌ی تشخیص گفتار این شرکت کیفیت بالایی پیدا کرده است

اندیشه سبز خزر۱۹:۰ - ۱۳۹۵ چهارشنبه ۲۸ مهر

تیمی که بر روی پروژه‌ی تشخیص گفتار Microsoft کار می‌کرده، به دستاوردی مهم در این حوزه رسیده است. چرا که موفق به تولید سامانه‌ای شده‌اند که صدای انسانی را به خوبی تشخیص و پردازش می‌کند.
البته این سامانه در مقایسه با رونویسی حرفه‌ای انسانی، به میزان ۵.۹ درصد خطا به ازای هر کلمه دارد. حتی اگر این سامانه به خوبی صدا را نشنود، اما دقت ۹۴ درصدی برای یک مکالمه کافی به نظر می‌رسد.
همه‌ می‌دانیم که تشخیص گفتار از آن حوزه‌هایی بوده که دهه‌ها توسط شرکت‌های تحقیقاتی و بازاری تکنولوژی مورد کند و کاو قرار گرفته است. کیفیت این سامانه‌ها به مرور زمان رشد کرده و آخرین پیشرفت‌ها مربوط به حوزه‌ی شبکه‌های عصبی و یادگیری ماشین می‌باشد.
به گفته‌ی تیم گرداننده‌ی این پروژه‌ی Microsoft، به سرانجام رسانی چنین پروژه‌ای، دستاورد مهندسی دقیق و بهینه‌سازی‌های کانولوشنی و شبکه‌های عصبی می‌باشد. به نظر می‌رسد این تیم همچنین از ابزار متن‌باز Computational Network به خوبی استفاده کرده است.
به طور طبیعی برای ارزیابی سامانه‌های تشخیص گفتار شرایطی وجود دارد که کیفیت و صحت آن را به خوبی محک می‌زند. یکی از این شرایط می‌تواند عدم توانایی شنیدن عامل انسانی و ماشینی در شرایط وجود نویز باشد. و یا حتی وجود لهجه‌های مختلف کلمات در صوت و گفتار. مورد لهجه و روش‌های مختلف ادای یک واژه را می‌توان از طریق شبکه‌های عصبی و تنظیم مجموعه داده‌های آموزشی به دست آورد.
به تیم Microsoft بابت این دستاورد تبریک می‌گوییم و بعید است که کار را در این مرحله رها کنند. باید منتظر پیشرفت‌های دوچندان هوش‌مصنوعی در این حوزه باشیم.

می پسندم0

برچسب هاMicrosoft Speech Recognition AI

دسترسی سریع

تولید باتری اتانولی با ظرفیت بالای شارژ برای خودروهای برقی

روسیه خودروی برقی پرنده ۶ نفره ساخت

مشکل رایانه‌ای در تلسکوپ فضایی هابل و تلاش‌های بی‌نتیجه ناسا

اولین پرتاب مداری راکت استارشیپ اسپیس ایکس احتمالا به تعویق خواهد افتاد

موبایل تاشوی جدید سامسونگ ارزان می‌شود

انتشار تصاویری جدید از پیکسل 6 و پیکسل 6 پرو گوگل

فروش گوشی‌‌های هوشمند 5G سامسونگ به‌سرعت در حال رشد است

گوشی جان‌سخت موتورولا موتو Defy رونمایی شد

اپل از کنترلر مجازی برای توسعه‌دهندگان بازی رونمایی کرد

سرقت ۷۸۰ گیگابایت از اطلاعات شرکت EA توسط هکرها

مایکروسافت آزمایش نسخه تحت وب سرویس xCloud را برای iOS آغاز کرده است

زمان دقیق عرضه کنسول آتاری VCS مشخص شد

چگونه در تلگرام تنها افراد خاصی می‌توانند وضعیت شما را آنلاین مشاهده کنند؟

اپلیکیشن‌های برتر برای فیلمبرداری از صفحه نمایش در اندروید

چگونه حساب عادی اینستاگرام را به حساب تجاری تبدیل کنیم؟

هشدار: تماشای ویدیو آنلاین = دانلود ویروس

یوتیوب بار دیگر قابلیت تصویر در تصویر را در iOS ارائه خواهد داد

رمزنگاری سرتاسری Google Messages برای تمام کاربران جهان فعال شد

یک اپلیکیشن جدید به جمع رقیبان کلاب‌هاوس پیوست

اینستاگرم بالاخره نحوه عملکرد الگوریتم نمایش محتوای خود را توضیح داد

ایرباد هواوی FreeBuds 4i؛ گجتی برای موسیقی با کیفیت و مکالمه شفاف

عینکی که به چشم‌های‌ شما استراحت می‌دهد

مینگ-چی کو: اولین هدست واقعیت افزوده اپل فصل دوم ۲۰۲۲ معرفی می‌شود

گلکسی واچ ۴ سامسونگ یک قدم به معرفی نزدیکتر شد

حمید فتاحی از افزایش ۱۰ برابری پهنای باند شبکه ملی اطلاعات طی ۴ سال گذشته خبر داد

جزئیات برگزاری الکامپ ۲۶

انتخابات ریاست‌جمهوری در ۳۳ شهر به صورت کاملا الکترونیکی برگزار می‌شود

«همراه اول» همچنان بازیگر اصلی اینترنت کشور

استخراج رمز ارز در میامی آمریکا با استفاده از برق هسته‌ای

افتتاح اولین مرکز OpenRAN نوکیا در آمریکا

افزایش سرقت کارت‌های گرافیک با بالا رفتن تب استخراج ارزهای دیجیتال

سامسونگ از جدیدترین مانیتورهای گیمینگ Odyssey رونمایی کرد

به گفته‌ی Microsoft، سامانه‌ی تشخیص گفتار این شرکت کیفیت بالایی پیدا کرده است

بیوگرافی بیل گیتس؛ از ابتدا تا ثروتی بی انتها