هوش مصنوعی متن‌باز گوگل قابلیت تشخیص صداها با ۹۲ درصد دقت را دارد

اندیشه سبز خزر۱۳:۰ - ۱۳۹۷ پنج شنبه ۲۴ آبان

Diarization – فرایند بخش‌بندی یک نمونه‌ی گفتاری به اجزا متمایز و همگن بر اساس اینکه چه شخصی چه چیزی، چه موقع می‌گوید است – اما این فرایند برای ماشین به اندازه‌ی انسان ساده نیست و آموزش الگوریتم یادگیری ماشین برای انجام آن سخت‌تر از آن چیزی است که تصور می‌شود. یک سیستم قوی Diarization بایستی قادر به ارتباط با افراد جدید و بخش‌های گفتاری باشد که قبلا با آن مواجه نبوده.
اما بخش تحقیقات هوش مصنوعی گوگل فرایند نویدبخشی را در کارا کردن این مدل پیش برده‌اند. در مقاله‌ی جدیدی با عنوان "Fully Supervised Speaker Diarization"، محققان سیستم هوش مصنوعی جدیدی را توصیف کردند که "استفاده از برچسب‌های اسپیکر تحت نظارت را موثرتر می‌کند."
الگوریتم‌های اصلی که نویسندگان مقاله ادعا می‌کنند به آن رسیده‌اند، نرخ خطای Diarization آنلاین (DER) به قدری پایینی دارد که امکان استفاده‌ی آن را در سامانه‌های بلادرنگ مهیا می‌سازد. مقدار جدید خطا ۷.۵ درصد در معیار NIST SRE 2000 CALLHOME در مقایسه با ۸.۸ درصد DER در روش قبلی گوگل است، و به صورت متن‌باز بر روی Github قابل دسترس است.
در آینده، تیم تحقیقاتی قصد اصلاح این مدل را دارد که می‌تواند اطلاعات متنی را برای رمزگشایی آفلاین ادغام کند و انتظار می‌رود DER در آینده کاهش بیشتری داشته باشد.

می پسندم0

برچسب ها

دسترسی سریع

تولید باتری اتانولی با ظرفیت بالای شارژ برای خودروهای برقی

روسیه خودروی برقی پرنده ۶ نفره ساخت

مشکل رایانه‌ای در تلسکوپ فضایی هابل و تلاش‌های بی‌نتیجه ناسا

اولین پرتاب مداری راکت استارشیپ اسپیس ایکس احتمالا به تعویق خواهد افتاد

موبایل تاشوی جدید سامسونگ ارزان می‌شود

انتشار تصاویری جدید از پیکسل 6 و پیکسل 6 پرو گوگل

فروش گوشی‌‌های هوشمند 5G سامسونگ به‌سرعت در حال رشد است

گوشی جان‌سخت موتورولا موتو Defy رونمایی شد

اپل از کنترلر مجازی برای توسعه‌دهندگان بازی رونمایی کرد

سرقت ۷۸۰ گیگابایت از اطلاعات شرکت EA توسط هکرها

مایکروسافت آزمایش نسخه تحت وب سرویس xCloud را برای iOS آغاز کرده است

زمان دقیق عرضه کنسول آتاری VCS مشخص شد

چگونه در تلگرام تنها افراد خاصی می‌توانند وضعیت شما را آنلاین مشاهده کنند؟

اپلیکیشن‌های برتر برای فیلمبرداری از صفحه نمایش در اندروید

چگونه حساب عادی اینستاگرام را به حساب تجاری تبدیل کنیم؟

هشدار: تماشای ویدیو آنلاین = دانلود ویروس

یوتیوب بار دیگر قابلیت تصویر در تصویر را در iOS ارائه خواهد داد

رمزنگاری سرتاسری Google Messages برای تمام کاربران جهان فعال شد

یک اپلیکیشن جدید به جمع رقیبان کلاب‌هاوس پیوست

اینستاگرم بالاخره نحوه عملکرد الگوریتم نمایش محتوای خود را توضیح داد

ایرباد هواوی FreeBuds 4i؛ گجتی برای موسیقی با کیفیت و مکالمه شفاف

عینکی که به چشم‌های‌ شما استراحت می‌دهد

مینگ-چی کو: اولین هدست واقعیت افزوده اپل فصل دوم ۲۰۲۲ معرفی می‌شود

گلکسی واچ ۴ سامسونگ یک قدم به معرفی نزدیکتر شد

حمید فتاحی از افزایش ۱۰ برابری پهنای باند شبکه ملی اطلاعات طی ۴ سال گذشته خبر داد

جزئیات برگزاری الکامپ ۲۶

انتخابات ریاست‌جمهوری در ۳۳ شهر به صورت کاملا الکترونیکی برگزار می‌شود

«همراه اول» همچنان بازیگر اصلی اینترنت کشور

استخراج رمز ارز در میامی آمریکا با استفاده از برق هسته‌ای

افتتاح اولین مرکز OpenRAN نوکیا در آمریکا

افزایش سرقت کارت‌های گرافیک با بالا رفتن تب استخراج ارزهای دیجیتال

سامسونگ از جدیدترین مانیتورهای گیمینگ Odyssey رونمایی کرد

هوش مصنوعی متن‌باز گوگل قابلیت تشخیص صداها با ۹۲ درصد دقت را دارد