هوش مصنوعی Google با صدایی کاملاً شبیه به صدای انسان، سیستم جدید تبدیل متن به گفتار خود را بانام Tacotron 2 راهاندازی کرد. به گفتهی توسعهدهندگان این سیستم با دقت خیرهکنندهای کار میکند، صدای تولید شده توسط هوش مصنوعی، غیر قابل تشخیص از صدای انسان است.
باید گفت این ویژگی یک اغراق نیست: Tacotron 2 نسل دوم فناوری هوش مصنوعی است و شامل دو شبکه عصبی میباشد. شبکه عصبی اول، متن را به طیفی خاص تبدیل میکنند و شبکهی عصبی دوم، WaveNet نام دارد و کار خواندن نمودار تولید شده را بر عهده دارد. باید گفت که صدای خروجی از این فناوری غیرقابلتمایز با صدای انسان است.
سیستم جدید به هیچ عنوان "صدای ربات" را تولید نمیکند حتی میتواند کلمات را به درستی و با توجه به دایره معناشناسی، تلفظ کند.
در حال حاضر سیستم تمام تفاوتهای ظریف در زبان انگلیسی را میآموزد و میتواند شبیه به صدای زن صحبت کند. سیستم نه تنها میتواند متن را بخواند، بلکه میتواند نقاطی را که به صورت خاص مد نظر است به صورت خاص تلفظ کند و آنها را در متن برجسته نماید.
باید گفت این ویژگی یک اغراق نیست: Tacotron 2 نسل دوم فناوری هوش مصنوعی است و شامل دو شبکه عصبی میباشد. شبکه عصبی اول، متن را به طیفی خاص تبدیل میکنند و شبکهی عصبی دوم، WaveNet نام دارد و کار خواندن نمودار تولید شده را بر عهده دارد. باید گفت که صدای خروجی از این فناوری غیرقابلتمایز با صدای انسان است.
سیستم جدید به هیچ عنوان "صدای ربات" را تولید نمیکند حتی میتواند کلمات را به درستی و با توجه به دایره معناشناسی، تلفظ کند.
در حال حاضر سیستم تمام تفاوتهای ظریف در زبان انگلیسی را میآموزد و میتواند شبیه به صدای زن صحبت کند. سیستم نه تنها میتواند متن را بخواند، بلکه میتواند نقاطی را که به صورت خاص مد نظر است به صورت خاص تلفظ کند و آنها را در متن برجسته نماید.