VentureBeat گزارش کرد، محققان Deezer یک سیستم هوش مصنوعی را توسعه دادند که توانایی ارتباط آهنگهای خاص را با حالتها و شدتهای آنها دارد.
در جهت تعیین حالت موسیقی آهنگ، تیم تحقیقاتی سیگنالهای صوتی و متنی را بررسی کردند. برای شروع، محققان سیگنالهای صوتی را به یک شبکهی عصبی به همراه مدلهایی که زمینههای زبان شناختی کلمات را بازسازی میکنند، میفرستند. سپس، برای آموزش چگونگی تعیین حالت یک آهنگ، آن ها از Million Song Dataset (MSD) استفاده کردند که مجموعهای بزرگ از بیش از ۱ میلیون آهنگ معاصر است. به طور خاص، محققان از پایگاه دادهی Last.fm استفاده کردند که شناسهها را برای ردیابی بیش از ۵۰۰ هزار برچسب منحصر به فرد اختصاص میدهد. بسیاری از این تگها مربوط به حالتها هستند، و بیش از ۱۴ هزار کلمهی انگلیسی از این برچسبها در مقیاس رتبهبندی مرتبط با مثبت و منفی بودن کلمات و همچنین آرام و پرانرژی بودن یک کلمه به منظور آموزش سیستم هستند.
MSD تنها شامل مجموعهی اطلاعاتی برای آهنگها است و نه خود آهنگها، بنابراین تیم محققان تمامی این اطلاعات را به فهرست Deezer با استفاده از شناسههایی چون عنوان آهنگها، نام هنرمندان، و عنوان آلبومها هماهنگ کردهاند. حدود ۶۰ درصد از مجموعه دادههای به دست آمده (۱۸۶۴۴ آهنگ) برای آموزش AI استفاده شده و بقیه برای اعتبارسنجی و آزمایش بیشتر سیستم مورد استفاده قرار گرفتند.
در نهایت، محققان به این نتیجه رسیدند که هوش مصنوعی بهتر قادر به تشخیص حالت آرام یا پرانرژی یک آهنگ در مقایسه با رویکردهای بدون هوش مصنوعی بود. نتیجهی مشابهی در مورد مثبت و منفی بودن حالت کلمات هم به دست آمد.
در جهت تعیین حالت موسیقی آهنگ، تیم تحقیقاتی سیگنالهای صوتی و متنی را بررسی کردند. برای شروع، محققان سیگنالهای صوتی را به یک شبکهی عصبی به همراه مدلهایی که زمینههای زبان شناختی کلمات را بازسازی میکنند، میفرستند. سپس، برای آموزش چگونگی تعیین حالت یک آهنگ، آن ها از Million Song Dataset (MSD) استفاده کردند که مجموعهای بزرگ از بیش از ۱ میلیون آهنگ معاصر است. به طور خاص، محققان از پایگاه دادهی Last.fm استفاده کردند که شناسهها را برای ردیابی بیش از ۵۰۰ هزار برچسب منحصر به فرد اختصاص میدهد. بسیاری از این تگها مربوط به حالتها هستند، و بیش از ۱۴ هزار کلمهی انگلیسی از این برچسبها در مقیاس رتبهبندی مرتبط با مثبت و منفی بودن کلمات و همچنین آرام و پرانرژی بودن یک کلمه به منظور آموزش سیستم هستند.
MSD تنها شامل مجموعهی اطلاعاتی برای آهنگها است و نه خود آهنگها، بنابراین تیم محققان تمامی این اطلاعات را به فهرست Deezer با استفاده از شناسههایی چون عنوان آهنگها، نام هنرمندان، و عنوان آلبومها هماهنگ کردهاند. حدود ۶۰ درصد از مجموعه دادههای به دست آمده (۱۸۶۴۴ آهنگ) برای آموزش AI استفاده شده و بقیه برای اعتبارسنجی و آزمایش بیشتر سیستم مورد استفاده قرار گرفتند.
در نهایت، محققان به این نتیجه رسیدند که هوش مصنوعی بهتر قادر به تشخیص حالت آرام یا پرانرژی یک آهنگ در مقایسه با رویکردهای بدون هوش مصنوعی بود. نتیجهی مشابهی در مورد مثبت و منفی بودن حالت کلمات هم به دست آمد.