МЕТОД ШВИДКОГО ПОШУКУ ФРАГМЕНТА АУДІОЗАПИСУ
DOI:
https://doi.org/10.31649/2307-5376-2024-1-37-47Ключові слова:
аудіозапис, корпус музичних творів, міра близькості, обчислення відстані, кластеризація, kd-дереваАнотація
Враховуючи великі обсяги аудіоінформації, що зберігається у корпусі музичних творів, велике значення має швидкість та надійність їх пошуку. В статті пропонується метод швидкого пошуку фрагмента аудіозапису з удосконаленою оцінкою ступеня близькості між невідомим аудіофрагментом і шаблонами, який дозволяє підвищити достовірність прийняття рішення під час пошуку.
Для компактного опису параметрів сигналу обрано мел-частотні кепстральні коефіцієнти, на основі яких формується корпус параметрів музичних творів як набір центроїдів, отриманих у результаті кластеризації. Введено поняття власної приведеної відстані як оцінки ступеня близькості невідомого фрагмента музичного твору та попередньо створених шаблонів аудіозаписів. Обґрунтовано застосування kd-дерев для прискорення пошуку невідомого фрагменту в корпусі аудіозаписів та наведено основні етапи пошуку. Розглянуто різні варіанти обчислення міри близькості невідомого аудіофрагмента з аудіозаписами у корпусі, а саме: оцінювання міри близькості за приведеною відстанню, оцінювання міри близькості за кількістю попадань у список k найближчих центроїдів, оцінювання міри близькості за зваженою кількістю попадань у список k найближчих центроїдів. Показано, що виконання не точного, а наближеного пошуку векторів на основі kd-дерева дозволяє досягти значної економії часу, проте призводить до зниження достовірності результатів пошуку. Тому для зменшення складності обчислень при збереженні достовірності результатів запропоновано для великих архівів аудіозаписів виконувати комбінований пошук, що поєднує швидкий "неточний" пошук із застосуванням kd-дерева кількох найближчих аудіозаписів корпусу для заданого аудіофрагменту на першому етапі пошуку, серед яких на другому етапі за допомогою повного перебору визначається один найближчий. Запропонований метод дозволив підвищити повноту та релевантність результатів пошуку.
##submission.downloads##
-
PDF
Завантажень: 54