Тип публикации: статья из журнала
Год издания: 2025
Идентификатор DOI: 10.31772/2712-8970-2025-26-4-507-516
Ключевые слова: software-hardware system, sound source localization, real-world acoustic environments, sound intensity, deep learning, reverberant rooms, generalization ability, программно-аппаратная система, локализация акустических источников, реальные акустические среды, акустическая интенсивность, глубокое обучение, реверберирующее помещение, обобщающая способность
Аннотация: This article proposes a methodology for constructing a software-hardware system for solving the problem of sound source localization in real acoustic environments based on the synthesis of several models, including intelligent ones. To achieve this goal, a methodology is proposed that includes the selection of technologies and equiПоказать полностьюpment for collecting and processing acoustic signals, training models on experimental data, and conducting an additional series of experiments to evaluate the effectiveness of the models. Two models were considered: SI-GCC-CNN (Sound Intensity - Generalized Cross-Correlation Convolutional Neural Network), which combines sound intensity features and a generalized cross-correlation phase transform as input to convolutional neural networks, and SI-CNN (Sound Intensity - Convolutional Neural Network), which feeds sound intensity features into a convolutional neural network. To evaluate the effectiveness of the deep learning models used to solve this problem at a spatial resolution of 10º, a series of experiments were conducted in closed reverberant rooms. The generalization ability of these models was assessed by varying configuration settings. The experimental results demonstrated the effectiveness and generalization ability of the SI-GCC-CNN model when working in real-world acoustic environments. The SI-GCC-CNN model outperformed the SI-CNN model, achieving a 2.9x improvement in localization accuracy when changing the room size, 2.5x when changing the distance between the source and the center of the microphone array, and 2x when changing the location of the microphone array. В статье предложена методика построения программно-аппаратной системы для решения задачи локализации акустических источников в реальных акустических средах на основе синтеза нескольких моделей, в том числе интеллектуальных. Для достижения цели предлагается методика, включающая выбор технологий и оборудования для сбора и обработки акустических сигналов, обучение моделей на экспериментальных данных и проведение дополнительной серии экспериментов для оценки эффективности моделей. Были рассмотрены две модели: SI-GCC-CNN (Sound Intensity - Generalized Cross-Correlation - Convolutional Neural Network), которая основана на объединении признаков интенсивности звука и обобщенной кросс-корреляции - фазового преобразования в качестве входных данных для сверточных нейронных сетей, и SI-CNN (Sound Intensity -Convolutional Neural Network), которая основана на подаче признаков интенсивности звука в сверточную нейронную сеть. В рамках оценки эффективности моделей глубокого обучения, используемых для решения этой задачи с пространственным разрешением 10º, была проведена серия экспериментов в замкнутых реверберирующих помещениях. Обобщающая способность этих моделей оценивалась при изменении настроек конфигурации. Экспериментальные результаты продемонстрировали эффективность и способность модели SI-GCC-CNN к обобщению при работе в условиях реальной акустической среды. Модель SI-GCC-CNN превзошла модель SI-CNN, достигнув улучшения точности локализации в 2,9 раза при изменении размера помещения, в 2,5 раза при изменении расстояния между источником и центром микрофонной решетки и в 2 раза при изменении местоположения микрофонной решетки.
Журнал: Сибирский аэрокосмический журнал
Выпуск журнала: Т. 26, № 4
Номера страниц: 507-516
ISSN журнала: 27128970
Место издания: Красноярск
Издатель: Сибирский государственный университет науки и технологий им. акад. М.Ф. Решетнева