4.2. Использование программы Wavelet для приложений вейвлет-анализа.
Рассмотрим несколько приложений вейвлет-анализа, где может быть применена программа Wavelet.
4.2.1 Сравнение Фурье-анализа и вейвлет-анализа сигналов.
Данная задача носит, в основном, теоретический характер. С помощью программы можно визуально просмотреть то, как работает вейвлет-преобразование на различных типах сигналов.
Тип 1 –
стационарный сигнал.
В данном случае была сгенерирована синусоида с частотой 440Гц и частотой дискретизации 44100Гц. Фурье-анализ производился с помощью звукового редактора CoolEdit 2000 и дал следующие результаты:
Рис. 5.6. Результат Фурье-анализа одиночной синусоиды постоянной частоты.
В режиме просмотра спектра сигнала Spectral View (фактически, это оконное Фурье-преобразование со сдвигающимся по временной оси окном) наблюдалась следующая картина:
Рис. 5.7 Режим Spectral View для сигнала одиночной частоты.
В этом режиме белой горизонтальной линией показана основная частота сигнала.
Вейвлет-преобразование такого сигнала даёт следующую картину:
Рис. 5.8. Вейвлет-преобразование стационарного сигнала одиночной частоты.
Мы видим, что вейвлет-преобразование стационарного сигнала дало более «размазанную» спектральную картину, в то время как Фурье-преобразование дало более точные результаты. Таким образом, видно, что для анализа
стационарных сигналов Фурье-преобразование подходит лучше, чем вейвлет-преобразование.
Тип 2.
Сигнал с резко меняющейся частотой.
Был сгенерирован сигнал, в котором одна частота в определённый момент времени резко сменялась другой.
Для наглядности сразу покажем его вейвлет-преобразование:
Рис. 5.9. Вейвлет-преобразование сигнала с резко меняющейся частотой.
Мы видим, что в момент смены частоты сигнала (указан курсором мыши) вейвлет-преобразование очень точно показало смену частоты (основная частота показана белой линией).
Фурье-преобразование в том же масштабе даёт такую картину:
Рис. 5.10. Фурье-преобразование смены частот.
Пользуясь только результатом Фурье-преобразования, мы лишь можем только сказать, какие частоты присутствуют в сигнале, однако у нас нет никакой информации о том, когда какая частота присутствовала в сигнале.
Режим Spectral View даёт следующую картину:
Рис. 5.11. Режим Spectral View для смены сигналов.
Опять-таки, в области смены частот мы наблюдаем лишь общую спектральную картину, практически лишённую информации о том, в какой момент времени какая частота присутствовала в сигнале.
Тип 3.
Одиночный импульс.
Наконец, рассмотрим сигнал, состоящий из единственного одиночного импульса:
Фурье-преобразование такого сигнала будет выглядеть следующим образом:
Рис. 5.12. Фурье-преобразование одиночного импульса.
В режиме Spectral View данный сигнал даст такую картину:
Рис. 5.13. Режим Spectral View для одиночного импульса. Пунктирной линией показан момент возникновения импульса.
И, наконец, вейвлет-преобразование даст следующую картину:
Рис. 5.14. Вейвлет-преобразование одиночного импульса.
Здесь мы можем очень наглядно наблюдать, что вейвлет-преобразование даёт намного более точную временную локализацию импульса.
Таким образом, после рассмотрения этих трёх примеров можно сделать вывод, что вейвлет-преобразование намного лучше подходит для анализа нестационарных сигналов, нежели Фурье-преобразование, и обладает намного лучшим временным разрешением, особенно в высоких частотах.
4.2.2. Определение основного тона речи (pitch).
C помощью вейвлет-преобразования можно очень легко и достаточно точно определять основной тон речи.
В качестве примера был взят фрагмент текста, прочитанного мужчиной на английском языке (начало кассеты с тестом TOEFL). Базовым вейвлетом для анализа являлся B-spline-вейвлет, максимальная длина вейвлетов – 4096, минимальная – 32, размерность вейвлет-вектора – 256. Для каждого рассчитанного вейвлет-вектора определялась максимальная компонента, которая на рисунке выделялась белой точкой.
Результат анализа отображён на рис. 5.15.
Рис. 5.15. Результат вейвлет-анализа основного тона речи.
Можно заметить, что на рисунке очень хорошо наблюдается основной тон речи. Результат вейвлет-поиска основного тона может быть использован, например, при анализе и распознавании интонации речи человека.
4.2.3 Распознавание мужчины и женщины.
Во многих современных устройствах интерфейса с пользователем, связанных с речевым интерфейсом, необходимо отличать мужчину от женщины.
Эта задача оказалась достаточно легко решаемой с помощью вейвлет-анализа, а точнее – с помощью предыдущей задачи определения основного тона речи. Если проанализировать некоторый участок речи мужчины и женщины, (даже если они говорят одно и то же), то окажется, что вейвлет-образы речи существенно различаются.
В качестве примера были взяты два файла, в одном из которых было записано слово «четыре», произнесённое мужским голосом, а в другом – женским. Результаты вейвлет-анализа этих файлов приведены ниже:
Рис. 5.16. Вейвлет-образ слова «четыре», произнесённого женским голосом (слева) и мужским (справа).
Во-первых, самое существенное отличие между этими двумя вейвлет-образами – разный основной тон. Визуально хорошо видно, что справа он выше, чем слева.
Во-вторых, можно заметить, что справа в области над основным тоном присутствует так называемая «гармошка» – части вейвлет-векторов с изменяющейся общей амплитудой. Это тоже характерная черта мужского голоса, так как в нём, как правило, присутствуют «дребезжащие» звуки, в то время как женский голос, как правило, более «гладкий».
В-третьих, при наличии достаточно длинного промежутка речи, можно анализировать интонацию, которая часто у мужчин и женщин различается.
Таким образом, с помощью вейвлет-анализа можно достаточно легко производить определение пола говорящего человека.
4.2.4. Сегментация дикторов.
Иногда бывает необходимо обнаружить момент времени, когда происходит смена говорящего человека. В этом случае с помощью вейвлет-анализа можно не только отследить момент смены диктора, но и, дополнительно к этому, определить принадлежность голоса очередного диктора к мужчине или женщине (что может помочь дальнейшему распознаванию диктора).
В качестве рассматриваемого сигнала была взята часть аудиозаписи с моментом, когда происходит смена двух говорящих людей. Вейвлет-преобразование данного звукового фрагмента выглядит следующим образом:
Рис. 5.17. Вейвлет-преобразование звукового фрагмента со сменой диктора.
Момент смены диктора показан курсором мыши.
Мы можем видеть, что вейвлет-образы звуковых фрагментов до и после момента смены говорящего человека существенно различаются. Во-первых, изменился основной тон говорящего – он стал ниже, что позволяет сделать вывод о том, что, скорее всего, произошла смена говорящей женщины на мужчину. Во-вторых, изменилось «поведение» основного тона – если до смены основной тон плавно изменялся, то после смены он в основном находится на одном уровне, лишь изредка изменяясь (для выделения интонацией слогов или отдельных коротких слов). В третьих, изменился «фон» вейвлет-векторов – появились вейвлет-векторы с широкополосными компонентами, что с указывает либо опять-таки на смену говорящего, либо на смену фона и, как возможную причину, смену сюжета (а значит и диктора).
Таким образом, с помощью вейвлет-анализа можно достаточно эффективно судить о смене диктора.
4.2.5 Распознавание музыки.
Поиск музыки в современных мультимедийных базах данных невозможен без предварительного распознавания этой музыки – как в целях занесения в базу данных, так и с целью непосредственно поиска.
Вейвлет-анализ достаточно хорошо подходит для задачи распознавания музыки, так как имеет свойства, близкие к человеческому слуху, который так же, как и вейвлет-анализ, с достаточно высоким временным разрешением и низким частотным распознаёт высокие ноты и с низким временным разрешением, но с высоким частотным – низкие ноты.
Рассмортим вейвлет-картину фрагмента песни Faith Hill “Part of Your World”:
Рис. 5.18. Вейвлет-преобразование фрагмента песни.
Для распознавания и «узнавания» музыки нам не обязательно распознавать все ноты и инструменты (хотя с помощью вейвлет-преобразования эта задача перестаёт быть невозможной, какой она была бы, например, при попытке распознавания нот с помощью Фурье-преобразования). Нам необходимо лишь выделить основные характеристики музыкального фрагмента. Рассмотрим их на увеличенном участке вейвлет-картины:
Рис. 5.19. Часть вейвлет-картины музыкального фрагмента.
Итак, на данном рисунке можно выделить основные характеристики музыкального фрагмента:
1 – основная партия, как правило, голос. Распознаётся достаточно легко и точно. Как правило, содержит основную тему мелодии или песни.
2 – басы или аккомпанемент. Распознаётся наиболее легко и точно, так как, как правило, не имеет плавных переходов.
3 – музыкальный фон. Иногда можно без особых усилий определить несколько голосов. Распознаётся сложнее, так как имеет меньшую амплитуду и может перекрываться основной партией или её гармониками.
Для успешного распознавания музыкального произведения очень часто достаточно лишь первых двух перечисленных пунктов. Более того, существует много произведений, для распознавания которых достаточно знать только партию басов и общий ритм/темп, которые, опять-таки, легко определяются из басовой партии. Единственное требование при распознавании музыкального фрагмента только по басовой партии – это то, что фрагмент должен быть относительно длинным (в идеале – хотя бы один куплет песни или иная повторяющаяся часть).
Таким образом, мы видим, что вейвлет-анализ является ещё и удобным и мощным средством работы с музыкой, её распознаванием и индексированием.
4.2.6 Анализ биомедицинских сигналов.
Биомедицинские сигналы по своим характеристикам во многом схожи с сигналами акустическими, что позволяет эффективно применять по отношению к ним вейвлет-анализ.
Одним из типов биомедицинских сигналов являются сигналы электрокардиограмм. В качестве небольшого примера рассмотрим один из ЭКГ-сигналов, взятый из базы данных по заболеваниям сердечно-сосудистой системы.
Рис. 5.20. ЭКГ-сигнал и его вейвлет-образ.
Можно заметить, что с помощью вейвлет-преобразования с достаточно хорошей точностью определяется период сердцебиений (в данном случае он постоянен) и, соответственно, все отклонения от этого периода. Кроме того, более высокочастотным вейвлет-компонентам соответствуют иные характеристики ЭКГ-сигнала, которые также могут быть использованы при диагностике заболеваний.
Из всего вышеперечисленного можно сделать вывод, что вейвлет-преобразование может находить применение в различных областях анализа сигналов, как связанных с аудиоинформацией, так и далёких от неё, и использоваться как мощное средство обработки сигналов.
Указания к отчету
Отчет должен содержать:
-
Цель и задание по работе.
-
Ответы на контрольные вопросы.
-
Графики и таблицы по пунктам 3 и 4 согласно заданию к работе
-
Выводы и оценку полученных результатов
Контрольные вопросы
-
Что такое вейвлет-анализ?
-
В чём преимущество вейвлет-анализа по сравнению с Фурье-анализом?
-
В каких приложениях эффективно применение вейвлет-анализа?
-
В чём преимущество быстрого октавного метода подсчёта вейвлет-вектора?
Литература
-
Л. Левкович-Маслюк, А. Перебрин. Вейвлет-анализ и его приложения. Москва, 1997.
-
Астафьева Н.М. Вейвлет - анализ. Основы теории и применения. Успехи физических наук, т.166, вып. 11, ноябрь 1996 г.
-
Колмогоров А.H., Фомин С.В. Элементы функционального анализа. М.:Наука, 1968.
-
Пэн Дж., Топиков М. В. Wavelets и их применение к линейным и нелинейным проблемам электромагнетизма. "Зарубежная радиоэлектроника. Успехи современной радиоэлектроники" 1998, вып. 12 с.71
Учебное издание
исследование алгоритмов обработки акустических сигналов с использованием непрерывного вейвлетного преобразования в произвольной шкале
Методические указания
к лабораторной работе по статистической радиофизике
Для студентов факультета радиофизики и электроники.
Специальность Н. 01. 02. 00
А в т о р ы - с о с т а в и т е л и
Бовбель Евгений Иванович
Тишков Дмитрий Владимирович
Котов Олег Юрьевич
Лукашевич Анна Михайловна
В авторской редакции
Технический редактор Т.К. Раманович
Корректор С.М. Борисова
Ответственный за выпуск
М.И. Хомич
Подписано в печать . Формат 60´84/16. Бумага офсетная. Гарнитура Таймс.
Усл. печ. л.1,16 Уч.- изд. л. 0,77 Тираж 60 экз. Зак.
Белорусский государственный университет.
Лицензия ЛВ №315 от 14.07.98.
220050, Минск, проспект Франциска Скорины, 4.
Отпечатано на копировально-множительной технике
факультета радиофизики и электроники БГУ
220064, Минск, ул. Курчатова, 5.