Технология идентификации по голосу Voice Key основана на уникальности геометрии речевого тракта каждого человека. В Voice Key используется спектрально-формантный метод, базирующийся на различных спектральных характеристиках речи разных людей. Спектрально-формантный метод основан на анализе поведения трех и более формант (спектральных максимумов), отражающих уникальность геометрии речевого тракта индивида.
Наиболее явно различие спектральных характеристик проявляется в соположении формант в вокализованных отрезках речи. Пример формантного представления речи двух разных людей при произнесении фразы «Голосовой поиск» приводится на рисунке №1 ниже (по вертикальной оси - частота сигнала в Гц, по горизонтальной - время звучания в секундах, степень зачернения отражает концентрацию энергии).
Рисунок №1. Пример формантного представления речи двух разных людейИспользуемый в Voice Key спектрально-формантный метод основан на выделении и сравнении положения и динамики поведения трех и более формант. Используется несколько десятков параметров, характеризующих формантную структуру речи.
Принцип работы включает 4 основных этапа:
· Создание шаблона - сведения о физиологической или поведенческой характеристике преобразуются в форму, доступную компьютерным технологиям, и сохраняются в память биометрической системы
· Выделение - из вновь предъявленного идентификатора выделяются уникальные признаки, анализируемые системой
· Сравнение - сопоставляются сведения о вновь предъявленном и ранее зарегистрированном идентификаторе
· Решение - вносится заключение о том, совпадают или не совпадают вновь предъявленный и ранее зарегистрированный идентификатор
Заключение о совпадении/несовпадении идентификаторов затем транслируется другим системам (контроля доступа, защиты информации и т.д.), которые далее действуют в зависимости от полученной информации.
Важнейшим элементом успешного распознавания дикторов является выбор информативных признаков (речевых параметров), способных эффективно представлять информацию об особенностях речи конкретного диктора.
К ним предъявляются следующие требования:
эффективность представления информации об особенностях речи конкретного диктора;
простота измерения;
стабильность во времени;
частое и естественное появление в речи;
невосприимчивость к имитации.
В качестве уникального вектора признаков можно использовать одномерный частотный вектор кепстральных коэффициентов, а также вектор, составленный из его производных.
Кепстральные коэффициенты определяются в соответствии со схемой, представленной на Рисунке №2:
Рисунок №2 - Общая схема кепстрального анализа сигнала (FFT - блок быстрого преобразования Фурье сигнала, LOG - блок логарифмирования спектра, IFFT - блок обратного быстрого преобразования Фурье)
В качестве вектора признаков можно использовать коэффициенты отражения. Физический смысл коэффициентов отражения состоит в определении величины волны, отраженной на границе двух акустических труб.
Коэффициенты отражения рассчитываются путем преобразования вектора коэффициентов предсказывающего фильтра a в коэффициенты отражения соответствующей решетчатой структуры по следующему рекурсивному алгоритму:
(n)=an(n) (1.1)
(1.2)
Данные формулы основаны на рекурсивном алгоритме Левинсона. Для его реализации в цикле перебираются элементы вектора a, начиная с последнего и заканчивая вторым.
Иногда используются также функции от коэффициентов отражения - логарифмические отношения площадей (Log-Area Ratio - LAR):
(1.3)
где ki - коэффициенты отражения.
Еще одним признаком являются площади поперечных сечений акустических труб. Голосовой тракт можно представить в виде последовательности р акустических труб одинаковой длины и различных диаметров, имеющие площади поперечных сечений Ai. Представление голосового тракта в виде последовательности труб изображено на Рисунке №3. Перейти на страницу: 1 2 3
Другие статьи по теме:
Датчики в строительстве Для проведения качественных строительных и ремонтных работ во все времена строители использовали различные измерительные приборы, ведь только они могли указать невидные человеческому гла ...
Территориальное планирование сетей телерадиовещания с учетом ЭМС РЭС на основе геоинформационных технологий На этапе проектирования телекоммуникационных сетей с появлением электронных карт и геоинформационных систем появилась возможность проведения более точных расчетов размещения радиоэлектр ...
Преобразователь двоичной последовательности из фиксированного числа байт в ЧМ-сигнал Микроконтроллер (MCU) - микросхема, предназначенная для управления электронными устройствами. Типичный микроконтроллер сочетает в себе функции процессора и периферийных устройств, може ...