Синтез речи (озвучание речи компьютером)

Синтез речи (озвучение речи компьютером)

Постановка задачи.

Задача синтеза речи заключается в том, чтобы текст, представленный в компьютере в виде символов был бы озвучен и превратился в человеческую речь. При этом машина либо уже имеет исходный текст в виде файла, либо составляет его, руководствуясь каким — либо алгоритмом. Как правило, синтезированная речь затем передается по телефонным линиям, имеющим ограниченный сверху и снизу частотный диапазон, поэтому желательно использовать высокий (женский) голос, т.к. он лучше проходит телефонные линии. Речь должна быть максимально разборчивой и членораздельной, а так же должна учитывать изменения интонации в соответствии с правилами языка.

СИНТЕЗ РЕЧИ — speech synthesis — процесс преобразования текста в речь.

Синтез является одной из форм обработки речи, связанной с задачей чтения абонентской системой записанного в ее памяти электронного текста. Существует несколько методов синтеза речи. Первый из них заключается в построении слов путем комбинирования фонем и аллофон. Полученная фонемная последовательность, после выбора высоты тона и интонации, превращается в речь. При таком подходе генерируется вполне понятная речь, но слушающему пользователю ясно, что их произносит робот. Второй метод синтеза речи заключается в ее имитации с использованием модели голосового тракта Человека. Здесь глухие и звонкие согласные в речи представляются источниками периодических и шумовых сигналов соответственно. Затем сигналы проходят через каскад фильтров.

При синтезе для обеспечения высокого качества речи необходимы высокие скорости обработки данных и большая емкость памяти для хранения данных. Поэтому приходится выбирать компромисс за счет определенного ухудшения качества синтезируемой речи.