Оратор (синтезатор русской речи)
![]() |
![]() |
![]() |
Области применения
- в автоматизированных информационных службах (информирование, бронирование, оповещение);
- в системах call- и контакт- центров;
- в системах слухового контроля и речевого сопровождения;
- в системах для не зрячих и слабовидящих людей;
- построение голосовых порталов;
- в образовательных целях;
- для телевизионных и рекламных проектов;
- в системах подготовки документов и редакционно-издательских системах;
- создание электронных телефонных секретарей;
- для мультимедийных и развлекательных проектов;
Технология
Синтез речи представляет собой процесс преобразования любого орфографического текста заданного языка в его произносительный (звучащий) вариант. На вход такой системы поступает текст, произвольный или предварительно размеченный, а выходом служит голосовой эквивалент текста.
До недавнего времени системы синтеза речи не находили широкого применения. Одной из причин тому - недостаточное качество синтетической речи. Её роботизированность и неестественность делали системы синтеза непригодными для широкого использования. Сложность русского языка обуславливает ограниченный выбор производителей подобного рода технологий.
Центр речевых технологий, имеющий многолетний мировой опыт разработки различных речевых приложений, разработал уникальный синтезатор русской речи с высоким качеством звучания.
Реализация
STC TTS SDK 1.5 Text to speech Software Development Kit 1.5
Представляет собой набор инструментальных средств, предназначенных для внедрения системы синтеза речи в программные продукты. Состоит из ряда библиотек, заголовочных файлов, примеров подключения и документации. Библиотека не зависит от средств разработки, легко и динамично подключается к любому разрабатываемому программному продукту. Дополнительно c библиотекой поставляется один синтезированный мужской голос. Расширенная акустическая база, созданная совместно с ведущими учёными Санкт-петербургского университета, позволяет максимально полно учесть фонетико-акустические вариации звуков русской речи. За счёт детализации фонем и их вариантов, а так же большой практической работы просодического оформления, звучание синтезированного голоса максимально приближено к естественному.
STC TTS Engine 1.5 Text to speech Engine 1.5
Ядро системы синтеза речи “ЦРТ” представляет STC TTS Engine 1.5, разработанное и реализованное в соответствии с рекомендацией Microsoft Speech API 5.1 ( www.microsoft.com/speech). Данная технология предоставляет возможность быстро и надёжно внедрить (или заменить ранее существующую) систему синтеза речи, разработанную специалистами ЦРТ.
Быстрая и эффективная интеграция системы синтеза речи в приложения, высококачественное синтетическое звучание синтезированного голоса - главные преимущества использования STS TTS Engine.
Основные характеристики
- полностью совместимость с SAPI 5.1;
- полная поддержка SAPI XML тэгов;
- поддержка SAPI Лексикона;
- независимость от синтезированного голоса;
- возможность работы Engine в любом режиме, по требованию заказчика;
STC TTS Tools
Набор инструментальных средств, реализованные на основе TTS SDK или TTS Engine, такие как “Оратор” , “Orator SP Edition” , “Personal Voice settings” , “DicEditor” и ряд других. “Оратор” - Windows-приложение, предназначенное для преобразования в устную речь текстовых файлов в формате ANSI или rtf. Главное назначение программы состоит в демонстрации качества синтеза речи по тексту с помощью STC TTD SDK 1.5.
“Orator SP Edition 1.5″ - Windows-приложение, предназначенное для преобразования текстовой информации в звучащую речь. Программа использует технологию MS SAPI 5.x и осуществляет связь c установленными в системе STC TTS Engine 1.5. Система имеет удобный пользовательский интерфейс, возможность автоматического сохранения звучащего варианта в виде файлов wav, mp3. Возможность гибкой настройки системы и работа с закладками позволяет пользователю организовать собственную библиотеку и использовать систему в качестве текстового редактора.
В стандартном комплекте устанавливается возможность настройки синтезированного голоса “Personal Voice settings” , а также редактор словаря ударений, сокращений и аббревиатур - “DicEditor”.
“Режим объявления” - уникальный дополнительный режим “Объявления” , позволяет правильно обработать объявления различного характера (информационные, рекламные, о найме на работу и т.п.). Данный режим поставляется как дополнительный модуль к системе “Orator SP Edition 1.5″ , предоставляя возможность корпоративным заказчикам организовать многофункциональный, многоканальный сервис.
Достоинства
- “Чтение” произвольного русского текста, без специальной предварительной разметки;
- Разгрузка зрительного аппарата;
- Максимальная приближенность к естественной слитной речи;
- Естественный тембр голоса в широком диапазоне изменения основного тона и темпа речи;
- Использование 24 интонационных моделей: варианты утверждения, вопроса, восклицания;
- Возможность изменения высоты основного тона и темпа речи в широких пределах;
- Возможность изменения частоты дискретизации;
Возможности
Разработанная комплексная система синтеза русской речи относится к синтезаторам нового поколения и обеспечивет натуральное, естественное звучание. Обладая широкими возможностями и удовлетворяя общепринятым стандартам, система легко интегрируется в любые приложения и пользовательские системы.
Корпоративным клиентам, которые используют стандартную технологию SAPI, компания ЦРТ предлагает STC TTS Engine.
Разработчикам и клиентам, которые используют свои собственные технологии, следует обратить внимание на уникальный набор инструментальных средств STC TTS SDK.
Для более наглядного использования и настройки технологии системы синтеза предлагается набор инструментариев – STC TTS Tools.
Возможность гибкой настройки, использования различных режимов работы, удобный функциональный инструментарий (например, поддержка качественного сжатия речи, преобразования в звуковые файлы разного формата, редактирование пользовательского словаря ударений и т.д.) позволяет использовать синтезатор нового поколения практически во всех областях информационных технологий.
Характеристики стандартного комплекта:
- Один мужской синтезированный голос (частота дискретизации - 32 кГц)
- Режим работы - разговорный стиль
- Количество словоформ - З млн
- Объем словаря - 120 тыс. словарных основ (используется словарь группы AOT.ru )
В качестве дополнительных услуг ЦРТ предлагает:
- Включение любого синтезированного голоса по выбору заказчика (с любой частотой дискретизации и различными алгоритмами сжатия);
- Реализацию практически любого режима работы, необходимого заказчику
- Разработку дополнительного программного обеспечения
Программная и аппаратная совместимость:
- Поддерживаемые операционные системы: Windows 95/98/Me/NT/2000/XP/2003
- Язык реализации: C/C++;
- Используемые технологии: WinAPI, DLL, DSP;COM, ATL, SAPI
- Свободное место на жестком диске: 100 Mb
- Процессор: не хуже Pentium II
- Операционная память: не менее 64 Mb
- Звуковая карта
- Акустические аксессуары: колонки, наушники и т.п.





Нестор
Гном 2М
Незабудка
VoiceCom
Оратор
VoiceKey

