Сменить дизайн
Каталог статей
Проекты

Системы документооборота

Главная О Компании

postheadericon О Компании

 

AudiTech, Ltd

Компания AudiTech, Ltd (ООО ”ОДИТЕК”) создана в 1991 году на базе отдела речевых исследований НПО “Дальняя связь” . Основу коллектива составляют высококвалифицированные специалисты в области распознавания, синтеза, кодирования речи, верификации и идентификации диктора и определения эмоционального статуса говорящего.

За время существования компанией был выполнен ряд научно-исследовательских и коммерческих работ по заказам как российских так и зарубежных фирм.
Важнейшие из них:

  • Система верификации для итальянской фирмы VAI.
  • Распознавание речи в телефонном канале для банковских систем для канадской фирмы NORTEL.
  • Создание базы данных русского языка для телефонного канала в рамках европейских проектов SPEECHDAT(II) и SPEECHDAT(E).
  • Разработка "речевого" замка на основе идентификации диктора - "ГазПром".
  • Создание речевой базы для систем распознавания по телефонному каналу – ЛОНИИС.
  • Создание широкополосной четырехканальной речевой базы в рамках европейского проекта SPEECON.
  • Создание широкополосной речевой базы для ЗАО "ВНИИЗФ-СТЛ" (г.Саров).
  • Создание лексического корпуса русского и английского языков в рамках европейского проекта LC-Star для систем автоматического перевода, ориентированных на речь.
  • В настоящее время ведутся работы по созданию програмного обеспечения автоматического поиска ключевых слов в речевом потоке для телефонного канала с последующей рубрикацией диалогов на темы.

 

КОДИРОВАНИЕ РЕЧИ

Кодирование речи развивается в двух направлениях:

  • компрессия речевого сигнала;
  • формирование речевых баз данных для автоматического синтеза речи.

Качественная компрессия к настоящему времени реализована для вариантов 4800, 3600, 2400, 1200 bit/s.

ВЕРИФИКАЦИЯ / ИДЕНТИФИКАЦИЯ ДИКТОРА

В области верификации/идентификации говорящего по голосу фирма активно занимается как исследованиями, представляющими чисто научный интерес, так и разработкой прикладных систем контроля доступа, в том числе для конкретных заказчиков.

Нами разработаны:

  • алгоритм верификации/идентификации говорящего по произвольному тексту;
  • алгоритм повышенной надёжности для верификации/идентификации говорящего по набору паролей.

На основе вышеуказанных алгоритмов нами разработаны:

  • система контроля доступа к компьютеру (с поддержкой на аппаратном уровне);
  • автономные устройства контроля доступа - "речевой замок" (для дверей) и "сторож" (для автомобиля).

Демонстрационные версии: см. страничку ДЕМО (голосовой screen saver; программа идентификации пользователя; голосовой замок)

В настоящее время основной темой исследований является верификация/идентификация говорящего по произвольному тексту (время обучения от - 5 минут, контрольное воздействие - речь длительностью от трех секунд (короткая фраза)).

Разработки ведутся для разных типов каналов связи.

Компания имеет также опыт работ по оценке эмоционального и физиологического состояния человека по голосу.

РАСПОЗНАВАНИЕ РЕЧИ

  • В настоящее временя основные интересы фирмы находятся в области пофонемного распознавания слитной речи.
  • Создаваемые модули распознавания речи предполагается использовать как в широкополосных, так и телефонных (в том числе GSM и спутниковая связь) каналах.
  • Решается задача поиска ключевых слов в речевом потоке.
  • Разработаны модели (например, говорящий попугай Гришка), основанные на работе неинформационных функций речевой коммуникации, которые могут найти широкое применение как в игровых, так и рекламых сценариях.

РЕЧЕВЫЕ И ЛИГВИСТИЧЕСКИЕ БАЗЫ ДАННЫХ

Речевые базы данных предназначены для создания и тестирования автоматических систем распознавания речи и идентификации/верификации диктора.
Некоторые из этих баз также можно использовать как для лингвистических исследований, так и в междисциплинарных областях, так или иначе связанных с лингвистикой.

На данный момент коллекция речевых баз состовляет более 10 различных по своему составу и назначению речевых корпусов.

Общее колличество дикторов для телефонного канала состовляет более 4500 человек (более 120 часов "чистой" речи). Для широкополосного канала - более 800 дикторов (около 100 часов речи), из них 50 - дети.

Все фонограммы имеют орфографическую запись со специальными пометками. 
Часть речевого материала сегментирована на фонемы в соответствии с системой символов Russian SAMPA.

Подробное описание баз находится на страничке описание баз.

 

 

 
Поиск
Язык

RUS | ENG

Продукты
Сообщение

Перед тем, как чего-нибудь пугаться, нужно сначала посмотреть – действительно ли оно такое страшное, а то - зачем зря стараться…

Создание интернет-магазина