ОБЩИЕ СВЕДЕНИЯ


ИРНAP05131207, Номер госрегистрации0118РК00139

НаименованиеРазработка технологии мультиязычного автоматического распознавания речи с использованием глубоких нейронных сетей

Приоритетное направлениеИнформационные, телекоммуникационные и космические технологии, научные исследования в области естественных наук/Информационные, телекоммуникационные и космические технологии

Вид исследованияПрикладное

ЗаявительРеспубликанское государственное предприятие на праве хозяйственного ведения "Институт информационных и вычислительных технологий"

Научный руководительМамырбаев Оркен Жумажанович

Балл ГНТЭ30.33

Общая одобренная сумма54000000


Ожидаемые результаты

Будет выполнен аналитический обзор по тематике исследований. Будет создан расширенный корпус русской речи. Будет создан корпус текстов на казахском языке. Будет создан корпус казахского языка и обучение моделей языка на базе ИНС. Будет подготовлена публикация в научном издании, рекомендуемом ККСОН МОН РК Казахстана. Будет подготовлена публикация в издании, индексируемом в базах данных Web of Science или Scopus. Будет создан корпус казахской речи. Будут разработаны акустическая и языковая модели для казахского языка. Будут получены оценки созданных моделей казахского языка по показателю коэффициента неопределенности (preplexity) на тестовом корпусе. Будет разработана акустическая модель на базе ИНС для русской речи. Будет подготовлена публикация в научном издании, рекомендуемом ККСОН МОН РК Казахстана.


Скачать отчет за 2018 год (Русская версия)

Реферат (Абстракт) - 2018 год

Объект исследования, разработки или проектирования

Методы и модели распознавания и классификации речевых сигналов, искусственный интеллект, речевые технологии и компьютерная лингвистика, информационно-поисковые системы.

Цель работы

Основной целью данного проекта является повышение точности мультиязычного распознавания речи за счет применения искусственных нейронных сетей на этапе акустического и языкового моделирования.

Методы исследования

Методы проектирования и анализа программных средств, имитационного моделирования, теории вероятностей и математический статистики.

Полученные результаты и новизна

Мультиязычный корпус казахского и русского языков; методы предварительной обработки речевых сигналов. Анализ существующих систем распознавания речи, а также в разработка математических моделей и алгоритмов для решения поставленной задачи по разработке технологии мультиязычного автоматического распознавания речи.

Основные конструктивные и технико экономические показатели

Новая технология для распознавания речи, математические модели, алгоритмы и методы для автоматического анализа, синтеза и распознавания речевых сигналов. Повышение качества результатов распознавания казахской речи: будут использованы глубокие и рекуррентные нейронные сети, акустические модели, модель языка.

Степень внедрения

На стадии разработки.

Эффективность

Разработанная технология будет способствовать увеличению качества речевых человеко-машинных интерфейсов.

Область применения

Государственные структуры, ответственные за расширение области применения национальных языков на базе информационных технологий; производители мобильных телефонов (увеличение числа потенциальных покупателей за счёт внедрения речевых технологий на национальных языках); сотовые операторы и банки (call-центры с поддержкой голосовых функций, голосовая аутентификация); сектор производства различных устройств с поддержкой голосовых функций.

Скачать отчет за 2019 год (Русская версия)

Реферат (Абстракт) - 2019 год

Объект исследования, разработки или проектирования

Методы и модели распознавания и классификации речевых сигналов, искусственный интеллект, речевые технологии и компьютерная лингвистика, информационно-поисковые системы.

Цель работы

Основной целью данного проекта является повышение точности мультиязычного распознавания речи за счет применения искусственных нейронных сетей на этапе акустического и языкового моделирования.

Методы исследования

Методы проектирования и анализа программных средств, имитационного моделирования, теории вероятностей и математический статистики.

Полученные результаты и новизна

Мультиязычный корпус казахского и русского языков; методы предварительной обработки речевых сигналов. Анализ существующих систем распознавания речи, а также в разработка математических моделей и алгоритмов для решения поставленной задачи по разработке технологии мультиязычного автоматического распознавания речи.

Основные конструктивные и технико экономические показатели

Новая технология для распознавания речи, математические модели, алгоритмы и методы для автоматического анализа, синтеза и распознавания речевых сигналов. Повышение качества результатов распознавания казахской речи: будут использованы глубокие и рекуррентные нейронные сети, акустические модели, модель языка.

Степень внедрения

На стадии разработки.

Эффективность

Разработанная технология будет способствовать увеличению качества речевых человеко-машинных интерфейсов.

Область применения

Государственные структуры, ответственные за расширение области применения национальных языков на базе информационных технологий; производители мобильных телефонов (увеличение числа потенциальных покупателей за счёт внедрения речевых технологий на национальных языках); сотовые операторы и банки (call-центры с поддержкой голосовых функций, голосовая аутентификация); сектор производства различных устройств с поддержкой голосовых функций.

Скачать отчет за 2020 год (Русская версия) Скачать отчет за 2020 год (Английская версия)

Реферат (Абстракт) - 2020 год

Объект исследования, разработки или проектирования

Методы и модели распознавания и классификации речевых сигналов, искусственный интеллект, речевые технологии и компьютерная лингвистика, информационно-поисковые системы.

Цель работы

Основной целью данного проекта является повышение точности мультиязычного распознавания речи за счет применения искусственных нейронных сетей на этапе акустического и языкового моделирования.

Методы исследования

Методы проектирования и анализа программных средств, имитационного моделирования, теории вероятностей и математической статистики.

Полученные результаты и новизна

Мультиязычный корпус казахского и русского языков; методы предварительной обработки речевых сигналов. Анализ существующих систем распознавания речи, а также создание математических моделей и алгоритмов для решения поставленной задачи по разработке технологии мультиязычного автоматического распознавания речи.

Основные конструктивные и технико экономические показатели

Новая технология для распознавания речи, математические модели, алгоритмы и методы для автоматического анализа, синтеза и распознавания речевых сигналов. Повышение качества результатов распознавания казахской речи: применены глубокие и рекуррентные нейронные сети, акустические модели, модель языка.

Степень внедрения

Внедрено

Эффективность

Разработанная технология будет способствовать увеличению качества речевых человеко-машинных интерфейсов.

Область применения

Государственные структуры, ответственные за расширение области применения национальных языков на базе информационных технологий; производители мобильных телефонов (увеличение числа потенциальных покупателей за счёт внедрения речевых технологий на национальных языках); сотовые операторы и банки (call-центры с поддержкой голосовых функций, голосовая аутентификация); сектор производства различных устройств с поддержкой голосовых функций.