![]() |
![]() |
||||||||
|
Вид доклада: [только публикация] СБОР РЕЧЕВОЙ БАЗЫ ДАННЫХ СЛАБОСЛЫШАЩИХ ДЕТЕЙ Аграновский Александр Владимирович, Леднов Дмитрий Анатольевич, Карпов Игорь Александрович Государственное предприятие конструкторское бюро «Спецвузавтоматика» (ГП КБ «Спецвузавтоматика»), г. Ростов-на-Дону Сбор речевых данных слабослышащих детей для выявления особенностей произношения и последующим анализом для создания программных продуктов, направленных на самостоятельную корректировку произношения инвалидов по слуху. Люди, страдающие серьезными нарушениями слуха, не способны к полноценному общению посредством речи, поэтому существует проблема создания эффективных методов обучения речи инвалидов по слуху. Для автоматизации процесса обучения созданы программно-аппаратные комплексы, которые успешно применяются в специализированных учреждениях России. Сейчас, технологическое первенство в этой области можно смело отдать корпорации IBM, которая в 1987-89 годах представила вниманию логопедов США настольную систему "Видимая речь" (Visual Viewer). Несмотря на высокую цену в 1991-1993 году на территории СНГ было приблизительно около 100 комплектов подобного оборудования, которое успешно работает и в настоящее время. Последняя разработка фирмы IBM – "Видимая речь-3". Наиболее известные из отечественных производителей: "Речевой калейдоскоп" – НПО "КАСКОД" – С.Петербург; "Филиппок" – КУДИЦ – Москва; "КОСПР" – Минск. Практически все они использовали нестандартные внешние устройства обработки речи, заменяющее современные звуковые карты, и были аналогами разработок IBM. В настоящее время из отечественных разработок предлагаются к поставке тренажеры "Дельфа" – Москва, "Учимся говорить" – С.Петербург, "Визуальный тренажер произношения" – Минск. На данный момент их и нельзя назвать самыми современными средствами, но они остаются самыми доступными средствами для системы специального обучения. Опыт применения компьютерных тренажеров показывает, что, работая только с ними, нельзя решить всех проблем формирования правильного произношения. Однако их использование, особенно при работе с детьми, делает занятия привлекательными, обеспечивая необходимый психологический и эмоциональный настрой. Тестирование программных модулей, созданных на основе метода максимального правдоподобия [3] и на основе искусственных нейронных сетей [4] показало, что точность использованных алгоритмов недостаточна. В значительной мере ошибка функционирования алгоритмов была связана с тем, что их обучение производилось на речевой базе нормально слышащих людей. Этот факт заставляет идти по пути создания базы данных записей речи глухих и слабослышащих людей. Для тестирования и повышения эффективности используемых методов были собраны речевые данные пятидесяти учеников школы-интерната для слабослышащих в возрасте от 9 до 17 лет с 2-4 степенью тугоухости и глухоты 4-й степени. Речевые данные представляют собой слоги, сформированные из комбинации фонем согласная-гласная ([Ж], [З], [С], [Ф], [Х], [Ш], [Щ] и [А], [И], [О], [Э]). В данное время проводится обработка собранной информации. Анализ позволит определить особенности произношения инвалидов по слуху и классифицировать их, что в свою очередь, поможет в разработке новых алгоритмов. Литература
|