![]() |
![]() |
||||||||
|
Вид доклада: [устное выступление и публикация] ИТО-2002/Секция II /Подсекция 2 ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ АНАЛИЗА РУССКОЯЗЫЧНОГО КОНТЕКСТА ДЛЯ ПОСТРОЕНИЯ АКТИВНЫХ ОБУЧАЮЩИХ СИСТЕМ В ОБЛАСТИ ГУМАНИТАРНЫХ ДИСЦИПЛИН Мухин Олег Игоревич, Власов Василий Геннадьевич Пермский государственный технический университет, Региональный центр информатизации (РЦИ ПГТУ) Предлагается технология анализа русскоязычного контекста для построения активных компьютерных обучающих систем в гуманитарных предметных областях. Данная технология позволит улучшить процесс обучения за счёт качественно новых методов подачи и контроля учебного материала. Основная проблема компьютерного обучения гуманитарным дисциплинам — пассивная подача учебного материала. При такой подаче материала отсутствует обратная связь с обучаемым. В результате из учебного процесса исключаются такие важные принципы, как индивидуальный подход, принцип обратной связи, принцип деятельности. Для обеспечения таких принципов в компьютерных обучающих средах необходимо создание модели предметной дисциплины. Естественно, что эксперты гуманитарных предметных областей не в состоянии самостоятельно построить модель своей предметной области. Предлагаемая технология способна строить модели предметных областей, используя знания экспертов. Суть технологии состоит в том, что эксперт создаёт описание предметной области на русском языке, а компьютер, анализируя текст выстраивает модель этих знаний. Основа данной технологии строится на математической модели русского языка, которая и позволяет разбирать и анализировать текст и связи объектов предметных областей внутри него. Компьютер в силу своей архитектуры способен исполнять только математические и логические операции. Это означает, что необходимо перевести фразу с естественного языка на язык компьютера, то есть на математический. В лаборатории моделирования Пермского регионального центра информатизации создана математическая модель русского языка. Известно, что русский язык относится к группе флективных языков. Синтаксическое и семантическое значение слова в тексте зависит не от позиции слова в предложении, а от таких его категорий, как часть речи, падеж, число, лицо и т.д. При изменении категорий слова у него происходит изменение флексии и основы. Созданная математическая модель, имея на входе категории слова, формирует на выходе значение флексии и изменение основы. В инверсном режиме функционирования данная модель способна определять категории слова на основании значения флексии. Если в прямом режиме функционирования модель формирует однозначный результат, то в обратном режиме получается множественное решение. Для выбора правильного решения из множества возможных значений дополнительно используются синтаксические правила построения предложений русского языка, которые позволяют снизить такую неопределённость и прийти к однозначному решению. Вероятность однозначного восстановления смысла сейчас удаётся довести до 70-80% в зависимости от контекста. На основе данной модели в инструментальной среде моделирования Stratum‑2000 реализована автоматизированная среда по автоформализации текстовых описаний, представленных на русском языке. Входными данными для данной среды являются тексты, сформулированные на естественном языке. На выходе образуется система линейных и нелинейных алгебраических уравнений, которая и является моделью описания, поданного системе на вход. Первоначально русскоязычный текст попадает на вход математической модели русского языка, которая, функционируя в инверсном режиме, определяет для каждого слова входного текста его категории. Затем на основании синтаксических правил русского языка уточняются категории слов. После формирования списка слов исходного текста с определенными категориями для каждого слова он подаётся на вход модели формализации текстовых описаний. Данная модель, анализируя категории слов, выделяет из текста объекты, взаимодействующие между собой, определяет характер взаимодействий и в итоге порождает математические уравнения, отражающие отношения, сформулированные в задаче. Кроме задачи формализации текстовых описаний может решаться задача синтеза русскоязычного текста. Для этого математическая модель русского языка функционирует в прямом режиме. Система успешно перенастраивается на различные предметные области. Для этого к ней дополнительно подключаются базы знаний необходимых предметных областей, что позволяет менять область приложения при решении задач и расширить сферу применения системы.
|