![]() |
![]() |
||||||||
|
Вид доклада: [только публикация] ПРОГРАММНО-АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АНАЛИЗА РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ НА ОСНОВЕ МОДЕЛИ РАША Маслак Анатолий Андреевич, Осипов Сергей Александрович, Биянов Виталий Владимирович Курский государственный педагогический университет, Славянский филиал Армавирского государственного педагогического института, г.Славянск-на-Кубани, Славянский филиал Армавирского государственного педагогического института, г.Славянск-на-Кубани Современный этап развития и функционирования тестового контроля характеризуется применением к решению психолого-педагогических задач методологии латентно-структурного анализа (LSA). Одним из направлений LSA является Item Response Theory (IRT) – распространенная на западе современная теория, направленная на оценивание латентных качеств личности и параметров тестовых заданий. В рамках IRT датский ученый Georg Rasch разработал математическую модель, в которой нашли взаимосвязь два латентных параметра: уровень знаний тестируемого T и уровень трудности задания теста B P=exp(T-B) / (1+exp(T-B)). Причем, латентные параметры T и B оцениваются в одной и той же шкале – шкале логитов. Выходной величиной данной модели является вероятность правильного ответа тестируемого с уровнем знаний T на задание трудностью B. Величину вероятности правильного ответа P определяет разность T–B. Если эта разность велика по модулю и отрицательна, то задание трудностью B является слишком трудным для тестируемого с уровнем знаний T; если разность велика по модулю и положительна, то такое задание для испытуемого слишком легкое. Начальная оценка уровня знаний испытуемого определяется по формуле Ti=ln(pi/qi), где pi – доля правильных ответов i-го испытуемого, qi – доля неправильных ответов, причем qi = 1 – pi. Аналогично определяется начальная оценка уровня трудности задания теста Bj=ln(qj/pj), где pj – доля правильных ответов на j-е задание теста, qj – доля неправильных ответов. В силу действия различных случайных факторов оценки параметров T и B, полученные на нескольких выборках, будут, конечно, различаться. Если объем выборки достаточно велик, то можно ставить вопрос о вычислении устойчивых значений параметров T и B, которые будут наиболее эффективными оценками и могут быть приняты в качестве объективных оценок параметров T и B. Существуют различные методы вычисления эффективных оценок параметров распределения. Одним из них является метод наибольшего правдоподобия, предложенный Р. Фишером. Авторским коллективом была разработана диалоговая система «Rasch Measurement», позволяющая вычислять эффективные оценки параметров модели T и B. В основу вычисления оценок положен алгоритм наибольшего правдоподобия. Основные характеристики диалоговой системы «Rasch Measurement»:
В целом диалоговая система может успешно применяться при построении эффективных тестов для определения латентных характеристик испытуемых. Планируется создание банка тестовых заданий, оценки трудности которых могут быть с большой точностью определены с помощью данной системы.
|