Главная страница

общение

Перейти на форум

Обсудить тезисы

Написать автору

события

Расписание

Приветствия

Пленарные заседания

"Круглые столы"

Семинары

Презентации

Мастерские

Участники конференции

Экспоненты выставки

Фотогалерея

секции

Содержание

I.1, I.2, I.3

II.1, II.2, II.3, II.4

III.1, III.2, III.3

- IV -

- V -

- VI -

Алфавитный список авторов

статистика

Вид доклада: [только публикация]

ИТО-2002/Секция VI

ПРОГРАММНО-АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АНАЛИЗА РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ НА ОСНОВЕ МОДЕЛИ РАША

Маслак Анатолий Андреевич, Осипов Сергей Александрович, Биянов Виталий Владимирович

Курский государственный педагогический университет, Славянский филиал Армавирского государственного педагогического института, г.Славянск-на-Кубани, Славянский филиал Армавирского государственного педагогического института, г.Славянск-на-Кубани

Современный этап развития и функционирования тестового контроля характеризуется применением к решению психолого-педагогических задач методологии латентно-структурного анализа (LSA). Одним из направлений LSA является Item Response Theory (IRT) – распространенная на западе современная теория, направленная на оценивание латентных качеств личности и параметров тестовых заданий.

В рамках IRT датский ученый Georg Rasch разработал математическую модель, в которой нашли взаимосвязь два латентных параметра: уровень знаний тестируемого T и уровень трудности задания теста B

P=exp(T-B) / (1+exp(T-B)).

Причем, латентные параметры T и B оцениваются в одной и той же шкале – шкале логитов. Выходной величиной данной модели является вероятность правильного ответа тестируемого с уровнем знаний T на задание трудностью B. Величину вероятности правильного ответа P определяет разность T–B. Если эта разность велика по модулю и отрицательна, то задание трудностью B является слишком трудным для тестируемого с уровнем знаний T; если разность велика по модулю и положительна, то такое задание для испытуемого слишком легкое.

Начальная оценка уровня знаний испытуемого определяется по формуле Ti=ln(pi/qi), где pi – доля правильных ответов i-го испытуемого, qi – доля неправильных ответов, причем qi = 1 – pi. Аналогично определяется начальная оценка уровня трудности задания теста Bj=ln(qj/pj), где pj – доля правильных ответов на j-е задание теста, qj – доля неправильных ответов.

В силу действия различных случайных факторов оценки параметров T и B, полученные на нескольких выборках, будут, конечно, различаться. Если объем выборки достаточно велик, то можно ставить вопрос о вычислении устойчивых значений параметров T и B, которые будут наиболее эффективными оценками и могут быть приняты в качестве объективных оценок параметров T и B. Существуют различные методы вычисления эффективных оценок параметров распределения. Одним из них является метод наибольшего правдоподобия, предложенный Р. Фишером.

Авторским коллективом была разработана диалоговая система «Rasch Measurement», позволяющая вычислять эффективные оценки параметров модели T и B. В основу вычисления оценок положен алгоритм наибольшего правдоподобия.

Основные характеристики диалоговой системы «Rasch Measurement»:

  • входные данные (матрица тестирования) могут быть представлены в виде ASCII-файла или в виде файла MS Excel;

  • предусмотрена возможность корректировки результатов тестирования;

  • возможность исключения из результатов тестирования неинформативных данных (в соответствии с моделью Rasch), то есть строк и столбцов, содержащих все нули или единицы. Хотя разработанный алгоритм вычисления оценок параметров модели предусматривает обработку и таких данных;

  • отмена последних действий (до ста) с возможностью их повтора;

  • построение характеристических кривых для тестируемых и для заданий теста с возможностью трехмерного представления;

  • построение информационной функции, как для каждого задания, так и для всего теста в целом;

  • сохранение полученных оценок параметров модели T и B в фале формата ASCII.

В целом диалоговая система может успешно применяться при построении эффективных тестов для определения латентных характеристик испытуемых. Планируется создание банка тестовых заданий, оценки трудности которых могут быть с большой точностью определены с помощью данной системы.

обсудить на форуме написать автору
Сервер поддерживается фирмой НПП "БИТ про"
и Московским центром Федерации Интернет Образования