• способов обработки результатов тестирования, процедуры проведения, методики количественного и качественного анализа результатов тестирования;
• процедуры проведения тестирования, унификация инструкции, бланков, тестовых материалов, условий проведения тестирования;
• целей тестирования и категорий испытуемых;
• подсчета баллов по результатам тестирования.
Процесс тестирования стандартизируется, если выполняется ряд требований:
• инструкции к одной форме заданий даются одними и теми же словами;
• ни одному тестируемому не дается преимуществ перед другими;
• система подсчета баллов применяется одинаково ко всем испытуемым;
• тестирование всех групп испытуемых проводится в одно время;
• все испытуемые получают одинаковые по содержанию и трудности задания.
При этом подготовка к тестированию также предусматривает ряд требований:
• организацию контроля согласно разработанной инструкции;
• предварительную подготовку испытуемых к тестированию;
• создание соответствующих условий для проведения тестирования (место, техника, приборы, программно–методические материалы);
• создание благоприятных психологических условий;
• представление теста в эффективной форме;
• оптимизацию системы подсчета баллов, методов их представления и интерпретации результатов.
Кроме того, следует учитывать, что точность тестовых оценок возрастает по мере повышения однородности (гомогенности) содержания теста, когда содержание всех заданий нацелено на измерение одной и той же переменной.
В табл. 3 приведен один из вариантов матрицы тестирования, которая позволяет не только зафиксировать общее количество баллов, полученное каждым тестируемым, но и провести качественную оценку содержания знаний, усвоенных испытуемыми.
Таблица 3
Матрица результатов тестирования
Из практики применения тестов следует, что чем более массовый характер имеет тестирование, тем большее число задач оно решает, тем более ответственны процедура и результат тестирования, больше вероятность получения ошибочных выводов при использовании некачественных контрольно–оценочных материалов. Именно поэтому для массовых обследований необходимо разрабатывать и использовать качественные педагогические измерители, применять современные технологии обработки, оценивания, анализа и интерпретации результатов тестирования. Это правило создает границы применимости различных по качеству текстов: авторских претестовых заданий для текущего контроля; стандартизированных тестов для массовых проверок учебных достижений школьников; итоговой аттестации выпускников или отбора абитуриентов.
Применение авторских тестов на локальном уровне возможно, но их тиражирование может иметь следствием получение недостоверных результатов на больших выборках испытуемых. Сегодня на уровне регионов и территорий для аттестации и определения качества образовательных учреждений, как правило, используются авторские контрольно–оценочные материалы, не позволяющие определять качество и, тем более, сравнивать показатели разных образовательных систем между собой.
3.5. Методы шкалирования результатов тестирования
Развитие и внедрение современных тестовых методов и технологий остро ставит вопрос необходимости совершенствования техники обработки результатов тестового контроля. Проблема надежности шкалирования результатов тестирования в педагогических измерениях так же важна, как подготовка качественного теста или техника тестирования.
В самом широком смысле измерение сводится в конечном счете к припис^гванию чисел измеряемым объектам или событиям согласно определенным правилам. Правила устанавливают соответствие между некоторыми свойствами объектов и чисел, позволяющее сравнивать между собой эти объекты по состоянию измеряемого свойства. В зависимости от целей измерения и сопоставления тех или иных объектов выбираются различные правила, отображающие различные свойства объектов. Переменные различаются тем, насколько хорошо они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает их шкала. Всякий раз при измерениях нужного свойства выбирают соответствующую измерительную шкалу. Шкала – это средство фиксации результатов измерения определенных свойств объектов путем упорядочения их в определенную числовую систему, в которой отношение между отдельными результатами выражено в соответствующих числах. Очевидно, в каждом измерении всегда присутствует некоторая ошибка, определяющая границы «количества информации», которое можно получить. Другим фактором, определяющим количество информации, содержащейся в переменной, является тип шкалы, в которой проведено измерение.