ДЛЯ КОНТРОЛЯ УСПЕВАЕМОСТИ
На вопрос о применимости тестов для контроля успеваемости студентов по учебной дисциплине или по ее отдельным частям (разделам, темам, модулям) следует ответить отрицательно. Казалось бы, достаточно просто изменить подход к интерпретации результатов тестирования – установить шкалу оценивания в зависимости от количества правильно выполненных тестовых заданий, в соответствии с которой и выставить испытуемым оценки. Однако, к сожалению, задача более сложна.
Как уже указывалось, сфера применения тестов как средства педагогических измерений ограничена задачей ранжирования испытуемых внутри подвергнутой тестированию группы. Именно этой задаче подчинены и композиция тестов, и принципы отбора тестовых заданий. Другими словами, педагогические тесты формируются так, чтобы обеспечить оценивание знаний испытуемых по отношению друг к другу, тогда как контроль успеваемости подразумевает оценивание уровня подготовленности по некой абсолютной шкале, учитывающей не только факт усвоения определенного учебного материала (усвоен – не усвоен), но и степень этого усвоения.
В подтверждение приведем хотя бы такой аргумент. Как известно, тестовое задание, с которым успешно справляются все испытуемые, должно быть исключено из теста, равно как и задание, которое не может выполнить никто, поскольку такие задания не позволяют ранжировать членов группы. Если же речь идет о проверке знаний, а указанными заданиями контролируется усвоение определенного учебного материала, исключать их нет никакой необходимости. При качественно сформулированных заданиях тот факт, что некоторые из них выполняются всеми, а отдельные не выполняются никем из студентов, говорит лишь о достоинствах или недостатках преподавания соответствующих разделов дисциплины.
Разрешающая способность теста как инструмента ранжирования испытуемых всегда должна быть выше разрешающей способности средств измерения успеваемости, поскольку в последнем случае необходимо только разделять испытуемых на группы по количеству баллов в принятой шкале оценивания, а не выстраивать их по рейтингу. Отсюда следует возможность корректировки в сторону смягчения требования возрастающей трудности заданий. Видимо, нет жесткой необходимости в последовательном нарастании трудности от задания к заданию. Можно допустить наличие в тесте нескольких групп заданий возрастающей сложности при том, что внутри этих групп трудность заданий будет одинаковой.
Изложенное приводит к выводу, что для контроля успеваемости необходимо применять не педагогические тесты, а комплекты заданий в тестовой форме.
При этом все требования к форме заданий, изложенные ранее в настоящем пособии, остаются неизменными. Меняется лишь подход к отбору заданий.
Прежде всего, необходимо обеспечить репрезентативность содержания учебной дисциплины в комплекте заданий. При комплектовании следует обратить внимание на полноту и достаточность числа заданий для аргументированного вывода о знаниях. В самом деле, проверить знания испытуемых можно по пяти-шести заданиям. Но где уверенность, что студенты знают остальные элементы содержания учебной дисциплины? Путь к появлению такой уверенности лежит в наиболее полном отображении необходимых знаний и умений в заданиях комплекта. Репрезентативность не означает обязательного включения в комплект всех значимых элементов содержания или строго пропорционального включения в тест заданий по различным темам. Ведь многие из них явно связаны между собой в общей структуре знаний, включены один в другой, полностью или частично. Кроме того, многие элементы в структуре знаний иерархически соподчинены, а потому из соображений экономии, нет смысла включать в комплект задания по всем изучавшимся темам.
Сколько же заданий следует включать в комплект? Стремление к повышению точности результатов контроля путем увеличения числа заданий в комплекте нельзя, в принципе, признать правильным. При создании комплекта заданий в тестовой форме обычно ставится задача отобразить в нем то основное, что отражает идею измерения уровня и структуры подготовленности студентов, как результат образовательной деятельности. Можно сказать так: содержание учебной дисциплины, как правило, всегда будет шире содержания комплекта заданий в тестовой форме.
Разумеется, репрезентативность комплекта заданий связана с числом заданий и в общем случае, чем больше заданий, тем репрезентативнее могут оказаться результаты. Точность педагогических измерений также зависит от числа заданий и растет по мере их увеличения. В то же время, число заданий, включаемых в комплект, ограничивается временем, которое отводится для проведения контрольного мероприятия (обычно 1–2 академических часа). Таким образом, можно говорить о некоем предельном (30 заданий) и оптимальном по размеру комплекте заданий в тестовой форме.
Что касается дифференцирующей способности и коррелированности баллов каждого задания с суммарной оценкой по всему комплекту, то эти важнейшие требования к тестовым заданиям в полной мере должны быть отнесены и к заданиям в тестовой форме, включаемым в комплект для контроля успеваемости.
Ниже приводится один из возможных подходов к формированию комплектов заданий в тестовой форме для модульного контроля, принятый кафедрой автоматизации производственных процессов НМетАУ и соответствующей кафедрой ГИПОпром. Указанный подход ориентирован на использование 12-бальной шкалы оценивания, которая, легко трансформируясь в отечественную 4-бальную шкалу (см. табл. 5.1), позволяет существенно увеличить точность педагогических измерений.
Таблица 5.1 – Соответствие оценок 12-бальной и 4-бальной шкал
4-бальная шкала | 12-бальная шкала |
неудовлетворительно | |
удовлетворительно | |
хорошо | |
отлично | |
Сущность предлагаемой методики состоит в том, что каждый вариант комплекта заданий включает 12 заданий в тестовой форме, дифференцированной трудности (рис.5.1). Половина из них (6 заданий) соответствуют наиболее низкому ознакомительно-ориентировочномууровню сформированности знаний. Задания этой группы выявляют знание студентами таких учебных элементов дисциплины, как основные категории, термины, понятия и обозначения, свойства, явления, наблюдаемые факты и утверждения, описания объектов, механизмов и т.п. Условно говоря, это «задания на тройку».