Как известно, начиная с 2001 года в Российской Федерации вводится единый государственный экзамен для всех выпускников общеобразовательных учебных заведений (принятая аббревиатура – ЕГЭ). По проблематике ЕГЭ уже выпущено немало научно-методических и научно-организационных материалов. Среди них сборники статей (Болотов, 2002), материалы конференций (Хлебников, 2001-2002). Проблема шкалирования является одной из центральных в системе методического обеспечения ЕГЭ. Вместе с тем до настоящего времени она решена далеко не так, чтобы удовлетворить все стороны, вовлеченные в процесс проведения и использования результатов ЕГЭ. Прежде всего в данном случае имеются в виду интересы самих учащихся и их родителей, а также самого массового отряда педагогов – школьного учительства.
В 2001-2003 годах результаты ЕГЭ обрабатывались в соответствиии с моделью шкалирования, разработанной в Центре тестирования Министерства образования России (ЦТМО) – организации, ответственной за технологию проведения ЕГЭ (Нейман, 2002). С точки зрения пользователей результатов основные черты этой модели состоят в следующем:
В едином методическом центре в Москве из регионов собираются все протоколы экзамена по каждому предмету и для каждого протокола (ответов одного учащегося) подсчитываются так называемые «первичные» (или «сырые») баллы ЕГЭ. Эти баллы отражают число правильных ответов на все задания экзамена с весовыми коэффициентами, разными для заданий разных типов. Известно, что экзамен ЕГЭ состоит из частей А, В и С, где А – задания с выбором из предложенных вариантов, В – задания с кратким свободным ответом, С – задания, с развернутым свободным письменным ответом. Практически для всех предметов принята упрощенная схема весовых коэффициентов: задания А и В дают коэффициент 1, задания С – от 2 до 4. Ответы А и В проверяются автоматизированно – на компьютере. Первичные баллы по заданиям типа «С» выставляют эксперты. При этом эксперты исходят в своих оценках из предлагаемого авторами заданий диапазона оценок – от 0 до 2 (для более легких заданий), от 0 до 4 (для более сложных) и т.п.
После подсчета первичных баллов производится пересчет в стандартизированные, так называемые «тестовые баллы», которые измеряются на 100-балльной шкале. При этом применяется однопараметрическая модель Раша в модификации Ю.М.Неймана, которая позволяет сохранить монотонность преобразования первичных баллов в стандартизированные несмотря на взвешивание эмпирической трудности заданий. Калибровка заданий по трудности при этом происходит весьма приближенно – с точностью не до отдельного конкретного задания в отдельном варианте, а до «типового задания», занимающего определенное место (по теме и типу задания) во всех вариантах. Но уже такая калибровка дает эффект нормализации распределения баллов (в логике известной теоремы Муавра-Лапласа о приближении биномиального распределения к нормальному), хотя нынешний алгоритм шкалирования в ЕГЭ и не реализует сам по себе принцип форсированной нормализации (см. ниже в параграфе, посвященном зарубежному опыту).
Для стобалльной шкалы тестовых баллов предметная комиссия Минобразования разрабатывает рекомендации по переводу в пятибалльные отметки. Так как для тестовых шкал, принятых в ЕГЭ-2002-2003, фактически действует модель нормального распределения с параметрами 50+/-15 (то есть, математическое ожидание принималось равным 50, а среднее квадратическое, или стандартное отклонение 15), Минестерство образования получило возможность управлять балансом традиционных оценок (в масштабе страны в целом), рекомендуемых школам для учета в аттестатах. При этом верхняя граница «двойки» в районе 30 баллов отсекает от распределения нижнюю группу численностью примерно в 10 процентов по всем предметам. Симметрично нижняя граница «пятерки» в районе 70 тестовых баллов отсекает верхнюю группу численностью также в 10 процентов. А точка 50 на этой шкале примерно соответствовала медиане и часто утверждалась (предметными комиссиями) как граница между «четверкой» и «тройкой».
Описанный здесь подход явился несомненным шагом вперед в плане создания более удобной, более стандартизированной и легкой в использовании шкалы, чем шкалы, применявшиеся ранее в Централизованном тестировании (см. Нейман, Хлебников, 2000). В целом данный подход вполне находится в русле мировых научных тенденций в области педагогических измерений. Наиболее ценным следствием этого подхода для практиков явился тот факт, что определенным отрезкам шкалы тестовых баллов фактически поставлены в соответствие определенные вероятности эмпирической встречаемости учащихся с определенным уровнем подготовки. Это облегчает приемным комиссиям вузов планирование приема по результатам ЕГЭ. Вот как примерно выглядит соответствие между определенными точками на шкале тестовых баллов ЕГЭ и процентильными баллами (процентами от выборки испытуемых, выполнявших тест – см. словарь Балыхина, 2000)
Таблица 1.
Ниже 30 |
Ниже 40 |
Выше 50 |
Выше 60 |
Выше 70 |
Менее 10 процентов |
Менее 25 процентов |
50 процентов |
Менее 25 процентов |
Менее 10 процентов |
Информация о ообразовании:
Типы семинаров
Семинары могут быть различными как по содержанию, так и по построению, организации работы. Обычно на семинарах обсуждаются заранее поставленные вопросы. Студенты заблаговременно знакомятся с планом семинарского занятия и литературой, рекомендуемой к изучению данной темы, чтобы иметь возможность под ...
Педагогическая деятельность Н.И. Пирогова
Николай Иванович Пирогов (1810—1881) родился в Москве. По окончании Московского университета (медицинский факультет) он подготовлялся в Дерпте (г. Тарту) к профессуре и после защиты диссертации на степень доктора медицины в течение двух лет занимался в Германии усовершенствованием своих знаний. B в ...
Особенности управления ВУЗом
Термин «руководство образовательным учреждением» обозначается как механизм для организации и обеспечения оптимальных условий функционирования образования на всех уровнях, «мозг» системы. Особенностью управления современной системой образования является прежде всего обеспечение руководящими кадрами ...