1. История экзаменационных систем

Долгое время в системах государств и цивилизаций превалировали локальные устные и письменные экзамены. Тем не менее имеются сведения, датированные III тысячелетием до н. э., о наличии в странах Древнего Востока (Египет, Вавилон, Индия, Китай) конкурсных испытаний интеллектуального характера. Это свидетельствует о том, что уже тогда методы тестирования в образовании использовались для оценки знаний и предназначались для отбора персонала на государственные должности. Однако все эти методы исследования вряд ли можно назвать тестами в современном понимании этого термина.

В школьной практике тесты начали применяться одним из их основателей – британским ученым-энциклопедистом Фрэнсисом Гальтоном в 1892 году. Он по праву считается родоначальником тестового движения. В 1883 году был опубликован его научный труд «Исследования человеческих способностей и их развития», который можно считать началом научной психологии и метода тестов. Важным вкладом в развитие теории тестов было определение трех основных принципов:



• Применение серии одинаковых испытаний к большому количеству испытуемых;

• Статистическая обработка результатов;

• Выделение эталонов оценки.



Эти принципы используются и в настоящее время – на основе проведения серий испытаний. Большинство современных тестов построено на базе статистической теории измерений, а идея эталона оценки лежит в основе определения тестов как стандартизированного инструмента.



Далее новые методики были подхвачены учеными Нового Света. Во втором десятилетии XX века в Америке начал применяться новый тип контроля качества и диагностики уровня образования. Его широкое распространение, как все в Америке, переросло в настоящий бум – тестирование в образовании стало ускоренными темпами набирать обороты. 2. «Армейский» SAT

О динамике развития событий в тестологии свидетельствует история самого популярного на сегодняшний день экзамена – «Теста схоластических способностей», или SAT.

В начале 20-го века в США для поступления в вуз абитуриенту приходилось сдавать ряд экзаменов в конкретном университете. Эта методика была не слишком эффективна – у будущих студентов не всегда была возможность ехать через полстраны в выбранное ими учебное заведение.

Чтобы оптимизировать процедуру поступления в вуз, в 1899 году в Нью-Йорке был создан College Board (Университетский совет) – некоммерческая организация, своего рода вузовская лига, в которую первоначально вошли 12 высших учебных заведений Северо-Востока США (Колумбийский, Принстонский, Корнельский, Пенсильванский и другие университеты и колледжи). Тогда же College Board начал разрабатывать универсальный комплексный тест для учебных заведений.

В 20-х годах прошлого века Роберт Йеркс, психолог самого известного массачусетского вуза, Гарвардского университета, работал над прототипом экзамена IQ – специализированного теста для проверки интеллектуального уровня военнослужащих. Ученый к тому времени достиг больших высот академического Олимпа и стал основоположником ряда законов современной психологии.

Чуть позже, в 1923 году, его коллега Карл Бригэм из города Мальборо, Массачусетс, опубликовал книгу A Study of American Intelligence («Исследование американского интеллекта»), в которой описал специфику и детали применения теста более чем на 2 млн экзаменуемых новобранцах. В дальнейшем, уже будучи профессором Принстонского университета в Нью Джерси, Бригэм компилировал этот армейский тест для абитуриентов своего университета. Результаты адаптированного теста соответствовали действительности и справедливо оценивали когнитивные способности абитуриентов. Это достижение было отмечено College Board, которая пригласила Бригэма возглавить специальную комиссию по совершенствованию системы тестирования абитуриентов и в дальнейшем трансформировала бывший армейский тест в SAT. Первый тест SAT сдавали в 1926 году 8 000 американских абитуриентов в 318 экзаменационных центрах.

Десять лет спустя экзамен SAT вернется на родину – в Массачусетс, но уже не в качестве прототипа, а как полноценное мерило уровня знаний выпускников средней школы. В 1934 году Гарвард впервые использует его в процессе назначения университетских стипендий, а годом позже тест SAT сделают обязательным для всех абитуриентов.



Одновременно начинается популяризация теста на Северо-Востоке Америки – его практикуют в Новой Англии и Нью-Йорке, счет экзаменуемых идет на десятки тысяч… 92 года спустя, в 2018 году, в нем участвовали 2,1 млн школьников в США и намного больше во всем мире. На сегодняшний день результаты экзамена принимают при поступлении в вузы в Канаде, Австралии и всех странах Британского Содружества, как и в самом Альбионе. А также в Финляндии, Нидерландах, Японии, Южной Корее и ряде частных университетов и колледжей других стран.

Помимо SAT, с 1959 года в США можно сдавать другой стандартизированный экзамен – ACT (тест на принятие в колледж), который появился 20 годами позже и во многом повторяет своего предшественника по содержанию. Тест управляется одноименной некоммерческой организацией и, несмотря на более низкую популярность, не стал анахронизмом. Его результаты все чаще рассматриваются в колледжах Среднего Запада США, а также в ограниченных масштабах – за рубежом. 3. Устный, письменный экзамен или комплексный тест?

Многие страны мира разработали ряд современных методик тестирования для поступления в вуз. Где-то по-прежнему в приоритете устная экзаменация, где-то письменная. Каждая методика по-своему совершенна и оптимальна для конкретной страны, культуры и социума. Несмотря на ряд минусов тестирования как метода педагогического контроля, его положительные качества во многом говорят о целесообразности использования такой технологии в учебном процессе.

Вот его преимущества:

Объективность – за счет стандартизации процедуры проведения и проверки результатов.

Справедливость – тест ставит всех учащихся в равные условия и фактически исключает субъективизм преподавателя.

Объемность – тест позволяет выявить знания учащегося по всему программному курсу, исключив элемент случайности.

Точность – например, шкала оценки теста из 20 вопросов состоит из 20 делений, в то время как обычная шкала оценки знаний – только из четырех.

Время – тестирование и контроль результатов в группе из 30 человек занимает до полутора часов, устный или письменный экзамен – не менее четырех часов.

Стресс – тест ставит всех учащихся в равные условия и, используя единые критерии, приводит к снижению предэкзаменационного нервного напряжения.



А вот недостатки тестирования:

Безликость

Тест не позволяет проверять и оценивать уровень знаний, связанных с творчеством, выявляя главным образом абстрактные и методологические знания.

Оборотная сторона широты охвата

При тестировании, в отличие от устного или письменного экзамена, нет достаточного времени для более глубокой аналитики.

Случайность

В тестировании присутствует элемент случайности. К примеру, учащийся, не ответивший на простой вопрос, может дать правильный ответ на более сложный. Причиной этого может быть как случайная ошибка в первом вопросе, так и угадывание ответа во втором, что приводит к искажению оценки знаний.



Но все же преимуществ больше, чем недостатков, и это свидетельствует о том, что не стоит абсолютизировать возможности валидации знаний через тестовую систему. Во многих странах ряд методик оценки когнитивных способностей подтверждает, что тестирование должно обязательно сочетаться с другими формами и методами проверки и контроля знаний школьников.

Более того, меняются поколения. Сегодняшнее поколение Z – это далеко не Y и уж совсем не Х. У каждого поколения своя специфика и свой «ментальный отпечаток». Соответственно, и подход к тестированию меняется. К примеру, недавно тот же College Board убрал из обязательного списка заданий написание эссе. Возможно, это связано с тем, что те, кому трудно самовыражаться через эпистолярный жанр, теперь могут пропустить эссе, ставшее факультативной опцией.

С другой стороны, большинство приемных комиссий престижных университетов и колледжей по-прежнему настаивают на личных собеседованиях с абитуриентом независимо от результатов его экзамена SAT, академической успеваемости и рекомендаций преподавателей. Ведь за безликими результатами стандартизированных тестов можно не увидеть индивидуальность или одаренность абитуриента, особенно в хрупком и стеснительном подростковом возрасте.

Более того, приемные комиссии именно это и ищут в портфолио абитуриентов – уникальность интересов, участие в олимпиадах, социальную активность и т. п. Ни один тест не включает подробные доказательства математических способностей, виртуозное владение кистью или карандашом, или игру на музыкальных инструментах. Их нельзя облечь в тестовую форму с вопросами на выбор. А ведь именно они составляют личность и создают впечатление о ней. Поэтому, по мнению многих экспертов, тестирование не должно заменять традиционные методы оценки когнитивных способностей. Возможно, тот же тест SAT будет адаптироваться под тренды поколений, а приемные комиссии будут вооружаться новым инструментарием для поиска творческих и талантливых претендентов.

Ученые, которые почти сто лет назад разрабатывали SAT, в своих трудах явно имели отношение к евгенике. Ведь любой отбор по установленным критериям качества знаний – это неминуемо отбор лучших. Но сегодня любой педагог или исследователь шарахается от евгеники, как черт от ладана. В современном тестировании речь идет только о проверке знаний, но ни в коем случае не об «улучшении людской породы» путем отбора самых умных.

С появлением новых технологий обработки информации бинарным кодом увеличилась скорость процесса тестирования, но сегодняшнему поколению педагогов и методистов еще есть над чем потрудиться. В частности, необходимо обеспечить контроль над искусственным интеллектом – AI, используемым в системах тестирования. Бесконтрольное применение AI может привести к антиутопии в стиле песни Pink Floyd «Another Brick in the Wall» или «We Don't Wanna Become Somebody's Property» Дидье Маруани.

Загрузка...