Вы находитесь на странице: 1из 684

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

АКТУАЛЬНЫЕ
ВОПРОСЫ
ЯЗЫКОВОГО
ТЕСТИРОВАНИЯ
Под редакцией И. Ю. Павловской
Выпуск 2

ИЗДАТЕЛЬСТВО САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА


УДК 37:81’232’243
ББК 81.2.9
А43
Р е ц е н з е н т д-р физ.-мат. наук, проф. М. Ю. Волокубинский (кафедра математики и статисти-
ки Санкт-Петербургского филиала Финансового университета Правительства
России)
К о л л е к т и в а в т о р о в: С. Ахола (S. Ahola), А. А. Башарин, Н. И. Башмакова, Л. Г. Беликова,
Е. А. Бесядовская, А. А. Биркин, И. Г. Большакова, Л. С. Васильева, М. И. Всемир-
нов, А. Б. Глыбина, С. Г. Говорун, О. Г. Горина, А. О. Гребенников, И. В. Григорьев,
Д. А. Громова, К. Ю. Диброва, Т. В. Догот, И. Н. Ерофеева, Е. В. Есина, Е. В. Заруц-
кая, Е. А. Иванова, И. Л. Колесникова, Д. В. Колесова, О. В. Кораева, А. А. Коренев,
Н. В. Кравцова, М. Я. Креер, А. Л. Лупинова, И. А. Маковецкая, Е. Н. Марченко,
М. Ю. Муравьева, Т. Е. Нестерова, Л. Ниэминен (L. Nieminen), Дж. Ч. Олдерсон
(J. Ch.  Alderson), Е. В. Онушкина, И. Ю. Павловская (отв. ред.), Т. М. Панова,
Т. И. Попова, Л. Д. Ребикова, К. А. Рогова, Г. С. Рогожина, Е. К. Рохлина, Ю. Г. Се-
делкина, О. А. Сеничкина, Т. В. Сказочкина, Т. Ю. Солодилова, Д. К. Туманская,
Р. Уллаконоя (R. Ullakonoja), Н. Л. Федотова, Э.-Л. Хаапакангас (E.-L. Haapakan-
gas), А. Хухта (A. Huhta), Дж. Эйтон (J. Aiton), К. Эрикссон (K. Eriksson), Е. Е. Юр-
ков, А. А. Ярушкин, Т. С. Ярушкина
Рекомендовано к публикации научной комиссией
в области наук о языках и литературе
Санкт-Петербургского государственного университета
Актуальные вопросы языкового тестирования  /  С. Ахола,
А43 А. А. Башарин, Н. И. Башмакова [и др.]; под ред. И. Ю. Павловской. —
Вып. 2. — СПб.: Изд-во СПбГУ, 2017. — 684 с.
ISBN 978-5-288-05762-5
Второй выпуск «Актуальных вопросов языкового тестирования» является про-
должением инновационного междисциплинарного проекта, осуществленного специ-
алистами разных областей — лингвистики, методики преподавания, психологии, мате-
матической статистики — преподавателями и сотрудниками российских и зарубежных
вузов, языковых центров, служб тестирования. В нем освещен широкий спектр вопро-
сов языкового тестирования, ставшего за последние годы важной частью учебного про-
цесса в высшей и средней школе.
Адресовано преподавателям, аспирантам, исследователям, студентам, представи-
телям образовательного менеджмента и всем потенциальным потребителям тестовых
материалов в области иностранных языков (в том числе русского как иностранного).
УДК 37:81’232’243
ББК 81.2.9
Научное издание
АКТУАЛЬНЫЕ ВОПРОСЫ ЯЗЫКОВОГО ТЕСТИРОВАНИЯ
Выпуск 2
Корректор А. С. Перникова
Компьютерная верстка Ю. Ю. Тауриной
Подписано в печать 13.09.2017. Формат 60×90 1/16.
Усл. печ. л. 42,75. Планируемый тираж 500 экз. 1-й завод — 100 экз. Заказ № 0000.
Издательство Санкт-Петербургского университета. 199004, С.-Петербург, В.О., 6-я линия, 11.
Тел. (812)328-96-17; факс (812)328-44-22; publishing@spbu.ru publishing.spbu.ru
Типография Издательства СПбГУ. 199034, С.-Петербург, Менделеевская линия, д. 5.

© Санкт-Петербургский государственный
ISBN 978-5-288-05762-5 университет, 2017
ОГЛАВЛЕНИЕ

Предисловие (И. Ю. Павловская)........................................................................ 9

Глава 1. ОБЩИЕ ВОПРОСЫ ТЕСТОЛОГИИ


1.1. Современный понятийный аппарат тестологии
и его терминосистема........................................................................ 12
1.1.1. О единстве понимания и эволюции основного
тестологического термина — «тест»
(И. Ю. Павловская, Н. И. Башмакова)....................................... 12
1.1.2. Тест как инструмент измерения качества образования
в России (А. А. Коренев)............................................................... 17
1.1.3. Проблемы терминологического единства
в области тестирования по иностранным языкам
(Т. Ю. Солодилова, И. Ю. Павловская)....................................... 21
1.2. Исторические и социальные аспекты тестирования................ 32
1.2.1. Зарождение тестологических идей: Восток — Запад
(О. А. Сеничкина).......................................................................... 32
1.2.2. Шибболет-тест как одна из древнейших форм
лингвистического теста и его социальные последствия
(И. Г. Большакова)......................................................................... 36
1.2.3. Развитие метода тестов за рубежом в ХХ в.
(И. Ю. Павловская, Н. И. Башмакова)....................................... 42
1.2.4. Истоки отечественной тестологии
(И. Ю. Павловская, О. А. Сеничкина)......................................... 51
1.2.5. Проблема обратного влияния тестирования
в контексте социальных последствий (И. Г. Большакова)... 59
1.3. Современные положения теории тестирования........................ 72
1.3.1. Типология языковых тестов
(И. Ю. Павловская, Н. И. Башмакова)....................................... 72
1.3.2. Основные технологические приемы методики
языкового тестирования (И. Ю. Павловская)........................ 77
1.3.3. Языковая политика Совета Европы: плюрилингвизм,
мультилингвизм и языковое многообразие
(Е. В. Онушкина)............................................................................ 80
1.3.4. Лингвистические проекты Совета Европы
(И. Ю. Павловская)........................................................................ 87
1.3.5. Деятельность Ассоциации тестеров Европы (ALTE)
(И. Ю. Павловская, М. Я. Креер).................................................. 91

3
Оглавление

1.3.6. Уровни владения иностранным языком


(И. Ю. Павловская)........................................................................ 94
1.3.7. Коммуникативная компетенция: структура,
содержание, оценка (И. Н. Ерофеева, Т. Е. Нестерова,
Е. Е. Юрков)..................................................................................... 98
1.4. Статистический анализ тестовых данных................................... 109
1.4.1. Классические методики статистической обработки
результатов тестирования (И. Ю. Павловская)...................... 109
1.4.2. Современная теория тестовых заданий и метод анализа
Г. Раша (А. О. Гребенников, О. А. Сеничкина)........................... 125

Глава 2. СИСТЕМЫ ТЕСТИРОВАНИЯ


ПО ИНОСТРАННЫМ ЯЗЫКАМ
2.1. Тесты по русскому языку как иностранному.............................. 132
2.1.1. Современное состояние системы государственного
тестирования иностранных граждан в России
(Т. Е. Нестерова)............................................................................ 132
2.1.2. Тестирование по русскому языку: структура,
содержание, проблемы (И. Н. Ерофеева)................................. 141
2.2. Тесты по английскому языку........................................................... 146
2.2.1. Британские и американские тесты по английскому
языку как иностранному (И. Ю. Павловская)........................ 146
2.2.2. 50 лет TOEFL: смена парадигмы и ее последствия
(К. Ю. Диброва).............................................................................. 155
2.2.3. Некоторые особенности формата и принципов оценки
международного экзамена IELTS
(Дж. Эйтон, Е. К. Рохлина).......................................................... 165
2.3. Тестирование по французскому языку (Е. В. Есина).................. 172
2.4. Тесты по немецкому языку.............................................................. 184
2.4.1. Тесты по немецкому языку: современное состояние
(А. А. Башарин).............................................................................. 184
2.4.2. Формат устного экзамена по немецкому языку
на основной ступени обучения (Т. С. Ярушкина)................. 192
2.5. Экзамены по испанскому языку (А. А. Ярушкин)....................... 204
2.6. Экзамены по португальскому языку (А. А. Ярушкин)............... 217
2.7. Структура и особенности сертификации по итальянскому
языку как иностранному (Л. С. Васильева).................................. 227
2.8. Тестирование в скандинавских странах
(А. Л. Лупинова, К. Эрикссон)............................................................ 236
2.9. Тесты по финскому языку (Р. Уллаконоя, С. Ахола).................... 249
2.10. Тесты по новогреческому языку (Д. К. Туманская).................... 257

4
Оглавление

2.11. Экзамены Нидерландского языкового союза


(Е. В. Заруцкая).................................................................................... 263

Глава 3. ТЕОРИЯ И ПРАКТИКА ТЕСТИРОВАНИЯ


ЯЗЫКОВЫХ НАВЫКОВ И РЕЧЕВЫХ УМЕНИЙ
3.1. Тестирование уровня сформированности навыка
произношения..................................................................................... 268
3.1.1. Фонетические тесты при обучении иноязычному
произношению (в аспекте русского языка как
иностранного) (Н. Л. Федотова)............................................... 268
3.1.2. Критерии оценки сформированности фонологической
компетенции и виды фонетических тестов
(Т. В. Сказочкина).......................................................................... 288
3.1.3. О тестировании произносительных навыков
в условиях полилингвизма (И. Ю. Павловская)..................... 312
3.2. Тестирование уровня сформированности лексических
и грамматических навыков (И. Л. Колесникова).......................... 321
3.3. Тестирование уровня сформированности навыков
и умений аудирования (С. Г. Говорун)............................................ 334
3.4. Тестирование говорения как вида речевой деятельности....... 348
3.4.1. Анализ методов тестирования устной речи и форматов
тестов по говорению (Е. В. Заруцкая)...................................... 348
3.4.2. Проведение тестирования в парах как способ
улучшения качества производимого устного речевого
продукта и повышения степени достоверности
результатов теста (М. И. Всемирнов)........................................ 360
3.4.3. Особенности подготовки к субтесту «Говорение»
ТРКИ с учетом феномена сценарности речевого
взаимодействия (М. И. Всемирнов)........................................... 365
3.4.4. Практика использования формульного языка
в адаптационном тестировании (М. И. Всемирнов)............. 374
3.5. Чтение как объект тестирования (К. А. Рогова).......................... 384
3.6. Письмо как объект тестирования.................................................. 389
3.6.1. Критерии оценки письменной речи как вида
речевой деятельности (М. Я. Креер)......................................... 389
3.6.2. Критерии оценки письменной речи
(обучение и тестирование в рамках ТРКИ)
(Д. В. Колесова)............................................................................... 410
3.7. К вопросу о разработке критериев оценки письменного
перевода, выполненного студентами неязыковой
специальности (А. Б. Глыбина)........................................................ 417

5
Оглавление

Глава 4. ТЕСТИРОВАНИЕ НАВЫКОВ ВЛАДЕНИЯ


ИНОСТРАННЫМ ЯЗЫКОМ В СФЕРЕ
ПРОФЕССИОНАЛЬНОЙ КОММУНИКАЦИИ
4.1. Место профессионально-ориентированного
иностранного языка в системе обучения (Т. М. Панова).......... 423
4.2. Деловой английский язык как профессионально-
ориентированный язык и его тестирование
(Д. А. Громова, Л. Д. Ребикова).......................................................... 425
4.3. Анализ коммуникативных ситуаций в устно-речевых
тестах по деловому английскому языку (Е. В. Заруцкая).......... 434
4.4. Кембриджский экзамен по английскому языку
в сфере финансов (М. Ю. Муравьева)............................................ 443
4.5. Обучение и тестирование в рамках интегрированного
курса (Т. М. Панова)........................................................................... 448
4.6. Сравнительный анализ внутритестовых параметров
и определение кросстестовой корреляции тестов BEC
Higher и Institutional TOEFL (Т. В. Догот).................................... 454

Глава 5. ОПРЕДЕЛЕНИЕ УРОВНЯ СФОРМИРОВАННОСТИ


МЕТОДИЧЕСКОЙ КОМПЕТЕНТНОСТИ
ПРЕПОДАВАТЕЛЯ ИНОСТРАННОГО ЯЗЫКА
5.1. Тестирование профессионально-коммуникативной
компетенции преподавателей иностранного языка вузов
в России (А. А. Коренев)..................................................................... 465
5.2. Тестор и преподаватель: трансформация компетенции
(И. Н. Ерофеева, Л. Г. Беликова)........................................................ 470
5.3. Международные инструменты оценивания методической
компетенции преподавателя иностранного языка.................... 484
5.3.1. Содержание и тестирование уровня сформированности
методической компетенции преподавателя
иностранного языка (И. Л. Колесникова)................................ 484
5.3.2. TKT — экзамен по методике преподавания
английского языка и результаты его проведения
в СПбГУ (И. Ю. Павловская)...................................................... 492
5.3.3. Международный экзамен для преподавателей
по предметно-интегрированному обучению
(модуль CLIL TKT): курс подготовки к экзамену
и результаты (Т. М. Панова)....................................................... 502

6
Оглавление

5.3.4. Международный экзамен для преподавателей TKT


(модуль Young Learners — преподавание английского
языка детям) (Н. В. Кравцова).................................................... 509
5.3.5. Международный сертификат CELTA и педагогическая
практика российских студентов (Ю. Г. Седелкина)............... 511
5.4. Компетенции преподавателя
профессионально-ориентированного языка.............................. 515
5.4.1. Определение критериев компетентности преподавателя
профессионально-ортентированного языка (М. Я. Креер) 515
5.4.2. Искусство преподавателя в отборе
профессинально-ориентированных пособий
(М. Я. Креер).................................................................................... 521

Глава 6. ТЕСТИРОВАНИЕ КАК СТРАТЕГИЯ ОРГАНИЗАЦИИ


УЧЕБНОГО ПРОЦЕССА
6.1. Методические принципы интеграции обучения языку
для специальных целей в систему языковой подготовки
студентов управленческих специальностей (И. В. Григорьев,
Л. Д. Ребикова)...................................................................................... 528
6.2. Целеполагание при разработке программ обучения
иностранным языкам и сопутствующей системы
тестирования (Д. А. Громова, Л. Д. Ребикова)............................... 532

Глава 7. ПСИХОЛИНГВОДИДАКТИЧЕСКОЕ ТЕСТИРОВАНИЕ


7.1. Введение в психолингводидактическое тестирование
(И. Ю. Павловская).............................................................................. 539
7.2. Тест смещения репрезентативной системы (О. В. Кораева)..... 550
7.3. Сопоставительный анализ методов измерения
фоносемантики текста (Г. С. Рогожина)......................................... 558
7.4. Начала сравнительной психофизиологии речи.
Физиологические особенности восприятия русских
и английских текстов (А. А. Биркин).............................................. 569

Глава 8. КОМПЬЮТЕРНЫЕ И ИНТЕРНЕТ-ТЕХНОЛОГИИ


В ЯЗЫКОВОМ ТЕСТИРОВАНИИ
8.1. Применение интернет-технологий для административных
процедур в определении уровня владения иностранным
языком (на примере Оксфордского адаптивного
диагностического онлайн-теста) (И. А. Маковецкая)................ 578

7
Оглавление

8.2. Компьютеризованное тестирование как средство обучения


грамматическим навыкам владения иностранным языком
(на материале английского языка) (И. А. Маковецкая)............. 588
8.3. Психолингвистические аспекты оценки эффективности
курсов онлайн-сопровождения при обучении студентов
иностранному языку и их тестировании (И. А. Маковецкая). 601
8.4. Использование корпуса в языковом тестировании
(О. Г. Горина)......................................................................................... 604

Глава 9. ОСОБЕННОСТИ ЯЗЫКОВОГО ТЕСТИРОВАНИЯ


УЧАЩИХСЯ СРЕДНЕЙ ШКОЛЫ
9.1. Влияние языковых и когнитивных факторов
на формирование умений в чтении на финском языке
и в финской письменной речи у русско-финских
школьников (Р. Уллаконоя, Э.-Л. Хаапакангас, Л. Ниэминен,
А. Хухта, Дж. Ч. Олдерсон)............................................................... 614
9.2. О приравнивании результатов централизованного
экзамена по русскому языку как иностранному в Латвии
к общеевропейской шкале уровней владения языком
(Е. Н. Марченко).................................................................................. 625
9.3. Оценка уровня сформированности дискурсивной
компетенции билингвов старшего школьного возраста
(Т. И. Попова)....................................................................................... 630
9.4. Текущий контроль с помощью системы тестов в старших
классах негуманитарных направлений в Академической
гимназии СПбГУ (Е. А. Иванова).................................................... 638
9.5. Использование тестов международных экзаменов
и материалов ЕГЭ в процессе подготовки школьников
к Всероссийской олимпиаде по английскому языку
(Е. А. Бесядовская)............................................................................... 641
Заключение (И. Ю. Павловская).......................................................................... 653
Библиография......................................................................................................... 655

8
ПРЕДИСЛОВИЕ

Монография «Актуальные вопросы языкового тестирования»


написана по материалам докладов членов секции тестологии в рамках
Международной филологической конференции, проходящей в Санкт-
Петербургском государственном университете ежегодно вот уже бо-
лее сорока лет. Второй выпуск отражает обобщение современного
российского и зарубежного опыта в области языкового тестирования.
Это инновационный междисциплинарный проект, явившийся плодом
труда специалистов разных областей — лингвистики, методики пре-
подавания, психологии, математической статистики. Авторы — веду-
щие специалисты российских и зарубежных вузов, языковых центров,
служб тестирования.
За время, прошедшее с момента издания первого выпуска, в те-
стологии произошли заметные изменения. Тестирование стало не-
отъемлемой частью учебного и  учебно-организационного процесса,
как в  высшей, так и в  средней школе. В  связи с  введением Единого
государственного экзамена к  работе по подготовке к  тестированию
приступили широкие массы учителей школ и  преподавателей вузов.
Многие преподаватели прошли повышение квалификации в области
тестологии. Отечественными тестологами был накоплен новый опыт,
расширился спектр изучаемых проблем. В  книге добавились новые
главы, посвященные тестированию школьников и интернет-техноло-
гиям в языковом тестировании. Добавились и новые авторы. Однако
составители и редактор сочли необходимым сохранить общую струк-
туру издания, многие названия глав и разделов, наполнив их новым
содержанием. От некоторых устаревших разделов пришлось полно-
стью отказаться.
В настоящем издании рассматриваются теоретические основы
тестологии — проблемы терминологии, понятийного аппарата, типо-
логии тестов, методов тестирования языковых навыков и видов рече-
вой деятельности, — ввиду того, что настоящее издание может быть
использовано в  качестве материала для чтения лекций. Кроме того,
рассматриваются проблемы прикладного, практического характера —
способы статистической обработки тестовых данных. Представлен

9
Предисловие

богатый фактологический материал по системам тестирования наци-


ональных языков (как иностранных) в различных странах — в России,
Великобритании, Америке, Германии, Франции, Нидерландах, Испа-
нии, Португалии, Дании, Норвегии, Швеции, Греции, Италии. Авто-
рами — преподавателями соответствующих языков — дано не только
описание систем тестирования, но  и  глубокий лингвометодический
анализ спецификаций, форматов и содержания тестов.
В книге также описываются профессионально-ориентированное
тестирование, психолингвистическое тестирование, тестирование ме-
тодической компетенции преподавателя и вопросы, связанные с ним,
компьютерное тестирование и  тестирование школьников. Представ-
лен исследовательский материал авторов, уникальный по своему со-
держанию.
Монография, являясь научным изданием, может быть полезным
источником идей, информации и опыта ознакомления с тестировани-
ем не только для коллег-тестологов, но и для молодого поколения пре-
подавателей, аспирантов, магистрантов и студентов, специализирую-
щихся в данной области. Книга также будет полезна широкому кругу
читателей, интересующихся языковым тестированием.
Ответственный редактор приносит глубокую благодарность
всем авторам разделов данной книги, а также всем участникам секции
тестологии в  рамках Международной филологической конференции
СПбГУ, чей энтузиазм и  профессионализм сделали возможным осу-
ществление настоящего издания. Особая благодарность К. Ю. Дибро-
ве, И. Н. Ерофеевой, М. Я. Крееру и  Т. М. Пановой, скомпоновавшим
и отредактировавшим отдельные главы данной книги.
Редакция приносит извинение за приведение в  отдельных слу-
чаях устаревших интернет-ссылок. Наряду с оригинальными (автор-
скими) приводятся более новые, действующие на момент издания,
ссылки.

Авторы разделов:
С. Ахола (2.9), А. А. Башарин (2.4.1), Н. И. Башмакова (1.1.1, 1.2.3,
1.3.1), Л. Г. Беликова (5.2), Е. А. Бесядовская (9.5), А. А. Биркин (7.4),
И. Г. Большакова (1.2.2, 1.2.5), Л. С. Васильева (2,7), М. И. Всемирнов
(3.4.2, 3.4.3, 3.4.4), А. Б. Глыбина (3.7), С. Г. Говорун (3.2), О. Г. Гори-
на (8.4), А. О. Гребенников (1.4.2), И. В. Григорьев (6.1), Д. А. Громова
(4.2, 6.2), К. Ю. Диброва (2.2.2), Т. В. Догот (4.6), И. Н. Ерофеева (1.3.7,
2.1.2, 5.2), Е. В. Есина (2.3), Е. В. Заруцкая (2.11, 3.4.1, 4.3), Е. А. Ивано-

10
Предисловие

ва (9.4), И. Л. Колесникова (3.2, 5.3.1), Д. В. Колесова (3.6.2), О. В. Ко-


раева (7.3), А. А. Коренев (1.1.2, 5.1), Н. В. Кравцова (5.3.4), М. Я. Кре-
ер (1.3.5, 3.6.1, 5.4.1, 5.4.2), А. Л. Лупинова (2,8), И. А. Маковецкая (8.1,
8.2, 8.3), Е. Н. Марченко (9.2), М. Ю. Муравьева (4.4), Т. Е. Нестерова
(1.3.7, 2.1.1), Л. Ниэминен (9.1), Дж. Ч. Олдерсон (9.1), Е. В. Онушкина
(1.3.3), И. Ю. Павловская (Предисловие, 1.1.1, 1.1.3, 1.2.3, 1.2.4, 1.3.1,
1.3.2, 1.3.4, 1.3.5, 1.3.6, 1.4.1, 2.2.1, 3.1.3, 5.3.2, Заключение), Т. М. Па-
нова (4.1, 4.5, 5.3.3, 7.1), Т. И. Попова (9.3), Л. Д. Ребикова (4.2, 6.1, 6.2),
К. А. Рогова (3.5), Г. С. Рогожина (7.3), Е. К. Рохлина (2.2.3), Ю. Г. Седел-
кина (5.3.5), О. А. Сеничкина (1.2.1, 1.2.4, 1.4.2), Т. В. Сказочкина (3.1.2),
Т. Ю. Солодилова (1.1.3), Д. К. Туманская (2.10), Р. Уллаконоя (2.9, 9.1),
Н. Л. Федотова (3.1.1), Э.-Л. Хаапакангас (9.1), А. Хухта (9.1), Дж. Эйтон
(2.2.3), К. Эрикссон (2,8), Е. Е. Юрков (1.3.7), А. А. Ярушкин (2.5, 2.6),
Т. С. Ярушкина (2.4.2).
Ответственный редактор
проф. И. Ю. Павловская

11
Глава 1.  ОБЩИЕ ВОПРОСЫ ТЕСТОЛОГИИ

1.1.  СОВРЕМЕННЫЙ ПОНЯТИЙНЫЙ АППАРАТ ТЕСТОЛОГИИ


И ЕГО ТЕРМИНОСИСТЕМА

1.1.1. О ЕДИНСТВЕ ПОНИМАНИЯ И ЭВОЛЮЦИИ ОСНОВНОГО ТЕСТОЛОГИЧЕСКОГО


ТЕРМИНА — «ТЕСТ»

В данном разделе находит освещение основная проблема тесто-


логии — проблема определения теста1.
Слова «тест», «тестирование» в  речи преподавателей теперь
можно слышать достаточно часто. Их употребляют, когда говорят
о  контрольных мероприятиях; ими пользуются, когда описывают
психологический или педагогический эксперимент; «тестами» назы-
вают различные виды контрольных упражнений, которые зачастую
при ближайшем рассмотрении ничего общего с ними не имеют. Исто-
рически тесты впервые появились в психологических исследованиях,
и  понятие «тест» иногда ассоциируется с  психологической анкетой.
Полисемия английского слова «test» (‘испытание, эксперимент, про-
верка’) также вносит свою лепту в имеющуюся путаницу. В англоя-
зычной литературе под тестом понимают и экзамен, и зачет, и любую
другую учебную проверку. Российские же методисты предпочитают
называть тестом только такое задание, где правильность ответа опре-
деляется по заранее подготовленному ключу и  которое составлено
так, что требует однозначного ответа. Таким образом, за термином
«тест» закрепляется характеристика объективности, хотя не всегда
в  реальных случаях эта характеристика оправдывается. Отсутствие
четкого определения педагогического теста играет в  этом далеко не
последнюю роль.
Учитывая противоречивость и расплывчатость термина и поня-
тия «тест», рассмотрим, как же он трактуется в различных источниках.

1
Павловская И. Ю., Башмакова Н. И. Основы методологии обучения ино-
странным языкам: Тестология: учебник. 2-е изд., перераб. и  доп. СПб.,
2007. С. 82–86.

12
1.1.  Современный понятийный аппарат тестологии и его терминосистема

По мнению одних, этимологически слово «тест» происходит


из старофранцузского языка и обозначает небольшой сосуд из глины,
который алхимики использовали для проведения опытов2. В  других
источниках дается два значения: «1) испытательная присяга, религи-
озная английская клятва, которую каждый вступающий в обществен-
ную должность должен давать, чтобы доказать, что он не тайный ка-
толик; 2) плоский плавильный сосуд или сосуд из выщелоченной золы
для выделения олова из золота или серебра»3.
Не следует забывать, что тесты впервые были применены в пси-
хологической науке много лет назад как инструмент для измерения
определенных функций поведения человека. И  все определения те-
ста исходили из  их психологической сущности. Так, например, одно
из первых определений теста было дано около ста лет назад С. Г. Гел-
лерштейном. Он определил тест как испытательный эксперимент, но-
сящий характер определенного задания, которое стимулирует опреде-
ленную форму активности и выполнение которого, поддаваясь коли-
чественной и качественной оценке, служит симптомом совершенства
определенных функций4. Легко заметить, что в этом определении про-
изошло отождествление понятий «эксперимент» и  «тест». Вероятно,
для психологии в  таком уравнивании понятий заключен известный
смысл, ибо зачастую весь психологический эксперимент может уло-
житься в  рамки того или иного теста. Для методики преподавания
иностранного языка подобное отождествление недопустимо: здесь по-
нятие «эксперимент» не покрывается понятием «тест», так как первое
является общим по отношению ко второму, более частному. Для ме-
тодики преподавания иностранного языка тест — это одно из средств
контроля и один из методов эксперимента.
И. А. Рапопорт, Р. Сельг и И. Соттер предлагают следующее опре-
деление теста: «Тест — это самым тщательным образом подготовлен-
ная в  соответствии с  определенными разработанными правилами,
прошедшая предварительную экспериментальную проверку и специ-

2
Пэнто Р., Гравитц М. Методы социальных наук / пер. с фр. М.: Прогресс,
1972.
3
Бурлачук Л. Ф. Словарь-справочник по психодиагностике. 3-е изд., пере-
раб. и доп. СПб.: Питер, 2007. С. 446 (со ссылкой на изд.: Русский энцикло-
педический словарь / издан И. Н. Березиным. СПб.: тип. т-ва «Обществен-
ная польза», 1873–1879).
4
Геллерштейн С. Г. Прогностическая ценность тестов и связи с упражне-
ниями // Тесты: (теория и практика). Сб. 2. М., 1928. № 2. С. 37.

13
Глава 1.  Общие вопросы тестологии

альную процедуру для ее улучшения, имеющая достаточные харак-


теристики своей эффективности совокупность вопросов и  заданий,
предъявляемых испытуемому с целью квалиметрического выявления
социальных, психологических и  психофизиологических характери-
стик его личности, отличающаяся формализацией ответов испытуе-
мых, выделением в  них части, несущей наибольшую информацион-
ную нагрузку, что ускоряет, облегчает и объективизирует их последу-
ющий анализ, обработку и интерпретацию»5.
Это определение в отличие от предыдущих отражает последова-
тельность этапов тестирования (планирование, составление, апроба-
ция). В то же время оно имеет явную узкоспециализированную, пси-
хологическую направленность.
Педагогическому же тесту нужна своя дефиниция.
Э. А. Штульман определяет педагогический тест как контроль-
ные задания, проводимые в равных для всех обучающихся условиях,
длительность и характер которых строго соотнесены с объективными
факторами (такими как общая цель обучения и конкретно данного те-
ста, возрастные особенности обучающихся, характер изученного ма-
териала) и результаты выполнения которых поддаются количествен-
ной оценке, являясь показателем определенных итогов учебного про-
цесса к моменту проведения данного теста6.
Без учета языковой специфики иностранного языка как пред-
мета не представляется возможным сформулировать конкретное
определение языкового теста. Для решения этой проблемы необхо-
димо выделить частное направление в тестировании — лингводидак-
тическое тестирование (language testing), которое находится на стыке
двух важных областей: с одной стороны, оно является областью ме-
тодики преподавания иностранных языков, а с другой — относится
к  педагогическому (предметному) тестированию как части общей
тестологии. Сущность этого направления раскрыта в  книге «Линг-
водидактическое тестирование» В. А. Коккота. Автор вводит термин
«лингводидактический тест» и определяет его как «подготовленный
в  соответствии с  определенными требованиями комплекс заданий,
прошедший предварительную апробацию с  целью определения его

5
Рапопорт И. А., Сельг Р., Соттер И. Тесты в обучении иностранным язы-
кам в средней школе: (пособие для учителей). Таллин: Валгус, 1987. С. 27.
6
Штульман Э. А. Тестирование при обучении английскому языку в неязы-
ковых вузах. Воронеж, 1972. С. 8.

14
1.1.  Современный понятийный аппарат тестологии и его терминосистема

показателей качества и позволяющий выявить у тестируемых степень


их языковой (лингвистической) и / или речевой (коммуникативной)
компетенции, результаты которого поддаются определенной оценке
по заранее установленным критериям»7. Под лингвистической ком-
петенцией в отечественной науке, вслед за Н. Хомским, подразумева-
ется «способность понимать и продуцировать неограниченное число
правильных в  языковом отношении предложений с  помощью усво-
енных языковых знаков и правил их соединения»8, а под коммуника-
тивной  — способность осуществлять речевую деятельность, реали-
зуя коммуникативное речевое поведение на основе фонологических,
лексико-грамматических, социолингвистических и  страноведческих
знаний и  навыков с  помощью умений, связанных с  дискурсивной,
иллокутивной и стратегической компетенцией, в соответствии с раз-
личными задачами и ситуациями общения9. Первое есть часть второ-
го (см. разд. 1.3.7.).
Понятие «лингводидактический тест» удачно соединяет в  себе
его педагогический, с одной стороны, и языковой — с другой, харак-
тер. Однако нельзя согласиться с тем, что автор по существу прирав-
нивает и  подает понятия речевой и  коммуникативной компетенции
как синонимы.
Итак, «тестирование» («testing») как термин встречается в  ли-
тературе в узком смысле — в значении использования и проведения
теста — и в широком — как совокупность процедурных этапов пла-
нирования, составления и апробации тестов, обработки и интерпре-
тации их результатов. В нашем исследовании термин «тестирование»
понимается и используется в широком смысле.
Временная последовательность этапов тестирования представле-
на схемой (рис. 1)10.

7
Коккота  В. А. Лингводидактическое тестирование. М.: Высшая школа,
1989. С. 8.
8
Азимов Э. Г., Щукин А. Н. Новый словарь методических терминов и поня-
тий: (теория и  практика обучения языкам). М.: Икар, 2009. 448  с. URL:
http://methodological_terms.academic.ru/ЯЗЫКОВАЯ_КОМПЕТЕНЦИЯ
(дата обращения: 15.04.2017).
9
Зимняя И. А. Речевая деятельность и речевое поведение в обучении ино-
странному языку //  Сб. науч. трудов МГПИИЯ им. М. Тореза. М., 1984.
№ 242. С. 3–10.
10
Коккота В. А. Указ. соч. С. 5.

15
Глава 1.  Общие вопросы тестологии

I стадия — разработка предтеста

Составле- Опробова- Обработка Интерпретация


Планирова-
ние теста → ние пред- → ние пред- → результатов → результатов
теста теста предтеста предтекста

II стадия — разработка окончательного теста

Перепланирование Составление и оформление Подготовка спецификаций


предтеста → окончательного теста → и инструкций к тесту

III стадия — применение теста

Подготовка Обработка
Проведение Интерпретация
к применению → теста → результатов → результатов теста
теста теста

Рис. 1. Последовательность этапов тестирования. I–III стадии.

На наш взгляд, схему необходимо дополнить IV стадией:


1) регулярная статистическая обработка результатов проведе-
ния тестов со всеми группами тестируемых;
2) лингвистическая, психологическая, лингвокультурная, со-
циолингвистическая, техническая интерпретация успешно-
сти / неуспешности прохождение теста;
3) редактирование теста на основе сделанных выводов. Необхо-
димо отметить, что хороший тест не может не меняться хотя
бы раз в 2 года, так как постоянные изменения внешних фак-
торов (политических, экономических, технических) приво-
дят к тому, что тест морально устаревает, к тому же меняется
и контингент испытуемых.
4) Итак, характерными особенностями теста в  отличие от дру-
гих видов контроля мы будем считать его объективность, на-
дежность, обеспечиваемую тщательной подготовкой тестовых
материалов и анализом результатов тестирования, четкую на-
правленность на контролируемый объект, удобство и  ком-
пактность формы, экономичность по времени. Иначе говоря,
тест  — это точный инструмент измерения контролируемого
процесса.
5) Цикличность всех стадий разработки теста представлена
в следующем разделе.

16
1.1.  Современный понятийный аппарат тестологии и его терминосистема

1.1.2. ТЕСТ КАК ИНСТРУМЕНТ ИЗМЕРЕНИЯ КАЧЕСТВА ОБРАЗОВАНИЯ В РОССИИ

Чертой организации любой качественной услуги по стандартам


ISO11 является принятие решений на основании фактической инфор-
мации12. Данное требование вполне можно распространить на обра-
зование как одну из наиболее важных сфер жизни общества. Высшее
образование в данном контексте является особенно важным, так как
обеспечивает общество профессиональными кадрами. Спецификой
высшего образования по направлениям «Лингвистика» и  «Препода-
вание иностранных языков» является то, что фактически происходит
самовоспроизводство профессиональной среды, т. е. подготовка пре-
подавательских кадров начальной, средней и высшей школы13.
В этой связи возникает вопрос о том, обладает ли современное
высшее образование по названным направлениям достаточным набо-
ром валидных инструментов стандартизированного и  нестандарти-
зированного контроля с целью получения фактической информации
для принятия решений о  присвоении выпускникам квалификации
учителя или преподавателя иностранного языка. В  опубликованных
программах подготовки по данному направлению десяти ведущих
российских вузов достаточно расплывчато описаны процедуры оце-
нивания. В  лучшем случае описан формат оценивания, однако кри-
терии и  шкалы оценивания, демо-версии экзаменов, статистика пи-
лотирования и использования тестов, описание процедур подготовки
экзаменаторов и рейтеров не предусмотрены ни в одной из программ.
Данная ситуация также не позволяет собирать информацию для
измерения качества образования в  России. Опросы социологов по-
казывают отрицательную динамику общественного отношения к ка-

11
ГОСТ Р ИСО 9000–2015: Системы менеджмента качества: Основные по-
ложения и словарь [с Поправкой]. М.: Стандартинформ, 2015. URL: http://
protect.gost.ru/document1.aspx?control=31&baseC=6&page=10&month=10
&year=2016&search=&id=205275 (дата обращения: 10.10.2016).
12
Шмерлина И. Качество высшего образования в России. 25.01.2007 // База
данных ФОМ: [сайт]. URL: http://bd.fom.ru/report/map/d070421 (дата об-
ращения: 15.05.2014).
13
Onoprienko  E., Polshina  Y. Testing and Assessment Practices in Russian
Universities // Роль изучения иностранных языков в создании междуна-
родных профессиональных сообществ: программа и тезисы международ-
ной конференции, посвященной проблемам лингвистики, преподавания
иностранного языка и культуры. Владивосток, 1–4 ноября 2012 г. Влади-
восток: Изд. дом Дальневост. фед. ун-та, 2012. С. 85.

17
Глава 1.  Общие вопросы тестологии

честву высшего образования (см. табл.  1; строка выделена автором


раздела)14.
Таблица 1
Как вам кажется, качество работы системы образования в России
за последний год…?

Варианты ответа 2005 2006 2007 2008 2009 2010 2011 2012 2013
Значительно улуч-
шилось / несколько 16 20 22 23 10 12 11 11 10
улучшилось
Не изменилось 37 44 45 47 35 38 34 43 41
Несколько ухудши­
лось / значительно 34  23 21 20 29 29 34 32 38
ухудшилось
Затруднились
13 13 14 10 26 21 18 14 11
ответить

Данные исследования отчетливо демонстрируют необходимость


детальной оценки профессиональным сообществом качества образо-
вания в России, и сообщество учителей и преподавателей иностран-
ного языка не должно оставаться в стороне. Необходимо разработать
механизмы сбора информации о качестве образования, как в течение
обучения, так и по его окончании.

Цикл разработки теста


Существует несколько моделей разработки тестов. Наиболее
удобной в рамках нашего исследования представляется модель, пред-
ложенная в материалах проекта по развитию грамотности российских
преподавателей в области оценивания «Tempus ProSET» (см. рис. 2)15.
Как следует из  приведенной на рис.  2 схемы, любое тестирова-
ние начинается с  необходимости принятия определенного решения.
Таким решением может быть отбор для приема на обучение в  вуз,

14
О качестве образования. 02.09.2013  //  Левада-центр: Аналитический
центр Юрия Левады: [сайт]. URL: http://www.levada.ru/02-09–2013/o-
kachestve-obrazovaniya (дата обращения: 16.05.2014).
15
 Language Testing and Assessment Course: Course Materials: M1U2 Lecture.
ppt //  ProSet Projects Site: [сайт]: URL: http://www.proset-tempus.net/mod/
folder/view.php%3Fid=46.html (дата обращения: 20.04.2016).

18
1.1.  Современный понятийный аппарат тестологии и его терминосистема

Рис. 2. Цикл создания теста.

присвоение квалификации, прием на определенную работу. Заказчи-


ки обращаются к  разработчикам теста, которые определяют тесто-
вый конструкт (т. е. то, что будет измерять данный тест), из каких он
будет состоять частей или разделов, кем, как и  по каким критериям
будут оцениваться работы тестируемых, как будет представлена ин-
формация для принятия решения, — и фиксируют это в специфика-
ции теста. После этого спецификация поступает разработчикам от-
дельных заданий (item writers). Они разрабатывают в  соответствии
со спецификацией несколько вариантов пилотной и основной версии
теста. Параллельно идет работа по организации тестирования: от-
ветственные за проведение теста разрабатывают инструкции для тех,
кто будет проводить данный тест (administrators  /  invigilators). Если
в случае с валидностью теста основная ответственность лежит на раз-
работчиках, то надежность теста во многом зависит от грамотной ор-
ганизации (подробнее о валидности и надежности см. в разделе 1.4.1).
Именно учет всех деталей в  письменных инструкциях и  подготовка
экзаменаторов обеспечивают равные условия для всех тестируемых,
независимо от места проведения теста.

19
Глава 1.  Общие вопросы тестологии

Итоговыми являются два документа: сама экзаменационная ра-


бота («script»), а также отчет проводящего экзамен, в котором фикси-
руются все отклонения от правил проведения экзамена. Экзаменаци-
онная работа может быть отправлена на проверку в письменном виде,
в виде аудиозаписи или в электронной форме. После этого начинается
второй, ключевой для надежности и валидности теста процесс — оце-
нивание работы. Для данного вида работы разработчики теста гото-
вят шкалы и критерии оценивания, примеры работ каждого уровня,
а  также проводят тренинги всех оценивающих (которых еще назы-
вают «рейтерами», или «маркёрами»). Принципиально важно, чтобы
не было существенных расхождений в оценке схожих работ разными
проверяющими, для чего проводится специальная процедура «раз-
граничение уровней» («bench marking»), чтобы каждый оценивающий
четко понимал, какой результат соответствует каждому уровню шка-
лы. При этом в  случае, если присутствуют элементы субъективного
оценивания (например, при оценивании устной и письменной речи),
проводится как минимум двойное оценивание, т. е. оценивание двумя
разными экзаменаторами. Если между ними возникнет значительное
расхождение в оценке, то работа направляется третьему (как правило,
старшему) экзаменатору для принятия решения, и по каждому такому
случаю ведется работа с маркёрами для обеспечения большей надеж-
ности оценивания.
Финальным становится этап, когда результат экзамена попадает
к тому, кто будет принимать решение на его основе. Результат может
быть выражен как в  баллах (например, в  случае со вступительными
экзаменами или ЕГЭ), так и набором оценок (например, в экзаменах
IELTS и TOEFL), или, например, развернутым комментарием (напри-
мер, рецензия на диплом или диссертацию). В  любом случае важно
дать максимально полный объем информации, чтобы принимающий
решение имел достаточную фактическую базу. С другой стороны, до-
статочно часто принимающий решение хочет получать информацию
в максимально сжатом виде (например, сумма баллов экзаменов).
Важным звеном разработки любого теста являются присут-
ствующие в рамках каждого этапа «валидаторы», которые постоянно
контролируют валидность теста и могут отправить его на доработку
на любой стадии (например, в случае, если конструкт теста не позво-
лит принять решение, если формат теста не позволяет измерить кон-
структ, или же пробелы в  описании процедуры тестирования могут
привести к неоднородности во время его проведения).

20
1.1.  Современный понятийный аппарат тестологии и его терминосистема

Таким образом, создание качественного теста является длитель-


ным и  дорогостоящим процессом, включающим работу большого
количества экспертов на разных стадиях. Кроме того, создание те-
ста подразумевает создание целого ряда документов (спецификации,
шкал и  критериев оценивания, пилотной версии теста, демо-версии
теста, инструкций для проводящих тест, инструкций для оцениваю-
щих и др.). Данные документы не всегда могут находиться в открытом
доступе, но они обязательно должны существовать и быть доступны
для оценки.

1.1.3. ПРОБЛЕМЫ ТЕРМИНОЛОГИЧЕСКОГО ЕДИНСТВА


В ОБЛАСТИ ТЕСТИРОВАНИЯ ПО ИНОСТРАННЫМ ЯЗЫКАМ

Из всех сфер лингводидактической терминологии сфера тестиро-


вания складывается наиболее динамично. Поэтому авторам представ-
ляется, что задачами настоящей книги и первой ее главы в частности
являются следующие:
а) проанализировать и  синтезировать существующий отече-
ственный и  зарубежный опыт лингводидактического тести-
рования;
б) на основе этого анализа выработать разумные рекомендации;
в) предоставить времени и языку самим произвести отбор наи-
более жизнеспособных понятий, терминов и формулировок.
Терминология лингводидактического тестирования содержит
большое количество автономных терминов, характеризующих раз-
ные подходы, типологизации, классификации одних и тех же явлений
с  разных точек зрения, что порождает трудности как в  понимании
учеными друг друга, так и в  преподавании тестологии как учебной
дисциплины. Проблема терминологического единства не раз под-
нималась в  докладах и  дискуссиях на заседаниях секции тестологии
Международной филологической конференции СПбГУ16, а  также

16
Беляева Л. Н., Девель Л. А. «Языковое тестирование» Т. Макнамары // Ма-
териалы XXXIII Международной филологической конференции. Вып. 19.
Тестология  /  под ред. И. Ю. Павловской. СПб.: Филол. ф-т СПбГУ, 2004.
С. 10–14; Солодилова Т. Ю. Проблемы терминологического единства в об-
ласти тестирования по иностранным языкам // Материалы XXXIV Меж-
дународной филологической конференции. Вып. 24. Тестология / под ред.
И. Ю. Павловской. СПб.: Филол. ф-т СПбГУ, 2005. С. 51–57; Гордеев  Е. Н.,

21
Глава 1.  Общие вопросы тестологии

были осуществлены попытки создания тестологических словарей17.


Сам термин «языковое тестирование» может послужить знаком или
свидетельством изменений в  языковой картине мира тестирования.
Термин «тестология» не известен в переводе на другие языки, однако
имеет свое определение в  русскоязычных публикациях: «Тестология
(от англ. test — проба, греч. logos — знание) — междисциплинарная
наука о создании качественных и научно обоснованных измеритель-
ных диагностических методик»18.
В целом можно отметить следующие этапы в развитии термино-
логии:
•• период изолированного использования английской термино-
логии в  русском языке, несовпадение русской и  английской
лингвометодической терминологической базы во многих
сферах деятельности, обусловленное различиями профессио-
нальной практики, традиций и др.;
•• период перевода  — калькирования, приводящего к  не очень
удачным вариантам, как, например, «тест языковых знаний»
(пример из  брошюры Британского Совета при описании
IELTS);
•• современный этап  — период появления русских эквивален-
тов, соответствующих зарубежным понятиям, когда слово
и обозначаемое явление получили реальную почву в россий-
ской практике.

Ерофеева И. Н., Нестерова Т. Е. и др. К проблеме развития тестологиче-


ской терминосистемы // Материалы XXXV Международной филологиче-
ской конференции. Вып. 25. Тестология / под ред. И. Ю. Павловской. СПб.:
Филол. ф-т СПбГУ, 2006. С. 8–13.
17
См.: Балыхина  Т. М. Словарь терминов и  понятий тестологии. М.: Изд-
во МГУП, 2000; Multilingual glossary of language testing terms // Studies in
Language Testing. Cambridge, 1998. No. 6; Шмелев А. Г. Гипертекстовый сло-
варь методических терминов //  Human technologies  = Лаборатория «Гу-
манитарные технологии»: [портал]. URL: http://www.ht.ru/cms/dictionary/
dictionary (дата обращения: 30.09.2016); Девель Л. А. Англо-русский прак-
тический учебный словарь языкового тестирования: англо-русские соот-
ветствия, программа диагностирования и сертификации коммуникатив-
ной компетенции, литература, интернет-справочник. СПб.: Филол. ф-т
СПбГУ, 2004.
18
Шмелев А. Г. Указ. соч.

22
1.1.  Современный понятийный аппарат тестологии и его терминосистема

В связи с тем, что основным языком межкультурного общения,


в том числе и научного, является английский язык, мы считаем умест-
ным провести параллели между традиционными российскими и ан-
глоязычными терминами, одновременно представив основные поня-
тия тестологии.
Очевидной является ведущая роль так называемых BANA-стран
(Britain, Australasia, North America) в  области языкового тестирова-
ния. В этих странах интенсивно проводятся исследования, развивают-
ся различные технологии тестирования, что, несомненно, оказывает
влияние на развитие языкового тестирования в нашей стране. Иногда
происходит прямой перенос англоязычных терминов в  отечествен-
ную методику. Это приводит к тому, что в области языкового тести-
рования существуют различные термины, которые определяют одно
и то же понятие и используются как эквиваленты.
Кроме того, проблема оценки качества обучения, степени сфор-
мированности иноязычной коммуникативной компетенции, уровня
владения различными видами речевой деятельности настолько мно-
гогранна и многоаспектна, что это не могло не отразиться в многооб-
разии тестологических терминов.
В данном разделе нами предпринята попытка сопоставить неко-
торые основные понятия, которые наиболее часто встречаются в ра-
ботах отечественных ученых в  области тестологии и  языкового те-
стирования с  соответствующими терминами, которые используются
различными зарубежными авторами, в частности британскими и аме-
риканскими. В своей работе мы использовали анализ опыта тестиро-
вания, описанный в научной и методической литературе за последние
два десятилетия.
В современных условиях в отечественной методике для обозна-
чения сложного и  многообразного понятия «контроль качества об-
учения» используются термины «оценка качества усвоения знаний»,
«измерение знаний». Употребляются также термины «отслеживание
учебных достижений учащихся», «диагностика», «педагогические из-
мерения учебных достижений», «мониторинг», «экспертиза», «образо-
вательная статистика», «квалиметрический мониторинг»19.
Термин «контроль» в  широком смысле включает в  себя над-
смотр, проверку, оценку, измерение, управление. С  помощью кон-

19
См.: Ефремова  Н. Ф. Современные тестовые технологии в  образовании.
М.; Ростов: Изд. центр ДГТУ, 2001.

23
Глава 1.  Общие вопросы тестологии

троля можно выявить достоинства и недостатки новых методов об-


учения, установить взаимосвязь между планируемым, реализуемым
и  достигнутым уровнем образования, сравнить работу различных
преподавателей, оценить достижения учащегося и выявить пробелы
в  его знаниях, дать руководителю учебного заведения объективную
информацию для принятия управленческих решений и  выполнить
ряд других задач.
Контроль  — это одновременно и  сфера практической деятель-
ности педагога, и  объект теоретических исследований. Например,
контроль речевых навыков и умений служит цели выявления уровня
сформированности этих навыков и  умений, определения характера
протекания этого процесса, диагностики трудностей, проверки эф-
фективности приемов и способов обучения20.
Термин «оценка» включает в себя не только конечный результат,
но  и  процесс формирования оценки  — оценивание. Педагогическая
оценка иногда отождествляется с отметкой, которая является числен-
ным аналогом оценочных суждений. Термин «отметка» соответствует
английским словам «mark» или «grade».
В отличие от субъективных оценок и отметок «измерение» пред-
полагает проведение объективного количественного сопоставления
оцениваемого свойства ученика с  некоторым эталоном, принятым
в  качестве единицы измерения21. Задачи объективного оценивания
и контроля решает «тестирование».
Термины «контроль», «оценка», «педагогические измерения»
соотносятся с  английскими терминами «evaluation», «assessment»,
«testing», «measurement», которые во многих источниках часто исполь-
зуются как синонимы. Но, несмотря на схожесть, эти понятия имеют
некоторые отличительные характеристики.
Слово «evaluation» имеет словарное значение ‘оценка, оценива-
ние, определение качества, количества или пригодности, анализ’. Тер-
мин «evaluation» трактуется Л. Бахманом как систематический сбор
качественной, надежной и адекватной информации с целью принятия
правильного решения22. Эта информация не обязательно должна быть

20
См.: Павловская И. Ю., Башмакова Н. И. Указ. соч.
21
См.: Челышкова  М. Б. Теория и  практика конструирования педагогиче-
ских тестов: учебное пособие. М.: Логос, 2002.
22
Bachman L. F. Fundamental Considerations in Language Testing. Oxford: Ox-
ford University Press, 1990.

24
1.1.  Современный понятийный аппарат тестологии и его терминосистема

количественной, а поэтому не обязательно включает в себя тестирова-


ние (testing) или измерение (measurement).
Термин «measurement» («измерение») означает процесс сбора
количественной информации в  соответствии с  определенными про-
цедурами и правилами. Поэтому «measurement» не всегда имеет функ-
цию принятия решения, в отличие от «evaluation».
Термин «testing» («тестирование, проверка») не во всех случаях
подразумевает оценку, так как тестирование может использоваться
для других педагогических целей, например, как средство мотивации
к  обучению или как средство повторения пройденного материала.
В  этих случаях тестирование не предполагает принятия оценочных
решений на основе результатов тестов.
Термин «assessment» употребляется наряду с  термином
«evaluation» в  широком значении ‘контроль’, при этом на первое ме-
сто выдвигается оценочная функция контроля. Понятие «evaluation»
шире, чем понятия «assessment» и «testing». Часто употребляются про-
изводные термины (self-assessment, self-evaluation, peer-assessment,
peer-evaluation, teacher assessment, oral assessment).
Термин «language testing» соответствует термину «лингводидак-
тическое тестирование», хотя употребляется также термин «языковое
тестирование» в широком значении. Лингводидактическое тестирова-
ние занимается разработкой и  использованием языковых и  речевых
тестов и  является областью методики преподавания иностранных
языков, с одной стороны, а с другой — относится к педагогическому
(предметному) тестированию как части общей тестологии23.
В зарубежной методике термин «test» употребляется для обо-
значения любого контроля в  значении ‘контрольная работа’, ‘опрос’,
‘зачет’, ‘экзамен’ (см. разд. 1.1.1.). Американские тестологи выделяют
объективные тесты (objective tests) и  субъективные тесты (subjective
tests). В  объективных тестах определение правильности ответа осу-
ществляется механически, по заготовленному ключу, в  субъектив-
ных  — основывается на мнении проверяющих. Объективные тесты
могут быть стандартизированными (standardized tests). Стандарти-
зированным называется тест, который прошел апробацию (trialling,
trying out) на достаточно большом контингенте тестируемых (test-
takers, testees) и который имеет стабильные и приемлемые показатели
качества, а также спецификацию (test specification) — паспорт с норма-

23
Коккота В. А. Указ. соч.

25
Глава 1.  Общие вопросы тестологии

ми, условиями и инструкциями для его многократного использования


в разных условиях.
Различают также традиционное тестирование (traditional testing)
и  альтернативные методы контроля и  оценки (alternative assessment).
К  традиционным видам тестов можно отнести тесты, выполняемые
на бумаге (paper-and-pencil language tests), и  компьютерные тесты
(computer based tests — СВТ, computer adaptive tests — CAT). В традици-
онном тестировании проверяется знание грамматики и лексики, а так-
же понимание звучащей или письменной речи. В таких тестах присут-
ствуют задания (test items) с фиксированным ответом (fixed response)
или свободно-конструируемым ответом (free response). К альтернатив-
ным методам контроля можно отнести коммуникативные или рече-
вые тесты (performance tests, performance base tests), в которых речевые
навыки проверяются в процессе коммуникации. Это тесты говорения
или письма, в которых образец устной или письменный речи тестиру-
емого оценивает тестирующее лицо, рейтер (tester, rater). Альтернатив-
ные методы контроля могут также включать составление портфолио,
аудио- или видеозапись устного выступления, интервью и т. д.
Характерными особенностями теста в  отличие от других видов
контроля в отечественной методике считаются его объективность (ob-
jectivity), валидность (validity), надежность (reliability), которые обеспе-
чиваются тщательной подготовкой тестовых материалов и  анализом
результатов тестирования, четкой направленностью на контролиру-
емый аспект, удобством и компактностью формы, экономичностью».
В отечественных публикациях при рассмотрении влияния тести-
рования на учебный процесс и  роли тестирования в  преподавании
иностранных языков условно выделяют различные функции тести-
рования, а  именно: контролирующую, оценочную, обучающую, ин-
формационную, управляющую, корректирующую, диагностическую,
стимулирующую, учебно-организационную, развивающую, воспиты-
вающую.
В практике использования тестов эти функции обычно реали-
зуются в единстве. Коккота считает, что основная роль тестирования
в  преподавании иностранных языков заключается в  обратной связи
(в широком смысле) и в контроле (в узком смысле), и чем теснее вза-
имосвязаны тестирование и учебный процесс, тем эффективнее учеб-
ный процесс и качественнее тестирование24.

24
Там же.

26
1.1.  Современный понятийный аппарат тестологии и его терминосистема

Единство контролирующей и  обучающей функций в  англоя-


зычной методике проявляется в  тесной взаимосвязи тестирования
(testing) и  обучения (teaching). Тестирование (language testing), с  од-
ной стороны, служит целям исследования в области усвоения языка
(language acquisition) и  обучения языкам (language teaching), а с  дру-
гой — использует результаты этих исследований25.
Сложность вызывает понятие «direct testing» («прямое тестиро-
вание»). Т. Макнамара определяет этот термин как подход к  тести-
рованию, который подчеркивает необходимость близкой симуля-
ции критериального поведения (criterion), т. е. использования языка
в  «реальной жизни» при тестировании26. В  Интерактивном проекте
отраслевого терминологического стандарта Центра тестирования
приводится следующее определение: «Тестирование абсолютное  —
педагогическое тестирование, предназначенное для оценивания уров-
ня подготовленности каждого испытуемого персонально (безотно-
сительно к успехам других) в четко определенной области знаний»27.
Л. Н. Беляева и Л. А. Девель считают, что определения терминов «direct
testing» и «абсолютное тестирование» совпадают, что позволяет при-
равнять их на уровне перевода28.
В англоязычной литературе при рассмотрении социальной роли
и влияния тестов используют два терминологических словосочетания:
«ethical language testing»29 и «critical language testing»30. Влияние тести-
рования на учебный процесс в англоязычной литературе определяет-
ся термином «washback / backwash effect». Это влияние может быть по-
ложительным, если при разработке тестов учитывают дидактические
цели, задачи и опираются на содержание и приемы обучения, а может
быть отрицательным, если существует разрыв между учебным про-
цессом и тестированием. При рассмотрении эффекта тестирования за
пределами аудитории, т. е. влияния тестирования на образовательный

25
Bachman L. F. Op. cit.
26
McNamara T. Language Testing. Oxford: Oxford University Press, 2000.
27
Отраслевой стандарт: Педагогические тесты, термины и  определе-
ния / Министерство образования РФ. 1-я редакция. М., 2001. URL: http://
bank.orenipk.ru/Text/t19_135.htm (дата обращения: 20.06.2017).
28
Беляева Л. Н., Девель Л. А. Указ. соч.
29
Hanson A. Testing testing: Social Consequences of the Examined Life. S. l.: Uni-
versity of California Press, 1993.
30
Spolsky B. Measured Words: The Development of Objective Language Testing.
Oxford: Oxford University Press, 1995.

27
Глава 1.  Общие вопросы тестологии

процесс и на общество в целом, выделяют термин «test impact»31 (см.


разд. 1.2.5.).
Основными характеристиками теста считаются надежность и ва-
лидность.
Надежность теста (reliability)  — это способность теста давать
подобные результаты при его применении к  одинаковым выборкам
тестируемых, надежный тест характеризуется устойчивостью и точ-
ностью результатов тестирования. Теоретически надежность теста
отражает идею точности измерений уровня подготовки заданиями
теста. Оценка результатов надежного теста не зависит ни от време-
ни и условий его проведения, ни от экспертов, осуществляющих кон-
троль32.
Значение надежности рассчитывается по коэффициентам корре-
ляции между результатами двукратного тестирования одного и того
же контингента испытуемых по эквивалентным вариантам тестов. На
практике по ряду причин это используется редко. Иногда для опреде-
ления надежности гомогенных тестов используется метод расщепле-
ния. Для этого тест разделяют на две эквивалентные половины, затем
стандартным способом вычисляют коэффициент корреляции между
результатами тестирования по двум половинкам теста (см. раздел 2.3).
Валидность теста (validity)  — это его способность соответство-
вать поставленным задачам, она характеризует пригодность тестовых
результатов для определенной цели. Валидность — это методологиче-
ская характеристика способности теста измерять то, для чего он соз-
дан33.
Многие зарубежные и отечественные педагоги считают, что важ-
нейшими сторонами этого показателя эффективности теста являют-
ся содержательная валидность (content validity), внешняя валидность
(face validity), конструктная (конструктивная, концептуальная) валид-
ность (construct validity), сопоставительная (сопряженная, конкурент-
ная) валидность (concurrent validity), прогностическая валидность
(predictive / prognostic validity), диагностическая валидность (diagnostic
validity) и валидность, связанная с последствиями применения тестам

31
См.: Messick S. Validity and washback in language testing // Language testing.
1996. No. 13; McNamara T. Language Testing.
32
См.: Аванесов  В. С. Композиция тестовых заданий. 2-е изд. М.: Адепт,
1998; Bachman L. F. Op. cit.
33
Аванесов В. С. Композиция тестовых заданий.

28
1.1.  Современный понятийный аппарат тестологии и его терминосистема

(consequential validity)». Различные стороны, или типы, валидности


являются, по существу, разными способами ее определения.
Нельзя не упомянуть и разночтения при переводе некотоых имен
собственных. Так, название экзаменационного центра при кембридж-
ском университете, первоначально обозначавшегося как University
of Cambridge Local Examination Syndicate (UCLES) и  переводившего-
ся на русский язык как Кембриджский экзаменационный синдикат,
несколько раз менялось, менялся и  перевод. В  настоящее время эта
структура носит название Cambridge English Language Assessment, или
просто Cambridge English, аббревиации не подвергается и плохо под-
дается точному переводу. В  настоящем издании с  целью устранения
разночтений было принято, помимо английского оригинала, наиме-
нование Департамент экзаменов по английскому языку Кембриджско-
го университета, встречающееся на официальном сайте данной орга-
низации.34
На представленных примерах терминологических эквивален-
тов видно, что их можно условно разделить на три категории. Одни
термины имеют устоявшиеся в англо-русском переводе эквиваленты,
например: objective tests, standardized tests, validity, reliability. Другие
термины переводятся рядом понятий, иногда близких по смыслу слов,
понятных читателю, однако могущих вызвать разночтение (direct
testing  — абсолютное тестирование, прямое тестирование), различ-
ное понимание сути явления (construct validity — конструктная / кон-
структивная  /  концептуальная валидность, concurrent validity  — со-
поставительная  /  сопряженная  /  конкурентная валидность), а  также
представляющих различные точки зрения (некоторые авторы счита-
ют, что термины «predictive / prognostic validity» — «прогностическая
валидность» и «diagnostic validity» — диагностическая валидность оз-
начают, по сути, одно и то же).
К третьей группе можно отнести те термины, которые не имеют
эквивалентов и  переводятся при помощи описания (ethical language
testing, critical language testing, washback  /  backwash effect, test impact,
consequential validity).
Все затронутые в данном разделе понятия будут более подробно
рассмотрены в следующих главах книги.
Сказанное выше показывает настоятельную необходимость уни-
фикации терминов, разработки понятийного аппарата. В этом могут

34
URL: http://cambridgeenglish.org.ru/ (дата обращения 26.07.2017).

29
Глава 1.  Общие вопросы тестологии

помочь специальные словари-справочники. Приведем некоторые


примеры.
В настоящее время в публикациях, в том числе на сайтах Интер-
нета, уже есть попытки создания глоссариев терминов тестологии.
Уже упоминавшийся «Словарь терминов и понятий тестологии»
(2000) представляет базисные понятия тестовой теории и практики,
лингвистического тестирования. Автор словаря проф. Т. М. Балыхи-
на произвела отбор наиболее употребительных специальных слов
и устойчивых терминологических словосочетаний и представила их
семантизацию. Достоинством и отличительной особенностью данно-
го словаря является то, что в нем наряду с простыми определениями
терминов представлены также словарные статьи широкого информа-
ционного характера. В них содержатся краткие сведения об истории
вопроса, называются авторы термина и  исследователи, разрабаты-
вавшие вопросы, связанные с определяемым понятием, а также ин-
формация о состоянии развития представляемого вопроса в России
и за рубежом на современном этапе. В некоторых случаях приводятся
примеры тестовых заданий, характеристики уровня и др. Все это по-
зволяет назвать словарь Т. М. Балыхиной кратким пособием по введе-
нию в тестологию и тестирование. Несомненно, данная работа полез-
на для центров тестирования и преподавателей. Однако у этого сло-
варя есть и недостатки: единицы терминосистемы психодиагностики
и математической статистики в словаре представлены недостаточно
полно.
Интересным опытом создания методического словаря являет-
ся «Гипертекстовый словарь методических терминов», созданный
проф. А. Г. Шмелевым в  2004  г. и  размещенный на портале «Human
technologies» (www.ht.ru). Данный словарь содержит основные поня-
тия из области психодиагностики и психометрии, некоторые общеп-
сихологические термины. В словаре даются также авторские опреде-
ления некоторых терминов и  понятий из  области тестологии. Всего
в  работе определяется 427  единиц, около 120  из  них актуальны для
исследователей-тестологов и  тесторов-практиков. Несомненным до-
стоинством данного издания является гипертекстовая модель пред-
ставления материала. Словарь А. Г. Шмелева  — словарь-справочник
для тех, кому необходимо быстро установить содержание термина.
Но в нем нет ни информации об истории появления термина, ни о ра-
ботах создателей термина. Однако необходимо принять тот факт, что
введение такой информации не являлось целью автора.

30
1.1.  Современный понятийный аппарат тестологии и его терминосистема

«Англо-русский практический учебный словарь языкового те-


стирования» (2004)  Л. А. Девель отличается адекватной подборкой
словарных статей, широким охватом методических, тестологических
и связанных с ними терминов, содержит приложения в виде таблиц,
в  которых представлена информация, необходимая современному
тестологу. Лаконичные словарные статьи содержат прямой однознач-
ный перевод терминов и не включают их толкования, что продикто-
вано, по-видимому, учебным характером словаря. В то же время этот
перевод иногда дает лишь общее, а не специально-терминологическое
значение слова.
«Многоязычный глоссарий терминов оценивания и  тестирова-
ния» («Multilingual glossary of language testing terms», 1998) был создан
специалистами разных стран, входящих в Европейскую ассоциацию
языкового тестирования (Association of Language Testers in Europe —
ALTE). В  процессе совместных дискуссий исследователи в  области
тестологии и  практического тестирования пришли к  выводу о  том,
что такой словарь даст им возможность быть уверенными в точности
и  корректности использования терминов в  разных странах. В  сло-
варной статье глоссария содержатся очень краткое определение тер-
мина, его разъяснение со ссылкой на источник, где можно получить
более подробную информацию. Несомненно, удобно то, что каждая
словарная статья в  словаре одного из  языков содержит указание на
номер соответствующей словарной статьи в словарях других языков,
входящих в общий глоссарий. Однако узкая трактовка терминов (чет-
кость — по замыслу создателей) является причиной смешения терми-
нов. К этому приводит совпадение в семантизации разных слов (ср.:
item task и др.). Данный словарь — это словарь терминов тестологии
для специалистов. Глоссарий содержит 442 термина, включает в себя
термины тестологии, а  также дидактики, статистики, психометрии
и  методики, используемые в  исследованиях и  практической работе
тестологов.
Итак, даже краткий анализ четырех словарей говорит о том, что
исследовательская работа в области систематизации терминов тесто-
логии и семантизации единиц терминосистемы в последние годы ве-
дется очень активно.
При этом не следует забывать, что правильное моделирование
развития науки в будущем зависит от того, насколько полно и адек-
ватно мы представляем себе ее развитие в прошлом. Для этого обра-
тимся к истории.

31
Глава 1.  Общие вопросы тестологии

1.2.  ИСТОРИЧЕСКИЕ И СОЦИАЛЬНЫЕ АСПЕКТЫ ТЕСТИРОВАНИЯ

1.2.1. ЗАРОЖДЕНИЕ ТЕСТОЛОГИЧЕСКИХ ИДЕЙ: ВОСТОК — ЗАПАД

Ошибочно думать, что современная парадигма тестирования за-


родилась на Западе. Как будет показано далее, система испытаний, из-
вестная сегодня как тестирование, зародилась задолго до нашей эры
как на Западе, так и на Востоке. Анализируя педагогические феномены
прошлого, можно провести аналогию между испытаниями, проводи-
мыми в  древних социумах, и  принципами современного тестирова-
ния. Точно определить время и  место зарождения первых тестовых
испытаний пока не удалось. Зарубежные и  отечественные ученые
(П. Дюбуа, Г. Ченси и  Д. Доббин, А. Анастази, Г. А. Миллер) называют
приблизительные даты типа «свыше двух тысяч лет» или «свыше четы-
рех тысяч лет». Например, первые тесты на «профпригодность» про-
водились в Китае уже ранее 2200 лет до н. э.35 Император самолично
тестировал претендентов на государственные должности по 6 аспек-
там, включающим, наряду с испытаниями по музыке, верховой езде,
стрельбе из лука, и знание порядка проведения придворных ритуалов
и церемоний, тестирование умения писать и читать. Есть упоминания
о многоаспектном тестировании в школах для мужчин в Южном Дву-
речье в  III  тыс. до н. э. Так, например, после тестирования по степе-
ни эрудиции и специализации различалось около 20 видов писцов36.
В школах Древнего Ирана также готовили большое количество пис-
цов, а на службе при дворе царя и сатрапов и в армии служили пере-
водчики, которые знали по несколько языков37. В  античной Греции
тестирование было способом получения знаний и  функционально
с обучением не разделялось38.
В Древнем Египте кандидат на обучение искусству жрецов про-
ходил ряд тестовых испытаний, который включал собеседование
с  целью оценить внешние данные, проверить умение вести беседу,

35
Du Bois P. H. A History of Psychological Testing. Boston: Allyn and Bacon Inc.,
1970.
36
Белявский  В. А. Вавилон легендарный и  Вавилон исторический. М.:
Мысль, 1971.
37
Дандамаев М. А., Луконин В. Г. Культура и экономика древнего Ирана. М.:
Наука. 1980.
38
Chauncey  H., Dobbin  J. E. Testing, Its Place in Education Today. New York:
Harper and Row, 1963.

32
1.2.  Исторические и социальные аспекты тестирования

выяснить биографию, также оценивался уровень образованности


кандидата. Далее кандидат подвергался испытаниям, по результатам
которых оценивались его умения слушать, молчать и трудиться. Так,
например, Пифагор (570–490 гг. до н. э.) прошел эту «систему тестов»
и, как пишет И. П. Шмелев, «после обряда посвящения» получил свое
имя (греч. Ρυθαγόρας), которое «составлено из двух половин и озна-
чает „прозревающий гармонию“, ибо пифии в Древней Греции были
жрицами-прорицательницами, а  Гор в  Древнем Египте олицетворял
гармонию»39. После возвращения в  Грецию Пифагор основал свою
школу, поступить в которую было можно только пройдя серию тестов,
по структуре похожих на те, которым подвергался он сам.
Пифагор придавал значение диагностике, в первую очередь, ин-
теллектуальных способностей. Тестирование включало решение труд-
ных математических задач.
Безусловно, с  точки зрения современного понимания тестовых
испытаний, не все испытания, которые проводились в  школе Пифа-
гора, могут быть отнесены в  полном объеме к  тестовым методикам.
Однако уже приблизительно за 500 лет до н. э. были выработаны важ-
нейшие элементы тестовых испытаний, такие как одинаковая степень
трудности для всех испытуемых и  последовательность этих испыта-
ний в соответствии с принципом возрастания степени трудности за-
даний.
Важно отметить и еще один элемент, вошедший в современные
тестовые методики: если испытуемый выполнил не все задания теста,
это не является препятствием для положительной оценки итогового
результата тестирования.
Опыт развития цивилизации дает многочисленные примеры
того, как человечество решало проблемы отбора конкретных людей
для выполнения тех или иных конкретных функций по обеспечению
нормальной жизнедеятельности общества. Все цивилизации, в  том
числе и развивавшиеся независимо от других, приходили к понима-
нию необходимости отбора людей в соответствии с их личными ка-

39
Шмелев  И. П. Феномен Древнего Египта. Минск: Университетское; Ред.-
изд. центр «Лотаць» Белорус. фонда Рерихов, 1993. С. 58. — О Пифагоре
см. также: Бородин  А. И., Бугай  А. С. Биографический словарь деятелей
в  области математики  /  под ред. И. И. Гихмана. Киев: Радянська школа,
1979; Холл  М. П. Энциклопедическое изложение масонской, герметиче-
ской, каббалистической и  розенкрейцеровской символической филосо-
фии / пер. с англ. и предисл. В. В. Целищева. Новосибирск: Наука, 1992.

33
Глава 1.  Общие вопросы тестологии

чествами и способностями, равно как и в соответствии с социальным


заказом, через систему разнообразных испытаний.
Примеры существования разного рода испытаний дает и религи-
озная литература, а  наряду с  ней и  светская, изучающая различные
аспекты феномена религиозной культуры. Испытания, по форме близ-
кие к современным тестовым, можно найти в Библии. Для иллюстра-
ции можно привести библейский сюжет о том страшном испытании,
которому Господь подверг Авраама, проверяя степень его преданно-
сти. В этом библейском фрагменте уже встречается тот принцип, ко-
торый сегодня является законом в тестологии — принцип расположе-
ния заданий в тесте по возрастающей степени трудности (отправить-
ся в путь, взойти на гору, пожертвовать сына).
В Коране также можно найти ряд примеров различных «тесто-
вых» испытаний. Одним из слов самой широкой семантики, использу-
ющихся в Коране, является термин «фитна», т. е. испытание40.
В дошедших до нас рукописях V–VI  вв. есть свидетельства ис-
пользования в школах, где изучались основы чань-буддизма, испыта-
ний тестового характера. Чаньские парадоксальные загадки применя-
лись в качестве тестов на «чаньский» код мышления41. В зависимости
от того, какой ответ давал тестируемый на эти загадки, наставник
определял уровень просветленности, на котором находится неофит,
и  предписывал меры, необходимые для углубления его «чаньского
опыта».
Многочисленные примеры испытаний, которым подвергают-
ся люди или мифические и  сказочные персонажи, дошедшие до нас
в виде мифов, былин и сказок, говорят о том, что тестовые методики
зародились в глубокой древности. Тестология, как междисциплинар-
ная наука, является итогом длительного развития человеческой циви-
лизации. Этот период в развитии тестологии можно назвать предте-
стовым или донаучным.
В этот период был накоплен большой багаж фундаментальных
знаний во многих научных областях, например, в психологии и педа-
гогике, где на сегодняшний день тесты применяются особенно широ-

40
Хадисы пророка / пер. и коммент. В. Пороховой; гл. ред. М. С. Аль-Рошд.
2-e изд. М.: Аванта+, 2001.
41
Абаев  Н. В. Архаичные формы религиозной теории и  практики в  чань-
буддизме //  Буддизм и  средневековая культура народов Центральной
Азии / отв. ред. К. М. Герасимова. Новосибирск: Наука, 1980. С. 156–176.

34
1.2.  Исторические и социальные аспекты тестирования

ко. Разного рода испытания, из которых и выросло целое научное на-


правление — тестология, зарождались в глубокой древности, по мере
развития цивилизации условия испытаний дополнялись, видоизменя-
лись, шлифовались и совершенствовались в соответствии с потребно-
стями социума. На определенном этапе в разных цивилизациях уста-
навливались свои приемы и правила испытаний в соответствии с по-
требностями социума, сложившимися традициями, общественными
нормами и т. д.
Примеры из разных эпох и цивилизаций, приводившиеся выше,
показывают, что люди в  разных уголках планеты находили нередко
свой, и весьма нестандартный, путь к проведению тех или иных ис-
пытаний человеческих способностей, а  часто и  заимствовали опыт,
уже накопленный другой цивилизацией, что существенно ускоряло
цивилизационный процесс в целом. Опыт развития человечества по-
казывает, что по мере накопления знаний процесс их научного осмыс-
ления ускоряется, количественные изменения начинают переходить
в стадию качественных. Проявление закона перехода количественных
изменений в качественные в полной мере проявился и в освоении че-
ловечеством тестовых методик.
В ряду предпосылок генезиса педагогического тестирования ле-
жат идеи выдающихся педагогов Нового времени Я. А. Коменского,
Д. Локка, Ж.-Ж. Руссо, И. Г. Песталоцци. В их трудах получил научное
обоснование принцип движения в обучении от простого к сложному,
который положен в  основу конструирования педагогического теста,
где задания выстраиваются по возрастающей степени трудности.
В трудах этих ученых сформулированы и многие другие идеи, нашед-
шие применение в педагогике Нового времени.
В рамках этого периода созрела и научная идея, лежащая в основе
тестологии, о возможности количественных измерений в психологии.
Первым, кто сформулировал задачу или вопрос о таких измерениях,
был немецкий ученый XVIII  в. Х. Вольф (1679–1754). Он также ввел
в научный оборот понятие психометрии. Вольф считал, что величину
удовольствия можно измерить осознаваемым нами совершенством,
а  величину внимания  — продолжительностью аргументации, кото-
рую мы в  состоянии проследить. Идеи измерения в  психологии вы-
сказывали в XVIII в. философы, естествоиспытатели Бернулли, Бонне,
Хаген, Крюгер, однако лишь в конце XIX — начале ХХ в. методы стати-
стики превратились в важный элемент научного анализа психических
явлений.

35
Глава 1.  Общие вопросы тестологии

Теория эволюции, выдвинутая Ч. Дарвиным, явилась мощным


генератором для активизации научных исследований в  других об-
ластях знаний. Важно подчеркнуть решающее влияние естествозна-
ния на общее состояние науки, в том числе психологии и педагогики.
Именно в этих науках на рубеже XIX–XX вв. активно внедрялся метод
тестов с применением статистики.

1.2.2. ШИББОЛЕТ-ТЕСТ КАК ОДНА ИЗ ДРЕВНЕЙШИХ ФОРМ


ЛИНГВИСТИЧЕСКОГО ТЕСТА И ЕГО СОЦИАЛЬНЫЕ ПОСЛЕДСТВИЯ

С древних времен в  обстановке межгрупповых или межнаци-


ональных конфликтов у  представителей тех или иных социальных
групп возникала необходимость идентификации людей по принципу
«свой — чужой» на основе общности / различия языковых явлений.
И в этих случаях в качестве средства для идентификации как «проб-
ный камень» часто использовался один и тот же прием — требование
произнести определенное слово или фразу, которые сразу выдавали
«чужака». Этот прием получил название «шибболет-теста» (shibboleth
test). (Слово «тест» здесь используется в своем первоначальном, широ-
ком значении, как испытание, проверка.)
Этимология понятия «shibboleth test» такова. В Библии приводит-
ся описание войны, происходившей около 3 тыс. лет назад между еф-
ремлянами и жителями Галаада. В их языках было небольшое, но легко
обнаруживаемое различие в способе произношения определенного со-
гласного звука: в одном случае /sh/ произносилось как палато-альвео-
лярный фрикативный звук [∫], в другом — приближалось по звучанию
к /s/. «Во время войны между ефремлянами и жителями Галаада, когда
первые убежали по направлению к Иордану, то они были задержаны
при переправе через реку галаадскими воинами, которые спрашивали
каждого прибегающего: „не ефремлянин ли ты?“ Если он отвечал от-
рицательно, то они заставляли его произнести слово „шиболет“ (поток
или колос); если он произносил „сибболет“ и не мог иначе выговорить,
то его убивали. И так убили 42.000 ефремлян (Суд. 12: 4 и дал.)»42.

42
Нюстрем  Э. Библейский словарь: энциклопедический словарь: новое
пересмотр. и испр. изд. с черно-белыми фотографиями и иллюстрация-
ми / сост. Э. Нюстрем; пер. со швед. под ред. И. С. Свенсона; рус. пер. пе-
ресмотр. и испр. изд-я Библейского словаря, составленного Эриком Ню-
стремом в  1868  г. М.: Локид-пресс, 2005  (репринт). URL: http://logosenc.
org/nustrem/shibbolet.html (дата обращения: 30.09.2016).

36
1.2.  Исторические и социальные аспекты тестирования

Таким образом, лингвистический тест служил критерием соци-


альной идентификации, на основании которого принималось реше-
ние о праве человека на жизнь.
Этот пример далеко не единичен. Шибболет-тесты использова-
лись в разные времена и в разных культурах. Т. Макнамара и К. Роувер
описывают события в Йемене в 1060 г., когда солдаты Аль-Мукаррама
Ахмада применяли шибболет-тест, чтобы отличить арабов африкан-
ского происхождения от абиссинцев — африканских рабов неарабско-
го происхождения, из рук которых Аль-Мухаррам Ахмад освободил
свою похищенную мать и хотел отомстить им, не причинив вреда со-
племенникам-арабам, имевшим схожую с ними внешность. Глашатаи
Аль-Муккарама провозгласили приказ войскам обнажить мечи про-
тив жителей захваченного города, но предупредили о том, что арабы
могли иметь детей от африканских наложниц, и поэтому черный цвет
кожи может встречаться как у рабов, так и у свободных граждан. По-
этому различать их было приказано по произношению слова «aẓm»:
в  случае произношения этого слова на абиссинский манер человека
следует убить, а при произношении, свойственном арабскому населе-
нию, пощадить43.
Два столетия спустя при подавлении восстания в Египте в 1302 г.
шибболет-тест был снова применен, но  на этот раз уже против ара-
бов. В Верхнем Египте арабские племена восстали против владычества
султана Мамелюка, и восстание было жестоко подавлено, в ходе чего
были уничтожены 16 тыс. чел., а их имущество, жены и дети захваче-
ны. Если кто-то из них пытался уйти от возмездия и выдавал себя за
обычного жителя города неарабского происхождения, от него требо-
вали произнести арабское слово «dakĩk», которое египтяне не могли
выговорить. Гортанное произношение задненёбного звука, характер-
ного для арабского языка, сразу выдавало истину. Во всех упомянутых
исторических коллизиях наказанием для не прошедших лингвистиче-
ский тест оказывалось лишение жизни.
Это печальное перечисление можно продолжить описанием при-
мера из  истории Англии ХIV  в., когда фламандцев, живущих в  Лон-
доне, сделали козлами отпущения в  ответ на восстание английских
крестьян под предводительством Уота Тайлера в 1381 г. В ходе бойни,
которая была устроена на улицах Лондона, фламандцев не смогли спа-

43
McNamara T., Roever C. Language testing: The Social Dimension. Ann Arbor
(Mich.): University of Michigan [in association with] Blackwell Publishing,
2006. P. 151.

37
Глава 1.  Общие вопросы тестологии

сти даже священные стены, и 13 чел. выволокли из церкви, где они пы-
тались укрыться, и обезглавили прямо на улице. После того, как были
обнаружены еще 17 чел., укрывавшихся в другой церкви, их постигла
та же участь. Для того, чтобы распознать чужестранцев среди других
жителей города, им тоже был предъявлен шибболет-тест: те, кто про-
износил «Brot and Cawse» вместо «Bread and Cheese», поплатились за
это головой.
Во время фризского восстания (1515–1523) использовалась фра-
за «Bûter, brea, en griene tsiis; wa’t dat net sizze kin, is gjin oprjochte Fries»
(«Масло, ржаной хлеб и зеленый сыр — кто не может это выговорить,
не настоящий фриз»). Когда партизанский фризский флот встречал-
ся в море с незнакомыми судами, их экипаж просили произнести эту
фризскую скороговорку, выступавшую в  роли шибболета. Корабли,
с борта которых не могли ее произнести с приемлемым акцентом, не
впускались в порт и захватывались, а их экипажи топили.
Не стоит думать, что подобные события можно относить толь-
ко к древности и мрачному средневековью. Шибболет-тесты не знают
временных границ. Так, в  прошлом веке в  Японии пусковым меха-
низмом трагических событий послужило землетрясение 1923 г., в ко-
тором погибли более 100 тыс. чел. Среди тех, кто погиб, было около
6 тыс. корейцев, проживавших в Токио, включая тех, кто выжил в зем-
летрясении, но был впоследствии обвинен в отравлении запасов воды
и других преступлениях. Чтобы избежать обвинений, многие из них
пытались выдать себя за японцев, но их выдал шибболет-тест: фразу
«jyugoen gojyussen» («15 йен 50 сен») корейцы произносили как «chugo
en kochussen». В итоге сотни, а возможно, и тысячи людей были уби-
ты44.
В октябре 1937 г. шибболет-тест сыграл свою роковую роль в ис-
паноговорящей Доминиканской Республике, когда были убиты от
15  тыс. до 35  тыс. (по разным подсчетам) франкоговорящих гаитян
по приказу доминиканского диктатора Трухильо. Солдаты диктатора
обращались ко всем темнокожим гражданам, держа в  руках веточку
петрушки и предлагая ответить на вопрос: как это называется? Судь-
ба жертвы теста зависела от произношения. В испанском языке звук
/r/ вибрирующий, а в языке гаитянцев — широкий и плоский, и ис-
панское название приправы, труднопроизносимое для них, решало их
судьбу.

44
Ibid.

38
1.2.  Исторические и социальные аспекты тестирования

Неверно было бы считать, что это явление не коснулось и наших


соотечественников. В  нашей истории также есть печальные страни-
цы, отмеченные применением шибболетов. Так, во время Русско-фин-
ской войны 1918 г. в районе г. Тампере финны использовали шиббо-
лет для того, чтобы отделить русских, многие из которых были одеты
в  гражданскую одежду, от представителей местного населения. Всех
захваченных подозрительных лиц собрали вместе, некоторых прямо
из госпиталей, и потребовали произнести слово «yksi» («один»). Если
первый звук слова произносился на русский манер как /й/  ([juksi]),
пленник считался русским лазутчиком и  расстреливался на месте.
Не принималось в расчет, был ли пленник славянином или выходцем
из прибалтийских республик, был ли он большевиком или нет; в числе
убитых были и члены Белой Гвардии45.
В ХХ в. шибболет-тест использовался по отношению к русским
и  на Украине  — солдатами батьки Махно. Слово «паляни́ця» (чита-
ется «паляны́ця», буханка хлеба круглой формы) применялось в  ка-
честве шибболета для того, чтобы опознавать большевиков, прислан-
ных экспроприировать запасы провизии. «При кажущейся простоте
этого слова, человек, привыкший к  фонетике и  алфавиту русского
языка, автоматически выговаривает его с заметным для украинского
уха акцентом (обычно произнося «паляни́ца»), причем независимо от
того, прочел ли он его, или пытается воспроизвести со слуха»46. Слово
«паляни́ця» использовалось в качестве шибболета и во время Второй
мировой войны украинскими националистами.
Во время армянского погрома в Сумгаите 27–29 февраля 1988 г.
азербайджанские националисты выводили представителей армянско-
го населения из  домов и  транспортных средств и  просили произне-
сти слово «фундук», в котором армяне традиционно произносят звук
/п/ вместо /ф/, что и служило доказательством принадлежности к ар-
мянской национальности47.
Можно привести примеры относительно недавних событий на
острове Шри-Ланка (1983) и в Ливане во время войны между ливан-
скими христианами и палестинцами, которые говорят о условиях ми-

45
List of shibboleths // Wikipedia: The Free Encyclopedia: [сайт]. URL: https://
en.wikipedia.org/wiki/List_of_shibboleths (дата обращения: 30.09.2016).
46
Шибболет  //  Википедия: свободная энциклопедия: [сайт]. URL: https://
ru.wikipedia.org/wiki/Шибболет (дата обращения: 30.09.2016).
47
Шибболет // Википедия …

39
Глава 1.  Общие вопросы тестологии

ратом, что шибболет-тесты — это не достояние прошлого, а инстру-


мент, который регулярно извлекается на свет в случае межнациональ-
ных и межэтнических конфликтов. Однако необратимые последствия
его применения — проблема не инструмента, а того, кто им пользует-
ся.
Известно немало примеров, когда шибболет-тесты использо-
вались, наоборот, в  благих целях, например во время борьбы с  за-
хватчиками. Так, во время Второй мировой войны американскими
вооруженными силами использовалось в  качестве пароля слово
«lollapalooza» (обозначающее нечто совершенно исключительное),
чтобы отличить японцев, выдающих себя за китайцев. Известно, что
японцы заменяют звук /l/ звуком /r/, тогда как у китайцев происходит
обратная замена, что и  позволило использовать шибболет-тест для
обнаружения обмана.
Во время Нормандской операции паролем американских солдат
было сочетание «Flash — Thunder — Welcome», последнее слово кото-
рого позволяло определить, является ли для говорящего английский
язык родным. Немцы произносили его как «Velcome». Британцы для
этих же целей использовали слово «squirrel», которое произносилось
немцами как «sqvirrel».
В приведенных выше примерах лингвистические тесты типа
«шибболет» используются для установления социальной идентично-
сти и часто имеют фатальные последствия для тех, кто их выполняет.
Можно было бы воспринимать этот вид языковых тестов как доста-
точно курьезный и  экзотический, если бы не одно обстоятельство,
которое роднит их со многими современными и  широко использу-
ющимися тестами на знание иностранного языка. Например, с теми,
которые предлагаются для выполнения иммигрантам, беженцам, тем,
кто хочет принять гражданство того или иного государства. Это об-
стоятельство — политический контекст лингвистического тестирова-
ния. И хотя в условиях мира по результатам тестирования никого не
лишают жизни, однако эти результаты имеют судьбоносную роль.
Но речь идет не только о международной или национальной по-
литике. Результаты языкового оценивания на уровне крупных, обще-
государственных проектов непосредственно связаны с распределени-
ем таких насущных ресурсов, как, например, рабочие места, получе-
ние образования, финансовое обеспечение разработки и проведения
тестов. Вопрос справедливого распределения этих ресурсов перестает
иметь чисто академический характер.

40
1.2.  Исторические и социальные аспекты тестирования

Традиционный психометрический подход к тестам порой засло-


няет от нас иное — социальное — измерение проблемы использова-
ния тестов. Однако, как метко замечает Макнамара, «психометриче-
ски хороший тест — не обязательно хороший тест с социальной точки
зрения. Фактически, между двумя этими понятиями нет связи: любое
оценивание может иметь далеко идущие и непредвиденные социаль-
ные последствия»48. Между тем вопрос о роли языкового тестирова-
ния в  обществе зачастую недооценивается. Обращение к  шибболет-
тестам способно привлечь внимание к природе и социальным послед-
ствиям применения лингвистических тестов и обозначить проблему
более зримо и ярко.
Мы могли убедиться на исторических примерах, что одна из наи-
более значимых функций языкового тестирования  — применение
тестов как «пропускных ворот», инструмента отбора, своего рода со-
ртировки человеческого материала, процедуры, способной влиять на
принятие политических и социальных решений. Эта процедура спо-
собна оказывать серьезное влияние на течение жизни тех, кто ей под-
вергается. Показатели тестирования могут являться причиной про-
движения по службе или увольнения, приема в учебное заведение или
отказа в  нем, получения гражданства или политического убежища,
разрешения иммигрировать в какую-либо страну и т. д.
Современные тесты теоретически устроены гораздо более слож-
но, чем шибболеты, но  в  конечном итоге многие из  них так же сво-
дятся к принятию решения «свой / чужой», обеспечивая допуск про-
шедших тест к тем или иным социальным структурам, ресурсам или
перспективам и, соответственно, лишая этих возможностей тех, кто
не достиг определенного критерия по результатам испытания. Часто
даже там, где не предусматривается никаких поощрительных или ка-
рательных мер по итогам теста (например, в диагностических тестах
для определения дальнейшей стратегии обучения), можно обнару-
жить такие дихотомические следствия. Они могут лежать в  сфере
моральных оценок (можно гордиться своими познаниями или нужно
стыдиться их), престижа, но чаще выходят за рамки индивидуальных
реакций и переносятся в более глобальные сферы принятия решений
на уровне организаций и государственных структур. (О социальных
последствиях современных тестов см. раздел 1.2.5.)

48
McNamara T., Roever C. Op. cit. P. 2 (перевод мой. — И. Б.).

41
Глава 1.  Общие вопросы тестологии

1.2.3. РАЗВИТИЕ МЕТОДА ТЕСТОВ ЗА РУБЕЖОМ В ХХ В.

Систематическая экспериментальная работа в  области количе-


ственного измерения способностей человека и возможностей их раз-
вития началась еще в  XIX  столетии, а  ее ранние этапы в  значитель-
ной мере связаны с  идеями и  исследованиями английского ученого
Фрэнсиса Гальтона49. Революционный подход Гальтона состоял в том,
что оценка физиологических и психологических параметров человека
впервые была поставлена на научную основу.
Гальтон утверждал, что умственные способности людей явля-
ются в  основном наследственными. Он делал различие между «об-
щей способностью» (general ability) и «специальными склонностями»
(special aptitudes), считая, что первые являются данными природой,
а вторые — приобретенными. Согласно его теории, успех в интеллек-
туальной области определяется в  основном «общей способностью»,
а не «специальными склонностями», а уровень «общей способности»
ставит предел тому, что может достичь человек в своей умственной
работе, как бы он ни старался. В процессе своих исследований Галь-
тон разработал способы определения ряда физических и психологи-
ческих свойств человека. В 1884–1885 гг. он провел для всех желаю-
щих серию испытаний физиологических возможностей, физических
качеств и  психологических свойств (куда вошли на равных, напри-
мер, рост, вес, жизненная емкость легких, запоминаемость букв, раз-
личение цвета и  т. д.). Эти исследования и  положили начало разра-
ботке приемов тестирования, которая с самого начала проходила под
влиянием представлений Гальтона о природе умственных способно-
стей человека.
В США первые опыты использования тестов относятся к концу
XIX в. и связаны с работой американского психолога Джеймса Кэт-
тела. Побывав в  лабораториях В. Вундта в  Германии и  Ф. Гальтона
в Англии, Кэттел провел целый ряд опытов, в которых использовал
серию простых тестов, составленных с  помощью Гальтона. Кэттел
ввел термин «тест». Он увидел в тестах средство измерения неизме-

49
Фрэнсис Гальтон (1822–1911)  — английский психолог, исследовавший
проблему генетических предпосылок развития психологических харак-
теристик и способностей человека, их наследственной обусловленности.
Разработал приемы диагностики способностей, которые положили нача-
ло тестологическим испытаниям. Являлся двоюродным братом Ч. Дарви-
на.

42
1.2.  Исторические и социальные аспекты тестирования

ряемых, казалось бы, характеристик человеческой психики. В 1890 г.


он опубликовал работу, где дал список 50 лабораторных тестов (кото-
рые сейчас назвали бы не тестами, а контрольными заданиями) и на-
писал, что «только тогда психология сможет стать действительной
и точной наукой, когда она будет иметь своей основой эксперимент
и измерения»50.
Кэттел поставил себе задачу описать образ цельной личности по-
средством возможно меньшего числа экспериментов. С этой целью он
предложил в  1890  г. нескольким лабораториям произвести в  одина-
ковых условиях 10 основных экспериментов. В этот комплекс вошли
наиболее точные и разработанные в то время психо-физиологические
эксперименты (например, измерение силы правой и  левой руки по-
средством динамометра, измерение скорости рекции на звук и т. д.).
Попытка Кэттела и его продолжателей окончилась ничем. И это
понятно: эксперименты, поставленные Кэттелом, затрагивают наи-
более примитивные области человеческой психики  — области, где
индивидуальные различия оказываются незначительными. Как позд-
нее писал С. М. Василейский, своеобразие личности определяется не
физическими свойствами организма (остротой органов чувств, емко-
стью памяти, быстротой реакции и т. д), а сложными психическими
процессами (характером интеллектуальных восприятий, актами воли,
эмоциями — этическими, эстетическими и т. п.)51.
Очевидно, нужно было создать какой-то новый метод, учитыва-
ющий сложные проявления человеческой личности. Более сложные,
но и более практичные тесты пришли в психологию из медицины на
рубеже XIX–XX  вв. Появление этих тестов было вызвано потребно-
стью в средствах для выявления и классификации случаев ненормаль-
ного умственного развития и психических заболеваний у детей с це-
лью помещения умственно дефективных детей в особые школы. Сре-
ди других наибольшую известность получили работы французского
психолога Альфреда Бине.
Бине попытался осуществить идею метода, учитывающего слож-
ные проявления человеческой личности, в виде так называемого «син-
тетического эксперимента». В 1891 г. он создал первую серию тестов

50
Cattell J. McK. Mental Tests and Measurements // Mind. 1890. Vol. 15. No. 15.
P. 373.
51
Василейский С. М. Введение в теорию и технику психологических, педоло-
гических и психотехнических исследований. Минск, 1927.

43
Глава 1.  Общие вопросы тестологии

для испытания личности. В эту серию вошли испытания памяти, типа


представления, воображения, внимания, восприятия и т. п.
В 1905 г. появились общеизвестные тесты Бине. Его «десятичная
шкала умственных способностей» была опробована на группе детей
различного возраста и давала некоторую основу для сравнения уме-
ний решать определенные задачи как у детей одного возраста, так и
у детей разного возраста.
Практические работы Бине положили начало широкому при-
менению тестов. Но поскольку и  этот «синтетический эксперимент»
подводил к пониманию личности довольно слабо, психологи на дли-
тельное время отказались от труднейшей задачи экспериментально
понять личность человека во всей ее целостности и ограничились зна-
чительно более простыми задачами: получить более или менее верное
представление об отдельных сторонах, свойствах, наклонностях и да-
рованиях человека.
В начале XX в. начинают разграничиваться два направления в те-
стовой работе: тесты психологические и педагогические.
Под психологическими тестами мы условно будем иметь в виду
интеллектуальные тесты, т. е. такие, которые измеряют уровень ум-
ственного развития. К педагогическим тестам относятся тесты, кото-
рые измеряют успешность учащихся по тем или иным дисциплинам за
определенный период обучения.
Несмотря на то, что в дальнейшем в монографии основное вни-
мание будет уделено языковым тестам, нам представляется необходи-
мым коротко проследить историческое развитие и  психологических
тестов, так как они, в сущности, и явились основой для создания педа-
гогических тестов Р. Л. Торндайком выделено три периода в развитии
измерений в области психологии и педагогики в XX в.52
Период с 1900 по 1905 г. — период исканий. В это время появля-
ются первые индивидуальные психологические тесты Бине во Фран-
ции. В 1905 г. Бине и Симоном была построена первая «измерительная
шкала ума».
Но уже в 1911–1915 гг. тесты Бине подверглись пересмотру. Его
провел основоположник тестового движения в  Америке Льюис Тер-
мен53 совместно с Х. Чайлдсом. Они создали 90 отдельных тестов, ко-
52
Thorndike  R. L., Hagen  E. P. Measurement and Evaluation in Psychology and
Education. New York: Wiley, 1955.
53
Terman  L. M. The Measurement of Intelligence. Boston: Houghton Mifflin,
1916.

44
1.2.  Исторические и социальные аспекты тестирования

торые были предназначены для детей от 3- до 10-летнего возраста. Все


эти тесты были тестами психологическими54.
В 1915 г. Р. М. Йеркс создал свою серию тестов. Главное отличие
этих серий тестов от тестов Бине заключается в системе подсчета. Вме-
сто возрастных долей (по Бине) испытуемый получает за каждый пра-
вильно решенный тест известное количество баллов. По определению
М. С. Бернштейна, «эти американские ревизии Бине представляли зна-
чительные удобства, как в отношении проведения, так и в отношении
подсчета результата теста. В конечном счете, количество полученных
испытуемым баллов переводилось по приложенным стандартам в ко-
эффициент одаренности или успешности»55.
В эти же годы появляются первые стандартизованные педагоги-
ческие тесты по различным дисциплинам. Это были тесты К. В. Стоу-
на56 на проверку арифметики, Б. Р. Бекингема57 на проверку правопи-
сания. В то же время появляется шкала правописания Э. Л. Торндайка.
Следующие 15  лет, с  1915  по 1930  г., являются периодом бума
в  развитии тестов. Началось широкое составление тестов в  психо-
логии и в  педагогике. Были разработаны тесты успешности по всем
школьным дисциплинам. Особенно широко в это время тестовая ра-
бота проводится в США, где одобряются даже несовершенные тесты,
разрабатываемые учителями кустарным способом. Но наряду с очень
несовершенной тестовой работой мы находим законченные исследо-
вательские работы, отшлифованные методически и теоретически. Это
работы Э. Л. Торндайка58 и  Л. Келли59, которые, как известно, не без
основания считаются эпохальными работами в  этой области. После
работы Бине работа Э. Л. Торндайка является крупнейшей в  области
психологических измерений.
54
Terman L. M., Childs H. G. A tentative revision and extention of the Binet–Si-
mon Measuring Scale of Intelligence // Journal of Educational Psychology.1912.
No. 3. P. 61–74, 133–153, 277–289.
55
Бернштейн  М. С. Тесты: (теория и  практика): в  3  сб. М.: Работник про-
свещения, 1928–1930. Сб. 3. С. 52.
56
Stone С. W. Arithmetical Abilities and Some Factors Determining Them. New
York, 1908.
57
Бекингем Б. Р. Исследование педагогического процесса для учителей / под
ред. Л. С. Выготского, А. А. Нусенбаума. М.: Работник просвещения, 1930.
58
Thorndike E. L., Bregman E. O., Cobb M. V. et al. The Measurement of Intelli-
gence. New York: Teachers College, Columbia University, 1926.
59
Kelley L. Interpretation of Educational Measurements. Chicago: World Book,
1927.

45
Глава 1.  Общие вопросы тестологии

Первые групповые тесты были составлены и применены в Аме-


рике в 1917–1918 гг. Во время Первой мировой войны перед американ-
цами встала проблема отбора рекрутов в армию. Эта проблема была
решена с помощью тестового обследования. При этом обследовании
были применены специально разработанные две серии групповых те-
стов, получивших название альфа- и бета-тестов. Альфа-тесты пред-
лагались испытуемым, которые владели английским языком. Они
явились прототипом групповых словесных тестов. Бета-тесты пред-
лагались испытуемым, которые не владели английским языком. Они
явились прототипом бессловных тестов. Тесты были составлены по
проекту известного психолога Артура Отика60. По нашему мнению,
появление именно этих тестов сыграло большую роль в дальнейшем
развитии тестирования, так как основные принципы, использован-
ные при их составлении, и легли в основу всей методологии группо-
вых тестов. Эти принципы были в  дальнейшем систематизированы
М. С. Бернштейном61 и сведены к следующему.
1. Был введен принцип ограничения времени. Время было рас-
считано таким образом, что только около 5 % испытуемых мог-
ли окончить проработку всего теста в срок. Показатель развития
был поставлен в  прямую зависимость от скорости выполнения
заданий испытуемыми.
2. Был введен принцип детализованной инструкции, как в отноше-
нии проведения теста, так и в отношении подсчета результатов.
3. Были введены тесты с выборочным методом формирования от-
вета, с указанием подчеркивать наугад в случае незнания или со-
мнения.
4. Сами тесты подбирались после тщательной статистической обра-
ботки и экспериментальной проверки.
Эти принципы армейских тестов серии альфа были положены
впоследствии в  основу большинства групповых тестов, получивших
такое широкое применение в психологии и педагогике.
Обратимся к тому, как развивалось тестирование в средней шко-
ле.
В Соединенных Штатах в начале 1918 г. А. Отик опубликовал пер-
вую серию групповых психологических тестов для школы. В  это же
60
Otic A. S. Scale for Rating Tests. Yonkers; New York: World Book, 1928.
61
Бернштейн Н. А. Очерки по физиологии движений и физиологии актив-
ности. М.: Наука, 1966. С. 100.

46
1.2.  Исторические и социальные аспекты тестирования

время С. Л. Пресси62 публикует свою групповую шкалу. Группа амери-


канских психологов (Р. М. Йеркс, Э. Л. Торндайк, Л. Термен, А. Уиппл,
С. Хаггерти) работает над созданием «интеллектуальных» тестов для
школ всей страны, т. е. таких тестов, которые измеряют уровень ум-
ственного развития. Эти тесты получили название «национальных
тестов». «Национальные тесты» были составлены в  двух сериях по
два варианта в каждой серии. Совершенствуя методику, американские
тестологи в  этих тестах впервые перед каждым разделом теста дают
примерные упражнения. «Национальные тесты» были опробованы
на 4 тыс. испытуемых каждой школьной группы. Они явились итогом
большой исследовательской и экспериментальной работы американ-
ских тестологов.
Второе направление в области составления и применения тестов
относится к измерению школьной работы: успешности учащихся, ра-
боты учителя, методов преподавания и организации.
Начало педагогических измерений относится к 1863 г., когда поя-
вились первые педагогические тесты. Они были составлены в Англии.
Их автором был директор школы Р. Дж. Фишер63. Он создал «scale
book» — «градуированную книгу», где были даны вопросы и ответы
для выбора. Книга эта содержала вопросы по правописанию, арифме-
тике, чтению, грамматике и навигации.
Однако началом систематических измерений в педагогике счита-
ется 1894 г. Их провел американский ученый доктор Дж. М. Райс, кото-
рый составил первый педагогический тест. Тест должен был измерить
эффективность более длительного или менее длительного обучения
навыку письма. Результаты, полученные Райсом, в корне противоре-
чили установившемуся методу обучения этому навыку. Поэтому его
тестовый метод подвергся резкой критике со стороны преподавате-
лей. Но с развитием педагогической науки идеи Райса стали привле-
кать внимание наиболее передовых американских педагогов.
Основоположником педагогических измерений принято счи-
тать Р. Л. Торндайка. Под его руководством и при его непосредствен-
ном участии были созданы первые школьные тесты. Книга Торндай-
ка «Введение в  теорию психологических и  социальных измерений»
(1904)  явилась результатом его большой исследовательской работы

62
Pressey S. Introduction to the Use of Standard Tests. New York, 1923.
63
См.: Цатурова И. А. Из истории развития тестов в СССР и за рубежом.
Таганрог: Изд-во ТРТИ, 1969.

47
Глава 1.  Общие вопросы тестологии

в  области измерений и, в  частности, метода тестов. Эта работа дала


мощный импульс всей тестовой работе в Америке и, конечно, способ-
ствовала дальнейшему развитию школьных тестов. Первый стандар-
тизованный тест был опубликован под руководством Торндайка. Это
был тест Стоуна на решение арифметических задач, впервые снабжен-
ный «нормами».
В 1909–1914  гг. выходят из  печати: шкала оценки детского по-
черка Э. Л. Торндайка, шкала оценки сочинений английского языка
Ф. Хиллегаса, шкала правописания Б. Р. Бекингема, оценочные шкалы
почерка и правописания Р. Айреса, составленные на основе экспери-
мента.
Большое значение для дальнейшей разработки школьных тестов
имели школьные обследования. Целью этих обследований было срав-
нение оценки разных школ. Для этих обследований специально раз-
рабатывались системы тестов.
Первое исследование, посвященное проблеме тестирования
в  области иностранных языков, было проведено Беном Вудом64.
Первые тесты по иностранным языкам были составлены в Америке
в 1925 г. по принципам построения психологических тестов. В тече-
ние четырех лет ставились эксперименты в исследовательском бюро
Колумбийского университета на предмет использования их в  каче-
стве тестов успешности по иностранным языкам. Тесты состояли
из трех частей.
Первая часть — тест на словарь — состояла из 100 иностранных
слов, каждое из которых сопровождалось пятью английскими слова-
ми. Учащийся должен был выбрать слово, которое соответствовало по
значению иностранному слову. Слова эти были отобраны из словаря,
состоящего из 2 тыс. наиболее употребимых слов.
Вторая часть  — тест на понимание прочитанного  — состоя-
ла из  60  предложений на французском и  испанском языках. Каждое
предложение сопровождалось пятью альтернативными концовка-
ми. Только одна из  концовок соответствовала смыслу предложения,
и учащийся показывал понимание предложения выбором единствен-
но правильной концовки.
Третья часть — грамматический тест — состояла из 60–65 корот-
ких английских предложений, каждое из которых сопровождалось не-

64
Wood B. D. New York Experiments with New Type Modern Language Tests.
New York: Macmillan, 1927.

48
1.2.  Исторические и социальные аспекты тестирования

законченным переводом на французский язык. Учащийся должен был


показать свое знание грамматики, заканчивая это предложение.
Каждый тест состоял из 220–225 элементов, которые осуществля-
ли испытание по пройденному материалу значительно шире, чем экза-
мены. (На каждую часть отводилось только 30 мин.)
В 1920-е годы широкое применение тестов наблюдается и в  ан-
глийских школах. О масштабах использования тестов в Англии мож-
но судить по получившим печальную известность испытаниям для
школьников в возрасте 11 лет, так называемым «11+».
Вопрос оценки этого опыта гораздо сложнее, чем это может пока-
заться с первого взгляда. В этом опыте очень ясно выявилось противо-
речие между развитием науки, идеологией и практикой. Изначально
назначение этих испытаний заключалось в том, чтобы отобрать наи-
более способных детей для дальнейшего обучения в высших учебных
заведениях. Главную роль в  этом начинании играл Годфрей Томсон,
последователь Гальтона, при этом он исходил, казалось бы, из  до-
брых побуждений  — дать возможность наиболее одаренным детям
из  сельских начальных школ получить высшее образование. И  дей-
ствительно, процент детей из  сельской местности, получавших сти-
пендии в «грамматических школах», который раньше был ничтожно
мал, заметно поднялся после введения тестов. После 1944  г. экзамен
«11+» для отбора детей в «грамматические школы» стал проводиться
по всей стране, и тесты стали обязательной частью этого экзамена. Од-
нако отбор проводился не только на основании результатов теста. При
отборе наряду с тестами использовались традиционные экзамены по
английскому языку и  математике, а  также характеристики учителей
и  «собеседование». При этом оказалось, что шансы на поступление
в  «грамматические школы» для молодежи из  рабочего класса замет-
но снизились, поскольку тесты «11+» были классово субъективны уже
«на уровне составления»65.
В нашем подходе к психологическим и иным тестам и тестиро-
ванию мы исходим из того, что тесты — это технический прием, «из-
мерительный прибор», который можно использовать на благо или во
вред испытуемому. Чтобы тест использовался на благо испытуемому,
необходимо иметь в  виду границы его возможностей и  не пытаться
получить от него большего, чем он может дать.

65
Slacey  G. Psychological Testing Education and Ideology //  Marxism Today.
1967. February. P. 48.

49
Глава 1.  Общие вопросы тестологии

Подобно многим научным достижениям, злом могут быть не


тесты, а их неправильное использование. Более того, отдельный тест
с определенной степенью точности позволяет измерять и сравнивать
уровни проявлений той или иной умственной деятельности людей
лишь в  момент тестирования, а  не предопределяет границ потенци-
альных возможностей личности.
Однако такие измерения, проводимые на протяжении достаточ-
но длительного периода времени, позволяют изучать динамику про-
цесса развития человеческих способностей, что открывает большие
возможности совершенствования путей целенаправленного воздей-
ствия на личность через воспитание и образование.
В 1930-е годы возникли тесты на коэффициент умственного раз-
вития (IQ)66. Проследив развитие этих тестов, можно отметить, что
они должны были выявить изначальные (присущие от рождения)
свойства психики, определяющие на всю жизнь способности и  воз-
можности человека. Эти тесты были внедрены в систему образования
Америки и Англии в 1950-х годах с целью диагностики врожденного
интеллекта и  умственных способностей ребенка. Опираясь на поло-
жение о том, что способности ребенка к обучению зависят от уровня
его интеллекта, психологи и  педагоги стали использовать эти тесты
также для предсказания успешности и обучения. Однако со временем
тесты на коэффициент умственного развития изжили себя, посколь-
ку, во-первых, они определяли уровень развития ребенка на данный
момент, а не врожденный интеллект, во-вторых, они не предполагали
дифференциацию тестируемых по сферам деятельности для одновре-
менной диагностики и, в-третьих, результаты тестирования не отра-
жали реальной картины умственных способностей, так как носили
кратковременный характер.
В настоящее время тесты IQ не используются как педагогический
инструмент, однако имеют хождение наряду с другими психологиче-
скими тестами.
В это же время стала разрабатываться методика обработки ре-
зультатов тестов. Наблюдается переход от случайных единичных те-
стов к  тестовым системам. Этому переходу значительно содейство-
вали, наряду с работами Бине, и работы Карла Спирмана67, который

66
Pavlovskaya I. Yu. Language Teaching Methodology and Course Management:
(a course of lectures). St. Petersburg, 1999. Part 1. Р. 22.
67
Например: Spearman C. “General Intelligence”: Objectively Determined and
Measured // American Journal of Psychology. 1904. Vol. 15, No. 2. P. 201–292.

50
1.2.  Исторические и социальные аспекты тестирования

к этому времени разработал свои основные идеи о применении при-


емов корреляционного анализа для целей стандартизации тестов, для
объективного измерения.
В основе системы тестов Бине лежал возрастной принцип. Спир-
ман же основное внимание тестологов обратил на статистический ха-
рактер тестового материала. Он считал, что важным фактором для
теста является степень корреляции данных по одному тесту с данны-
ми других тестов или с каким-либо другим объективным критерием.
Статистические методы Спирмана, изложенные в его работах68,
сыграли большую роль для дальнейшего развития метода тестов, как
в Америке, так и за ее пределами.
На основании изложенного в данном разделе можно сделать вы-
вод, что систематическая экспериментальная работа в области коли-
чественного измерения способностей человека и  возможностей их
развития началась еще в конце XIX в., а ее ранние этапы в значитель-
ной мере связаны с идеями и исследованиями американских ученых.
Тесты, как инструмент для измерения определенных функций поведе-
ния человека, а в дальнейшем и как метод определения коэффициента
успешности в обучении и одаренности в определенных областях ин-
теллектуальной деятельности, интересовали педагогов и  психологов
на протяжении многих десятилетий.

1.2.4. ИСТОКИ ОТЕЧЕСТВЕННОЙ ТЕСТОЛОГИИ

Первая в России публикация тестологического плана появилась


в 1903 г. Это была работа зачинателя отечественного тестового движе-
ния А. П. Нечаева об основателе педологии С. Холле. Проблему генези-
са тестирования в первой трети ХХ в. в той или иной мере затрагивали
в своих трудах Г. И. Челпанов, Н. Е. Румянцев, Е. В. Гурьянов, А. М. Шу-
берт, Ю. А. Левин, С. М. Василейский, И. Н. Шпильрейн. В работах этих
авторов можно также найти описание зарубежных и  отечественных
тестовых методов.
В нашей стране до начала 1930-х годов проявлялся значительный
интерес к  проблемам тестирования не только в  кругах психологов
и педагогов, но и среди тех, кто занимался проблемами научной орга-
низации труда, а также профессионального отбора и ориентации.


68 Ibid.

51
Глава 1.  Общие вопросы тестологии

Начало составления и применения тестов в нашей стране отно-


сится к 1926 г. Такие крупные психологи и педагоги, как С. Г. Геллер-
штейн, П. П. Блонский, А. П. Болтунов, М. С. Бернштейн, начинают
проводить исследования по изучению и применению метода тестов.
Большую работу по разработке и применению психологических
тестов проводила Центральная педологическая лаборатория Москов-
ского отдела народного образования (МОНО), которой руководил из-
вестный педолог Е. В. Гурьянов.
Лабораторией были разработаны:
•• шкала для измерения умственного развития детей;
•• тесты для учета навыков в чтении, счете и письме;
•• тесты коллективного испытания умственной одаренности.
В Государственном институте экспериментальной психологии,
в секции детской психологии, разрабатывались тесты отдельных ви-
дов одаренности.
В Ленинградском детском обследовательском институте им.
проф. А. С. Грибоедова занимались выработкой тестов для массового
обследования детей нормальных школ. Работа велась в двух направ-
лениях: по разработке тестов на одаренность и на школьную успевае-
мость.
Большая работа по разработке тестов на одаренность и  школь-
ную успеваемость проводилась под руководством А. П. Болтунова и
в Ленинградском научно-педагогическом институте им. А. И. Герцена,
который сделал обстоятельный обзор новейших достижений в обла-
сти измерения одаренности в странах Западной Европы и Америки.
Под руководством проф. П. П. Блонского велись работы по про-
верке шкалы Бине–Симона, школьных тестов и  по построению соб-
ственных стандартов.
Блонский выдвинул следующие требования к тестам:
•• тесты должны быть сопоставлены друг с другом;
•• тест должен обладать высокой степенью самокорелляции, т. е.
четные задания должны давать такие же результаты, как и не-
четные;
•• тесты должны быть стандартизованы69.

69
Блонский П. П. Учет школьной работы // На путях к новой школе. 1926.
№ 7–8. С. 26–30.

52
1.2.  Исторические и социальные аспекты тестирования

Таким образом, метод тестов стал предметом серьезных обсужде-


ний психологов и педагогов в нашей стране. Некоторые из них придер-
живались той точки зрения, что тесты дают преподавателям возмож-
ность определить реальные знания школьника. Так, П. П. Блонский
отмечал, что преимущество тестов состоит в том, что они позволяют
обычный ответ учителю «Так мне кажется» заменить словами «Я это
знаю» или «Я этого не знаю». Тесты вскрывают недостатки методики
преподавания.
Как отмечают И. А. Рапопорт, Р. Сельг и  И. Соттер, «первым из-
вестным нам тестом по иностранному языку (немецкому) в  нашей
стране был тест, составленный сотрудником научно-исследователь-
ского института методов школьной работы (г. Москва) Н. Э. Мамму-
ной в  1928  г.»70. Ими также упоминается эксперимент, проведенный
в 1930 г. на Украине научным сотрудником научно-исследовательского
института М. Герасимовичем, посвященный вопросу проверки усвое-
ния знаний и методике обучения немецкому языку в трудшколах. Ав-
тор эксперимента не имел возможности опереться на разработки за-
рубежных коллег, так как тесты Э. Л. Торндайка и Д. Старча оказались
непригодны для использования в трудшколах. Поэтому Герасимович
провел большую самостоятельную работу: для составления тестов
он использовал собственные наблюдения на уроках немецкого языка
в школах Харькова, проработал специально подготовленные для него
ведущими преподавателями немецкого языка списки контрольных
вопросов, а  также провел анализ тетрадей и  письменных работ уча-
щихся. Немаловажно, что Герасимович провел предварительную экс-
периментальную проверку теста.
Автором эксперимента были сделаны неутешительные выводы:
общий уровень усвоения немецкого языка являлся очень низким; об-
учение немецкому языку не приобрело систематического характера;
темп обучения и  усвоения крайне медленный; ученики не могут ни
говорить, ни писать по-немецки.
Несмотря на это, данное исследование представляет интерес как
«одна из первых попыток изучать состояние преподавания и качество
знаний по иностранному языку в период становления этого учебного
предмета в советской школе, привлечь внимание педагогической об-

70
Рапопорт И. А., Сельг Р., Соттер И. Указ. соч. С. 64.

53
Глава 1.  Общие вопросы тестологии

щественности к обнаруженным недостаткам и наметить пути улучше-


ния методики обучения иностранным языкам в школе»71.
Однако с середины 1930-х годов наблюдается резкий спад в раз-
витии тестирования. Он был обусловлен выходом двух постановле-
ний Центрального комитета партии: от 5 сентября 1931 г. «О началь-
ной и  средней школе», после которого интерес к  тестовой методике
был резко ослаблен, и от 14 июля 1937 г. «О педологических извраще-
ниях в системе Наркомпросов», после которого работа над изучением
тестовой методики как в области определения психических характе-
ристик личности, так и в  области проверки знаний учащихся прак-
тически прекратилась. Это было связано с  политической ситуацией
в стране: в самом методе выискивалось дурное влияние Запада.
Лишь немногие российские ученые серьезно рассматривали те
полезные и ценные технические приемы измерения различных прояв-
лений умственной деятельности, которые давали тесты, в 1930-х годах.
Тесты нашли широкое практическое применение главным образом
в  профконсультационной работе, а  также в  исследованиях работо-
способности, режима труда, и лишь отчасти при изучении школьной
успеваемости. После 1936 г. тестология была вычеркнута из перечня
наук, финансируемых государством. В  этих условиях даже упомина-
ние тестологии допускалось только в плане критики и, как правило,
с классовым клеймом «буржуазной науки». Исключением были лишь
статьи в энциклопедиях, где критике сопутствовала и положительная
оценка тестов.
Языковое тестирование было забыто вплоть до 1960-х годов, ког-
да возникла новая волна исследований.
С 1956 по 1995 г. постепенно возрождаются научные тестовые ис-
следования и расширяется практика применения тестов в психологии,
педагогике, системе профессионального отбора. Появляются работы,
в которых в той или иной мере освещаются проблемы тестологии, в том
числе и генезис тестирования. Важным стимулом для возрождения те-
стирования в системе образования стало внедрение ЭВМ в учебный
процесс некоторых вузов. Система контроля знаний с помощью ЭВМ
предполагает составление заданий с вариантами ответов. В 1960-х го-
дах в формирование положительного отношения к тестам школьной
успешности включились педагогические журналы. Первой публика-
цией такого плана стала статья тестолога С. И. Воскерчьяна «Об ис-

71
Там же. С. 64.

54
1.2.  Исторические и социальные аспекты тестирования

пользовании метода тестов при учете успеваемости школьников»72.


Однако возрождение отечественной тестологии вплоть до середины
1990-х годов не носило характер сколь-нибудь проработанной обще-
государственной задачи.
1965–1990  гг. стали периодом, маркированным повышенным
интересом к методу тестов как к одному из методов наиболее эконо-
мичного, надежного, эффективного контроля обученности студентов
в  отечественной практике обучения иностранным языкам. Именно
в эти годы были написаны и защищены первые диссертационные ис-
следования и статьи по теории и практике лингводидактического те-
стирования.
Возрастает количество публикаций по данной проблематике
в  научных журналах, организуются семинары, стажировки, конфе-
ренции, основываются центры тестирования, кафедры иностранных
языков берутся за активную разработку метода. Стоит отметить ра-
боту кафедры иностранных языков Таганрогского радиотехниче-
ского института (ТРТИ), где закладывалась основа отечественного
лингводидактического тестирования. С  1969  по 1971  г. группой под
руководством И. А. Цатуровой «была составлена и опробована систе-
ма локально стандартизованных тестов учебных достижений по трем
языкам (английскому, французскому, немецкому) для студентов тех-
нических вузов, а также тест исходного (стартового) уровня»73. Такая
активная работа стала возможной благодаря созданию в  1972  г. при
Минвузе РСФСР Центра по тестированию под научным руковод-
ством И. А. Цатуровой. Она возглавила организованную Центром
тестирования группу по разработке стандартизованных тестов, в со-
став которой вошли представители 12 вузов страны. В их число вошли
В. А. Коккота, Л. В. Банкевич, К. А. Иванова, Л. А. Свешникова и др. Ре-
зультатом двухлетней работы группы стало создание и опробование
двух стандартизованных тестов по лексике и грамматике английского
и немецкого языков в двух вариантах, которые широко применялись
при тестировании студентов технических вузов страны.
Наряду с работой Центра тестирования при Минвузе РСФСР ве-
лись исследования тестологами И. А. Рапопортом, С. К. Фоломкиной,
Э. А. Штульманом, Ю. А. Веденяпиным и др.
72
Воскерчьян С. И. Об использовании метода тестов при учете успеваемости
школьников // Советская педагогика. 1963. № 10. С. 28–37.
73
Банкевич Л. В. Система тестов в американской методике // Иностранные
языки в школе. 1965. № 6. С. 51.

55
Глава 1.  Общие вопросы тестологии

Интересны, например, исследования Ю. А. Веденяпина, работав-


шего над проблемой составления и применения прогностических те-
стов74. Так, им составлено 38 серий тестов, опробованных на 350 аби-
туриентах Московского государственного педагогического института
иностранных языков им. Мориса Тореза. «Батарея» тестов, составлен-
ная Веденяпиным, проверяет:
•• способность к  слуховой дифференциальной чувствительно-
сти;
•• умение подметить языковую закономерность и самостоятель-
но применить ее;
•• способность к прогнозированию;
•• оперативную память;
•• знания грамматического и лексического материала, приобре-
тенные к моменту поступления в вуз.
В последние десятилетия педагогическое тестирование стало об-
ретать реальные очертания важной государственной задачи. Можно
сказать, что с середины 1990-х в России начался четвертый этап раз-
вития тестирования в России. Так, с 1995 г. проводится опережающее
аттестационное и абитуриентское тестирование. В 1996 г. Министер-
ством общего и  профессионального образования РФ была создана
централизованная служба тестирования выпускников общеобразова-
тельных учреждений РФ, выполняющая функции контроля и оценки
качества знаний и  умений учащихся, а с  2001  г. проводится единый
государственный экзамен (ЕГЭ).
В отечественной тестологии четко обозначилось направление по
созданию современной теории тестов (В. С. Аванесов, Н. Ф. Ефремова,
Е. А. Михайлычев, А. Н. Майоров, М. Б. Челышкова), опубликованы
несколько вариантов моделей статистической обработки результатов
массового тестирования (В. С. Аванесов, Ю. М. Нейман, В. А. Хлебни-
ков, М. Б. Челышкова), разработаны и  применяются в  образователь-
ной практике программы компьютерного тестирования (А. Г. Шмелев,
В. И. Нардюжев, И. В. Нардюжев, И. Д. Рудинский), по ряду учебных
дисциплин созданы обучающие тесты (А. И. Сеногноева, Н. Ф. Федо-
рова, В. М. Кадневский), активно разрабатываются проблемы методи-

74
Веденяпин Ю. А. О тестировании в области иностранных языков // Обу-
чение иностранным языкам в высшей школе: Методический сборник. М.,
1969. № 4/9.

56
1.2.  Исторические и социальные аспекты тестирования

ки создания и применения тестов по различным дисциплинам обра-


зовательного стандарта75.
Достижение высокого качества обучения возможно только при
наличии объективных методов диагностики. К сожалению, традици-
онная форма оценивания уровня знаний в  форме опроса, экзамена,
проводимого человеком, весьма субъективна. По мнению К. Инген-
кампа76, при использовании пятибалльной шкалы преподаватель вы-
ставляет оценки с разбросом плюс-минус 1 балл, т. е. с точностью 20 %.
Из этого следует, что за одни и те же знания испытуемый может быть
оценен разными экзаменаторами на «2», на «3» и  на «4». Более того,
К. Ингенкамп указывает, что один и тот же экзаменатор в разные мо-
менты времени, например с интервалом в 1 месяц, также по разному
оценивает один и тот же ответ (на экспериментах использовались ви-
деозаписи ответов испытуемых).
Очевидно, что столь неточный «измерительный прибор», како-
вым является человек, существенно снижает эффективность диагно-
стики учебного процесса. По этой причине в качестве контрольно-из-
мерительного мероприятия выбирается тестирование. Тестирование
учебных достижений является важной составной частью учебного
процесса. Педагогические тесты позволяют провести объективную
оценку достигнутого уровня обученности при массовой проверке зна-
ний, а также сравнить эффективность различных программ обучения.
В повседневной практике контроля знаний с помощью педагогических
тестов можно получить объективную информацию о владении инди-
видом определенными знаниями, умениями и навыками и соотнести
эти данные с задачами обучения для своевременной коррекции про-
цесса усвоения новых знаний. Как будет показано ниже, «управление
учебным процессом, как известно, является одним из определяющих
факторов повышения его эффективности»77 (см. главу 6).
Революционным периодом развития тестологических идей
в  мире стал момент активного внедрения методов статистического

75
Звонников В. И., Челышкова М. Б. Современные средства оценивания ре-
зультатов обучения. М.: Академия, 2007; Аванесов В. С. Основы научной
организации педагогического контроля в  высшей школе. М., 1989; Ней-
ман Ю. М. Педагогическое тестирование как измерение. М., 2002.
76
Ингенкамп К. Педагогическая диагностика. М.: Педагогика, 1991  (Зару-
бежная школа и педагогика).
77
Челышкова М. Б. Разработка педагогических тестов на основе современ-
ных математических моделей. М., 1995.

57
Глава 1.  Общие вопросы тестологии

анализа. В  течение трех-четырех десятилетий сформировалась клас-


сическая теория статистической обработки тестов, которая примерно
с  1970-х годов вступила в  этап трансформации. В  рамках классиче-
ской теории педагогические тесты в системе образования создавались
для контроля знаний. На этапе трансформации стали создавать те-
сты и  для обучения. В  России уже созданы и  применяются обучаю-
щие тесты по ряду общеобразовательных дисциплин (математика —
Н. А. Сеногноева, география  — В. А. Федорова, история  — В. М. Кад-
невский). В этот период происходит переход от классической теории
статистического анализа тестов методом корреляционного анализа
(Ч. Спирман, Дж. Браун, Л. Бахман) к  теории тестовых заданий (Item
Response Theory — IRT)78. Сложные математические процедуры при-
меняются для выявления степени трудности заданий, объем вычисле-
ний в которых стал возможным только с появлением доступа тестоло-
гов к  компьютерам. Это позволило углубить разработанную теорию
корреляции, факторный анализ и  мультифакторную теорию. На ос-
нове компьютерных технологий построена формально-структурная
модель нечеткого оценивания знаний, позволяющая организовать эф-
фективное педагогическое тестирование по слабо формализованным
(например, философия) дисциплинам (И. Д. Рудинский). В результате
функциональные возможности тестирования в образовании дополня-
ются новыми вариациями.
Таким образом, отечественные психологи и  педагоги достигли
многого не только в  области психологических, но  и в  области педа-
гогических измерений, велась большая исследовательская работа по
совершенствованию самих тестов, а также приемов обработки и ин-
терпретации результатов тестирования.

78
Spearman C. Correlation calculated from faculty data // British Journal of Psy-
chology. 1910. Vol. 3, No. 2. P. 271–295; Rasch G. Probabilistic models for some
intelligence and attainment tests. Copenhagen: Danish Institute for Educational
Research, 1960 (Expanded edition. Chicago: The University of Chicago Press,
1980); Birnbaum A. Some Latent Trait Models and their Use in Inferring an Ex-
aminee’s ability // Lord F. M., Novick M. R. (eds.) Statistical Theories of Mental
Test Scores. Reading (MA): Addison–Wesley, 1968. P. 397–479; Brown J. D. Un-
derstanding research in second language learning: A teacher’s guide to statistics
and research design. Cambridge: Cambridge University Press, 1988.

58
1.2.  Исторические и социальные аспекты тестирования

1.2.5. ПРОБЛЕМА ОБРАТНОГО ВЛИЯНИЯ ТЕСТИРОВАНИЯ


В КОНТЕКСТЕ СОЦИАЛЬНЫХ ПОСЛЕДСТВИЙ

Понятие обратного эффекта в  тестировании (washback)  — это


явление, достаточно хорошо изученное в  западных академических
кругах и считающееся общим для процессов обучения в любых офи-
циальных учебных заведениях. Обычно под ним понимают влияние
тестирования на преподавание и  обучение. Этот феномен известен
многим из нас практически, а не теоретически, из простого вопроса
школьника или студента: «Скажите, а это будет на экзамене?», возни-
кающего при изучении какой-либо темы. И если ответ преподавателя
на этот вопрос отрицательный, то интерес к данной теме у большей
части аудитории резко падает…
Замечено, что существует естественная тенденция и у преподава-
телей, и у студентов подстраивать обучение под требования теста, ко-
торый будет подводить этому обучению итог. Особенно ярко выраже-
но это бывает в том случае, когда результаты теста способны оказать
большое влияние на дальнейшую жизнь участников процесса оцени-
вания — в первую очередь, конечно, на жизнь тестируемого, а порой
и педагога, поскольку часто они трактуются как показатель эффектив-
ности преподавания. У таких оценочных методик в английском язы-
ке сложилось специальное название — high-stakes tests, т. е. букваль-
но «тесты, связанные с высокими ставками». Поскольку аналогичная
реалия на отечественной почве уже давно существует, но никем при
этом всерьез не анализируется, то и  соответствующего термина для
нее в русском языке не существует. Мы используем при обсуждении
данного феномена либо описательное определение «социально значи-
мые тесты», либо устоявшийся англоязычный термин  — хай-стейкс
тесты.
По сходным причинам нет пока в  терминологическом аппара-
те отечественной тестологии и  устоявшегося термина, аналогичного
английскому washback, поэтому в этом качестве можно синонимично
использовать следующие словосочетания: «обратная связь», «обрат-
ное влияние», «обратный эффект», «обратное воздействие». Во всех
этих случаях подразумевается обратное влияние методик оценивания
(в  данном случае  — тестов) на процессы, так или иначе связанные
с обучением.

59
Глава 1.  Общие вопросы тестологии

По замечанию С. Мессика79, обратное влияние относится к  той


степени, в которой введение или использование теста побуждает как
учителей иностранного языка, так и  учеников делать то, чего они
в противном случае не делали бы (имеется в виду: при отсутствии те-
ста), и что может способствовать или препятствовать овладению язы-
ком.
По мнению Дж. Ч. Олдерсона и Д. Уолл80, то, что тесты оказывают
обратное влияние на преподавание, является общим местом в литера-
туре по вопросам образования и прикладной лингвистики (заметим
в  скобках, в  западной, но  не в  отечественной литературе); принято
считать, что процедуры публичного оценивания влияют на установ-
ки, поведение и мотивацию преподавателей, учащихся и их родителей.
Это влияние обычно расценивается как негативное, разрушающее
учебный план, заставляющее учителей игнорировать материал и виды
деятельности, которые не относятся непосредственно к выполнению
экзамена (хотя отдельные исследователи все же считают, что экзаме-
национные испытания влияют на обучение позитивно).
Высказывается, однако, и  такая точка зрения, что одна из  важ-
нейших характеристик теста  — валидность  — должна измеряться
как раз степенью, в  которой он положительно влияет на обучение.
Так, К. Морроу81 предлагает ввести термин «валидность обратного
влияния» («washback validity») для обозначения отношений между те-
стом и связанным с ним преподаванием. При этом подразумевается,
что тест валиден, когда он имеет положительный обратный эффект,
и  не валиден, когда этот эффект негативен. Аналогичную концеп-
цию создали Дж. Фредериксен и  А. Коллинз, предложив термин «си-
стемная валидность» («systemic validity»), который они определили
следующим образом: «Тестом, обладающим системной валидностью,
является тест, вызывающий в системе образования такие изменения
в  учебном плане и  преподавании, которые благоприятствуют разви-
тию когнитивных навыков, для измерения которых этот тест и  был
предназначен. Доказательством системной валидности могло бы счи-

79
Messick S. Validity // Educational measurement / ed. by R. L. Linn. 3rd ed. New
York: Macmillan, 1989. P. 241.
80
Alderson  J. C., Wall  D. Does washback exist? //  Applied Linguistics. 1993.
Vol. 14, No. 2. P. 115–129.
81
Morrow K. The evaluation of tests of communicative performance // Innova-
tions in Language Testing / ed. by M. Portal. London: NFER/Nelson, 1986.

60
1.2.  Исторические и социальные аспекты тестирования

таться улучшение этих навыков спустя определенное время после на-


чала применения теста в образовательной системе»82.
Однако в ответ на это Олдерсон и Уолл замечают, что такая фор-
ма валидности не только никогда не была продемонстрирована на
практике или реально исследована, но даже не было сформулировано
никаких предположений о том, как ее можно было бы установить эм-
пирически, а не просто провозглашать. Более того, неясно, нужно ли
считать в случае, если тест не обладает валидностью обратного вли-
яния, что это  — недостаток валидности самого теста, как полагают
Морроу, Фредериксен и Коллинз. Ведь внутри школ, системы образо-
вания и общества в целом могут быть другие силы, которые не дают
обратному эффекту теста проявиться, или воздействуют на природу
обратного влияния вопреки «коммуникативному» качеству самого
теста. Это вряд ли можно было бы приписать внутритестовым про-
блемам. Позиция авторов состоит в  том, что, в  то время как валид-
ность является свойством теста, относящимся к его использованию,
обратное влияние теста  — по всей вероятности, сложный феномен,
который нельзя напрямую отнести к тестовой валидности83.
Само по себе понятие обратного влияния теста нейтрально. Ло-
гично предположить, что если тест «плох», то обратное влияние будет
негативно, если «хорош», то следует ждать положительных эффектов.
Но если принять, что обратное влияние теста состоит в том, чтобы по-
буждать учащихся и учителей делать то, чего они в противном случае
не делали бы, не будь тест приведен в действие, то логично предполо-
жить, что «плохой» тест, вероятно, мог бы иметь «хороший» эффект,
если бы побуждал учеников и преподавателей делать «хорошие» вещи,
которых они без него не делали бы (например, тщательнее готовиться
к урокам, выполнять домашние задания, относиться к тестируемому
предмету более серьезно и т. д.).
И действительно, часто говорят, что учителя используют тесты
для того, чтобы их учащиеся делали то, чего без этого не стали бы де-
лать: были внимательными на уроках, тщательнее готовили задания,
учили материал наизусть и  т. д. И  здесь Олдерсон и  Уолл приходят
к парадоксальному выводу: в той степени, в какой эти виды активно-
сти являются желательными (упорная работа предпочтительнее, чем

82
Frederiksen J. R., Collins A. A systems approach to educational testing // Educa-
tional Researcher. 1989. Vol. 18, No. 9. P. 27.
83
Alderson J. C., Wall D. Op. cit.

61
Глава 1.  Общие вопросы тестологии

отсутствие работы, а  внешняя мотивация, вероятно, лучше, чем от-


сутствие какой бы то ни было мотивации), любой тест, хороший или
плохой, может иметь положительное обратное влияние, если он спо-
собствует соответствующим видам активности и мотивации.
С другой стороны, можно рассмотреть обратную ситуацию, ког-
да любой тест, хороший или плохой, будет иметь негативный эффект.
Наиболее очевидный пример  — тревога, которую будет испытывать
ученик, которому предстоит выполнить тест, или обеспокоенность
учителей результатами теста, если они считают, что плохие резуль-
таты вызовут неприятные последствия. Страх плохих показателей
и связанные с этим эмоции вины, стыда, смущения могут приводить
преподавателей к желанию добиться хороших результатов любой це-
ной, что может приводить к «натаскиванию на тест» и, как следствие,
к обеднению учебных программ.
Таким образом, Олдерсон и  Уолл показывают, что качество об-
ратного влияния теста может быть независимым от качества самого
теста. Авторы приводят перечень факторов, способных опосредовать
влияние тестовых переменных. К  первым относятся базовая компе-
тентность преподавателя, его понимание принципов, положенных
в  основу теста, доступность учебных ресурсов в  школе, изменение
влияния мотивации на успешность выполнения деятельности соглас-
но закону Йеркса–Додсона, а  также такие психологические качества
тестируемого, как потребность в достижении, мотивация успеха или
избегания неудач, атрибуция причин (приписывание причин успехов
и неудач своим либо чужим способностям, усилиям, намерениям, ве-
зению и  т. д.), ситуативная тревожность или тревожность как черта
личности.
Олдерсон и  Уолл считают, что в  настоящее время вопрос надо
ставить не о том, существует ли обратное влияние тестов, а о том, ка-
ково оно, чем вызвано и  почему вообще оно существует. Они пред-
принимают перспективную попытку сформулировать относительно
обратного влияния тестов несколько гипотез, от самых общих до бо-
лее детализированных, которые позволяют лучше понять, с какой сто-
роны нужно подходить к  практическому изучению этого феномена,
поскольку, как известно, хорошо сформулированный вопрос  — это
половина ответа.
Хотя существование обратного влияния тестов в западной педа-
гогике и методологии давно уже не подвергается сомнению, до насто-
ящего времени было сделано не так много попыток проанализировать

62
1.2.  Исторические и социальные аспекты тестирования

и обосновать природу этого явления. С появлением перечня гипотез


Олдерсона и  Уолл об обратном влиянии («Some possible Washback
Hypotheses») ситуация изменилась, и  теперь этот список является
фактически хрестоматийным84. Поэтому приведем его здесь  — воз-
можно, впервые в отечественной литературе, чтобы восполнить этот
пробел, но воздержавшись от пояснений и комментариев в целях эко-
номии места.
Возможные гипотезы об обратной связи:
1) тест будет влиять на преподавание;
2) тест будет влиять на изучение;
3) тест будет влиять на то, чему преподаватели учат; и
4) тест будет влиять на то, как преподаватели учат;
5) тест будет влиять на то, что учащиеся учат; и
6) тест будет влиять на то, как учащиеся учатся;
7) тест будет влиять на темп и  последовательность преподава-
ния;
8) тест будет влиять на темп и последовательность изучения;
9) тест будет влиять на качество и глубину преподавания;
10) тест будет влиять на качество и глубину изучения;
11) тест будет влиять на отношение к содержанию, методам и т. д.
преподавания и обучения;
12) тесты, которые имеют значимые последствия, будут иметь об-
ратное влияние, и наоборот:
13) тесты, которые не имеют значимых последствий, не будут
иметь обратного влияния;
14) тесты будут влиять на всех учащихся и преподавателей;
15) тесты будут влиять на некоторых учащихся и некоторых учи-
телей, но не на всех. (В другом варианте: степень и тип обрат-
ного влияния теста на различных преподавателей и учащихся
неодинаковы и отличаются от степени и типа обратного влия-
ния на других преподавателей и учащихся.)
В зависимости от переменных, включенных в контекст в каждой
конкретной ситуации, обучение и преподавание могут испытывать на
себе воздействие обратного эффекта тестирования множеством раз-
личных способов. Задача исследователя в  данном случае  — обнару-
жить эти переменные, суметь их измерить и взвесить степень их вли-
яния.
84
Ibid. P. 120–121.

63
Глава 1.  Общие вопросы тестологии

Зная, что для успешного прохождения теста учащимся понадо-


бятся не все знания и  навыки, необходимые для освоения согласно
учебным программам, учителя сталкиваются с моральной дилеммой.
С  одной стороны, они обязаны преподать все то, что положено по
учебным стандартам. Но те учащиеся в их учебном заведении, кото-
рые сосредоточатся на освоении более ограниченного материала, не-
посредственно нужного при выполнении теста, могут справиться с те-
стом лучше и получить преимущество. В этом случае при подведении
официальных итогов тестирования более добросовестный и  ответ-
ственный преподаватель оказывается в невыгодном положении и де-
монстрирует более низкие результаты, чем его коллеги, успешно уре-
завшие учебный план в угоду потребностям тестирования85. При этом
преподаватели могут награждаться премиями или публично крити-
коваться и даже подвергаться увольнению в зависимости от успехов
своих учеников при выполнении теста.
К аналогичным выводам приходит и Р. В. Смит в своем исследо-
вании роли внешнего тестирования в двух начальных школах США86.
Говоря о влиянии, которое тестирование оказывает на учителей, Смит
упоминает следующие эффекты.
1. Опубликование тестовых оценок вызывает чувство стыда, сму-
щения, вины и гнева у учителей, порождая решение сделать все,
что необходимо, чтобы избежать таких чувств в  будущем. Это
приводит к тому, что они начинают заниматься «натаскиванием
на тест».
2. Мнение о  невалидности теста в  сочетании с  необходимостью
повышать тестовые результаты порождает чувство диссонанса
и отчуждения. Если тесты не сочетаются с убеждениями учите-
лей о том, что является ценностью с точки зрения образования,
то у них возникает чувство неприятия: «Почему мы должны бес-
покоиться об оценках, если мы знаем, что в них нет смысла?»
3. Убеждение в  эмоциональном воздействии тестирования на ма-
леньких детей порождает чувство тревоги и вины у учителей.
4. Программы тестирования сокращают время, необходимое для

85
Mehrens  W., Kaminski  J. Methods for Improving Standardized Test  Scores:
Fruitful, Fruitless, or Fraudulent? //  Educational Measurement: Issues and
Practice. 1989. Vol. 8. P. 14–22.
86
Smith R. W. The Rise and Fall of Public Education in America: The Interdepen-
dence of Public Education and Society. Bloomington: Author House, 2006.

64
1.2.  Исторические и социальные аспекты тестирования

обучения. Концентрация усилий на освоении материала, входя-


щего в тест, сужает возможности учебной программы, а с ними
и способность учителя разнообразить урок, адаптировать его со-
ответственно нуждам класса, проявлять творчество.
Сужение учебных программ и  пренебрежение нетестируемыми
предметами, утверждает Смит, происходит на наших глазах. Учителя,
сталкиваясь с  этими явлениями, выбирают одну их двух тенденций
реагирования. В  первом случае это аккомодация, т. е. приспособле-
ние к требованиям, превышающим возможности учителя компетент-
но преподать весь курс обучения, подстраивание под тест и отказ от
изучения того, что не будет тестироваться. Во втором случае это со-
противление урезанию учебных программ и рутинной работе на уро-
ках. В  такой ситуации учителя должны быть готовы защищать свой
учебный план и испытывать беспокойство по поводу санкций в слу-
чае низких тестовых оценок. Сопротивление может выливаться в по-
литическую акцию. Так, в некоторых штатах США учителя добились
принятия закона, по которому не требуется проходить тестирование
ученикам 1-го класса.
Смит делает еще два заключения. Во-первых, форма теста (нор-
мативно- или критериально-ориентированный тест) не имеет отноше-
ния к влиянию, которое он оказывает на учителей и методику препо-
давания. Этот эффект определяется политическими или социальными
выводами, которые следуют из интерпретации тестовых оценок. Во-
вторых, если преподаватели испытывают слишком сильный контроль
с помощью тестов за тем, чему они учат и как именно, они утрачивают
способность обучать нетестируемым разделам программы и исполь-
зовать другие методы обучения.
С нашей точки зрения, есть три общих фактора, с помощью ко-
торых можно охарактеризовать изменения, происходящие в учебных
программах и методах обучения различных образовательных заведе-
ний с введением социально-значимых тестов. Имеющийся опыт пока-
зывает, что каждый раз при переходе от традиционной системы кон-
троля качества обучения к контролю с помощью стандартизованных
тестов в сходных социально-экономических и политических условиях
наблюдаются следующие черты:
1) неизбежность изменений в программах и методах обучения;
2) оперативность этих изменений (часто для их инициации до-
статочно уже однократно проведенного тестирования);

65
Глава 1.  Общие вопросы тестологии

3) автоматизм происходящих перемен (т. е. обычно нет никакой


необходимости в применении административных и иных мер,
требующих соответствующей коррекции программ и  мето-
дов, поскольку при введении социально-значимых тестов си-
стемные регуляционные механизмы, заставляющие заинтере-
сованных лиц вносить изменения в планы и программы обу-
чения, запускаются самопроизвольно).
Серьезной проблемой для ряда исследователей представляется
ситуация, когда стратегией обучения становится «натаскивание на
тест» («teaching to the test»), т. е. когда программа обучения превра-
щается в  подготовку к  стандартизованному тесту. Согласно С. Йе87,
критики хай-стейкс тестов обычно выделяют 4 вида негативного воз-
действия тестирования на обучение, связанного с «натаскиванием на
тест» вместо преследования более широких учебных целей:
1) сужение учебной программы в  ущерб не тестируемым пред-
метам (например, связанным с преподаванием истории, рисо-
вания, музыки, физкультуры и т. д.; в российских школах это
может касаться, например, русской словесности, второго ино-
странного языка, астрономии);
2) при изучении тестируемых предметов — удаление или суже-
ние тех разделов и навыков, которые не проверяются в тесте;
3) сведение учебных планов и обучения к запоминанию отдель-
ных порций фактической информации;
4) выделение слишком большого объема учебного времени под-
готовке к  тесту (т. е. конкретным приемам и  стратегиям вы-
полнения теста, например тренировке заполнения тестового
бланка) вместо реального обучения.
Практика «натаскивания на тест» часто вызывает критику с по-
зиций этики. В. Мехренс и  Дж. Камински88 предложили своего рода
«этический континуум» ситуаций обучения при подготовке к  тесту,
состоящий из 7 пунктов, проранжированных от наиболее до наиме-
нее этичных:
1) общее обучение, направленное на частные цели;
2) обучение общим навыкам выполнения тестов;
87
Yeh S. S. Limiting the Unintended Consequences of High-Stakes Testing // Ed-
ucation Policy Analysis Archives / ed. by Sh. Dorn. 2005. Vol. 13, No. 43. P. 2–3.
88
Mehrens W., Kaminski J. Op. cit.

66
1.2.  Исторические и социальные аспекты тестирования

3) обучение тому, что обычно измеряется стандартизованными


тестами;
4) обучение тому, что измеряется данным тестом;
5) обучение тому, что измеряется данным тестом, с использова-
нием формата этого теста;
6) обучение с  использованием уже изданного теста или теста-
«клона», который воспроизводит формат и  содержание ис-
пользуемого теста;
7) использование теста, который должен применяться для оцен-
ки, до или во время его официального предъявления.
Авторы приходят к  выводу, что этическая граница проходит
между пунктами  3  и  5, причем пункты  1  и  2  являются изначально
этичными, а пункты 6 и 7 — неэтичными.
Если согласиться с  авторами в  случае с  пунктом  6, то следова-
ло бы признать неэтичными весьма значительное количество учеб-
ных пособий для подготовки к  тестам, которые как раз и  строятся
на использовании уже изданных версий, возможно, применявшихся
в предыдущие годы (past papers) или воспроизводящих формат самых
значимых хай-стейкс тестов (в частности, отечественных ЕГЭ и ГИА)
и пользующихся заметной популярностью. Вероятно, если уж мы ста-
вим целью успешное выполнение тестов, без подобных пособий обой-
тись нельзя. Иначе встает другой этический вопрос: учащиеся, не ис-
пользующие для подготовки упомянутые пособия, будут показывать
результаты заведомо ниже, чем те, кто их использовал. Использование
такого рода пособий приходится считать злом, с которым мы вынуж-
дены мириться, рискуя иначе быть обвиненными в ханжестве и лице-
мерии. Действительно, было бы по меньшей мере странно требовать
от учащихся успешного выполнения тестов с весьма значимыми для
них социальными последствиями, и при этом не давать им возможно-
сти проверить и потренировать свои умения на аналогах этого теста.
Ведь, как уже было сказано выше, успех при выполнении теста зависит
не только от наличных знаний и навыков, но и, например, от тесто-
вой искушенности. Другое дело, что общее время, затраченное на это
в учебном курсе, не должно быть слишком значительным.
Но обратное влияние тестов не ограничивается воздействием
только лишь на преподавателей и обучаемых, а также на содержание
и методы обучения. Оно гораздо шире по своей сути.

67
Глава 1.  Общие вопросы тестологии

Л. Бахман и  А. Палмер89 считают, что об обратном эффекте те-


стирования можно говорить в двух плоскостях: в более узком смысле,
на микроуровне, затрагивающем эффект обучения в  классе и  влия-
ние на учащихся и педагогов, и в более широком смысле (часто — test
impact)  — на макроуровне, относящемся к  выработке политических
решений, администрированию в сфере учебных заведений, издатель-
ской деятельности, ожиданиям, которые родители связывают со сво-
ими детьми, а также в целом к уровню общих возможностей для че-
ловека в данном обществе. Следовательно, на макроуровне обратный
эффект тестирования способен выходить за границы отдельно взято-
го учебного класса и проявляться в рамках всей образовательной си-
стемы или даже общества в целом.
Если подход на микроуровне можно было бы условно назвать
психолого-педагогическим, а на макроуровне — социологическим, то
стоит упомянуть еще одну точку зрения на значение тестирования для
общества, которая в последнее время все чаще обсуждается в тестоло-
гических трудах, — философскую.
Применительно к  проблемам языкового оценивания вызывает
интерес подход французского философа, теоретика культуры и исто-
рика Мишеля Фуко. Согласно его позиции, все экзаменационные
процедуры  — символы власти и  контроля. В  соответствии с  точкой
зрения Фуко, эволюция тестов в образовании является формой кон-
троля, с помощью которой люди, выполняющие тест, превращаются
в  объекты для измерения и  классификации. Само понятие «знание»
является конструктом, используемым группой, обладающей властью,
для подавления слабых и удержания их в повиновении. Таким обра-
зом, разработчики тестов вольно или невольно транслируют ценно-
сти правящей общественной группы в педагогические структуры.
По мнению Фуко, «экзамен  — нормализующий взгляд, надзор,
позволяющий квалифицировать, классифицировать и наказывать. Он
делает индивидов видимыми, благодаря чему их можно дифференци-
ровать и  наказывать. Поэтому во всех дисциплинарных механизмах
экзамен — совершенный ритуал. В нем соединяются церемония вла-
сти и форма опыта, применение силы и установление истины»90.

89
Bachman  L. F, Palmer  A. S. Language Testing in Practice. New York: Oxford
University Press, 1996.
90
Фуко M. Надзирать и наказывать: Рождение тюрьмы / пер. с фр. В. Наумо-
ва под ред. И. Борисовой. M. : AdMarginem, 1999. C. 165.

68
1.2.  Исторические и социальные аспекты тестирования

Согласно Фуко, если сначала экзамен знаменовал собой конец об-


учения, то потом он стал одним из  его постоянных факторов и  был
вплетен в  обучение посредством постоянно повторяемого ритуала
власти. В связи с этим школа «становится своеобразным аппаратом
непрерывного экзамена, который дублирует процесс обучения на всем
его протяжении»91. Здесь можно заметить, что в современной школе
непрерывный экзамен (в  широком понимании этого слова, подраз-
умевающем не только контроль, но и сам принцип усвоения знаний,
специальным образом организованных для сдачи экзаменов) зача-
стую не дублирует, а  подменяет процесс обучения. Развивая мысль
Фуко, можно было бы сказать, что культура обучения повсеместно
и планомерно превращается в культуру экзамена.
Многие другие современные исследователи (например, Л. Хэмп-
Лайонз, Э. Шоухами, Т. Макнамара) также считают, что проведение
лингвистического тестирования — это политический акт. По мнению
Шоухами92, существуют 6 факторов, способствующих тому, что тесты
становятся инструментами власти.
1. Тесты проводятся общественными институтами, обладаю-
щими властью. Тестируемые подвергаются методикам, разработан-
ным организациями, осуществляющими контроль над типом и содер-
жимым применяемых тестов. В них главное внимание отводится тому,
что считается важным образовательными системами, правительством
или обществом; следовательно, получение неудовлетворительных ре-
зультатов по тесту приводит к уменьшению потенциальных возмож-
ностей человека в образовательной или профессиональной сфере.
2. В тестах используется научный язык. Использование стати-
стики и презентация тестов и экзаменов в научных терминах придает
процессу авторитет, вследствие чего общественность приходит к вы-
воду, что системы тестирования «справедливы и обоснованы» и «за-
служивают доверия» даже в тех случаях, когда это не так.
3. В тестах используется язык чисел, свойственный для средств
масс-медиа. Цитирование чисел в докладе, даже если они сомнитель-
ны, придает докладу ореол авторитетности.
4. Тесты используют письменную форму коммуникации. Вве-
дение письменного теста, в  котором нет коммуникации, усиливает

91
Там же. С. 166.
92
Shohamy E. The Power of Tests: A Critical Perspective on the Uses of Language
Tests. London: Longman, 2001. P. 20–24.

69
Глава 1.  Общие вопросы тестологии

чувство, что процесс имеет научную основу. От тестируемых требует-


ся продемонстрировать знание, которое оценивается безотноситель-
но к способности это знание интерпретировать.
5. Доверие к документации как таковой. Тестовые результаты
могут быть записаны и задокументированы, с тем чтобы каждому ис-
пытуемому было отведена папка, которая может быть использована
для сравнения с  другими, так же, как и  для целей классифицирова-
ния и вынесения суждений об индивиде. Создается некая постоянная,
фиксированная запись о человеке (permanent record of the person), ко-
торая теоретически будет существовать всегда.
6. Тесты используют объективные форматы. «Истина» со-
держится в  самом тесте постольку, поскольку большинство методик
имеют пункты, для которых существует «правильный» ответ. Это ка-
сается даже некоторых открытых вопросов и заданий, данных в более
свободной форме, как, например, при оценке письма или говорения,
где формат и  процедура подсчета результатов ограничивают то, что
может быть сказано или оценено.
Так, например, по мнению Шоухами, в том случае, когда в обще-
стве существует централизованная образовательная система, вво-
димые на государственном уровне тесты дают инициаторам их вне-
дрения исключительные средства контроля. Этот контроль может
включать доступ к  высшему образованию, возможность навязывать
учебные планы и программы в общенациональных масштабах, опре-
деление критериев эффективности педагогической деятельности с со-
ответствующими дисциплинарными мерами — вплоть до увольнения
преподавателей, им не соответствующих, и даже закрытие образова-
тельных учреждений, если тестовые оценки тех, кто в них обучается,
не отвечают определенным бюрократическим требованиям.
Шоухами рассматривает множество тестов, введенных на выс-
шем уровне, интерпретируя их в терминах Фуко: как акт власти, ко-
торая вводит инструменты надзора, чтобы численно измерить соот-
ветствие, классифицировать результаты на «пригодные» и «непри-
годные», и  наказать в  случае «непригодных». Таким образом, тесты
используются для того, чтобы обеспечить ситуацию, когда знания,
ценимые властными структурами общества, поддерживают их статус
кво.
Возрастающее понимание социального и  политического значе-
ния языкового оценивания приводит исследователей к  пересмотру
своей роли и  ответственности в  обществе. Так, Макнамара и  Роу-

70
1.2.  Исторические и социальные аспекты тестирования

вер93 считают, что этот процесс происходит в настоящее время в двух


течениях, заметных в  лингводидактических исследованиях: более
либеральном, получившем название «этического языкового тестиро-
вания» («ethical language testing»), и более радикальном, называемом
«критическое языковое тестирование» («critical language testing»).
В первом случае расширенное понимание задач разработчиков
тестов включает в себя принятие ответственности за социальные по-
следствия тестирования. Во втором ставится под вопрос сама прак-
тика использования лингвистических тестов. Это движение является
реакцией на мощную критику, которой подвергается в настоящее вре-
мя на западе дисциплинарная природа существующего общественно-
го порядка и роль классификации в системе надзора за индивидами.
В истории лингводидактики наступила новая эпоха из-за уверенного
выхода языкового тестирования на международную арену и перехода
его в  стадию индустриализованного тестирования, когда, например,
тест TOEFL ежегодно выполняют в разных странах около 1 млн чел.
Это еще одна из  причин, по которой сторонники радикального на-
правления высказывают критические социальные замечания.
По мнению Макнамары, признание социально-политического
значения лингвистического тестирования, которое мы сейчас наблю-
даем, является результатом теоретической переориентации в  этой
сфере науки и практики, происходящей отчасти благодаря принятию
расширенного толкования валидности Мессиком94 с  его интересом
к ценностному измерению тестовых конструктов и социальному кон-
тексту оценивания. Но в настоящее время границы классической те-
ории валидности пересматриваются с позиций социальной теории95.
Происходит отречение от идеи науки, свободной от категории ценно-
стей (value free science), в данном случае — психометрии. Это означает,
что начинает признаваться значение категории ценностей и их влия-
ние на интерпретации тестовых оценок.

93
McNamara T., Roever C. Op. cit.
94
Messick S. Validity.
95
McNamara  T. Language Testing: A Question of Context //  Language Testing
Reconsidered / ed. by J. Fox and others. Ottawa (Ontario): University of Ottawa
Press, 2007. P. 137.

71
Глава 1.  Общие вопросы тестологии

1.3.  СОВРЕМЕННЫЕ ПОЛОЖЕНИЯ ТЕОРИИ ТЕСТИРОВАНИЯ

1.3.1. ТИПОЛОГИЯ ЯЗЫКОВЫХ ТЕСТОВ

Опираясь на основные принципы классификации учебных те-


стов Э. А. Штульмана96, представим типологию педагогических тестов
в виде таблицы (см. табл. 2).
Таблица 2
Типы педагогических тестов по принципам тестирования

№ Принцип Типы тестов


1 По основной цели Диагностические, прогностические,
применения тестов констатирующие, смешанные
2 По структуре построения Простые и комбинированные
3 По периодичности Повседневные (текущие), периодические
применения (контрольные задания, коллоквиумы, зачеты
и т. п.), глобальные (подводящие итог более
или менее длительному периоду обучения)
4 По содержанию 1. Дискретные тесты отдельных умений
и навыков, например грамматические,
фонетические, лексические и комплексные
тесты.
2. Глобальные (интегральные — контроль
совокупности навыков)
5 По форме выполнения Устные, письменные, смешанные
6 По условиям и месту Аудиторные и внеаудиторные (лабораторные)
проведения
7 По технике организациии Компьютерные и бумажные
проведения
8 По способу приготовления Стандартизованные и нестандартизованные
и количественной обработке
данных
9 По предметной области 1. Естественнонаучные.
2. Гуманитарные.
3. Математические.
4. Лингводидакгические и др.

96
См.: Штульман Э. А. Указ. соч.

72
1.3.  Современные положения теории тестирования

Раскрывая содержание первого класса тестов, следует отметить,


что они далеко не всегда имеют четкую функциональную направлен-
ность, и результаты одних и тех же тестов могут обеспечивать разноо-
бразную основную и косвенную информацию. Например, результаты
тестов успешности могут подтверждать или опровергать первоначаль-
ные данные тестов склонности, способности.
Языковые тесты имеют свою специфику и  классифицируются
более конкретным образом. Подавляющее большинство зарубеж-
ных теоретиков тестирования (Р. Ладо97, Дж. Б. Кэрролл98, А. Девис99
и др.) выделяют 4 класса. Однако это количество классов не является
предельным: некоторые ученые выделяют больше классов, например
Дж. Брайен Хитон100, выделяющий 6 категорий языковых тестов.
Российские авторы к  первой категории относят тесты общего
умения, проверяющие уровень владения языком относительно той
деятельности, к которой готовит себя испытуемый. Сюда же они от-
носят и тесты склонности, способности к языку. По нашему мнению,
эти виды тестов можно отнести и к прогностическому типу, так как
и  первый, и  второй проверяют готовность испытуемого к  будущей
деятельности. Вторая категория тестов — тесты успешности и тре-
тья — диагностические тесты.
А. Девис различает 4 типа языковых тестов. В своей работе он дает
подробную характеристику каждому из приведенных типов. Каждый
из этих тестов он разделяет по двум признакам: связь с программой
обучения и связь с временнóй шкалой. Первое влияет на второе. Так,
тесты достижений имеют известную программу и касаются прошло-
го. Тесты на определение языковых способностей не имеют прошлого
и  касаются будущего. Тесты диагностических и  фактических знаний
касаются прошлого и  оба относятся к  будущему. Они могут состав-
ляться в  соответствии с  какой-либо программой обучения или без
нее101.

97
Lado R. Language Testing: A scientific approach. New York; San Francisco; To-
ronto; London: Me Graw Hill, Inc., 1964.
98
Carroll J. B. Fundamental considerations in testing of English language profi-
ciency of foreign students. New York, 1964. P. 50.
99
Davies A. Language Testing: Introduction. Edinburgh: Department of Applied
Linguistics, 1968.
100
Heaton J. B. Classroom Testing. Harlow: Longman, 1986.
101
Davies A. Op. cit.

73
Глава 1.  Общие вопросы тестологии

В табл. 3 представлены 4 класса языковых тестов, выделяемые за-


рубежными американскими исследователями.
Таблица 3
Типы языковых тестов в зависимости от цели их применения

Категория Цель применения теста Тесты


1-я Определение уровня владе- Тесты на определение уровня владе-
ния иностранным языком ния иностранным языком (General
proficiency tests, Selection tests, Place-
ment tests, etc.)
2-я Определение способности Тесты на определение способности
к языкам (Aptitude tests / Prognostic tests)
3-я Выявление слабых сторон Диагностические тесты (Diagnostic
знаний обучающихся по tests)
отдельным языковым навы-
кам, причины их отставания
и т. д.
4-я Проверка успехов, достигну- Промежуточные и итоговые тесты
тых обучающимися за опре- (Progress tests, Achievement tests)
деленный период обучения

1. Тесты на определение уровня владения иностранным язы-


ком (General Proficiency tests). В зависимости от назначения различа-
ется несколько видов тестов этой категории. Если определение уровня
владения иностранным языком имеет целью проверку знаний абиту-
риентов, то соответствующие тесты могут называться selection tests
(отборочные тесты); если их целью является распределение студентов
по группам в зависимости от их знаний — placement tests (вступитель-
ные, распределительные) и т. д.
2. Тесты способностей (Aptitude tests) — тесты для определения
способностей экзаменующегося по иностранному языку и  времени,
необходимого ему для овладения языком. Эта категория тестов часто
также носит название тестов прогнозирования (Prognostic tests), т. е.
предсказывающих возможный успех в изучении иностранного языка
испытуемым, который ставится в зависимость от его способностей.
3. Диагностические тесты (Diagnostic tests) — тесты для выяв-
ления наиболее слабых сторон знаний учащихся по отдельным язы-
ковым навыкам, причины их отставания и т. д., с тем чтобы принять
соответствующие меры для их устранения.

74
1.3.  Современные положения теории тестирования

4. Промежуточные и итоговые тесты (Progress tests, Achieve-


ment tests) — тесты для определения достижений в области знаний,
умений и навыков, приобретенных в процессе обучения за определен-
ный период. Эта категория тестов по своему характеру близка к те-
стам определения уровня владения иностранным языком, что дает
основание некоторым авторам рассматривать их как разновидности
одной категории. Основное различие между ними заключается в том,
что тесты определения уровня владения языком составляются безот-
носительно к учебнику или методу, тогда как тесты для определения
достижений в  занятиях всегда соответствуют учебным материалам,
по которым происходит обучение. Тесты определения достижения
могут охватывать как отдельные разделы или части курса, так и весь
курс.
Наряду с  перечисленными основными категориями тестов раз-
личается также большое количество их разновидностей, например:
•• planning tests  — для планирования подачи учебного матери-
ала;
•• grading tests  — для определения знаний студентов в  группе
(по сравнению друг с другом и по сравнению с общепринятым
стандартом);
•• motivation tests — для стимулирования интереса к изучаемому
языку;
•• pragmatic tests — прагматические тесты, направленные на вы-
явление коммуникативной компетенции испытуемых в ситу-
ациях, приближенных к естественным.
Различие между классификациями заключается в том, что авторы
нашей страны не выделяют тесты склонности в отдельную категорию,
как это делают зарубежные авторы. Кроме того, по мнению В. А. Кок-
коты, в соответствии с общим определением лингводидактических те-
стов их можно подразделить на две группы: языковые и речевые.
Языковые тесты измеряют в основном лингвистическую компе-
тенцию испытуемых. В качестве примеров языковых тестов Коккота
приводит лексические и грамматические тесты.
Речевые тесты — тесты, которые измеряют компоненты комму-
никативной компетенции (тесты чтения, аудирования) и в  соответ-
ствии с применяемой формой контроля подразделяются:
•• на традиционные, которые предназначены для выявления на-
выков и  умений чтения, аудирования и  письма с  помощью

75
Глава 1.  Общие вопросы тестологии

традиционных приемов (например, вопросно-ответные зада-


ния);
•• на прагматические (например, тесты восстановления, диктан-
ты);
•• на коммуникативные (тесты устной речи)102.
Изучение проблемы затрудняет отсутствие единой терминоло-
гии, что и ощущают не только методисты других стран, но и методи-
сты- американцы.
Оптимально классификация языковых тестов по целям их при-
менения сводится к 6 категориям:
1) placement tests — распределительные тесты или тесты разме-
щения, позволяющие распределить студентов в  однородные
группы при наборе, например Oxford Placement Test (ОРТ);
2) selecting tests — отборочные тесты, позволяющие задать ниж-
ний порог при зачислении в  определенную группу или на
определенный курс (таковым является, например, TOEFL, по
результатам которого иностранные студенты допускаются
к обучению в университетах Соединенных Штатов);
3) progress tests — промежуточные тесты, фиксирующие успеш-
ность прохождения учебного материала при продвижении
по программе, например промежуточные тесты в учебно-ме-
тодических комплексах (УМК) «The New Cambridge English
Course», «First Certificate Gold», «Matters» и многие другие;
4) achievement tests — выпускные тесты, регистрирующие успеш-
ность прохождения курса в конце обучения;
5) proficiency tests  — тесты на владение языком, не связанные
с  какой-либо конкретной программой (таковыми являют-
ся, например, тесты Кембриджского департамента языково-
го тестирования, The University of Michigan Examination for the
Certificate of Proficiency in English);
6) diagnostic tests  — диагностические тесты, проводимые в  на-
чале обучения по программе и  имеющие целью определить
слабые места учащихся и  скорректировать курс (они при-
меняются, например, в  американских программах по подго-
товке к  сдаче тестов Службы педагогического тестирования
(Educational Testing Service — ETS)103.
102
Коккота В. А. Указ. соч. С. 26.
103
См.: Павловская  И. Ю. Тестирование в  учебном процессе: Эксперимен-

76
1.3.  Современные положения теории тестирования

1.3.2. ОСНОВНЫЕ ТЕХНОЛОГИЧЕСКИЕ ПРИЕМЫ МЕТОДИКИ


ЯЗЫКОВОГО ТЕСТИРОВАНИЯ

Для языкового тестирования чрезвычайно важным является


правильный выбор технологических приемов тестирования, посколь-
ку именно от их адекватного использования в определенной степени
зависит получение наиболее объективных результатов по тесту, а со-
ответственно и выявление максимально точных внутритестовых па-
раметров.
Конечной целью каждого приема, применяемого при тестовой
проверке, является стремление вызвать у испытуемых желаемую ре-
акцию. При выборе и разработке таких стимулов необходимо соблю-
дение условия — ответная реакция должна быть такой, чтобы сохра-
нилась возможность однозначной оценки ответа, что диктуется тре-
бованием объективности теста.
Роль стимула при этом может быть рассмотрена в связи с «зада-
чей действия», так как стимул предъявляет эту задачу испытуемому.
Задача действия представляется действующему человеку в виде моде-
ли последующего действия, или, точнее, некоторых параметров его.
«Модель будущего» носит вероятностный характер. «Моделирование
будущего» возможно на основе вероятности опыта, накопленного
в  прошлом и  управляющего оценками вероятностей будущих собы-
тий. Вероятностная структура прошлого опыта связана не с частотой
появления тех или иных стимулов прошлого, а с  частотой тех или
иных реакций организма на них.
Нам представляется, что именно в  связи с  изложенным выше
и следует рассматривать существующие технологические приемы язы-
кового тестирования.
Множественный выбор (Multiple choice). Это наиболее попу-
лярный прием в тестировании, так как полученные с его помощью ре-
зультаты легко поддаются статистической обработке. Суть этого при-
ема заключается в том, что испытуемый должен выбрать подходящий
вариант из числа 3–5 предложенных правильных в языковом отноше-
нии конструкций, среди которых лишь одна является правильным от-
ветом на поставленный вопрос. Причем ответ на вопрос в тестах на
рецептивные виды речевой деятельности (чтение, понимание на слух)

тальное исследование британских тестов в российском вузе // Материалы


XXXII Международной филологической конференции. Вып. 28. Тестоло-
гия. СПб.: Филол. ф-т СПбГУ, 2003. С. 5–13.

77
Глава 1.  Общие вопросы тестологии

может представлять собой как парафраз услышанного (как в TOEFL),


так и фактический ответ на вопрос, заданный диктором или автором
письменного текста (как в Мичиганском тесте). Простейшей его раз-
новидностью являются вопросы, требующие ответа «да / нет». Мето-
дика множественного выбора имеет ряд недостатков.
1. Применяемая обычно методика представления нескольких
неправильных вариантов ответов и  одного правильного не соответ-
ствует типичной для реальной коммуникации стратегии. В общении
исходят либо из наиболее подходящего для данной ситуации выбора
(особенно в случае родного языка), либо из наличных вариантов для
поддержания общения (в случае иностранного языка).
2. Угадывание правильного ответа, как по случайным, так и по
формальным или другим, не относящимся к  владению языком при-
знакам (если ответ сразу не найден). Случайное угадывание обычно
ограничивается стремлением тестируемого найти правильный ответ
путем построения, подтверждения или отвержения гипотез о пригод-
ности того или иного варианта ответа. Доказательством сказанного
являются 10–15 правильных ответов у некоторой части тестируемых
при величине случайного угадывания 25 % при 4 вариантах ответов.
Задания языкового теста можно составить таким образом, чтобы уга-
дывание по внешним и другим признакам было минимальным.
3. Недостаточная активность мыслительных процессов из-за на-
личия готовых ответов и из-за общей ориентации на результат теста.
Указанную активность можно несколько повысить с помощью подбо-
ра соответствующих характеру объектов тестирования типов и форм
заданий, а также регулированием степени трудности заданий.
4. Возможность непроизвольного запоминания неправильных
ответов. Такая опасность существует при слишком трудных заданиях,
когда тестируемый не может построить гипотезы о  правильном ва-
рианте ответа. Поэтому на начальных этапах обучения предлагается
больше использовать невербальные (наглядные) формы ответов.
5. Тестовая ситуация в  задании недостаточно полна, информа-
тивна и  коммуникативна из-за сжатости контекста в  языковых те-
стах (1–2 предложения). С помощью специальных мер для улучшения
смысловой и экстралингвистической стороны задания этот недоста-
ток обычно удается в значительной степени исправить.
6. Неправильные варианты ответов могут содержать избыточ-
ную и  отвлекающую информацию, препятствующую определению
правильного ответа. В  этом отношении составителю теста следует

78
1.3.  Современные положения теории тестирования

быть весьма осмотрительным, чтобы соблюдать так называемое се-


мантическое равновесие среди вариантов ответов тестового задания.
«Да / нет», «верно / неверно», «истинно / ложно» (True / False
technique), — когда испытуемому предлагается выбрать правильный
и  неправильный варианты ответа. Одно очко присуждается за каж-
дый правильный ответ (как в британских тестах Cambridge English).
Установление соответствия (Matching technique). Суть этого
приема — в нахождении парного соответствия: испытуемый должен
правильно сочетать часть стимулирующего задания с тем, что пред-
ставлено для выбора, т. е. найти парные соответствия. Прием на-
правлен на проверку в основном лексических знаний и используется
в  промежуточных тестах. Предлагается попарно соединить синони-
мы, антонимы, коллокации, слова и  определения к  ним. Правильно
подобранная пара — одно очко.
Метод подстановки, дополнения или заполнения пробелов
(Recall technique (Cloze / Filling the gaps)): языковые единицы встав-
ляются в  пропуски в  тексте. Этим приемом можно тестировать все
языковые навыки, кроме говорения. Этот прием более однозначен,
чем прием множественного выбора, благодаря тому что широкий
и узкий контексты исключают почти на 100 % разночтения (как в те-
стах Департамента экзаменов по английскому языку Кембриджского
университета). Очко присуждается за каждую правильную подста-
новку.
Ранжирование (Sorting out). Испытуемым предлагается выстро-
ить услышанную / прочитанную информацию в определенном поряд-
ке или найти в ней логические связи. Такой вид задания тестирует не
только языковые навыки, но и элементы логического анализа, что вхо-
дит в коммуникативную компетенцию говорящего. Оценить такое за-
дание в цифрах трудно, обычно за все задание в целом присуждается
интегральный балл (2–5).
Свободное конструирование ответа (Essay technique) — обуча-
ющийся должен сам составить и написать ответ на заданный вопрос.
Найти ошибки в  письменном тексте (Correcting). Прием про-
веряет навыки письма, знания грамматических структур и форм, син-
таксических правил и лексики, словоупотребления и коллокаций (как
в британских тестах Cambridge English). Каждая найденная ошибка —
одно очко.
На наш взгляд, все эти технологические приемы языкового те-
стирования отличаются друг от друга надежностью, пригодностью,

79
Глава 1.  Общие вопросы тестологии

временем выполнения, легкостью подсчета результатов, возможно-


стью догадки и приемлемостью для определенных учебных целей.
Так, технологические приемы множественного выбора и «да / нет»
ответа требуют меньше времени для выполнения, чем методы запол-
нения пробелов и свободного конструирования ответа. Методы мно-
жественного выбора, «да / нет» ответа, установления соответствия до-
пускают возможность догадки, что исключается при методе заполне-
ния пробелов и методе свободного конструирования ответа. Подсчет
результатов теста легче провести при первых четырех методах, когда
ответы испытуемых могут быть записаны на специальном бланке, ко-
торый легко проверить посредством шаблона, а при наличии специ-
ального оборудования — посредством машины. При других приемах
подсчет результатов затруднен, так как учащиеся составляют ответы
сами и их ответы записать на специальном бланке трудно. Кроме того,
учащиеся могут дать ответ в разной форме, что затрудняет проверку
результатов теста, так как формализация проверки становится невоз-
можной даже при использовании бланков (ответных листов).
Далее мы переходим к системе понятий, связанных с современ-
ной теорией компетентностного подхода в  преподавании, и  оценке
уровня владения языком, во многом подготовленной в рамках языко-
вой политики Совета Европы.

1.3.3. ЯЗЫКОВАЯ ПОЛИТИКА СОВЕТА ЕВРОПЫ: ПЛЮРИЛИНГВИЗМ,


МУЛЬТИЛИНГВИЗМ И ЯЗЫКОВОЕ МНОГООБРАЗИЕ

Совет Европы как международная организация, объединяющая


европейские страны и осуществляющая общеевропейскую политику
в  различных областях, уделяет большое внимание и  развитию язы-
ковой политики в Европе уже на протяжении более четырех десяти-
летий. Основными институтами Совета Европы по данному вопросу
являются Подразделение по языковой политике при образователь-
ном департаменте в  Страсбурге (Франция)104 и  Европейский центр
современных языков в Граце (Австрия)105. Проекты по современным
языкам и развитию языковой политики принимают за основу Евро-

104
Education and Languages, Language Policy // Council of Europe: Democracy:
[сайт]. URL: http://www.coe.int/lang (дата обращения: 10.10.2016).
105
European Centre for Modern Languages of the Council of Europe: [сайт]. URL:
http://www.ecml.at/ (дата обращения: 10.10.2016).

80
1.3.  Современные положения теории тестирования

пейскую культурную конвенцию106, принятую в 1954 г., и направлены


на внедрение основных направлений политики на общеевропейском
уровне, как то: доступ к изучению языков как неотъемлемое право для
всех, развитие индивидуального плюрилингвизма и плюрикультура-
лизма, европейское лингвистическое наследие как источник взаимно-
го обогащения.
Изучение языков рассматривается как одно из  основных прав
человека, а не как привилегия отдельной социальной группы, так как
оно является одним из инструментов для сплочения единой Европы,
равенства и социокультурной гибкости, толерантности и интеграции,
содействия развитию демократической гражданственности и  право-
вого государства в более широких рамках. Знание нескольких языков
является неотъемлемой частью современной жизни в  европейском
обществе и важно не только для осуществления большей профессио-
нальной мобильности и доступа к информации, но и для лучшего по-
нимания и уважения других культур и осуществления плодотворной
коммуникации между разными культурами и странами107.
Целью изучения языков является развитие индивидуального
плюрилингвизма и  плюрикультурализма. В  настоящее время языко-
вой нормой в  пределах Европы считается владение родным языком
и двумя иностранными на уровне, позволяющем осуществлять про-
дуктивную коммуникацию, при этом целью не ставится овладеть
языками в совершенстве. В данном случае говорится о развитии ком-
петенции «межкультурного посредника». В  рекомендациях государ-
ствам-членам Совета Европы предлагаются варианты разработки
более гибких программ, позволяющих отражать разнообразие изучае-
мых языков и признавать частично языковые компетенции по отдель-
ных видам речевой деятельности.
Таким образом, языковое разнообразие рассматривается как
способ взаимного обогащения языков и  культур, раскрытия куль-
турной идентичности и  ее многогранности. Языковое многообразие
в Европе представлено более чем 200 языками и активно дополняет-
ся множеством других языков, привносимых мигрантами. Феномен
106
Совет Европы: Бюро договоров: [сайт]. URL: http://www.coe.int/ru/web/
conventions/ (дата обращения: 10.10.2016).
107
Онушкина Е. В. Изучение современных языков в европейском обществе:
основные направления деятельности Совета Европы // Материалы науч-
но-практической конференции «Дополнительные образовательные про-
граммы по иностранным языкам». СПб.: Филол. ф-т СПбГУ, 2001.

81
Глава 1.  Общие вопросы тестологии

билингвизма в настоящее время является нормой в рамках европей-


ского общества, и  тенденция развития феномена плюрилингвизма
определяет дальнейшую языковую политику и политику образования
в европейских странах, где особое внимание уделяется малым языкам
и  культурам. Нормативными документами являются Европейская
хартия региональных языков или языков меньшинств (1992) и Рамоч-
ная конвенция защиты национальных меньшинств (1995), в которых
отражены основные направления языковой политики относительно
и более редких языков, что в целом составляет языковое и культурное
наследие Европы108. Другими инструментами ненормативного харак-
тера являются «Общеевропейские компетенции владения иностран-
ным языком»109, «Руководство по развитию языковой образователь-
ной политики»110 и  «Европейский языковой портфель»111 (см. далее
разделы 1.3.4–1.3.7).
В «Общеевропейских компетенциях…» перечисляются основные
дескрипторы, характеризующие уровень владения языком с точки зре-
ния коммуникативных умений и навыков, отражающих также и куль-
турологические особенности того или иного языка. В связи с тем, что
данный документ не является нормативным, а только дескриптивным,
в  нем не даются рекомендации относительно проведения языковой
политики, а затрагиваются различные аспекты изучения языка, пре-
подавания и оценки. Данный документ предоставляет базу для даль-
нейшей разработки учебных программ, учебников, экзаменационных
материалов. Таким образом, была разработана стратегическая мето-
дическая основа для общеевропейского языкового взаимодействия
между государствами — членами Совета Европы с учетом все возрас-
тающей европейской мобильности, что в целом способствует взаим-
ному признанию квалификаций и  выравниванию экзаменационных
требований к языкам.
«Руководство…» предлагает различные подходы к анализу муль-
тилингвизма и  выработки соответствующей языковой образова-
108
Совет Европы: Бюро договоров: [сайт].
109
Common European Framework of Reference for Languages: Learning, Teach-
ing, Assessment (CEFR)  //  Council of Europe: [сайт]. URL: http://www.coe.
int/t/dg4/linguistic/Cadre1_EN.asp (дата обращения: 10.10.2016).
110
Education and Languages, Language Policy // Council of Europe: Democracy:
[сайт].
111
Council of Europe: European Language Portfolio: [сайт]. URL: http://www.coe.
int/en/web/portfolio (дата обращения: 10.10.2016).

82
1.3.  Современные положения теории тестирования

тельной политики в  определенном регионе или стране, что в  целом


направлено на дальнейшее развитие концепции лингвистического
многообразия. Лингвистическое многообразие рассматривается и как
мультилингвизм, т. е. наличие более одного языка в  определенной
географической местности, и  как плюрилингвизм, т. е. наличие не-
скольких языков, которыми человек пользуется в повседневной жиз-
ни (родной язык, первый, второй, малый, иностранный и т. д.). Таким
образом, данное руководство помогает определять и  анализировать
факторы, как лингвистические, так и  экстралингвистические, в  том
или ином регионе для выработки соответствующей языковой полити-
ки на местах с учетом языкового и культурного многообразия.
В соответствии с  этими документами, современная политика
в многоязычной и мультикультурной Европе и проекты по современ-
ным языкам, осуществляемые Советом по культурному сотрудниче-
ству Совета Европы, ориентируются на развитие нового разносто-
роннего подхода к  изучению языков в  контексте демократического
европейского гражданства. Реализация данного направления вклю-
чает в  себя анализ политики в  области изучения языков, выработку
лучших стратегий для максимального языкового разнообразия, раз-
витие и внедрение общеевропейских инструментов взаимопонимания
и сотрудничества в данной области. Особое значение придаётся обра-
зованию, способствующему взаимопроникновению культур, т. е. меж-
культурному образованию, международному взаимному признанию
квалификаций для увеличения мобильности и  расширения границ
занятости, обучению на протяжении всей жизни, с тем чтобы найти
своё место в постоянно обучающемся обществе.
Стоит отметить одно из векторных событий, определивших даль-
нейшее развитие и сотрудничество в области плюрилингвизма и линг-
вистического многообразия в Европе, — это Европейский год языков
(2001), организаторами которого стали Совет Европы и Европейский
Союз, а также ЮНЕСКО. Год проводился с учетом того, что языковые
знания имеют важное значение для взаимопонимания между народа-
ми, демократической стабильности, занятости и мобильности людей
в  Европе. Это событие подвело итог той многолетней деятельности
международных организаций, которая была направлена на привлече-
ние внимания и  содействие сохранению лингвистического наследия
в Европе, на мотивацию всех граждан Европы к изучению иностран-
ных языков, включая те, которые являются менее распространенными,
на поддержку самого процесса изучения языков на протяжении всей

83
Глава 1.  Общие вопросы тестологии

жизни в качестве ответа на экономические, социальные и культурные


изменения в Европе и мире в целом. Европейский год языков особо
подчеркнул ценность и  значимость лингвистического разнообразия,
а также важность предоставления всем гражданам возможности при-
обретения, по крайней мере, определенного уровня компетентности
в  знании нескольких иностранных языков. Впоследствии стал еже-
годно отмечаться Европейский день языков (26 сентября)112, который
служит платформой для осуществления постоянного сотрудничества
и обмена опытом в области языковой политики Совета Европы.
В целом вышеуказанные структуры Совета Европы по разработ-
ке и внедрению языковой политики дополняют функции друг друга.
Подразделение по языковой политике занимается стратегической
разработкой европейской языковой политики, и, соответственно, его
первоочередными задачами являются проведение политики междуна-
родной координации и межкультурного диалога, разработка стандар-
тов и стратегических инструментов языковой политики, а также под-
держка и содействие разнообразному и качественному преподаванию
языков в  Европе. В  то время как деятельность Европейского центра
современных языков направлена на решение более практических за-
дач: разработку учебных программ, подготовку семинаров и  меро-
приятий с  дидактической направленностью, осуществление общих
исследовательских проектов, обмен опытом в области преподавания
иностранных языков и т. д.
Совет по культурному сотрудничеству Совета Европы вместе
с Европейским центром современных языков и другими европейски-
ми организациями разрабатывают проекты в  области современных
языков, в которых отражаются основные направления языковой, об-
разовательной и мультикультурной политики Совета Европы. Основ-
ными темами проводимых проектов и семинаров на протяжении бо-
лее четырех десятилетий являются:
•• развитие системы обучения взрослых иностранным языкам
в рамках непрерывного образования и в дальнейшем непре-
рывного обучения взрослых;
•• разработка критериев для определения уровня владения ино-
странным языком для европейских языков;

112
European Day of Languages (EDL) // Council of Europe: Democracy: [сайт].
URL: http://www.coe.int/edl/ (дата обращения: 10.10.2016).

84
1.3.  Современные положения теории тестирования

•• изучение и преподавание современных иностранных языков


в коммуникативных целях;
•• изучение иностранных языков и европейская гражданствен-
ность;
•• изучение иностранных языков на протяжении всей жизни
(постдипломное и дистанционное образование);
•• язык обучения в школе и общеевропейские стандарты обуче-
ния, преподавания и оценки;
•• мультилингвальные школы;
•• лингвистическая интеграция взрослых мигрантов;
•• языки обучения и  право на плюрилингвистическое и  меж-
культурное образование (в  том числе и в  начальном школь-
ном, и в среднем профессиональном образовании);
•• право обучающегося на качество и равенство в образовании
и роль языка и межкультурных умений.
Подробнее эти проекты будут представлены в следующем разде-
ле.
Одним из  практических инструментов Совета Европы для по-
литиков, методистов, педагогов, исследователей является непрерыв-
ный поток издательской продукции, в  которой отражены последние
направления языковой и  образовательной политики этой организа-
ции. Среди наиболее актуальных за последние несколько лет стоит
отметить ряд изданий113.Все это еще раз подчеркивает актуальность
и  значимость данной темы в  современном европейском обществе
и  требует постоянной работы, направленной на развитие сотрудни-
чества и  взаимопонимания между представителями разных культур
и языков в Европе для приумножения и сохранения лингвистического
и культурного многообразия.

113
Promoting plurilingualism: Majority language in multilingual settings. S. l.:
Council of Europe, 2012; Relating language examinations to the Common Eu-
ropean Framework of Reference for Languages. S. l.: Council of Europe, 2012;
Using the European Portfolio for student teachers of languages. S. l.: Council of
Europe, 2012; Plurilingualism and pluriculturalism in content-based teaching:
A training kit. S. l.: Council of Europe, 2012; Languages for social cohesion:
Language education in a multilingual and multicultural Europe. S. l.: Council of
Europe, 2009; Plurilingual and pluricultural awareness in language teacher ed-
ucation: A training kit. S. l.: Council of Europe, 2008; Developing and assessing
intercultural communicative competence: A guide for language teachers and
teacher educators. S. l.: Council of Europe, 2008, и многие другие.

85
Глава 1.  Общие вопросы тестологии

Таким образом, актуальность мультилингвизма как социокуль-


турного феномена в Европе состоит в том, что владение несколькими
языками является необходимым условием успешной жизнедеятель-
ности человека в современном обществе. Это не только способность
говорить на нескольких языках, но это еще и особый тип мышления,
впитывающий в себя культурные ценности разных народов, мышле-
ние, открытое к диалогу. Два и более языка обычно бывают сформиро-
ваны у человека в разной степени, поскольку сферы действия языков
и представленных ими культур различаются. Поэтому в определении
билингвизма и  мультилингвизма отсутствует требование абсолютно
свободного владения языками. Если один из  языков не мешает дру-
гому, а  другой развит в  высокой степени, близкой к  владению язы-
ком у носителя языка, то говорят о сбалансированном би- или муль-
тилингвизме. Тот язык, которым человек владеет лучше, называется
доминантным; это не обязательно первый язык по времени усвоения,
так как соотношение языков может изменяться в  пользу того или
иного языка, если создаются соответствующие условия: один из язы-
ков может частично деградировать, отрицательно влиять на другой
(интерференция), перестать развиваться, вытесняться из  употребле-
ния (смена языка), забыться, выйти из употребления или, наоборот,
возрождаться, поддерживаться (сохранение), доводиться до уровня
официального признания и употребления. Это касается не только от-
дельных людей, но и языковых сообществ, именно поэтому языковая
политика Совета Европы направлена как на сохранение лингвистиче-
ского разнообразия в Европе, так и на распространение и взаимопро-
никновение европейских языков и культур.
Стоит отметить еще раз важность и  терминологического опре-
деления языка. Обозначение языка является также и политически об-
условленным: мы говорим о языке или диалекте, национальном языке,
языке большинства или меньшинства, родном или первом языке и т. д.
Человек, владеющий двумя и более языками, традиционно считается
би-, или мульти-, или плюрилингвальным. Термин, закрепленный
в документах Совета Европы, подчеркивает различие между мульти-
и  плюрилингвальным пользователем и  подчеркивает тот факт, что
изучение языков на протяжении всей жизни является непрерывным
образовательным процессом, направленным на достижение различ-
ных целей и  уровней владения языком. Отсюда следует и  проблема
би- и мультилингвального образования и разработки соответствую-
щей мультилингвальной образовательной политики.

86
1.3.  Современные положения теории тестирования

Интересно отметить, что феномен мультилингвизма в  мире не


является исключением из правила. Недавние исследования продемон-
стрировали, что развитие в  би- и  мультилингвальной среде способ-
ствует развитию когнитивных способностей как у детей, так и у пожи-
лых людей и укреплению памяти и здоровья в целом. С этой точки зре-
ния мультилингвальная коммуникация становится самой постоянной
и действенной тренировкой для мозга и способствует долголетию.
Таким образом, плюрилингвизм и мультилингвизм являются по-
вседневной реальностью в европейском обществе и отражают осново-
полагающую концепцию в  современном образовательном простран-
стве — концепцию обучения на протяжении всей жизни в условиях
поликультурного мира.

1.3.4. ЛИНГВИСТИЧЕСКИЕ ПРОЕКТЫ СОВЕТА ЕВРОПЫ

С исчезновением границ между европейскими государствами


и  увеличением возможностей для граждан перемещаться из  одной
страны в другую с целью поиска места работы и учебы возникла острая
необходимость выявить соответствие их квалификации, полученной
в  одной стране, требованиям к  квалифицированному специалисту
в другой стране. Необходимо точно знать, что подразумевается под тем
или иным уровнем владения языком в различных странах, т. е. какими
умениями и навыками должен обладать владелец сертификата о соот-
ветствующем языковом уровне, претендующий на определенную по-
зицию, и  каким образом можно выявить соответствие между квали-
фикациями в области языка, полученными в разных странах Европы.
Для достижения этой цели специалистам в области языка в раз-
личных европейских странах необходимо было работать вместе, в ре-
зультате чего были разработаны соответствующие механизмы для
описания и сравнения экзаменационных требований в области ино-
странного языка.
Языковой департамент Совета Европы в свое время разработал
ряд преемственных проектов, формирующих современную языковую
политику.
1971 г.: «Система обучения взрослых иностранным языкам». Со-
гласно этому проекту в программу народных школ в Европе были вве-
дены программы изучения иностранных языков для взрослых.
1975  г.: разработка порогового уровня (Threshold Level) для ан-
глийского языка.

87
Глава 1.  Общие вопросы тестологии

1976  г.: разработка порогового уровня (Niveau-Seuil) для фран-


цузского языка.
Эти проекты дали возможность четко разделить обучение ино-
странным языкам на этапы и сделать освоение языков мотивирован-
ным.
1977–1981  гг.: проект №  4  «Современные языки». Особое место
в этом проекте занимает изучение исчезающих языков, таких как ре-
тороманский и швейцарский.
1982–1987 гг.: проект № 12 «Изучение и преподавание современ-
ных языков в целях общения». Проект включал принципы коммуни-
кативного подхода:
•• направленность на обучаемого и его языковые потребности;
•• язык — инструмент коммуникации;
•• коммуникативная компетенция языковая + социолингвисти-
ческая + дискурсивная + стратегическая + социокультурная +
социальная;
•• когнитивная психология;
•• обучаемый — активный партнер по общению;
•• преподаватель — эксперт в языке и искусстве коммуникации;
•• благоприятная психологическая атмосфера;
•• аутентичные материалы;
•• ТСО и наглядность;
•• модульная организация содержания и процесса обучения;
•• спиралевидное прогрессирование;
•• реабилитация родного языка;
•• широкое использование игр, имитаций, проблемных задач
и т. п.;
•• работа в диадах, триадах, малых и средних группах;
•• лояльное отношение к ошибкам.
Этот проект значительно способствовал развитию методики пре-
подавания языков.
1989–1996 гг.: проект «Изучение языков и европейское граждан-
ство». Основой создания этого проекта стали эмиграционные процес-
сы в Европе.
1991  г.: «Общеевропейские компетенции владения иностран-
ным языком: изучение, преподавание, оценка»114 (английская версия
114
Общеевропейские компетенции владения иностранным языком: изуче-
ние, обучение, оценка  /  Департамент современных языков Директората

88
1.3.  Современные положения теории тестирования

«Common European Framework of Reference for Languages: Learning,


Teaching, Assessment»115, далее  — CEFR, французская версия «Cadre
europeen commun de reference pour les langues: Apprendre, Enseigner,
Evaluer»). Этот проект унифицировал требования к  обучению ино-
странным языкам в европейских странах.
1993–1996  гг.: «Европейский языковый портфель» («European
Language Portfolio»). Проект разрабатывался несколько лет совместно
с национальными центрами современных языков. Компетентностный
подход к изучению языков потребовал разработки инструмента, по-
зволяющего обучаемому самостоятельно контролировать процесс об-
учения и оценивать свои достижения вне зависимости от используе-
мых при обучении методик и средств. В качестве такого инструмента
был предложен «Европейский языковой портфель», представляющий
собой сборник документов, отражающих процесс изучения языка,
включая возможность самооценки и накопления культурологическо-
го опыта.
Европейский языковой портфель — это личный документ, кото-
рый позволяет обучающемуся оценить собственную языковую ком-
петенцию в различных языках и контакты с другими культурами. Он
включает:
а) языковой паспорт, в  котором отражены языковые навыки,
описанные на основе уровней «Общеевропейских компетен-
ций владения иностранным языком», сведения об изучении
языков и опыте межкультурного общения, перечень сертифи-
катов и дипломов;
б) языковую биографию. В языковой биографии содержатся де-
скрипторы, т. е. параметры, по которым уточняется и оцени-
вается (как пользователем, так и учителем) уровень владения
учащимся иностранным языком. Дескрипторы российского
языкового портфеля применительно к  разным видам рече-
вой деятельности ориентированы по ситуации аутентичного
межкультурного общения. В  языковой биографии учащийся
определяет свой уровень владения изучаемым языком по та-
блице самооценки. Он внимательно осваивает описание ком-

по образованию, культуре и спорту Совета Европы; пер. с англ. под общ.


ред. К. М. Ирисхановой. М.: Моск. гос. лингвистич. ун-т, 2003.
115
Common European Framework of Reference for Languages: Learning, Teach-
ing, Assessment. Strasbourg: Council of Europe, 2001.

89
Глава 1.  Общие вопросы тестологии

муникативных умений в  листах самооценки, затем отмечает


те коммуникативные умения, которыми он, по его мнению,
уже овладел, и те, которыми ему предстоит овладеть;
в) досье, содержащее документы, подтверждающие достижения
обучающегося в области изучения иностранных языков («На
другом языке я могу…»). Европейский языковой портфель по-
зволяет оценить степень способности общаться на иностран-
ном языке. Он позволяет также проинформировать других
о  языковой компетенции обучающегося в  терминах, приня-
тых Советом Европы и  понятных на всем европейском про-
странстве. Портфель поможет объяснить любому, где и  как
обучающийся изучал языки и что он может делать на нерод-
ном языке. Это может быть важно при поступлении на новую
работу или желании учиться в другой стране и т. д. В насто-
ящее время существуют три версии типового портфеля для
трех возрастных групп. На их основе разрабатываются наци-
ональные версии. Российская версия европейского языкового
портфеля, разработанная специалистами из Московского го-
сударственного лингвистического университета, была пред-
ставлена в феврале 2001 г. в Лунде на официальной церемонии
открытия Европейского года языков116.
2002 г.: «Изучение языков на протяжении всей жизни». В проекте
прорабатывались вопросы постуниверситетского и  дистанционного
образования.
Задача программы CEFR — создание в Европе с ее различными
образовательными системами и учреждениями общего информацион-
ного базиса для разработки учебных программ, учебников, оценочной
системы языковых компетенций. С другой стороны, ее целью является
также создание единообразного описания различных знаний, умений
и  навыков по разным языкам (единой коммуникативной компетен-
ции). И здесь кроется более глубокий смысл концепта «многоязычие»:
он означает не только языки во множественном числе, но и умение ис-
пользовать знания в различных языках для своих коммуникативных
целей с учетом связей и взаимодействий этих языков.

116
Европейский языковой портфель для России. М.: Моск. гос. лингвистич.
ун-т; СПб.: Златоуст, 2001.

90
1.3.  Современные положения теории тестирования

1.3.5. ДЕЯТЕЛЬНОСТЬ АССОЦИАЦИИ ТЕСТЕРОВ ЕВРОПЫ (ALTE)

В последние десятилетия тенденция к  объективизации оценки


знаний во всем мире привела к развитию различных технологий тести-
рования. Для координации усилий тестологов разных стран в 1990 г.
была создана Европейская ассоциация языкового тестирования (The
Association of Language Testers in Europe — ALTE), которая вырабаты-
вает, унифицирует и распространяет критерии тестирования в кругу
своих членов, среди которых Датский лингвистический тестовый кон-
сорциум, Институт Гёте, Департамент экзаменов по английскому язы-
ку Кембриджского университета (Cambridge English), Институт Сер-
вантеса и Университет Саламанки, Альянс Франсэз и др. В настоящее
время ассоциация насчитывает в своих рядах 33 члена — университе-
ты, колледжи, тестирующие центры и экзаменационные комитеты —
и представляет 27 языков. Проект CEFR был во многом подготовлен
деятельностью ALTE.
Члены ALTE осуществляют работу в нескольких направлениях:
•• установление единых для всех уровней владения иностран-
ными языками, которые будут признаваться во всех странах
Европы;
•• установление общих стандартов для всех этапов языкового
тестирования  — от технологии составления тестового зада-
ния и  разработки критериев оценки до способа извещения
кандидата о результатах теста;
•• участие в совместных проектах, обмен опытом и новыми иде-
ями.
Первая из этих целей практически полностью направлена на ре-
шение проблем, связанных с трудоустройством иностранцев в разных
странах Европы. Цель установления общих стандартов осуществля-
ется с  помощью долгосрочного проекта «компетенций». На первом
этапе осуществления этого проекта был разработан описательный до-
кумент «Европейские языковые экзамены», который был опубликован
как «Документ 1  ALTE». Он содержит описание основных языковых
экзаменов, предложенных к рассмотрению членами ассоциации ALTE.
Описания представлены таким образом, чтобы было ясно, признают-
ся ли результаты экзаменов как достаточные для присвоения необхо-
димой квалификации в области языка, дающей право на работу или
получение образования, и для оценки навыков владения языком в за-
висимости от уровня.

91
Глава 1.  Общие вопросы тестологии

Второй цели ALTE — установлению общих стандартов для всех


этапов языкового тестирования — посвящен второй документ ALTE
«Европейские экзаменационные системы». В данном документе опи-
сывается, каким образом разрабатывалась система экзаменов, а  так-
же применяемые методы контроля качества. Этот документ включает
и  «Унифицированный кодекс», которым должны руководствоваться
все члены ассоциации.
«Европейские языковые экзамены» (первый документ ассоциа-
ции ALTE) не только обеспечивают информацией для осуществления
своих целей, но  и  играют роль описательного фундамента для буду-
щего определения компетенции, уровней владения иностранным язы-
ком, на котором будут строиться экзаменационные требования, пред-
лагаемые разработчиками ассоциации ALTE. 
Система ALTE (ALTE Framework) состоит из  шести уровней  —
от нулевого до пятого, для каждого из которых существует описание
того, что должен знать и  уметь, какими навыками должен обладать
студент, изучающий иностранный язык.
По мере развития системы уровней ALTE создавался проект
«Can-do», или DIALANG117. Проект представляет собой систему, кото-
рая определяет, какими знаниями иностранного языка на каком уров-
не должен обладать студент в  каждом из  аспектов владения языком
(аудирование, говорение, чтение, письмо). Система «Саn-do» включа-
ет около 400 утверждений, которые подразделяются на 40 категорий,
где описывается, что пользователь языка может делать в соответству-
ющем языке, на соответствующем уровне.
Проект DIALANG является дополнением к  системе CEFR для
проведения различного ряда диагностических мероприятий. Здесь
основное внимание уделяется утверждениям, используемым для са-
мооценки, и процедуре их калибровки, выполненной в ходе создания
системы DIALANG. Данный проект также включает две взаимос-
вязанные описательные шкалы, которые основываются на системе
CEFR и  используются для информирования тестируемых учащихся
о  результатах и  для объяснения этих результатов. Дескрипторы, ис-
пользуемые в рамках этого проекта, были шкалированы и приведены
в соответствие с уровнями «Общеевропейских компетенций…» Если

117
Zhang S., Thompson N. DIALANG: A Diagnostic Language Assessment System:
(review) // The Canadian Modern Language Review. 2004. Vol. 61, No. 2. P. 293.
URL: http://muse.jhu.edu/article/177002 (дата обращения: 10.10.2016).

92
1.3.  Современные положения теории тестирования

уровень языковой компетентности учащегося продвинутый, то веро-


ятность его правильного ответа на простой вопрос очень высока. Ве-
роятность же правильного ответа на вопрос продвинутого уровня для
начинающего — мала.
DIALANG  — это онлайн-система оценки, предназначенная для
изучающих иностранные языки и желающих получить диагностиче-
скую информацию относительно своего уровня владения языком.
Система включает листы самооценки, языковые тесты и  мате-
риалы для объяснения полученных результатов, подготовленные
на 14  европейских языках: датском, голландском, английском, фин-
ском, французском, немецком, греческом, исландском, ирландском,
итальянском, норвежском, португальском, испанском и  шведском.
DIALANG можно бесплатно получить из Интернета.
Система оценки DIALANG и описательные шкалы, используемые
для сообщения результатов пользователям, непосредственно основа-
ны на системе «Общеевропейских компетенций…» Дескрипторы для
самооценки, используемые в системе DIALANG, были в основном за-
имствованы из системы «Общеевропейских компетенций…» и адап-
тированы к специфическим потребностям данной системы.
DIALANG предназначена для взрослых пользователей, желаю-
щих определить свой уровень владения иностранным языком и полу-
чить подробное описание сильных и слабых сторон своих языковых
умений. Эта система также позволяет учащимся понять, каким об-
разом они могут улучшить свои языковые навыки, и более того, она
формирует осознанное представление о таких понятиях, как изучение
иностранных языков и уровень владения языком. В рамках этой си-
стемы сертифицирование не производится.
Основными пользователями системы DIALANG являются, та-
ким образом, учащиеся, изучающие язык самостоятельно или в рам-
ках учебного заведения. Однако преподаватели иностранных языков
также могут найти полезную для себя информацию в рамках системы
DIALANG118.

118
Dialang.org: [сайт]. URL: http://www.dialang.org/altindex.htm (дата обраще-
ния: 10.10.2016).

93
Глава 1.  Общие вопросы тестологии

1.3.6. УРОВНИ ВЛАДЕНИЯ ИНОСТРАННЫМ ЯЗЫКОМ

Общеевропейская система определения уровней владения ино-


странным языком и  «Языковой портфель…» являются, таким обра-
зом, звеньями единой образовательной цепи, облегчающей сравнение
и  корреляцию национальных систем лингвистического образования
в Европе.
В рамках новой системы определения уровня владения ино-
странным языком, разработанной Советом Европы с  целью унифи-
кации компетенций учащихся, были выявлены четкие дескрипторы,
позволяющие определить уровень языковых компетенций учащихся
на каждом этапе. Основными принципами, в соответствии с которы-
ми разработаны спецификации, являются уровневый подход к пред-
ставлению лингводидактических единиц и коммуникативно-ориенти-
рованный подход к отбору содержания обучения. При этом аппарат
формирования текста на уровне предложений, а именно грамматика
и лексика, не рассматривается как цель обучения сами по себе, но яв-
ляется средством для выполнения коммуникативных целей. При раз-
работке европейской системы уровней проводились обширные иссле-
дования в разных странах, методики оценки опробовались на практи-
ке. В результате пришли к согласию по вопросу о количестве уровней,
выделяемых для организации процесса изучения языка и оценки сте-
пени владения им.
Существует шесть уровней, которые представляют собой более
низкие и более высокие подуровни в классической трехуровневой си-
стеме, включающей в  себя базовый, средний и  продвинутые уровни
(А, В и С). Схема уровней построена по принципу последовательного
разветвления (А1, А2, В1, В2, С1, С2). Далее добавляются промежуточ-
ные подуровни (A2+, B1+, B2+).
Общая шкала предусматривает владение следующими навыками
и умениями соответственно уровням.

Может четко формулировать свои мысли, подчеркнуть самое важное, ис-


C2 ключить двоякое понимание, при этом свободно использует самый широ-
кий спектр языковых средств.
Может легко и свободно выбирать из широкого спектра языковых средств
C1
наиболее адекватные способы выражения своих мыслей.

94
1.3.  Современные положения теории тестирования

Может четко выразить свою мысль, не испытывая при этом видимых за-
труднений. Владеет запасом языковых средств, достаточных для четкого
B2 описания явлений и предметов, выражения точки зрения, построения аргу-
ментации. При этом не испытывает видимых затруднений в подборе слов,
использовании некоторых сложных моделей предложений.
Имеющийся запас языковых средств позволяет дать без подготовки описа-
ние нетипичной ситуации, достаточно четко изложить суть проблемы или
вопроса, выразить свои мысли на абстрактную тему (например, связанную
с культурой, наукой, кино и т. д.).
Словарного запаса хватает для общения на повседневные темы (семья, ра-
B1 бота, увлечения, последние события), однако испытывает трудности при
подборе нужного слова, повторяется, иногда с  трудом формулирует свои
мысли.
Владеет базовым словарным запасом, достаточным для общения в простей-
ших повседневных ситуациях, однако испытывает затруднения в  выборе
слов, что существенно ограничивает возможность общения.
Может кратко высказаться на простейшие темы: рассказать о  себе, своих
повседневных занятиях, изложить просьбу, задать вопрос. Может расска-
зать о себе и других, сообщать, чем они занимаются, где живут, что у них
A2 есть, используя простейшие грамматические конструкции, заученные слова
и словосочетания.
Владеет ограниченным числом коротких заученных фраз для общения в по-
вседневных ситуациях.
Владеет весьма ограниченным запасом простых выражений, позволяющих
A1
сообщить информацию о себе, попросить / спросить что-либо.

Эта шкала наглядно демонстрирует критерии оценки владения


общим навыком изложения мыслей и  обмена информацией. Крите-
рии оценки представлены в виде дескрипторов.
Дескриптор в соответствии с формулировкой, данной в «Обще-
европейских компетенциях…», представляет собой определение
уровней владения языком, благодаря которому можно получить бо-
лее четкое представление о  языковых навыках учащихся на различ-
ных этапах, а также сформулировать более реальные и понятные цели
учебного процесса.
Различают рейтинговые (или оценочные) шкалы, ориентирован-
ные на оценку, дескрипторные шкалы, ориентированные на пользо-
вателей языка, и шкалы, ориентированные на разработчиков тестов.
Формулировки пользовательских дескрипторов (DIALANG, Язы-
ковой портфель), ориентированные на самооценку, обычно имеют по-

95
Глава 1.  Общие вопросы тестологии

зитивный характер и дают информацию о том, что учащийся может


делать даже на самых низких уровнях («Понимаю несложную англий-
скую речь…», «Могу писать простые предложения», и т. д.). Оценоч-
ные или рейтинговые шкалы определяют процесс внешней объек-
тивной оценки, подчеркивают, насколько хорошо учащийся владеет
языком, и  часто имеют отрицательную формулировку («Сочинение
невозможно признать отвечающим критериям», «Организация струк-
туры работы очень слабая или отсутствует совсем» и т. д.).
Дескрипторы шкал, ориентированных на разработчиков тестов,
представлены как коммуникативные задачи, которые учащийся дол-
жен выполнять в ходе тестирования. Шкалы этого типа, или перечни
спецификаций, также основаны на том, что умеет делать учащийся.
Их цель  — способствовать разработке тестов для соответствующих
уровней.
Система ALTE состоит из 5 уровней. Уровни описываются как со-
вокупность навыков и умений (CAN-DO statements), которая:
•• определяет уровень с  точки зрения того, что пользователь
языка может делать на каждом уровне в соответствии с кри-
териями, описанным в CEFR;
•• облегчает понимание пользователей языка, что означает каж-
дый уровень в  соотнесении с  тем, что он реально может де-
лать.
Значимые черты каждого уровня ALTE состоят в следующем:
•• уровень 5 (хороший пользователь): способность справлять-
ся с  языковым материалом, который требует академической
подготовки и обдумывания, и использовать язык для дости-
жения своих коммуникативных целей на уровне, который
в  некоторых аспектах может быть более продвинутым, чем
язык среднего носителя языка;
•• уровень 4  (компетентный пользователь): способность об-
щаться, когда основное внимание уделяется качеству процесса
общения с точки зрения уместности, внимания к собеседнику
и способности иметь дело с незнакомыми темами;
•• уровень 3 (независимый пользователь): способность почти
всегда достигать коммуникативных целей и  выражать свое
мнение по ряду тем;

96
1.3.  Современные положения теории тестирования

•• уровень 2 (пороговый пользователь): способность выразить


мысль в знакомых ситуациях и, в общем, справиться с незна-
комой информацией;
•• уровень 1  (предпороговый пользователь): способность
справляться с простой информацией и формирование умения
выразить мысль в знакомых условиях общения;
•• уровень выживания: способность выражать мысль и  обме-
ниваться информацией простым способом.
Эта система освещает 4 области применения языка — общую, со-
циально-туристическую, сферу труда и, наконец, сферу образования.
Система включает 4 таблицы. Каждая таблица иллюстрирует навыки
владения видами речевой деятельности (рецептивными — аудирова-
ние, чтение и продуктивными — говорение, письмо) на определенном
уровне. Таблицы различаются между собой по цели, которая ставится
перед пользователями языка:
•• общее владение языком;
•• общее владение (социальный и туристический аспект);
•• общее владение с целью работы;
•• общее владение с целью обучения.
В «Общеевропейских компетенциях…» вводится шкала владе-
ния языками из 6 уровней, основанная на коммуникативном подходе
(оценки по различным видам речевой деятельности).
Соотношение шкалы ALTE со шкалой CEFR представлено
в табл. 4.
Таблица 4
Соотношение уровней CEFR и ALTE

Шкала Уровни
CEFR A1 A2 B1 B2 C1 C2
Уровень
ALTE Уровень 1 Уровень 2 Уровень 3 Уровень 4 Уровень 5
выживания

Каждый из шести уровней CEFR является подуровнем более об-


щего уровня структуры (см. рис. 3).
Итак, прогресс в развитии способностей учащегося пользоваться
средствами языка может быть калиброван и  представлен в  виде об-
щей шкалы (A1–C2).

97
Глава 1.  Общие вопросы тестологии

A B C
Элементарное владение Самостоятельное Свободное владение
владение

A1 A2 B1 B2 C1 C2
Уровень Предпорого- Пороговый Пороговый Уровень Уровень
выживания вый уровень уровень продви- професси- владения
нутый онального в совершен-
уровень владения стве

Рис. 3. Уровни владения языком по шкале CEFR. 

1.3.7. КОММУНИКАТИВНАЯ КОМПЕТЕНЦИЯ: СТРУКТУРА, СОДЕРЖАНИЕ, ОЦЕНКА

Что такое коммуникативная компетенция? Каким образом ре-


зультаты изучения видов компетенции влияют на эффективность об-
учения иностранному языку? Что такое уровень коммуникативной
компетенции и как его определить? Эти и другие вопросы, связанные
с  видами компетенции личности, часто обсуждаются методистами
разных стран.
Использование языка и  его изучение включают действия чело-
века, в  процессе выполнения которых он развивает ряд компетен-
ций: общую (неязыковую, General competences) и  коммуникативную
(языковую, Communicative language competence). При этом под компе-
тенциями понимается сумма знаний, умений и  личностных качеств,
которые позволяют человеку совершать различные действия. Они
обеспечивают решение задач в различных условиях с учетом различ-
ных ограничений и  реализуются в  видах деятельности и  процессах
(действиях), направленных на порождение и / или восприятие текстов
в связи с определенными темами и сферами общения и с применением
соответствующих стратегий.
Для выполнения конкретных задач и осуществления различных
видов речевой деятельности в ситуациях общения человек использует
целый ряд компетенций, являющихся результатом его предыдущего
жизненного опыта. Все виды компетенций помогают человеку раз-
вить у себя умение общаться и, следовательно, могут рассматривать-
ся как составляющие коммуникативной компетенции. Однако, чтобы
получить более полное представление о так называемых неязыковых
и  собственно языковых компетенциях, было бы целесообразно рас-
смотреть их по отдельности.

98
1.3.  Современные положения теории тестирования

Общие компетенции включают:


•• декларативные знания (savoir) (знания о мире, социокультур-
ные знания, язык жестов, правила этикета, выполнение риту-
алов, межкультурные знания), умения и  навыки (know-how)
(практические умения и  навыки  — навыки общественной
жизни: умение действовать в соответствии с традициями дан-
ного культурного контекста, межкультурные навыки и  уме-
ния — способность соотносить свою собственную и иноязыч-
ную культуры);
•• экзистенциальную компетенцию (взгляды и  отношения, мо-
тивацию, ценности, тип познавательной способности, лич-
ностные качества);
•• познавательные способности (понимание механизмов язы-
ка и процессов коммуникации, общие фонетические навыки
и умения, учебные умения, эвристические умения — способ-
ность учащегося познавать новое и использовать другие ком-
петенции в учебных ситуациях).
Идея компетентностного подхода исходит из того, что языковые
программы должны в большей степени учитывать различный инди-
видуальный языковой опыт обучающихся.
Такой подход к изучению языков потребовал разработки инстру-
мента, позволяющего обучаемому самостоятельно контролировать
процесс обучения и оценивать свои достижения вне зависимости от
используемых при обучении методик и средств. В качестве такого ин-
струмента был предложен «Европейский языковой портфель» (о нем
говорилось в разделе 1.3.4), представляющий собой сборник докумен-
тов, отражающих процесс изучения языка, включая возможность са-
мооценки и накопления культурологического опыта.
Впервые понятие «коммуникативная компетенция» появилось
в американской социолингвистике, автором его является Д. Хаймс. До
этого Н. Хомский уже исследовал и теоретически обосновал отноше-
ние между языковой компетенцией и  языковым употреблением. По
Хомскому, лингвистическая компетенция — это идеальное знание, на
базе которого носитель языка в состоянии «порождать» грамматиче-
ски правильные предложения на данном языке и судить о том, являет-
ся ли данное высказывание принадлежащим его языку119.
119
См.: Хомский  Н. Язык и  мышление  /  пер. с  англ. Б. Ю. Городецкого. М.:
Изд-во МГУ, 1972.

99
Глава 1.  Общие вопросы тестологии

Эта теория, где ведущей была названа лингвистическая компе-


тенция, явилась базой для грамматико-переводного метода обучения.
В  основу была положена собственно языковая компетенция. Одна-
ко достаточно скоро стало ясно, что ориентация на обучение только
языковой компетенции недостаточна. «Беда» данного этапа состояла
в том, что за границы методики обучения иностранным языкам ушло
чуть ли не самое главное — употребление, использование этого иде-
ального знания в реальной жизни.
В 1970-х годах понятие коммуникативной компетенции расши-
ряется. Так, Хаймс определяет ее как совокупность знаний и навыков
говорящего об использовании языка120. Это было первым шагом «ком-
муникативной ориентации» в обучении иностранным языкам.
К речевой деятельности начали подходить с позиции целей этой
деятельности и  стали выделять типы операций, языковые средства,
используемые в актах речи, а также результат деятельности, «притом
не только в форме речевого высказывания, но и в форме дискурса или
текста»121.
Были разведены понятия лингвистической и  коммуникативной
компетенции. Коммуникативная компетенция стала определяться как
«сумма языковых навыков и знаний говорящего–слушающего об ис-
пользовании языка в  изменяющихся ситуациях и  условиях речи»122.
Это определение можно назвать предварительной дефиницией, кото-
рая с позиций сегодняшнего дня кажется не совсем корректной. Так,
«Словарь методических терминов» представляет коммуникативную
компетенцию как «способность решать средствами иностранного
языка актуальные для учащегося и общества задачи общения из бы-
товой, учебной, производственной и культурной жизни; умения уча-
щихся пользоваться фактами языка и  речи для реализации целей
общения»123.

120
Himes  D. Foundations in Sociolinguistics: An Ethnographic Approach.
Philadelphia: University of Pennsylvania Press, 1974.
121
Кубрякова  E. С. Общие замечания о  моделях порождения речи и  путях
вербализации мысли в речепорождающем процессе // Человеческий фак-
тор в языке: Язык и порождение речи. М., 1991. С. 25.
122
Федорова  Л. Л. К  понятию коммуникативной компетенции: автореф.
дис. … канд. филол. наук. М., 1980. С. 7.
123
Азимов  Э. Г., Щукин  А. Н. Словарь методических терминов: (теория
и практика преподавания языков). С. 109.

100
1.3.  Современные положения теории тестирования

В конце XX в. ученые начали разрабатывать модели коммуника-


тивной компетенции и изучать механизмы их формирования. В связи
с этим понятие «компетенция» стали рассматривать с различных то-
чек зрения — социологической, психологической, психолингвистиче-
ской, лингвистической. Исследователи выявляли различные составля-
ющие коммуникативной компетенции и высказывали разные мнения
в отношении их количественного и качественного состава. Так, можно
найти описание языковой, лингвистической, предметной, професси-
ональной, лингвострановедческой, страноведческой, социолингви-
стической, речевой, дискурсивной, социальной, социокультурной,
культурологической, прагматической, стратегической, поведенческой
компетенций как составляющих системной организации коммуника-
тивной компетенции. Разнообразие представлений говорит о много-
аспектности проблемы и  о  неоднозначности ее решения. Нет необ-
ходимости оспаривать, что сам по себе феномен «коммуникативная
компетенция» есть величина постоянная. Вероятно, различия в пред-
ставлениях о составляющих определены методической установкой.
В настоящее время изучение коммуникативной компетенции
идет в нескольких направлениях. Прежде всего несомненный интерес
и методическую важность продолжает представлять изучение струк-
туры коммуникативной компетенции, определение составляющих ее
частных компетенций и  их иерархии внутри общей системы компе-
тенции. Следующий вопрос — один из самых актуальных и интерес-
ных в методике — контроль и оценивание коммуникативной компе-
тенции, и он, несомненно, связан с первым вопросом. Для объектив-
ного оценивания необходимо точно определить объекты контроля,
а для этого необходим анализ умений, входящих в каждую составляю-
щую коммуникативной компетенции.
Еще одна интересная задача — характеристика и методика анали-
за уровней коммуникативной компетенции, а также их соотношение
в разных видах речевой деятельности.
Этому широкому кругу проблем посвящены «Общеевропейские
компетенции владения иностранным языком: изучение, обучение,
оценка». Согласно данной работе, учащийся для выполнения своих
задач использует общие компетенции (декларативные знания, неязы-
ковые умения и навыки, экзистенциальную компетенцию и познава-
тельные способности), а также коммуникативные компетенции (язы-
ковую, социолингвистическую, прагматическую).

101
Глава 1.  Общие вопросы тестологии

Коммуникативная языковая компетенция состоит из  лингви-


стического, социолингвистического и прагматического компонентов,
каждый из которых, в свою очередь, включает в себя знания, умения
и навыки. В рамках лингвистической компетенции выделяются: лек-
сическая, грамматическая, семантическая, фонологическая компе-
тенции. Значимость лингвистической компетенции очевидна, но  ее
ведущая роль при оценивании общей коммуникативной компетенции
методистами часто подвергается сомнению.
Еще одна «крупная» коммуникативная компетенция по «Обще-
европейским компетенциям…» — прагматическая. Ее составляют:
а) компетенция дискурса (знание правил построения высказы-
вания, их объединение в текст);
б) функциональная компетенция (умение использовать выска-
зывания для выполнения различных коммуникативных функ-
ций);
в) компетенция схематического построения речи (умение после-
довательно строить высказывание в соответствии со схемами
взаимодействия (см. рис. 4).

Коммуникативная компетенция

Лингвистическая Прагматическая Социолингвистическая

Компетенция Функциональная Компетенция


дискурса компетенция схематического
построения речи

Рис. 4. Виды компетенции.

С нашей точки зрения, основной и, возможно, интегрирующей


в  себе две остальные среди данных составляющих является дискур-
сивная компетенция. Авторы исследования декларируют наличие
трех компетенций внутри прагматической, однако противоречия в их
описании сами говорят в  пользу существования именно дискурсив-
ной компетенции как ведущей или единственной. Так, компетенция
схематического построения речи оказалась вовсе не описанной в ка-
честве отдельно существующей. Ее характеристики и параметры оцен-
ки можно найти в  описании функциональной компетенции (имеет-
ся в  виду умение использовать модели социального взаимодействия

102
1.3.  Современные положения теории тестирования

в процессе общения, которое в методических целях может быть пред-


ставлено в виде схем).
Говоря о функциональной компетенции, авторы утверждают, что
это «умение использовать устные и  письменные высказывания для
выполнения конкретных функций», а далее выделяют умения, харак-
теризующие уровень развития данной компетенции (микрофункции
и макрофункции). Например, умение найти и сообщить информацию,
выразить собственное мнение, убедить и др., а также функционально
использовать устную и  письменную речь, состоящую из  последова-
тельности предложений: описание, повествование, рассуждение, ком-
ментарий и др.124
Возможно, именно данный вид компетенции «отвечает» за про-
явление личностных особенностей в речевом поведении. Любое вы-
сказывание (как развернутое, так и  краткое, элементарное) строит-
ся с  учетом цели коммуникации и  разворачивается в  соответствии
с  коммуникативной стратегией говорящего. Функциональная ком-
петенция включает в себя стратегические умения — умение выбрать
правильную стратегию и тактику речевого поведения из уже извест-
ных стратегий и тактик или создать свою собственную, а также ком-
пенсаторные умения. Существуют исследователи, которые выделяют
стратегическую и  компенсаторную компетенции как самостоятель-
ные. С  нашей точки зрения, они обе (или одна  — функциональная)
есть инструмент, необходимый для построения дискурса.
Критериями оценки уровня дискурсивной компетенции являют-
ся: логичность, связность, целостность высказывания, а также умение
полно и точно выразить информацию, необходимую для достижения
коммуникативной цели.
Третья коммуникативная компетенция, рассматриваемая в
«Общеевропейских компетенциях…» как составляющая коммуни-
кативной компетенции,  — социолингвистическая. В  социолингви-
стическую компетенцию входят знания и  умения, необходимые для
эффективного использования языка в социальном контексте: знание
лингвистических маркеров социальных отношений, правил вежли-
вости, народной мудрости (выражений, обобщающих многовековой
опыт народа), умение использовать регистры общения, способность
распознавать диалект и акцент.

Общеевропейские компетенции владения иностранным языком…


124

С. 124–125.

103
Глава 1.  Общие вопросы тестологии

Значимость социолингвистической компетенции подтвердил


анализ успешности обучения русскому языку в последние годы.
Дело в  том, что настоятельное следование принципу «обучить
говорить» на основе коммуникативной методики имело свои недо-
статки: в процессе обучения часто недостаточное внимание уделялось
развитию социокультурного компонента общения. Отсутствие же или
недостаточность знаний (особенно социокультурного и предметного
характера) при сравнительно высоком уровне собственно лингвисти-
ческой компетенции очень портит картину общей коммуникативной
компетенции говорящего, заставляет говорить о ее низком уровне.
Приведем в качестве примера реплику студента при выполнении
задания «Пригласите делового партнера провести вместе вечер в ка-
ком-либо интересном месте»: «Я намереваюсь пригласить вас в театр.
Не будете ли любезны согласиться?» (студент из Японии, в России на-
ходится одну неделю, сдал тест по грамматике с результатом 93 %).
Мы видим типичную для обучавшегося самостоятельно в неязы-
ковой среде ошибку — форма выражения интенции взята из письмен-
ного источника (из произведения литературы XIX  в.) и  не подходит
к названной ситуации общения ни по стилистической форме, ни по
лексическому наполнению высказывания.
Социокультурная и  социолингвистическая компетенции  — те
частные компетенции, от низкого уровня развития которых страда-
ет общая компетенция: человек может осуществлять общение и  вы-
ражать свои потребности, но также может быть и неправильно понят.
То же можно сказать и о предметной компетенции. Ее значимость
легко выявляется при оценивании уровня компетенции на иностран-
ном языке, ибо она «представляет собой содержательный, денотатив-
ный план высказывания»125. В  «Общеевропейских компетенциях…»
этот вид отнесен к общим компетенциям человека.
Если образно представить общую коммуникативную компетен-
цию в  виде дерева, то лингвистическая компетенция займет место
корней — без развитой корневой системы не вырастет из ростка де-
рево. Ветвями кроны будут социокультурная и социолингвистическая
компетенция (чем больше социокультурных знаний имеет языковая
личность, тем больше ветвей на дереве). Листья — предметная ком-

Изаренков  Д. И. Базисные составляющие коммуникативной компетенции


125

и их формирование на продвинутом этапе обучения студентов-нефило-


логов // Русский язык за рубежом. М., 1990. № 4. С. 56.

104
1.3.  Современные положения теории тестирования

петенция, и их количество и яркость зависят от количества и качества


знаний человека о предмете (теме, проблеме) общения. Но самое глав-
ное в этом дереве — ствол. Его высота и прочность — уровень дискур-
сивной компетенции, а кора ствола — функциональная компетенция.
Человек не сможет продемонстрировать знания о предмете и культу-
роведческие знания без знания языка и  умения выразить информа-
цию — тогда ветви и листья не смогут никому показать свою красоту,
завянут.
Можно долго развивать образное понимание роли коммуника-
тивной компетенции в эволюции языковой личности. Для нас важно
показать ведущую, стволовую роль дискурсивной компетенции в це-
лостном организме коммуникативной компетенции и  зависимость
остальных видов компетенции от нее. Об этом писал еще С. И. Берн-
штейн, говоря об уровне языковой способности. Он выделял в рече-
вой деятельности ведущий уровень и ряд фоновых уровней. Ведущий
уровень, по Бернштейну, адекватен цели деятельности, а  фоновые
уровни обеспечивают те или иные «технические» компоненты дея-
тельности126.
Для того чтобы подтвердить нашу теорию о ведущей роли одной
из  коммуникативных компетенций и  определить правильность вы-
бора объектов контроля компетенции при ее оценивании, нами был
проведен методический эксперимент. Тридцати преподавателям рус-
ского языка как иностранного было предложено оценить ответ двух
кандидатов при выполнении задания теста второго уровня. (Зада-
ние: подробно описать все, что вы увидите в видеофрагменте, и сде-
лать предположение, почему такая ситуация возникла в жизни героя.
Фрагмент взят из фильма «Ирония судьбы».)
Представляем запись ответа одного из кандидатов:

Кандидат: Вот наш герой здесь  /  наш парень  /  скажем так  /  он,
наверное, как- то был пьяный  /  вшел в  эту квартиру  /  пото-
му что / когда она лилила воду / как-то он так / его реакция
была / как-то пьяный просто / разговаривать он как не в состо-
янии // Э-э / а девушка как-то / на Новый год одна / на Новый
год одна / Она хотела бы / как-то / с кем-то отметить / поэтому
она не звонила например в полицию в милицию какие-то / она
могла звонить / У нее было время / после того как она видела //

См.: Бернштейн  С. И. Вопросы обучения произношению применительно


126

к преподаванию русского языка иностранцам. М., 1937.

105
Глава 1.  Общие вопросы тестологии

Тестор: А где действие происходит / вообще //


К. : У нее / дома
Т. : Вы уверены?
К. : Я? // Сто процентов //
Т. : Скажите / а как такая ситуация могла все-таки возник-
нуть / еще раз / вот с вашей точки зрения / по какой причи-
не / Вот / Основная причина /
К. : Мужчина пьян  /  вошел в  квартиру  //  Думал  /  что
свою // Понимаете / этот процесс часто //
Т. : Понятно / Фильм смотрели? «Ирония судьбы».
К. : Нет.

Ответы кандидатов оценивались по рейтерской таблице (табл. 5).


Она определяет объекты контроля в соответствии с описаниями пара-
метров коммуникативной компетенции, и представленных в «Обще-
европейских компетенциях…»127, при этом нами учитываются только
те умения, которые подвергались проверке в данном задании. Столбец
1  в  табл.  5 не был показан преподавателям, он введен позже, чтобы
показать, к  какой компетенции по «Общеевропейским компетенци-
ям…» относятся те или иные параметры нашей таблицы 5.
Таблица 5
Рейтерская таблица для оценки компетенций

Компетенция Умения Баллы


Умение описывать ситуацию и действующих
лиц.
Полнота:
→ умение развить тему (логичность, четкость,
0 1 2 3 4 5
последовательность и беглость изложения темы
Развитие темы высказывания)
(дискурсивная → умение построить высказывание
0 1 2 3 4 5
компетенция) повествовательного или описательного характера
Точность:
→ умение достоверно передать необходимую
0 1 2 3 4 5
информацию
→ умение выделить наиболее важную
0 1 2 3 4 5
информацию

127
Общеевропейские компетенции владения иностранным языком…
С. 117–123.

106
1.3.  Современные положения теории тестирования

Умение сделать предположение:


→ умение строить развернутые высказывания
Беглость и понятно излагать свои мысли в соответствии 0 1 2 3 4 5
устной речи с требованиями ситуации
(функциональная Умение обосновать предположение:
компетенция)
→ умение строить развернутые высказывания
и понятно излагать свои мысли в соответствии 0 1 2 3 4 5
с требованиями ситуации
Композиционная структура и форма:
Целостность
→ умение создать развернутое логичное
и связность 0 1 2 3 4 5
высказывание с четкой структурой
(дискурсивная
компетенция) → умение использовать средства связи при
0 1 2 3 4 5
построении логичных и понятных высказываний
Языковые средства:
→ словарный запас 0 1 2 3 4 5
Лингвистическая
компетенция → грамматическая правильность речи 0 1 2 3 4 5
→ владение фонологией (четкость
0 1 2 3 4 5
произношения)
Социолингви- → знание основных правил и стереотипов
стическая общения в ситуациях, умение выбрать регистр 0 1 2 3 4 5
компетенция общения в соответствии с ситуацией

По результатам анализа оценок ответов кандидатов можно ска-


зать следующее.
Преподаватели со стажем работы менее 5  лет в  целом оценили
ответ кандидата на 2 (7 из 10 человек) и 3, преподаватели со стажем
более 10  лет  — на 3  и  4. Наибольший разброс оценок представлен
в группе преподавателей со стажем от 5 до 10 лет. Ответу даны оцен-
ки 4, и 3, и 2, и даже 0. Итак, данные эксперимента выявляют очень
серьезный разброс в  оценках ответа студента (от 0  до 4!). Причины
такого неадекватного оценивания еще предстоит анализировать. Нам
же в данном случае требовалось определить среднюю оценку, которую
дали этому кандидату все участвовавшие в  экспериментальном оце-
нивании преподаватели, и сравнить ее с «тестовой» оценкой (под «те-
стовой» оценкой мы имеем в виду оценку, данную профессиональны-
ми тесторами кандидату в результате оценивания по шкале, разрабо-
танной специально для оценки речевого продукта при помощи теста).

107
Глава 1.  Общие вопросы тестологии

Мы получили результат, подтверждающий объективность тестовой


оценки, — тестовая оценка совпала со средней (3,3)! Конечно, данный
результат — весомое подтверждение важности тестирования вообще.
Кроме оценки ответа кандидата преподавателям предлагалось
назвать степень значимости параметров (от 1  до 5), на которые они
ориентировались при оценке ответа студента.
Этими параметрами в  группе более опытных преподавателей
были названы (по убыванию): умение логично, последовательно
и  четко изложить информацию; создать текст описательного харак-
тера; достоверно передать информацию; умение создать развернутое
высказывание с  четкой структурой; грамматическая правильность
речи, словарный запас; знание основных правил общения в  ситуа-
циях (10 из 17 человек). Семь преподавателей также на первое место
поставили составляющие дискурсивной компетенции, а на второе —
умения социолингвистической компетенции. Молодые преподаватели
(5 из 10) на первое место поставили составляющие языковой компе-
тенции, на второе место — социолингвистической. Три преподавате-
ля особенно значимыми посчитали составляющие функциональной
компетенции, а на второе место поставили языковую. Два преподава-
теля выделили грамматическую компетенцию и словарный запас как
самые главные при постановке оценки, на третье место поставив все
остальные. Примерно такая же картина наблюдается и  при анализе
результатов оценивания ответа второго кандидата.
Все это позволяет сделать выводы, что при оценивании продук-
та речи большинство преподавателей-практиков, не имеющих опыта
работы в проведении тестирования, выделяют дискурсивную компе-
тенцию как основную, прежде всего влияющую на общую оценку от-
вета студента. Эксперимент выявил также необходимость обращать
больше внимания на социолингвистическую компетенцию как при
контроле, так и при обучении речевой деятельности.
Несомненно, наши наблюдения показали, насколько необходим
и важен анализ как самих оценок (тестовых и нетестовых), так и мето-
дики и механизма оценивания речевого продукта.

108
1.4.  Статистический анализ тестовых данных

1.4.  СТАТИСТИЧЕСКИЙ АНАЛИЗ ТЕСТОВЫХ ДАННЫХ

1.4.1. КЛАССИЧЕСКИЕ МЕТОДИКИ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ


РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ

С начала XX в. в научную парадигму мышления прочно начина-


ют входить статистические измерения. Попадают они и в лингвистику
(в результате чего создается особая отрасль знаний — математическая
лингвистика), и в  психологию (начиная с  работ Спирмана), и  через
нее  — в  тестологию. Статистические методы Спирмана128 сыграли
большую роль для дальнейшего развития метода тестов, как в  Аме-
рике, так и  за ее пределами. Спирман обратил особое внимание те-
стологов на статистический характер тестового материала. Он считал,
что важным фактором для теста является степень корреляции данных
по одному тесту с  данными других тестов или с  каким-либо другим
объективным критерием. В нашей стране особое внимание статисти-
ческому анализу тестов придавал Н. А. Бернштейн129. Всесторонне
и  полно классическая теория тестов впервые изложена в  фундамен-
тальном труде Гарольда Гулликсена130. С  тех пор теория несколько
видоизменялась, в частности совершенствовался математический ап-
парат. Классическая теория тестов в современном изложении приве-
дена у Л. Крокера и Дж. Альгины131. Из отечественных исследователей
впервые описание этой теории дал В. С. Аванесов132. В работе М. Б. Че-
лышковой133 приведены сведения о статистическом обосновании ка-
чества теста.
Итак, в  языковом тестировании принято использовать следую-
щие статистические понятия.
Во-первых, это первичные описательные статистики, т. е. отра-
жение в одном числовом значении множества результатов измерения.
К  ним в  первую очередь относятся меры центральной тенденции  —
мода, медиана, средняя.

128
Spearman C. “General Intelligence”…
129
Бернштейн Н. А. Указ. соч. С. 100.
130
Gulliksen H. Theory of mental tests. New York: Willey, 1950.
131
Crocker  L., Algina  J. Introduction to Classical and Modern TestTheory. New
York: Harcourt Brace Jovanovich, 1986.
132
Аванесов В. С. Основы научной организации педагогического контроля…
133
Челышкова М. Б. Теория и практика конструирования…

109
Глава 1.  Общие вопросы тестологии

Среднее арифметическое (the Mean) есть сумма всех баллов, по-


лученных экзаменуемыми, поделенная на количество экзаменуемых,
см. формулу (1):

M=
∑ x , (1)
N
где М — среднее арифметическое,
х — баллы,
N — общее количество экзаменуемых.
Среднее значение является наиболее очевидной и часто исполь-
зуемой мерой центральной тенденции. Но его использование огра-
ничивается тем, что на величину среднего влияет каждое отдельное
значение. Если какое-нибудь значение в  группе увеличится на с, то
среднее увеличится на c  /  N. Таким образом, среднее значение весь-
ма чувствительно к «выбросам» — экстремально малым или большим
значениям переменной.
Мода (the Moda)  — наиболее часто встречающееся количество
баллов, полученное испытуемыми. Когда два соседних значения встре-
чаются одинаково часто и чаще, чем любое другое значение, мода есть
среднее этих двух значений.
Распределение может иметь и не одну моду. Когда все значения
встречаются одинаково часто, принято считать, что такое распределе-
ние не имеет моды.
Бимодальное распределение имеет на графике распределения две
вершины, даже если частоты для двух вершин не строго равны. В по-
следнем случае выделяют большую и меньшую моду. Во всей группе
может быть и  несколько локальных вершин распределения частот.
Тогда выделяют наибольшую моду и локальные моды.
Моду полезно определять в том случае, когда тест слишком прост
или тяжел, либо когда тест проходят люди с различным уровнем зна-
ний. Наличие двух и более мод в выборке может показать ее неодно-
родность, т. е. наличие двух или более подгрупп испытуемых, выделя-
ющихся по какому-либо признаку, например по уровню подготовки,
возрасту, психологическому типу личности.
Медиана (the Median) — средний член упорядоченного ряда. Для
определения медианы134 необходимо выстроить все баллы в порядке

134
См.: Hughes A. Testing for Language Teachers. Cambridge, 1989. P. 157; Alder-
son J. C., Clapham С. M., Wall D. Language Test Construction and Evaluation.

110
1.4.  Статистический анализ тестовых данных

убывания (или возрастания) и затем найти средний член ряда. Если


10 испытуемых получили оценки 2, 2, 3, 3, 3, 3, 4, 4, 4 и 5, то медиана
будет равна 3. При четном количестве измерений два средних члена
упорядоченного ряда складываются и делятся пополам.
Вычисление медианы необходимо для полноты и  адекватно-
сти оценки теста. В  случае, если только 1  чел. из  группы численно-
стью 10 чел., заработавших по 8–10 баллов, получает 1 балл, то сред-
нее арифметическое резко снизится из-за этого «случайного» балла.
Для предотвращения неверного отражения действительной картины
и рассчитывается медиана.
Однако ни один из вышеперечисленных параметров не показы-
вает широты разброса баллов экзаменуемых. Для ее определения вы-
числяется размах колебаний значения признака.
Размах (the Range)  — разность между наибольшим и  наимень-
шим значениями. Размах является наиболее простой и  очевидной
мерой изменчивости, указывающей на диапазон изменчивости значе-
ний.
Размах — это очень неустойчивая мера изменчивости, на кото-
рую влияют любые возможные «выбросы». Более устойчивой мерой
является дисперсия.
Меры центральной тенденции используют при оценке качества
теста при проведении апробации теста на репрезентативной выборке
тестируемых. Известно, что хороший нормативно-ориентированный
тест обеспечивает нормальное распределение индивидуальных бал-
лов репрезентативной выборки участников135, когда среднее значение
баллов находится в центре распределения, а остальные значения кон-
центрируются вокруг среднего по нормальному закону, т. е. примерно
70 % значений в центре, а остальные сходят на нет к краям распреде-
ления, как на рис. 5 136.

Cambridge: Cambridge University Press, 1995.


135
Общая теория статистики: учебник / под ред. А. М. Гольдберга, В. С. Коз-
лова. М.: Финансы и статистика, 1985.
136
Наследов А. Д. Математические методы психологического исследования:
Анализ и  интерпретация данных: учебное пособие. 4-е изд. СПб.: Речь,
2008; Ким  В. С. Тестирование учебных достижений: монография. Уссу-
рийск: Изд-во Уссурийск. гос. пед. ин-та, 2007.

111
Глава 1.  Общие вопросы тестологии

Рис. 5. Стандартное нормальное распределение.

Если тест обеспечивает близкое к  нормальному распределение


баллов, то это означает, что на его основе можно определить устойчи-
вое среднее значение баллов, которое принимается в качестве одной
из репрезентативных норм выполнения теста.
При калибровке результатов теста за начальную точку принима-
ют среднее значение, а затем двигаются в меньшую и большую сторо-
ны с шагом, равным двум дисперсиям.
Подсчет дисперсии основан на вычислении отклонений каждого
значения показателя от среднего арифметического в распределении.
Расчет дисперсии производится по формуле (2):

Dx = ∑ i
( x − M x )2 , (2)
N −1
где xi — балл студента по тесту,
N — количество экзаменуемых,
Мx — среднее арифметическое баллов.
Дисперсия (variance)  — мера изменчивости для метрических
данных, пропорциональная сумме квадратов отклонений измеренных
значений от их арифметического среднего. Чем больше изменчивость
в данных, тем больше отклонения значений от среднего, тем больше
величина дисперсии. Размах достаточно точно оценивается дисперси-
ей, но эта величина имеет один недостаток: она не отражает наличие
пропусков в  распределении баллов. Показателем же, принимающим

112
1.4.  Статистический анализ тестовых данных

во внимание каждый отдельный балл, будет среднеквадратичное от-


клонение (standard deviation — SD). Это очень важный статистический
параметр, он показывает разность между баллом, полученным сту-
дентом и средним арифметическим всех баллов. Среднеквадратичное
отклонение  — квадратный корень суммы квадратов разниц между
баллами и средним арифметическим, поделенной на количество экза-
менуемых минус один, см. формулу (3):
( x − M )2
SD = , (3)
( N − 1)
где SD — среднеквадратичное отклонение,
х — балл студента по тесту,
N — количество экзаменуемых,
М — среднее арифметическое баллов.
Для вычисления среднеквадратичного отклонения вручную не-
обходимо составить таблицу.
1. В столбце под х необходимо выписать баллы в порядке убывания.
2. Под (хi  – Мx) выписываются разницы между количеством бал-
лов каждого i-того студента и средним арифметическим. М долж-
но быть точным, не округленным. Сумма всех значений (х – М)
должна равняться 0.
3. Затем все значения (x − М) возводятся в квадрат и записываются
в третьем столбце под (х – М)2.
4. Все значения (х – М)2 складываются, и получается ∑ (х – М)2.
5. Затем извлекается корень квадратный и вычисляется SD.
На основании указанных величин высчитываются параметры ре-
зультатов языкового теста и делаются выводы относительно выборки
испытуемых.
Качество теста в целом оценивается двумя главными параметра-
ми: пригодности (validity) и надежности (reliability).
Валидность в самом общем виде может быть определена как важ-
нейшая характеристика теста, которая показывает, что измеряет тест
и насколько хорошо он это делает. Другими словами, эта характери-
стика теста показывает большую или меньшую степень пригодности
теста для его использования с определенной целью.
Многие авторы давали определение этому понятию, но, пожалуй,
наиболее кратко и в то же время емко определял его Кюретон: «При-
годность теста  — это оценка состояния между простым подсчетом

113
Глава 1.  Общие вопросы тестологии

баллов затеет и „идеальным“, принятым за эталон»137. Иными слова-


ми, это характеристика теста, которая показывает, что измеряет тест
и насколько хорошо он это делает.
Если тест на проверку грамматических конструкций измеряет
знания или навыки употребления грамматических конструкций и ни-
чего более, то он является пригодным для измерения грамматики. Этот
тест не является пригодным для измерения знания слов или понима-
ния прочитанного. Если целью теста является проверить у студентов
навык правильного произношения отдельных звуков, то этот тест не
должен включать никакого другого материала (ни заданий, имеющих
целью проверку грамматических навыков, ни заданий, учитывающих
степень владения словарным запасом).
Вопросы пригодности теста — вопросы о том, какие и насколь-
ко правильные, обоснованные выводы могут быть сделаны на основе
тестовых оценок. Множество вопросов, относящихся к этому параме-
тру, может быть сведено к двум:
•• какие выводы следует сделать о том, что измерялось тестом;
•• какие выводы могут быть сделаны об ином поведении, отли-
чающемся от наблюдаемого при тестировании.
Различают несколько видов валидности.
1. Сопоставительная валидность (concurrent validity) определя-
ется тем, насколько хорошо измеряет данный тест то, что хочет те-
столог, по сравнению с другим тестом или оценкой. Результаты дан-
ного теста сопоставляются (определяется корреляция) с результатами
другого теста или оценками преподавателей, которые получены до
или сразу после данного теста. Различают критериально-ориентиро-
ванную и прогностическую сопоставительную валидность. Критери-
ально-ориентированная валидность опирается на какой-либо внеш-
ний критерий, с которым сравниваются результаты теста. Например,
если известно, что для того, чтобы адекватно измерить успешность
прохождения курса студентами, надо получить от них 100 ответов на
100  заданий теста, а  нам по какой-либо причине необходимо сокра-
тить этот список до 25, то сначала мы проведем тест на 100 вопросов,
потом на 25  вопросов и  сравним результаты с  помощью коэффици-
ента корреляции (см. ниже). Если результаты будут отличаться в до-
пустимых пределах, мы будем считать, что наш тест имеет высокую

137
Cureton Е. Е. Validity in «Educational Measurement». Washington, 1951. P. 21.

114
1.4.  Статистический анализ тестовых данных

валидность. Другим типом сопоставительной валидности является


прогностическая валидность.
2. Прогностическая валидность (predictive validity) показыва-
ет, насколько хорошо результаты данного теста предсказывают, на-
пример, успешность будущей учебы. Результаты данного теста сопо-
ставляются (определяется корреляция) с результатами другого теста,
который проводится через полгода или год учебы. Ввиду того что на
прогностическую валидность влияет так много факторов помимо
собственно усвоения материала и лингвистических достижений (как
то: общий интеллектуальный уровень, знание теории, мотивация, сте-
пень удовлетворенности учебой и др.), 20 %-ный уровень предсказа-
тельной способности теста является уже высоком.
3. Содержательная валидность (content validity) показывает,
представлены ли в данном тесте все важнейшие элементы содержания
программы, учебника и  т. п. Проводятся логический анализ и  сопо-
ставление объектов тестирования с элементами программы, учебника
и т. п., релевантны ли вопросы теста. Для определения содержательной
валидности теста необходимо проанализировать и  прописать спец-
ификацию тех знаний, умений и навыков, которые тест контролирует.
4. Конструктная (концептуальная) валидность отражает, на-
сколько объекты тестирования и  характер заданий учитывают пси-
холингвистическую модель усвоения рассматриваемого языкового
материала или данную модель. Проводится соответствующий анализ
языкового материала теста. Этот тип валидности, собственно, и отра-
жает общее определение валидности — насколько тест контролирует
тот процесс, который он призван контролировать.
5. Внешняя валидность показывает, насколько привлекатель-
ными, прагматичными считаются задания теста тестируемыми, пре-
подавателями и  администраторами. Проводится соответствующий
анализ языкового материала теста.
Итак, пригодность (валидность) языкового теста зависит от
лингвистического содержания теста, от его цели и  от ситуации или
метода, использованных для тестирования содержания.
Первые два типа валидности являются статистическими. При из-
мерении внутритестового параметра статистической валидности уда-
ется получить некоторые числовые величины, которые служат коли-
чественными характеристиками данного параметра языкового теста.
Эти величины получают на основании корреляционного анализа. Ко-
эффициент корреляции  — статистический показатель степени и  на-

115
Глава 1.  Общие вопросы тестологии

правленности взаимосвязи между двумя случайными величинами.


В частном случае это может быть связь между результатами первого
и повторного тестирования. Отрицательная корреляция указывает на
обратную зависимость — рост значения одного показателя сопрово-
ждается падением значения другого.
Коэффициент валидности вычисляется по формуле (4) как коэф-
фициент корреляции между двумя пробами теста, возведенный в ква-
драт:
 6 d2 
ρ =1− 
∑  , (4)
 N N 2 −1 
  ( )
где ρ — коэффициент корреляции,
d — разница между рангами баллов каждого испытуемого,
N — количество экзаменуемых.
Ранги присваиваются испытуемым в двух рядах — в критериаль-
ном тесте и в экспериментальном. Разница между ними и есть d.
Например, коэффициент корреляции 0,5, возведенный в квадрат,
дает нам 25 %-ную валидность как характеристику теста в целом.
Надежность является следующим важным параметром проверки
эффективности языкового теста. В широком плане под надежностью
понимается «такая сторона предметов, явлений, процессов и систем,
которая характеризует степень эффективности и  устойчивости их
становления, функционирования и развития»138.
Что касается психолого-педагогических измерений, то здесь под
надежностью методисты подразумевают состоятельность результата
оценки какого-нибудь периодически проверяемого (тестируемого)
навыка или аспекта либо состоятельность сравнительных результа-
тов тестирования какого-либо навыка в различных тестах. По нашему
мнению, наиболее кратко и в то же самое время точно определил его
С. Стивенсон: «Надежностью мы называем постоянство или устой-
чивость оценок, получаемых при повторяющихся наблюдениях»139.
Таким образом, можно сделать вывод, что применительно к  тестам
надежность определяется постоянством, с  которым тест выполняет
свою функцию измерительного инструмента. Надежность вычисляет-
ся сопоставлением цифровых данных, отражающих результаты ряда

138
Standards for Educational and Psychological Tests. Washington, 1974. P. 28.
139
Стивенсон С. Экспериментальная психология. М., 1960. С. 386.

116
1.4.  Статистический анализ тестовых данных

тестов, выполненных одними и  теми же студентами. То есть, если


группа сдает один и  тот же тест 2  раза с  небольшим промежутком
времени, в течение которого занятия языком не ведутся, результаты
должны очень мало отличаться друг от друга. В противном случае тест
ненадежен.
По мнению И. А. Рапопорта, тест может быть надежным, не бу-
дучи валидным (пригодным), однако он не может быть валидным
(пригодным), не являясь в то же время надежным140. Иными словами,
надежность теста — необходимое условие его валидности (пригодно-
сти). И это понятно, поскольку тест, результаты которого постоянно
меняются, вообще ничего не тестирует.
Показателем надежности служит величина коэффициента на-
дежности, который показывает, насколько устойчивы показатели те-
ста при повторном применении того же теста или его параллельного
варианта. Следует оговориться, что ни один тест не является абсолют-
но надежным инструментом. Следовательно, всякий раз, когда гово-
рят об устойчивости показателей тестов, имеют в виду относительную
устойчивость. На устойчивость тестовых показателей могут влиять
такие факторы, как недостаточное количество тестовых заданий (чем
полнее охватывают вопросы теста измеряемые функции, тем надежнее
тест), разновидность заданий (чем разнообразнее задания и чем боль-
ше их дифференцирующая сила, тем надежнее тест (применительно
к стандартным тестам)), ограниченное время, отводимое на выполне-
ние теста, непонимание испытуемым инструкции или вопросов теста.
В отличие от коэффициента пригодности коэффициент надеж-
ности теста вычисляется без помощи внешнего критерия. По самому
своему смыслу этот коэффициент показывает, насколько устойчивы
показатели испытуемого при повторных его испытаниях одним и тем
же тестом или его параллельными вариантами.
Существует несколько способов определения надежности. Самый
простой — повторное применение того же теста. Однако этот способ
имеет ограничения: на его результаты может оказывать влияние эле-
мент знакомства, памяти и упражняемости, а также фактор изменчи-
вости самих обучающихся в тех случаях, когда между двумя примене-
ниями теста проходит довольно много времени. С целью устранения
этих нежелательных факторов, изменяющих действительное значение
коэффициента надежности, при повторном испытании применяют

140
Рапопорт И. А. Теория и практика языковых тестов. Таллин, 1980. С. 39.

117
Глава 1.  Общие вопросы тестологии

параллельный вариант того же теста. При этом во внимание прини-


мается не только равная трудность заданий, но и относительно одина-
ковые коэффициенты корреляции каждого задания с тестом в целом.
Этот метод можно считать самым лучшим, хотя он очень громоздок
и здесь также имеет место фактор узнаваемости.
Другой способ определения надежности теста состоит в приме-
нении одной формы теста с последующим определением коэффициен-
та корреляции между двумя половинами одного и того же теста (чет-
ными и нечетными заданиями).
Если тест построен так, что задания следуют по возрастающей
трудности, применяют различные способы чередования заданий
в  каждой половинке. Далее вычисляется коэффициент корреляции,
который является показателем надежности половины теста.
Коэффициент корреляции определяется по специальным мате-
матическим формулам (см. выше).
Для вычисления коэффициента половинной надежности (КПН)
теста необходимо определить коэффициент корреляции между двумя
половинами теста — четной и нечетной. Для этого следует:
1) разделить тест пополам  — нечетные (№  1, 2, 3, 5  …) в  одну
группу, четные (№ 2, 4, 6, 8 …) — в другую;
2) занести результаты в таблицы;
3) сосчитать баллы в обеих группах;
4) присвоить каждому экзаменуемому два ранга: один в  нечет-
ном тесте, другой — в четном;
5) вычислить коэффициент корреляции между двумя полови-
нами теста — четной и нечетной (по той же формуле (4) (см.
выше), что и сопоставительная валидость).
Данный коэффициент говорит о  том, какова будет надежность
теста в том случае, если он будет в два раза короче, чем данный.
Для того чтобы определить надежность всего теста, нужно ис-
пользовать формулу (5) Спирмана—Брауна:
2rhh
ÊÏ Í = , (5)
1 + rhh
где КПН — коэффициент половинной надежности,
rhh — корреляция между двумя половинами теста.
Еще два параметра, применяемые в  тестологии, характеризуют
каждый вопрос теста по отдельности: facility value (F. V.)  — коэффи-

118
1.4.  Статистический анализ тестовых данных

циент трудности и  descrimination index  — дискриминационный ко-


эффициент. Они выявляют применимость теста к данной конкретной
группе.
Коэффициент трудности вопроса (F. V.) показывает, насколько
прост или сложен каждый вопрос теста. То есть вычисление коэффи-
циента трудности позволяет судить о том, насколько адекватно зада-
ние теста в данной языковой аудитории. Другими словами, F. V. отдель-
ного задания теста — процент экзаменуемых, ответивших правильно
на это задание. Если в группе 100 экзаменуемых и 50 из них ответили
верно на вопрос данного задания, то F. V. задания будет вычислено по
формуле (6):
50
F.V . = × 100% = 50%, (6)
100
где F. V. — коэффициент трудности.
Идеальный коэффициент трудности равен 50 %, т. е. когда половина
испытуемых в данной языковой группе дает правильный ответ.
Кроме определения, насколько сложно то или иное задание те-
ста, необходимо знать, как оно дискриминирует тестируемых, т. е. по-
зволяет разделить их на сильных и  слабых. С  этой целью выявляют
дискриминантный коэффициент (discrimination index). Этот внутри-
тестовый параметр показывает, насколько задание теста отличает хо-
рошо подготовленного испытуемого от плохо подготовленного.
Для вычисления дискриминантного коэффициента сначала не-
обходимо определить ранги экзаменуемых. Если расположить баллы,
полученные экзаменуемыми, в порядке убывания и присвоить перво-
му экзаменуемому № 1, второму № 2 и т. д., то эти номера и будут счи-
таться рангами. Если два или более экзаменуемых набрали одинако-
вое количество баллов, то ранг вычисляется как среднее между этими
двумя или более рангами. Так, например, если баллы были 8, 6, 6, 5, то
ранги будут соответственно 1,0, 2,5, 2,5, 4,0.
Существует множество способов вычисления дискриминантно-
го коэффициента. Наиболее простым способом является такой, кото-
рый требует ранжирования (ranking) экзаменуемых в  соответствии
с количеством очков, полученных ими в результате выполнения теста
с последующим сравнением количества правильных ответов в лучшей
трети тестируемых с количеством правильных ответов в худшей тре-
ти.

119
Глава 1.  Общие вопросы тестологии

Например, если лучшая группа состоит из  10  экзаменуемых


и 7 из них верно ответили на вопрос (0,7), в то время как только 2 чел.
из  10  в  слабой группе (0,2)  ответили верно, то Di = 0,7  – 0,2  = +  0,5.
Считается, что задание, у которого Di = + 0,5, хорошо дискриминирует
тестируемых.
Задания, дискриминантный коэффициент которых равен или
стремится к нулю, не позволяют выявить различий в уровне знаний
сильных и слабых экзаменуемых.
Для вычисления дискриминантного коэффициента используется
формула (7):
RT − RB
Di = , (7)
NT
где RT — количество правильных ответов в верхней группе,
RB — количество правильных ответов в нижней группе,
NT — количество испытуемых в верхней группе.
Такой анализ заданий не подходит для субъективных тестов, та-
ких как написание резюме, эссе, а также интервью, но предваритель-
ное апробирование заданий все же необходимо.
Иногда представляется целесообразным производить ранжи-
рование экзаменуемых не только по результатам теста на понимание
иноязычной речи на слух, но и по результатам всего теста (включая
говорение, чтение и письмо).
Более точное представление о  коэффициенте дискриминантно-
сти можно получить следующим образом.
Любой ответ испытуемого на конкретное задание можно оце-
нить по двухбалльной шкале  — «верно» (1  балл), «неверно» (0  бал-
лов). Сумма баллов по всем пунктам представляет собой первичную
(«сырую») оценку. Мера соответствия успешности выполнения одной
задачи всему тесту является показателем дискриминантности заданий
теста для данной выборки испытуемых и называется коэффициентом
дискриминации (индексом дискриминации)141, вычисляется по фор-
муле (8):
x −x Nn
rp = n , (8)
σx N − Nn
где rp — коэффициент корреляции,
x — среднее арифметическое всех индивидуальных оценок по тесту,

141
Ким В. С. Указ. соч.

120
1.4.  Статистический анализ тестовых данных

xn — среднее арифметическое оценок по тесту у испытуемых, правильно


выполнивших задание (в случае опросника личностного — соответствие
с «ключом»),
σx — среднеквадратичное отклонение индивидуальных оценок по тесту
для выборки,
Nn — число испытуемых, правильно решивших задачу (или тех, чей ответ
на данный пункт теста соответствует «ключу»),
N — общее число испытуемых.
Коэффициент дискриминации (дифференцирующая способ-
ность) тестового задания — количественная характеристика способ-
ности тестового задания дифференцировать испытуемых по уровню
их подготовленности. Изменяется от –1 до +1. Высокий положитель-
ный коэффициент дискриминации свидетельствует об эффективно-
сти деления испытуемых. Высокое отрицательное значение свидетель-
ствует о непригодности данной задачи для теста, о ее несоответствии
суммарному результату. Коэффициент дискриминации является, по
сути, показателем критериальной валидности отдельного тестового
задания, поскольку определяется по отношению к  внешнему крите-
рию — суммарному результату. Считается, что коэффициент дискри-
минации не должен быть меньше 0,25142. В соответствии со значением
коэффициента дискримации можно повести нормирование тестовых
заданий в банке тестовых заданий.
Более точное представление о  дискриминативности задания
можно получить, посчитав коэффициент точечно-бисериальной кор-
реляции (см. ниже формула (12)).
Описанные выше два параметра (коэффициент трудности во-
проса и  дискриминантный коэффициент) показывают, насколько
применим тест к данной группе испытуемых.
Таковы основные внутритестовые параметры, которые вычисля-
ются с помощью классического аппарата статистических методик.
Учитывая, что тестовая методика контроля для получения мак-
симально объективных данных требует правильного и точного при-
менения, считаем необходимым подчеркнуть, что внутритестовые
параметры языкового теста, приводимые ниже, в полном объеме мо-
гут и должны быть реализованы только в стандартизованных тестах
или экспериментальных тестах-срезах, подводящих итог длительному
периоду обучения и  претендующих на более или менее предельную

142
Crocker F. C. Statistics for the teacher. Windsor: NEFR-Nelson, 1985. P. 77.

121
Глава 1.  Общие вопросы тестологии

точность измерений. В тестах же, рассчитанных на повседневное при-


менение, покрывающих незначительный по объему материал, не пред-
ставляется возможным полностью реализовать требования, выполне-
ние которых предполагает постоянное применение математического
аппарата.
Внутритестовые параметры следует считать относительными,
а не абсолютными, каковыми их пытаются представить некоторые от-
ечественные и зарубежные авторы. В учебном процессе тестовая ме-
тодика — не единственная форма контроля. Ее функция, по нашему
мнению, состоит в  дополнении к  традиционным формам контроля,
в  частичной их замене там, где это необходимо, чтобы сэкономить
время и интенсифицировать процесс опроса на объективной основе.
Поэтому возможные неточности показаний тестов могут быть быстро
обнаружены преподавателем в процессе его повседневной работы со
студентами.
Современные тестологи разрабатывают новые методики стати-
стического анализа результатов тестирования. Примером может слу-
жить метод Георга Раша (Rasch Analysis) (см. раздел 1.4.2.), наиболее
популярный в настоящее время у тестологов группы ALTE143.
Современный аппарат базового статистического анализа тестов
включает такие понятия, как дисперсионный анализ и его виды, тео-
рия зависимости задания и  ответа (IRT), коэффициент альфа Крон-
баха, коэффициенты Кудера–Ричардсона КР20 и КР21. Вот некоторые
из них.
Альфа Кронбаха оценивает внутреннюю надежность и согласо-
ванность теста. По величине варьируется от 0 до 1. Часто использу-
ется для тестов с оценочными шкалами в противоположность тестам
с дихотомическими заданиями, хотя может использоваться и для тех,
и для других.
Стандартизированный коэффициент альфа Кронбаха αst вычис-
ляется по формуле (9)144:
N ⋅r
α st = , (9)
1 + ( N − 1) ⋅ r

143
Continuity and Innovation: Revising the Cambridge Proficiency in English Ex-
amination 1913–2002 / ed. by C. Weir, M. Milanovic. Cambridge, 2003 (Studies
in Language Testing. [T.] 15)
144
Клайн П. Справочное руководство по конструированию тестов: Введение
в психометрическое проектирование. Киев: ПАН Лтд, 1994..

122
1.4.  Статистический анализ тестовых данных

где αst — стандартизированный коэффициентр альфа Кронбаха,


N — количество исследуемых компонентов,
r̄ определяет средний коэффициент корреляции между компонентами.
Также коэффициент можно вычислить по формуле (10):
 2 N 2 
N  σ X − ∑ i =1σYi N
 , ãäå X = Y , (10)
α=
N − 1  σ2X  ∑ i
i =1
 
где α — коэффициентр альфа Кронбаха,
X — все исследованные множества,
Yi — отдельный компонент,
σ2X  — среднеквадратичное отклонение всех исследованных множеств,
σY2  — среднеквадратичное отклонение отдельного компонента.
i

Несмотря на то, что альфа Кронбаха может принимать значения


от 1  до ∞, только положительные значения поддаются интерпрета-
ции. Альфа Кронбаха сравнивает разброс каждого элемента с общим
разбросом всей шкалы. Если разброс результатов теста меньше, чем
разброс результатов для каждого отдельного вопроса, следовательно,
каждый отдельный вопрос направлен на исследование одного и того
же признака, свойства или явления. Они вырабатывают значение,
которое можно считать истинным. Если такое значение выработать
нельзя, т. е. получается случайный разброс при ответе на вопросы, то
тест ненадежен и коэффициент альфа Кронбаха будет равен 0. Если же
все вопросы измеряют один и тот же признак, то тест надежен и коэф-
фициент альфа Кронбаха в этом случае будет равен 1. Считается, что
профессионально разработанные тесты должны иметь внутреннюю
согласованность на уровне не менее 0,90145.
Для дихотомических заданий формула альфа Кронбаха была мо-
дифицирована Кудером и Ричардсоном в две другие формулы — KR-
20 и KR-21. KR-21 требует меньшего количества информации и более
проста для расчета, но в целом уступает по точности KR-20146. Послед-
няя имеет вид формулы (11):

145
Дружинин  В. Н. Экспериментальная психология: учебное пособие. М.:
Инфра-М, 1997; Наследов А. Д. Математические методы психологического
исследования … 4-е изд.
146
3десь и далее определения даются по: Multilingual glossary of language test-
ing terms (пер. E. H. Гордеева — неопубликованный).

123
Глава 1.  Общие вопросы тестологии

K  ∑pi qi 
α=  , (11)
K − 1  σ2X 

где K — количество тестовых заданий,
p  — пропорция правильных ответов по отношению к  числу вопросов
в тесте,
q — пропорция неправильных ответов по отношению к числу вопросов.
Бисериальная корреляция (biserial correlation) — индекс дискри-
минативности для дихотомических заданий, обозначаемый rbis: со-
отношение между критерием (обычно общий результат теста) и спо-
собностью, лежащей в основе правильного / неправильного ответа на
задание. Величина rbis по крайней мере на 25 % выше, чем для точеч-
но-бисериальной корреляции (rpb). Преимущество rbis состоит в  том,
что он является довольно устойчивым для выборок, различающихся
уровнем способностей испытуемых.
Расчет коэффициента точечно-бисериальной корреляции произ-
водится по формуле (12):
m1 − m0 n1n0
rpb = ⋅ , (12)
σX n ( n − 1)
где m1 и m0 — средние значения Х со значением 1 или 0 по Y,
σX — стандартное отклонение всех значений по Х,
n1, n0 — количество значений Х с 1 или 0 по Y,
n — общее количество пар значений.
Расчет точечно-бисериальной корреляции является одним из ви-
дов проверки валидности147.
Дисперсионный анализ оперирует понятиями дисперсии, или ва-
риативности (varience) — ANOVA (Analysis of Varience), и совместной
вариативности, или ковариации (covariance) — ANCOVA (Analysis of
Covarience), т. е. совместного изменения двух или более переменных.
Например, длина предложения и  лексическая трудность являются
особенностями текста для чтения, которые будут иметь тенденцию
к соотношению, т. е. совместно варьироваться. Совместное изменение
должно приниматься во внимание при выведении одной переменной
из других, например при предсказании трудности текста для чтения
исходя из длины предложений и лексической трудности.

147
Челышкова М. Б. Теория и практика конструирования…

124
1.4.  Статистический анализ тестовых данных

Метод ANOVA был разработан Р. Фишером для анализа резуль-


татов экспериментальных исследований. Метод сводится к изучению
влияния независимой переменной (одной или нескольких) на зависи-
мую переменную. Например, сравнивается эффективность двух учеб-
ных программ. Для этого из  нескольких сотен школ отобрано пять.
В них два параллельных класса обучались по разным программам —
типичная ситуация педагогического эксперимента. При этом неза-
висимой переменной являются программы (два фактора), зависимая
переменная — показатели в пяти школах. При этом изучается не толь-
ко гипотеза об эффективности учебных программ, но и различия их
эффективности в разных школах148.
Все эти методики не просты для понимания лингвистов и гума-
нитариев, однако дело упрощается тем, что по многим из них суще-
ствуют компьютерные программы подсчета.
Пример статистической обработки данных по тестам BEC
и  TOEFL и  развитие тестовой методики в  сторону сопоставленя не-
однородных тестов (поиск кросстестового коэффициента) см. в  раз-
деле 4.6.

1.4.2. СОВРЕМЕННАЯ ТЕОРИЯ ТЕСТОВЫХ ЗАДАНИЙ И МЕТОД АНАЛИЗА Г. РАША

Современная теория статистического анализа тестовых данных


(IRT, или теория тестовых заданий) — это группа математических мо-
делей, характеризующих соотношение выполнения теста индивидуу-
мом с уровнем его способностей. Эти модели основаны на фундамен-
тальной теории, состоящей в том, что ожидаемый ответ индивидуума
на определенный вопрос или задание теста является функцией как
уровня трудности задания, так и уровня способностей индивидуума.
Логит (logit) — в зависимости «задание — ответ» единица измерения,
полученная из  натурального логарифма отношения шанса на успех
к  шансу неудачи, т. е. odds ratio (отношение шансов). Различие в  ло-
гитах между способностью человека и трудностью задания — это log
odds лица для успешного выполнения задания.
Модель Раша, подробно рассматриваемая ниже, была расширена
до так называемой многоаспектной модели (many-facet Rasch model).

148
Наследов А. Д. Математические методы психологического исследования:
Анализ и интерпретация данных: учебное пособие. 2-е изд., испр. и доп.
СПб.: Речь, 2006. С. 186–187.

125
Глава 1.  Общие вопросы тестологии

Расширение модели Раша позволяет моделировать вероятные ответы


на основе добавочной комбинации аспектов. Например, выполнение
письменного задания может быть смоделировано с целью отражения
трудности задания плюс строгости рейтера.
Многообразие тестов вообще и тестов, используемых при обуче-
нии иностранным языкам, неизбежно ставит вопрос об их эффектив-
ности, т. е. адекватности теста уровню обучаемого, эффективности его
использования и  т. п. При решении подобных вопросов желательно
получить объективные оценки, т. е. оценки, не зависящие от множе-
ства случайных факторов, возникающих при тестировании, как то:
предъявления несложного теста группе сильных обучающихся (и на-
оборот), распределения учащихся по способностям внутри группы
и т. п.
Для решения подобной проблемы значительную популярность
в  последние полвека приобрел метод, названный в  честь датского
математика Георга Раша (Georg Rasch, 1901–1980), — так называемая
однопараметрическая модель Раша149. В своем основном виде модель
применяется для анализа дихотомических (т. е. имеющих только два
возможных значения) переменных, что как нельзя лучше подходит
к  тестам, где мы легко можем обозначить правильный ответ на во-
прос как 1, а  неправильный  — как 0. После проведения теста легко
составить матрицу, в строчках которой были бы испытуемые, в столб-
цах  — вопросы теста, а  на их пресечении  — баллы (1  или 0), полу-
ченные испытуемым за ответ на тот или иной вопрос. Легко заметить,
что подобная матрица не зависит ни от числа вопросов в тесте, ни от
количества студентов, что делает первоначальное применение моде-
ли практически универсальным и в  высшей степени нетрудоемким.
Суммировав баллы в  каждой строке (т. е. подсчитав число правиль-
ных ответов), мы получаем первичный балл испытуемого (аналогично
можно получить первичный балл задания, суммируя в столбцах число
правильных ответов на задание всеми испытуемыми; чем больше пра-
вильных ответов на задание, тем легче оно оказывается для данной
группы испытуемых). Отсюда, разделив полученный балл на общее
число заданий, легко перейти к вероятности правильных (p), и, соот-
ветственно, вероятности неправильных (q) ответов.

149
Rasch Analysis: [сайт]. URL: www.rasch-analysis.com (дата обращения:
10.10.2016); Rasch G. Op. cit.; Wright B. D., Masters G. N. Rating Scale Analysis:
Rasch Measurement. Chicago: Mesa Press, 1982.

126
1.4.  Статистический анализ тестовых данных

Можно ввести понятия уровня подготовленности (ability) S студен-


та и трудности заданий t, см. формулу (13):
p 1− p
S= , t= , (13)
q p
где S — уровень подготовленности студента,
p — вероятность правильных ответов,
q — вероятность неправильных ответов.
t — уровень трудности заданий.
Модель Раша зависит только от отношения S к t поэтому носит
название однопараметрической.
Можно обозначить lnt = δ.
Предлагается считать задания с δ > 2,6 очень сложными, с δ от
1,5 до 2,59 — трудными, от –1,49 до 1,49 — заданиями среднего уровня
сложности, от –2,59 до –1,5 — легкими, с δ < –2,6 — очень легкими150.
Задания, оценивающиеся нулями (предельно трудные) и  единицами
(предельно легкие), считаются «нетекстовыми», т. е. — не дифферен-
цирующими испытуемых по уровню подготовленности.
Вводя lnS = θ, lnt = δ, получаем общий вид модели в виде форму-
лы (14), или вероятность того, что участник с уровнем подготовки S
правильно выполнит задание трудности t:
exp ( θ − δ )
P ( δ, θ ) = , (14)
1 + exp ( θ − δ )
где P — вероятность правильного ответа,
θ — уровень обучающегося,
δ — сложность вопроса.
Модель верна для любого уровня трудности заданий и для любой
пары участников тестирования.
Отсюда происходит и другое название модели — функция успеха.
Единицей измерения модели является логит. Как и в случае со многи-
ми другими статистическими параметрами, логит является условной
единицей, смысл численного значения которой полностью выявляет-
ся только при сравнении результатов анализа нескольких тестов. При
одном логите вероятность успеха равна 0,5, т. е. сложность задания со-
ответствует уровню обучающегося. Вероятность правильного ответа

150
Аванесов В. С. Основы теории педагогических заданий // Педагогические
измерения. 2006. № 2.

127
Глава 1.  Общие вопросы тестологии

обучающегося на вопрос, простой для его уровня подготовки, боль-


ше 0,5, в  противном случае  — меньше 0,5. Задание считается более
трудным, если вероятность правильного ответа на него меньше, чем
на другое, независимо от уровня выполняющего его. Одновременно
более подготовленный студент имеет бóльшую вероятность правиль-
ного ответа на все задания.
Для обработки полученной матрицы имеются разнообразные
коммерческие пакеты программ, тем не менее она достаточно легко
вычисляется при последовательном применении стандартизованных
(т. е. имеющихся в меню программы) формул в таблице Microsoft Excel
(пример — табл. 6). Это позволяет быстро обработать результаты лю-
бого тестирования практически независимо от количества испытуе-
мых даже пользователями начального уровня.
Таблица 6
Пример вычисления тестовых результатов

Пример
Столбец Что вычисляем Формула
значений
A Порядковый № (или фамилия) студента 1
B Балл студента (количество правильных
23
ответов)
C Количество вопросов 50
D Вероятность правильных ответов (p) B
= 0,46
A
E Вероятность неправвильных ответов (q) = 1 – D 0,54
F S (ability) — уровень подготовленности D
= 0,85
E

G t — трудность задания 1− D


= 1,17
D

H lnt = δ = LN(G) 0,16


I lnS = θ = LN(F) −0,16
J Модель РАША — вероятность того,
что участник с уровнем подготовки S exp ( I − H )
= 0,42
правильно выполнит задание трудности 1 + exp ( I − H )
t (в логитах)

128
1.4.  Статистический анализ тестовых данных

Подобный анализ качественных данных количественными ме-


тодами позволяет получить оценки знаний испытуемых, которые не
зависят от уровня трудности отдельного теста, т. е.  — объективные
оценки151.
Для проверки работы модели был проведён следующий экспери-
мент. В эксперименте принимали участие 12 групп студентов III курса
факультета психологии СПбГУ разного уровня владения английским
языком общей численностью 139 чел. При проведении итогового те-
стирования в группах полученные результаты были обработаны с ис-
пользованием модели Раша. Необходимо отметить, что студентам
были предложены стандартизованные, т. е. априори валидные тесты,
что делает полученные результаты еще более показательными. В силу
ряда причин административного характера одна из групп осталась без
наблюдения во время тестирования и, таким образом, получила воз-
можность использования любых дополнительных материалов при от-
вете на вопросы теста. В итоговой таблице она обозначена как «группа
списавших» без указания уровня обучения. Следовательно, случай-
ным образом мы получили прекрасную возможность проверить ра-
ботоспособность модели и для случая, когда тестовые задания теряют
всякую трудность для испытуемых. Результаты приводятся в табл. 7.
Таблица 7
Значения модели Раша для результатов теста в группах испытуемых

Количество Среднее значение модели


Уровень изучения языка
человек Раша
Группа pre-intermediate 22 0,46
Группа intermediate − 22 0,42
Группа intermediate + 27 0,65
Группа upper-intermediate 24 0,76
Группа advanced 31 0,76
Группа списавших 13 0,79

Необходимо отметить, что мы не приводили значение моде-


ли Раша для каждого студента, а использовали усредненное, так как,

151
Карданова Е. Ю., Нейман Ю. М. Основные модели современной теории те-
стирования // Вопросы тестирования в образовании. 2003. № 7.

129
Глава 1.  Общие вопросы тестологии

по данным наблюдений, дисперсия в  каждой группе не превышает


0,03 (для групп с более низким уровнем) и 0,01 (для групп с более вы-
соким уровнем и  «списавших»). Подобные отклонения чрезвычайно
малы и дают нам полное право рассматривать усредненную величину
в качестве основной.
Даже беглый анализ приведенных результатов показывает, что
более подготовленный студент имеет бóльшую вероятность правиль-
ного ответа на все задания по сравнению с менее подготовленным. Са-
мая высокая вероятность у группы списавших студентов, что вполне
закономерно.
Было успешно доказано, что модель Раша может применяться не
только при оценивании заданий с  выбором одного правильного от-
вета, но  и  заданий других типов: с  выбором нескольких ответов, на
дополнение, на установление соответствия, на установление правиль-
ной последовательности и  т. п.152 В подобных случаях, рассматривая
подобные тесты как набор (т. е. последовательность) дихотомических
шагов, мы можем успешно применять так называемую политомиче-
скую модель Раша, определяющую вероятность того, что испытуемый
выполнит k-й шаг в задании при условии, что (k – 1)-й шаг выполнен
верно. См. формулу (15):
exp ( θ − δk )
P ( δ, θ ) = , ãäå δk = ln Sk −1 − ln Sk , (15)
1 + exp ( θ − δk )
где k — шаг в задании.
Для обработки полученной матрицы целесообразно, да и в слу-
чае филологических исследований более практично, применять спе-
циальное программное обеспечение для вычисления параметров мо-
дели: FASETS, PROX, PAIR, UCON и др.153
Необходимо отметить, что подобный метод может применяться
не только к  тестам с  множественным выбором ответов, как это мо-
жет показаться на первый взгляд. Действительно, путем несложных
преобразований любое тестовое задание становится доступным для

152
Карданова Е. Ю. Педагогические тесты: теория, модели, методы // Вопро-
сы тестирования в образовании. 2005. № 2.
153
См.: Extra-Conditional (XCON) Algorithm: [сайт]. URL: http://www.rasch.
org/rmt/rmt31b.htm (дата обращения: 10.10.2016); Winsteps & Facets Rasch
Software: [сайт]. URL: http://www.winsteps.com/index.htm (дата обраще-
ния: 10.10.2016).

130
1.4.  Статистический анализ тестовых данных

анализа с использованием модели Раша. Ведь, давая задание, скажем,


на перевод, любой преподаватель четко знает, владение какими имен-
но лексическими единицам и  грамматическими конструкциями он
хочет проверить у обучающихся того или иного уровня. Вряд ли мы
увидим ошибки в использовании окончания 3-го лица единственного
числа у глаголов в английском языке в группе продвинутого уровня,
в то же время никто не предложит перевод конструкций с инфинити-
вом группе начинающих. Соответственно, любое предложение может
быть представлено как набор из N вопросов, предполагающих един-
ственно правильный ответ, т. е. как набор 1 и 0 с точки зрения исполь-
зования нашей модели, где 1 — правильно переведённое слово (слово-
сочетание) или верно использованное правило грамматики.
Таким образом, метод анализа Раша представлен не одной, а ско-
рее «семейством моделей», основным преимуществом которых яв-
ляется возможность получения объективных оценок. Одновременно
необходимо отметить, что при анализе тестов все же не следует пре-
небрегать таким важным вопросом любой статистической обработ-
ки, как репрезентативность выборки, т. е. количеством испытуемых,
обследуемых для оценки того или иного теста, и соотношением этого
количества с генеральной совокупностью, т. е. общим количеством об-
учающихся.
Далее мы приводим обзор систем тестов, разработанных в раз-
ных странах с целью определения уровня владения языком жителей
этих стран как иностранным.

131
Глава 2.  СИСТЕМЫ ТЕСТИРОВАНИЯ ПО ИНОСТРАННЫМ ЯЗЫКАМ

2.1.  ТЕСТЫ ПО РУССКОМУ ЯЗЫКУ КАК ИНОСТРАННОМУ

2.1.1. СОВРЕМЕННОЕ СОСТОЯНИЕ СИСТЕМЫ ГОСУДАРСТВЕННОГО ТЕСТИРОВАНИЯ


ИНОСТРАННЫХ ГРАЖДАН В РОССИИ

В 1992  г., на фоне глобальных социально-политических транс-


формаций на постсоветском пространстве, в Российской Федерации
начала формироваться государственная система лингводидактическо-
го тестирования по русскому языку как иностранному (ТРКИ). Ак-
туальность создания данной системы была вызвана необходимостью
интеграции России в  международное образовательное сообщество
и повышения интереса к ее культурно-языковому наследию. Система
ТРКИ была призвана решать следующие задачи:
1) повысить статус русского языка как средства межкультурно-
го общения, его значимость в качестве учебной дисциплины
и объекта научных исследований в России и за ее пределами;
2) объективно и системно представить модель речевого поведе-
ния иностранца на каждом уровне владения русским языком
в соответствии с Европейской шкалой уровней владения ино-
странными языками, охарактеризовать коммуникативную
способность обучаемого с прагматической точки зрения через
всестороннее описание ее составляющих: декларативных, со-
циокультурных, межкультурных знаний, умений и  навыков,
познавательных способностей, лингвистической, социолинг-
вистической, прагматической компетенций и др.
3) обеспечивать стандартизацию целей овладения русским язы-
ком как иностранным в условиях вариативности и многооб-
разия форм обучения языку;
4) выступать научно-методической базой для создания про-
грамм, учебников и учебных пособий, средств контроля усво-
енных знаний;
5) служить основой прагматически направленного обучения,
предоставляя возможность соотносить цели, содержание

132
2.1.  Тесты по русскому языку как иностранному

и приемы обучения с представлениями учащихся о перспек-


тивах использования языка в своей деятельности;
6) унифицировать систему оценивания уровня владения рус-
ским языком;
7) обеспечить конвертируемость квалификационных докумен-
тов, принятых в разных странах.
Для решения этих масштабных задач объединилась группа ву-
зов, обладающих серьезным опытом преподавания и  изучения рус-
ского языка в аспекте иностранного. В неё вошли Московский госу-
дарственный университет им. М.  В. 
Ломоносова, Государственный
институт русского языка им. А. С. Пушкина, Российский университет
дружбы народов и Санкт-Петербургский государственный универси-
тет. В настоящее время эти вузы — создатели государственной систе-
мы тестирования по русскому языку как иностранному — получили
статус головных вузов системы тестирования.
За прошедшие четверть века этой группой была разработана на-
учно-методическая база российской системы тестирования ТРКИ,
включающая:
•• описание уровней владения русским языком (выделяется
6 уровней, от A1 до C2);
•• лингводидактические требования к  уровням владения рус-
ским языком, соотнесенные с  международными тестовыми
системами;
•• лексические минимумы;
•• профессионально-ориентированные модули, включающие
систему требований и  тестов по русскому языку как языку
специальности;
•• типовые (открытые) и закрытые варианты тестовых материа-
лов по русскому языку как иностранному;
•• типовые (открытые) и  закрытые варианты тестовых матери-
алов по русскому языку для иностранных граждан и лиц без
гражданства, желающих получить гражданство Российской
Федерации.
В последнее десятилетие отмечается устойчивый интерес к рос-
сийской системе тестирования как в  России, так и  за ее пределами.
Внимание к системе ТРКИ в зарубежных странах в значительной сте-
пени определяет ту роль, которую играет русская языковая и культур-
ная составляющая в той или иной стране. На основании договорных

133
Глава 2.  Системы тестирования по иностранным языкам

отношений с  зарубежными организациями-партнёрами головные


вузы системы тестирования успешно проводят тестирование в Болга-
рии, Великобритании, Германии. Италии, Латвии, Польше, Эстонии,
Китае, Корее, Японии и во многих других странах. Опыт зарубежного
тестирования не раз обсуждался на международных конференциях
и семинарах, таких как: «Русский язык и многоязычная Европа: тести-
рование, учреждения и средства для новой медиации» (Италия, Фор-
ли, 26–27 февраля 2008 г.), Методические совещания-семинары по из-
учению и преподаванию русского языка как иностранного (Германия,
Финляндия, Италия, Турция, Китай, май-июнь 2009  г.), V  Междуна-
родная научная конференция «Русский язык в культурном простран-
стве Европы и мира» (Варшава, 9–13 мая 2012 г.)
Следует отметить, что система тестирования по русскому языку
как иностранному на сегодня обеспечена обширным методическим
материалом. Как в  России, так и  за её пределами издаются десятки
учебников, учебных пособий и  тренировочных тестов, ориентиро-
ванных на тот или иной уровень владения русским языком как ино-
странным. Задача обеспечения системы ТРКИ профессиональными
тестологами также успешно решается благодаря семинарам повыше-
ния квалификации «Лингводидактическое тестирование», которые
ежегодно проводят Российский университет дружбы народов, Санкт-
Петербургский государственный университет и Московский государ-
ственный университет. Основной задачей этих семинаров является
формирование тестологической компетенции преподавателей рус-
ского языка как иностранного. Данный вид компетенции позволяет
осуществлять объективный тестовый контроль в системе тестирова-
ния ТРКИ. Не менее актуальной также является задача мониторинга
тестологической компетенции преподавателей-тесторов, ранее про-
шедших обучение на семинарах. К настоящему времени обучение на
семинарах прошли уже около 10 тыс. российских и зарубежных спе-
циалистов (преподавателей, менеджеров системы языкового обуче-
ния), способных проводить сертификационные экзамены, оценивать
результаты тестирования, создавать контрольные и  тренировочные
тестовые материалы и решать другие задачи, связанные с успешным
функционированием системы ТРКИ. 
Методические разработки российских ученых-русистов в  об-
ласти лингводидактического тестирования успешно интегрированы
с общепринятыми мировыми практиками в данной области. Единая
система уровней владения русским языком соотносится с  Европей-

134
2.1.  Тесты по русскому языку как иностранному

ской шкалой владения иностранными языками (CEFR). Уровни, выде-


ляемые в системе тестирования ТРКИ, представлены в ALTE c 1997 г.
и соотносимы с уровневыми системами, принятыми в странах Евро-
пы. Российская государственная система тестирования ТРКИ в 2009 г.
успешно прошла экспертный анализ на соответствие требованиям,
предъявляемым ALTE. 
Система лингводидактического тестирования играет важную
роль в реализации задач миграционной политики. Тесты для приёма
в гражданство представлены во многих европейских тестовых систе-
мах: Кембриджской системе тестирования (Департамент экзаменов по
английскому языку Кембриджского университета, Великобритания),
системах, разработанных организациями «Гёте Институт», «Альянс
Франсез» и др. С этой проблематикой связано одно из направлений де-
ятельности АLTE — «Оценивание в сфере миграции и интеграции» —
LAMI (Language Assessment for Migration and Integration). Новым эта-
пом развития российской государственной системы тестирования
ТРКИ стало введение в  2004  г. тестирования для приёма в  граждан-
ство Российской Федерации (в соответствии с Федеральным законом
№  62-ФЗ от 31  мая 2002  г «О гражданстве Российской Федерации»,
Положением о  порядке рассмотрения вопросов гражданства Рос-
сийской Федерации, утверждённым Указом Президента Российской
Федерации № 1325 от 14 ноября 2002 г.). Тест для приема в граждан-
ство РФ определяет базовый уровень владения русским языком как
иностранным, необходимый для получения гражданства РФ. Данный
тест подготовлен авторскими коллективами головных вузов системы
тестирования, он построен на тех же принципах и  имеет такую же
структуру, как и все тесты системы ТРКИ. Однако, если система ТРКИ
ориентирована на иностранцев, которые могли изучать русский язык
только в  своей стране, то тест на гражданство проходят кандидаты,
которые хотят стать гражданами России, т. е. стремятся обрести права
и обязанности, которые налагаются статусом гражданина. Обеспече-
ние этих прав и выполнение обязанностей определяют особенности,
касающиеся сфер, ситуаций общения, социокоммуникативных ролей,
актуальных для данного контингента.
Таким образом, государственная система тестирования ТРКИ
представлена следующими уровнями.

135
Глава 2.  Системы тестирования по иностранным языкам

Элементарный уровень (ТЭУ / A1)1: достижение данного уров-


ня позволяет иностранцу удовлетворять элементарные коммуника-
тивные потребности при общении с носителем языка в минимальном
наборе ситуаций, в том числе достижение данного уровня необходимо
трудящимся мигрантам для получения разрешения на работу (за ис-
ключением трудящихся мигрантов, занятых в  сфере ЖКХ, торговли
и бытового обслуживания).
Базовый уровень (ТБУ / A2): достижение данного уровня позво-
ляет удовлетворять самые необходимые коммуникативные потребно-
сти в определенных ситуациях, связанных с повседневной жизнью при
общении с носителями языка, в том числе достижение данного уровня
необходимо трудящимся мигрантам, претендующим на работу в сфе-
ре ЖКХ, торговли и  бытового обслуживания, а  также иностранным
гражданам и лицам без гражданства для принятия в гражданство Рос-
сийской Федерации2;
Первый уровень (ТРКИ-I  /  B1): достижение данного уровня
владения русским языком позволяет кандидату удовлетворять основ-
ные коммуникативные потребности в реальных ситуациях общения,
в том числе оно необходимо иностранным гражданам для их зачисле-
ния в высшие учебные заведения на обучение по программам бакалав-
риата и специалитета;
Второй уровень (ТРКИ-II  /  B2): достаточно высокий уровень
владения практическим русским языком, адекватный профессио-
нальному и социальному статусу тестируемого; достижение данного
уровня необходимо иностранным учащимся для получения диплома
бакалавра гуманитарного, инженерно-технического, естественно-на-
учного профилей, а также для зачисления в магистратуру или аспи-
рантуру по указанным направлениям.
Третий уровень (ТРКИ-III  /  С1): данный уровень свидетель-
ствует о  высоком уровне коммуникативно-речевой компетенции во
всех сферах общения, его достижение необходимо иностранным уча-

1
В соответствии с  Федеральными государственными требованиями по
русскому языку как иностранному языку, утвержденными Приказом
Министерства образования и науки Российской Федерации от 28 октября
2009 г. № 463, предусматривается 5 уровней владения языком, не включая
Элементарный уровень.
2
Лица, претендующие на получение гражданства РФ, могут проходить те-
стирование по уровням ТБУ / A2 — ТРКИ-II / B2 в зависимости от усло-
вий предоставления гражданства.

136
2.1.  Тесты по русскому языку как иностранному

щимся для получения диплома бакалавра по направлениям «Филоло-


гия», «Лингвистика» и  близким к  ним специальностям, для зачисле-
ния в магистратуру или аспирантуру по указанным направлениям.
Четвертый уровень (ТРКИ-IV  /  С2): уровень свободного вла-
дения русским языком, адекватный уровню образованного носителя
языка.
Единство государственной системы тестирования ТРКИ основы-
вается на следующих принципах:
•• единство содержания:
—— единая система уровней владения русским языком как
иностранным, на которую следует ориентироваться при
разработке тестовых материалов;
—— единые принципы описания целей и содержания каждого
уровня;
—— единые принципы минимизации целей и  содержания об-
учения для уровневых требований;
•• единство контроля:
—— единые принципы определения формата сертификацион-
ного тестового экзамена каждого уровня;
—— унифицированная модель типовых тестов;
—— единая процедура проведения сертификационного тесто-
вого экзамена;
—— унифицированный подход к оценке (на основе единых па-
раметров и критериев оценки).
В настоящее время перед системой ТРКИ встают новые масштаб-
ные задачи. В  связи с  принятием Федерального закона №  185-ФЗ от
12 ноября 2012 г. «О внесении изменений в статью 13.1 Федерального
закона „О правовом положении иностранных граждан в Российской
Федерации“ и статью 27.2 Закона Российской Федерации „Об образо-
вании“» введено обязательное тестирование по русскому языку для
иностранных мигрантов, желающих получить разрешение на работу
в России в сфере ЖКХ, торговли и бытового обслуживания.
На основании рекомендаций межведомственной рабочей группы
был подготовлен проект приказа Министерства образования и науки
РФ «Об организации тестирования трудящихся мигрантов по рус-
скому языку как иностранному». В соответствии с данным приказом
4 вуза-разработчика системы ТРКИ были признаны головными вуза-

137
Глава 2.  Системы тестирования по иностранным языкам

ми, осуществляющими организацию и проведение тестирования тру-


дящихся мигрантов. В обязанности этих вузов входит:
•• обеспечивать проведение тестирования в регионах России на
основе договорных отношений с региональными вузами;
•• рекомендовать к  утверждению Минобрнауки перечень орга-
низаций для тестирования трудящихся мигрантов за рубежом;
•• лицам, успешно прошедшим тестирование, выдавать серти-
фикат государственного образца;
•• готовить закрытые тестовые материалы и  регулярно обеспе-
чивать ими организации, проводящие тестирование трудя-
щихся мигрантов;
•• обеспечивать взаимодействие по организационным и право-
вым вопросам с региональными управлениями ФМС России;
•• организовывать тестирование за рубежом, используя инфра-
структуру филиалов Россотрудничества, центров фонда «Рус-
ский мир», а  также возможности национальных ассоциаций
русистов, входящих в Международную ассоциацию препода-
вателей русского языка и литературы.
Введение тестирования трудящихся мигрантов является первым
шагом исполнения Указа Президента Российской Федерации № 602 от
7 мая 2012 г. «Об обеспечении межнационального согласия». С 2015 г.
вводится обязательный экзамен по истории России и основам законо-
дательства Российской Федерации в качестве интегрированных про-
фильных частей общего экзамена по русскому языку.
Безусловно, весь этот комплекс мер призван способствовать сни-
жению социальной напряжённости в обществе, установлению циви-
лизованных толерантных отношений между коренным русскоязыч-
ным населением и  трудящимися мигрантами, созданию благоприят-
ных условий для социокультурной адаптации трудящихся мигрантов.
Для решения этих новых масштабных задач российской системе
тестирования необходим единый координационный центр, выполня-
ющий функцию коллегиального управления всей системой. В соответ-
ствии с проектом Положения «О государственной системе тестирова-
ния иностранных граждан» в качестве такого центра может выступать
Российский тестовый консорциум — общественное объединение го-
ловных вузов  — разработчиков системы тестирования, осуществля-
ющее научно-методическое сопровождение государственной системы
тестирования.

138
2.1.  Тесты по русскому языку как иностранному

Таким образом, управление системой тестирования иностран-


ных граждан осуществляют Министерство образования и науки Рос-
сийской Федерации и  Российский тестовый консорциум. Министер-
ство образования и науки Российской Федерации осуществляет раз-
работку и  проведение единой государственной политики в  области
тестирования иностранных граждан.
В ведении Российского тестового консорциума находится:
•• осуществление оперативного управления системой тестиро-
вания по русскому языку как иностранному;
•• разработка процедуры проведения государственного тести-
рования;
•• координация деятельности в  области учебно-методических
и научных разработок в области лингводидактического тести-
рования;
•• ведение единой базы данных лиц, прошедших тестирование;
•• обеспечение передачи информации в  Министерство образо-
вания и науки Российской Федерации и Федеральную мигра-
ционную службу;
•• совершенствование качества тестовых процедур;
•• инспекция качества тестовых испытаний;
•• внедрение единого стандарта деятельности локальных цен-
тров тестирования;
•• повышение квалификации сотрудников и  преподавателей
центров тестирования;
•• разработка и  утверждение формы и  порядка проведения те-
стирования;
•• подготовка закрытых тестовых материалов;
•• проведение экспертизы тестовых материалов;
•• издание методических материалов;
•• осуществление функции внутреннего аудита системы тести-
рования, в  том числе контроль за соблюдением процедуры
и регламента проведения тестирования;
•• ведение Единого реестра центров тестирования в Российской
Федерации и за рубежом.
В связи с  ожидаемым увеличением количества тестируемых  —
трудящихся мигрантов особую актуальность приобретают задачи соз-
дания и ведения единой базы данных для статистической обработки
результатов тестирования, что включает сбор статистических данных

139
Глава 2.  Системы тестирования по иностранным языкам

из всех тестирующих организаций, установление единого программ-


ного обеспечения во всех этих организациях, проведение статическо-
го анализа результатов тестирования, совершенствование системы
тестирования на основе статистического анализа. Эти задачи полу-
чили своё отражение в Концепции функционирования в РФ системы
обработки, хранения и использования результатов тестирования ино-
странных граждан по русскому языку, истории России и основам за-
конодательства Российской Федерации, подготовленной Российским
университетом дружбы народов. Реализации данной концепции явля-
ется одним из приоритетных направлений деятельности Российского
тестового консорциума.
Для успешного функционирования системы тестирования необ-
ходимо решить ряд задач, относящихся к нормативно-правовому обе-
спечению процесса тестирования.
В целях успешного внедрения и функционирования Российской
государственной системы тестирования граждан зарубежных стран
по русскому языку должно быть принято Положение о государствен-
ной системе тестирования, утвержденное указом президента Рос-
сийской Федерации или постановлением правительства Российской
Федерации. В  нем необходимо определить цели, задачи, структуру
и порядок деятельности в данной сфере, а также обозначить круг субъ-
ектов, уполномоченных осуществлять государственное тестирование
как в Российской Федерации, так и за её пределами, урегулировать во-
просы, касающиеся организационного обеспечения процесса тести-
рования. Принципиально важно учесть требование, в  соответствии
с которым тестовые процедуры за пределами России могут осущест-
вляться только российскими специалистами в области тестирования,
имеющими соответствующие сертификаты, предусмотреть возмож-
ность осуществления этих процедур как очно, так и в дистанционном
формате, с применением современных информационных технологий.
Также представляется необходимым ускорить принятие норматив-
но-правовых актов, закрепляющих за Московским государственным
университетом им. М. В. Ломоносова, Санкт-Петербургским государ-
ственным университетом, Российским университетом дружбы наро-
дов, Государственным институтом русского языка им. А. С. Пушкина
статус головных вузов в  области государственного тестирования по
русскому языку как иностранному.
Министерству образования и науки следует устранить противо-
речие в  выделении уровней языковой компетенции: в  соответствии

140
2.1.  Тесты по русскому языку как иностранному

с Федеральными государственными требованиями по русскому языку


как иностранному, утвержденными Приказом Министерства образо-
вания и науки Российской Федерации № 463 от 28 октября 2009 г. пред-
усматривается 5 уровней владения языком, тогда как государственная
система лингводидактического тестирования, создаваемая в  России
с 1992 г. и признанная в 1997 г. Ассоциацией лингвистических тесторов
Европы, включает 6 уровней, в том числе элементарный. Федеральные
государственные требования по русскому языку как иностранному
должны быть приведены в соответствие с существующими междуна-
родными стандартами, в частности применительно к каждому уровню
владения русским языком целесообразно указать соответствующий
уровень европейской системы тестирования (A1–C2).
Таким образом, весь более чем 20-летний период функциониро-
вания системы ТРКИ, создание профессиональной и научно-методи-
ческой базы, подготовка квалифицированных специалистов, совер-
шенствование нормативно-правовой базы, охват территорий  — всё
это свидетельствует о том, что государственная система тестирования
ТРКИ готова решать поставленные перед ней масштабные задачи.

2.1.2. ТЕСТИРОВАНИЕ ПО РУССКОМУ ЯЗЫКУ:


СТРУКТУРА, СОДЕРЖАНИЕ, ПРОБЛЕМЫ

Вхождение России в  мировые торговые и  экономические орга-


низации, расширение влияния русской культуры в мире вызвало уси-
ление интереса к изучению русского языка. Русский язык стал очень
востребованным среди студентов западных университетов.
Тенденции интернационализации образования, увеличения
удельного веса его международной составляющей, в  частности под
влиянием тенденций глобализации экономики, развития современ-
ных глобальных информационных сетей, заставляют идти по пути
выявления лучшего в методиках обучения различным языкам и при-
знания, введения многих этапов обучения в свою систему. Именно та-
ким путем идет во всех странах решение проблемы контроля качества
знаний студентов.
Как упоминалось выше (см. раздел 2.1.1), российская система те-
стирования ТРКИ имеет 6 уровней.
1. Тест элементарного уровня (обычно проводится через
1–1,5 месяца после начала учебных занятий).

141
Глава 2.  Системы тестирования по иностранным языкам

2. Тест базового уровня (обычно проводится в  конце первого


семестра подготовительного факультета).
3. Тест первого сертификационного уровня ТРКИ-I (обычно
проводится в  конце первого курса обучения). Данный уровень, как
правило, достигается учащимися после окончания обучения на под-
готовительном факультете.
4. Тест второго сертификационного уровня ТРКИ-II. Серти-
фикат этого уровня позволяет кандидату вести профессиональную де-
ятельность на русском языке в качестве специалиста гуманитарного,
инженерно-технического, естественно-научного профиля.
5. Тест третьего сертификационного уровня ТРКИ-III. Серти-
фикат этого уровня позволяет вести профессиональную деятельность
на русском языке в качестве специалиста-филолога, переводчика, ре-
дактора, журналиста, дипломата, менеджера, ведущего свою профес-
сиональную деятельность в русскоязычном коллективе.
6. Тест четвёртого сертификационного уровня ТРКИ-IV. Те-
стирование на этом уровне проходят лица, получающие диплом маги-
стра-филолога, а также диплом кандидата филологических наук.
Существуют также тесты по русскому языку в деловом общении3
и тесты на получение гражданства Российской Федерации4.
Каждый из этих тестов состоит из 5 аспектов:
1) лексика и грамматика;
2) чтение;
3) письмо;
4) аудирование;
5) говорение.
В соответствии с  уровнями коммуникативной компетенции
системы тестирования Совета Европы тесты ТРКИ представлены
в табл. 8.
Для анализа структуры тестов и характеристики тестовых зада-
ний мы посчитали удобным проанализировать тест ТРКИ-II. Это тест
«срединный» в общей системе: он проверяет компетенцию уже не на
начальном, а на достаточно высоком уровне, но и не является тестом,
проверяющим филологическое владение языком.
3
Типовые тесты по русскому языку как средству делового общения: Уро-
вень I, II, III. М., 1999.
4
Типовой тест по русскому языку для приема в гражданство Российской
Федерации. СПб., 2005.

142
Таблица 8
Системы уровней владения языком Совета Европы и России

Уровень A1 A2 B1 B2 C1 C2
Уровень
Пороговый Уровень
Уровень Предпороговый Пороговый професси-
продвинутый владения
Европейская выживания уровень уровень онального
шкала владения уровень в совершенстве
владения
иностранными
языками Effective
Breakthrough Waystage Threshold Vantage Operational Mastery
Proficiency
Первый Второй Третий Четвертый
Элементарный Базовый сертифика- сертифика- сертифика- сертифика-
Русский язык
уровень уровень ционный ционный ционный ционный
уровень уровень уровень уровень
Тест ТБУ ТБУ ТРКИ-I ТРКИ-II ТРКИ-III ТРКИ-IV

143
2.1.  Тесты по русскому языку как иностранному
Глава 2.  Системы тестирования по иностранным языкам

Чтение. Тест ТРКИ-II содержит 3  текста для чтения. Тематика


первого из  них должна быть актуальна для социально-культурной
и  официально-деловой сфер общения (при ее очевидной страновед-
ческой направленности). На основе второго текста проверяют способ-
ность тестируемого извлекать информацию о содержании текста в це-
лом, определять тему и идею, выделять основную и второстепенную
информацию, а также представлять логическую схему развертывания
основной концепции текста. Текст носит повествовательно-описа-
тельный характер с элементами рассуждения. Его тематика актуальна
для социально-культурной сферы. Третий текст определяет уровень
сформированности навыков и умений в чтении художественной ли-
тературы: способности тестируемого следить за ходом событий, из-
ложенных в тексте, квалифицировать способ сообщения, определять
сопричастность автора событию, а также выражать отношение к про-
читанному.
Задания после каждого из  текстов представлены в  форме мно-
жественного выбора: тестируемому необходимо закончить предложе-
ния, выбрав правильный вариант из четырех предложенных.
Грамматика — здесь представлены тесты множественного выбо-
ра и задания на дополнение.
Письмо. Субтест «Письмо» состоит из 3 заданий. Задание 1 опре-
деляет способность тестируемого репродуцировать письменный / ау-
диотекст в  соответствии с  законами жанра текста, который необхо-
димо создать. В  задании  2  определяется способность тестируемого
продуцировать письменный текст, относящийся к официально-дело-
вой сфере общения: самостоятельно оформлять официально-деловые
документы, участвовать в деловой переписке, владеть основами дело-
производства на русском языке. В задании 3 проверяется способность
тестируемого осуществлять письменное общение в  социально-куль-
турной и социально-бытовой сферах общения в форме монолога-опи-
сания, монолога-повествования с элементами рассуждения.
Аудирование. Этот субтест содержит 25 заданий, и после каж-
дого блока заданий тестируемому предъявляются вопросы в  пись-
менной форме. Задания по форме представляют собой тестовые за-
дания множественного выбора.
Говорение. Этот тест состоит из 3 частей и 15 заданий. Задания
первой части — условно-речевого характера. Задания 1–4, 5–8: тести-
руемый должен дать правильный вариант ответа на реплику тестиру-
ющего (продуцирование текста); в заданиях 9–12 проверяется способ-

144
2.1.  Тесты по русскому языку как иностранному

ность тестируемого достигать определенных коммуникативных целей


ритмико-интонационными средствами (тестируемый читает предло-
жения с заданной интонацией). В задании 13 — задании второй части
теста  — проверяется способность составить на основе видеосюжета
монологическое высказывание типа «описание», «повествование»
с  элементами рассуждения. Задания 14  и  15  — задания коммуника-
тивного характера  — направлены на проверку умений участвовать
в диалоге в качестве инициатора и собеседника («ролевая игра» и «ин-
тервью»).
Говорение является одним из самых интересных и показательных
видов речевой деятельности при измерении уровня коммуникатив-
ной компетенции. И именно говорение заслуживает особого внима-
ния с точки зрения соответствия данного теста российской системы
и  тестов по устной речи в  системах тестирования стран, входящих
в АЛТЕ. Стоит сравнить форматы тестов, процедуры проведения, си-
стемы оценивания речевого продукта.
Прежде всего, сравнивая тесты по говорению, мы видим боль-
шую разницу во времени проведения данного субтеста. Например,
тест по говорению 2-го уровня в системе ТРКИ проходит 45 мин., в си-
стеме тестирования Cambridge English — 14 мин.
Критерий экономичности лежит в  основе идеи о  сокращении
времени, отводимого на проведение теста по говорению, и, следова-
тельно, о пересмотре структуры теста по русскому языку.
Субтест «Говорение» должен отвечать критериям валидности,
надежности и  экономичности. Первый из  названных критериев за-
ставляет задуматься над возможностью изменения формата тестовых
заданий первого блока  — «условно-речевых», где в  первую очередь
проверяется лингвистическая компетенция кандидатов, а очень стро-
гая заданность параметров ситуации вызывает трудности психологи-
ческого характера при выполнении заданий.
Отдельным вопросом при сравнении тестов по говорению в раз-
ных системах является парное тестирование. Оно имеет ряд преиму-
ществ, но  вызывает и  некоторые сомнения в  соблюдении третьего
правила тестирования — соответствия критерию надежности.
В настоящее время распространение получает дистанционное
тестирование устной речи. При проведении экзамена в такой форме,
несомненно, выигрывает форма проведения «тестор  — кандидат».
Парное тестирование в дистанционной форме имеет огромные недо-
статки: для тестора, рейтера  — трудности акустического и  психоло-

145
Глава 2.  Системы тестирования по иностранным языкам

гического характера при ведении и, особенно, при оценке речевого


продукта тестируемого; для сдающих тест кандидатов  — сложность
ориентации на незнакомого, «виртуального» тестора, неосознанная
или сознательная «работа на камеру», поведение с  учетом фактора
безличного общения через экран.
Особого рассмотрения требуют вопросы, связанные с оценива-
нием результатов тестирования устной речи. Заметим, что опреде-
ленная размытость критериев оценивания и недостаточная четкость
в  описании параметров существует и в  системах тестирования по
другим языкам (см. ниже). Это объясняется огромной сложностью
и нерешенностью до конца этого вопроса на данном этапе. Возмож-
но, приведение в соответствие параметров и критериев оценивания
поможет созданию наиболее четкой системы оценивания устной
речи.

Проведенный в разделах 2.2–2.11 разделах обзор тестов по ино-


странным языкам, разрабатываемых в  разных странах, показывает,
что в них отражается языковая, культурно-национальная и социаль-
ная специфика.

2.2.  ТЕСТЫ ПО АНГЛИЙСКОМУ ЯЗЫКУ

2.2.1. БРИТАНСКИЕ И АМЕРИКАНСКИЕ ТЕСТЫ ПО АНГЛИЙСКОМУ ЯЗЫКУ


КАК ИНОСТРАННОМУ

Тестирование в  области английского языка получило наиболее


бурное развитие ввиду широкого использования английского язы-
ка как средства международного общения и  как языка-посредника
(«lingua franca») во многих странах с  многонациональным и  /  или
многоязыковым составом населения. Монополия в производстве ан-
глийских языковых тестов принадлежит учреждениям двух ведущих
англоязычных стран  — Великобритании и  США. В  Великобрита-
нии число тестирующих центров достаточно велико. Это и Департа-
мент экзаменов по английскому языку Кембриджского университета
(Cambridge English Language Assessment), и  Ассоциация признанных
английских школ, и  Лингвистический институт, и  Лондонский уни-
верситет, а также Питмановский институт, Лондонская торговая па-
лата, Оксфордский университет и некоторые другие.

146
2.2.  Тесты по английскому языку

В Великобритании, Австралии и некоторых других англоязычных


странах нет единого официально признанного экзамена по английско-
му языку для иностранцев. В этих странах учреждаются специальные
экзаменационные комиссии (boards), которые разрабатывают экзаме-
ны и проводят их у себя и за рубежом. Эти комиссии создаются при
университетах или лингвистических институтах; ни одна из этих ко-
миссий не является государственной и самой главной из всех. Более
того, Оксфордская или Кембриджская комиссии связаны с одноимен-
ными университетами не слишком тесно: это независимые как от го-
сударства, так и от самих университетов организации.
Безусловным лидером среди перечисленных членов ассоциа-
ции тестирования является Департамент экзаменов по английско-
му языку Кембриджского университета (Cambridge English Language
Assessment). Это некоммерческое подразделение Кембриджского Уни-
верситета, которое является частью компании Cambridge Assessment
Group. Эта независимая экзаменационная служба существует уже бо-
лее ста лет: первый экзамен проводился в 1913 г. Департамент имеет
тенденцию поглощать в себя другие тестовые службы в Великобрита-
нии, что произошло, например, с Оксфордским комитетом. Департа-
мент проводит различные экзамены для студентов разного возраста
и разных профессиональных категорий: бизнесменов, учителей и др.
Кембриджские экзамены пользуются большой популярностью
во всем мире. На сегодняшний день, например, экзамен FCE (First
Certificate in English) сдают более 270 тыс. чел. в год. Это можно объ-
яснить тем, что многие университеты Англии, Канады, Австралии,
Франции в качестве основного требования к иностранным абитури-
ентам предъявляют успешную сдачу именно кембриджских экзаме-
нов. Даже некоторые вузы США признают наряду с TOEFL результаты
IELTS (International English Language Testing System). Кроме того, атте-
статы Cambridge English признаются многими крупными европейски-
ми компаниями.
Основные кембриджские экзамены охватывают 5  уровней:
от начального (Key English Test  — КЕТ) до высокого продвинутого
(Certificate of Proficiency in English — CPE). Экзамены трех самых вы-
соких уровней (CPE, CAE и  First Certificate in English  — FCE) необ-
ходимы для продолжения учебы за рубежом и признаются большин-
ством университетов Европы.
Наибольшей известностью в  нашей стране пользуются следую-
щие британские тесты.

147
Глава 2.  Системы тестирования по иностранным языкам

KET (Key English Test) — соответствует начальному уровню вла-


дения английским языком и Waystage Level no шкале ALTE. 
PET (Preliminary English Test) — соответствует подготовитель-
ному уровню владения английским языком, Threshold Level по шкале
ALTE5.
FCE — самый популярный экзамен, который сдает наибольшее
число экзаменующихся в  центрах тестирования. Среднего уровня
(Independent User), на который он рассчитан, в принципе может до-
стичь любой желающий, потративший необходимое для этого время
на подготовку и обучение.
CAE (Certificate in Advanced English) позволяет определить уро-
вень владения английским языком у  испытуемых на продвинутом
уровне.
CPE (Certificate of Proficiency in English) — тест на общее владе-
ние английским языком самого высокого уровня (по шкале Совета Ев-
ропы — Mastery Level). Уровень языковой компетенции сдавших этот
тест соответствует требованиям, предъявляемым к  поступающим
в  большинство университетов Великобритании и  других англогово-
рящих стран. Отражает навыки, близкие к билингвальным.
FCE, CAE и  СРЕ построены по одной и  той же схеме и  состо-
ят из  пяти частей (субтестов): субтест на проверку навыка чтения
(Reading), субтест на проверку письменной речи (Writing), субтест на
проверку лексики и  грамматики (English in Use), субтест на провер-
ку восприятия речи на слух (Listening) и субтест на проверку навыка
говорения (Speaking). Экзамены различаются лишь по сложности за-
даний и продолжительности. Абсолютным лидером среди британских
экзаменов по числу кандидатов остается FCE. 
YLE (Cambridge Young Learners English Test) — тесты на общее
владение языком для детей, разработанные в  1996  г. Проводятся на
трех уровнях: Starters, Movers и Flyers, последний из которых соответ-
ствует по содержанию тестируемых навыков экзамену КЕТ. 

5
См. публикации по шкале ALTE: Ek  J. A. van, Trim  J. L. 1)  Threshold
1990  /  Council of Europe. Cambridge: Cambridge University Press, 1998.
URL: https://www.coe.int/t/dg4/linguistic/Threshold-Level_CUP.  pdf (дата
обращения: 15.10.2016); 2) Waystage 1990 / Council of Europe. Cambridge:
Cambridge University Press, 1998. URL: https://www.coe.int/t/dg4/linguistic/
Waystage_CUP. pdf (дата обращения: 15.10.2016); 3)  Vantage  /  Council of
Europe. Cambridge: Cambridge University Press, 2003. URL: https://www.coe.
int/t/dg4/linguistic/Vantage_CUP. pdf (дата обращения: 15.10.2016)

148
2.2.  Тесты по английскому языку

Отдельно стоят тесты по использованию английского языка


в специальных целях (ESP).
ВЕС (Business English Certificate) — тест по деловому английско-
му языку, администрируемый на трех уровнях (ВЕС I, ВЕС II, ВЕС III).
ILEC (International Legal English)  — экзамен по английскому
языку для юристов, введенный в  России лишь в  2006  г. и  пока что
мало известный публике. Он требует, помимо очень глубоких знаний
по юриспруденции, и высокого (B2–C1) уровня владения английским
языком. Инициирован Кембриджским синдикатом совместно с Ассо-
циацией переводчиков-юристов TransLegal. В настоящее время не ад-
министрируется.
ICFE (The International Certificate in Finance English) — тест для
пользователей английским языком в сфере международной финансо-
во-кредитной деятельности и  бухгалтерского учета, разработанный
Европейской ассоциацией языкового тестирования (ALTE) совместно
с международной профессиональной Ассоциацией сертифицирован-
ных присяжных бухгалтеров ACCA (The Association of Chartered Cer-
tified Accountants, основана в  1904  г.) в  2006  г. Первое тестирование
было осуществлено в мае 2007 г.
С каждым годом растет интерес к экзамену IELTS (International
English Language Testing System), который в  последнее время стал
наиболее востребованным тестом при поступлении в  высшие учеб-
ные заведения англоязычных стран, включая США. Он относится
к сфере употребления английского языка в академических целях. Осо-
бенно хорошо он известен в Европе и Латинской Америке, Австралии,
Новой Зеландии. Его, как и  TOEFL, нельзя «провалить»  — сколько-
нибудь баллов по этому экзамену набирает каждый кандидат. IELTS
администрируется Британским Советом и  австралийской образова-
тельной организацией IDP Educational Australia. Тест был разработан
в двух вариантах. Все желающие поступить в университет сдают ака-
демический модуль (Academic Module), а  для школьников, эмигран-
тов и  других категорий разработан общий модуль (General Training
Module).
У этого теста есть два преимущества перед основными Кем-
бриджскими экзаменами: он длится всего 3 ч. и все процедуры — от
регистрации до получения результата — занимают один месяц.
Среди профессиональных тестов для преподавателей в  тече-
ние ряда лет Cambridge English Language Assessment (Экзаменацион-
ный департамент Кембриджского университета) предлагал CEELT

149
Глава 2.  Системы тестирования по иностранным языкам

(Certificate of English for English Language Teachers) — тест, который


определял уровень подготовки преподавателей английского языка.
В настоящее время он не проводится, так как преподавательские ква-
лификации CELTA (Certificate in English Language Teaching to Adults),
DELTA (Diploma in English Language Teaching to Adults) и  COTE
(Certificate for Overseas Teachers of English) присваиваются только по
окончании соответствующих курсов профессиональной подготовки.
В настоящее время эти экзамены не имеют хождения в  России,
им на смену пришел пропилотированный в  2007  г. экзамен Teacher
Knowledge Test (TKT). По сравнению с предыдущими тестами на ме-
тодологическую компетенцию этот тест понижает планку владения
собственно английским языком (его уровень приблизительно соот-
ветствует PET), но при этом значительно расширяется охват вопросов
теории и методики обучения.
Почти все Кембриджские экзамены подробнее описаны в следу-
ющих разделах книги.
Кроме Кембриджских экзаменов международно признанными
являются и экзамены других тестирующих организаций.
Один из  них  — Trinity College Exam  — подразделяется на
12  уровней. Первые три соответствуют начальному уровню (Begin-
ners), 4-й и  5-й  — Lower intermediate, с  6-го по 9-й  — Intermediate,
10-й — Lower Proficiency, 11-й — Proficiency, 12-й — Higher Proficiency.
Чем выше уровень, тем больше различных заданий выполняют испы-
туемые. Восприятие на слух и говорение проверяется на всех уровнях,
чтение — с 4-го уровня, а письмо добавляется на 11 и 12 уровнях.
Еще один экзамен  — English for Speakers of Other Languages
(ESOL) — разработан Институтом Питмана, который входит в струк-
туру экзаменационной комиссии City & Guilds и признается универ-
ситетами и колледжами Великобритании, в том числе такими извест-
ными, как Бирмингемский и Лондонский университеты, Университет
Уэльса. Признан он и некоторыми зарубежными вузами, где препода-
вание ведется на английском языке, — Американским Высшим коллед-
жем в Греции, некоторыми вузами в Австралии, колледжем в Макао.
Экзамен принимается на пяти уровнях: Basic, Elementary, Intermediate,
Advanced.
Широкой популярностью в  нашей стране пользуется OPT
(Oxford Placement Test), тест Дейва Аллена, который является мягким
вступительным тестом с непрерывной шкалой, позволяющим распре-
делить студентов в однородные по уровню знаний и умений группы

150
2.2.  Тесты по английскому языку

при наборе. Однако этот тест не признается как вступительный в уни-


верситеты и не является сертифицирующим. Кроме того, наши иссле-
дования показали, что в  российской аудитории некоторые вопросы
этого теста нуждаются в замене ввиду неадекватности по культуроло-
гическому фактору6.
В США методические материалы для проверки знаний, умений
и навыков по английскому языку выпускаются организацией «Служ-
ба образовательного тестирования» (ETS) в городах Принстон, штат
Нью-Джерси; Беркли, штат Калифорния; Иванстон, штат Иллинойс.
Служба образовательного тестирования представляет собой
некоммерческую организацию, которая была основана в  1947  г. со-
вместно с Американским советом по образованию (American Council
on Education), Фондом Карнеги для содействия прогрессу в  области
преподавания (Carnegie Foundation for the Advancement of Teaching)
и  Управлением по проведению вступительных экзаменов в  высшие
учебные заведения (College Entrance Examination Board). При создании
этой службы перед ней была поставлена задача объединить, унифи-
цировать и расширить деятельность трех основавших ее организаций
в области педагогического тестирования и взять на себя руководящую
роль в деле измерений, связанных с обучением в национальном мас-
штабе. Деятельность этой организации охватывает все уровни образо-
вания, включая среднюю школу, вузы и аспирантуру. Материалы, вы-
пускаемые этой организацией, используются различными учебными
заведениями.
Американские университеты значительно различаются по своим
академическим стандартам в практике присвоения научных степеней
и других способах определения образовательного уровня. Однако су-
ществуют некоторые виды стандартных оценок. Для отбора студен-
тов на конкурсной основе из большого числа претендентов, имеющих
разные уровни подготовки, необходим стандарт, объективный кри-
терий для их сравнения. В  системе высшего образования США эта
роль отводится тестам. При поступлении в учебные заведения США
прохождение стандартных тестов является необходимым условием.
Обычно при поступлении в университет или аспирантуру требуется
прохождение общеобразовательного теста, теста по специальности,
иностранцы обязательно представляют результаты теста по англий-
скому языку.

6
Павловская И. Ю. Тестирование в учебном процессе…

151
Глава 2.  Системы тестирования по иностранным языкам

Описанные ниже американские тесты основаны на принципе


выбора тестируемым одного правильного ответа из нескольких, пред-
лагаемых в письменном виде, на каждый вопрос, т. е. на технологиче-
ском приеме множественного выбора (исключение составляют тест
устного английского языка (Test of Spoken English) и тест письменного
английского языка (Test of Written English).
Наибольшей популярностью пользуются тесты TOEFL (Test of
English as a Foreign Language), GMAT (Graduate Management Admission
Test), GRE (Graduate Record Examinations), сдача которых необходима
при поступлении в  американские университеты или на конкурсные
американские программы (при этом два последних — не языковые те-
сты и сдаются как иностранцами, так и местными жителями).
TOEFL — тест на определение уровня знания английского языка
как иностранного. Результаты именно этого теста требуются в 100 %
случаев при поступлении в университеты США студентов или аспи-
рантов. Он состоит из четырех разделов (подробнее о нем см. ниже).
GMAT  — тест, дающий возможность оценить уровень общего
развития выпускников высших школ, подающих заявления в амери-
канскую аспирантуру по специальности «бизнес». Этот тест не ставит
целью выявить уровень специальных знаний в  данной области. Со-
стоит из 7 разделов.
GRE (общеобразовательный тест)  — экзамен для аспирантов
всех специальностей, кроме медицины, бизнеса, права (для них раз-
работаны специальные тесты). Результаты GRE требуются при по-
ступлении в аспирантуру в большинстве университетов, особенно от
желающих получить финансовую помощь университета. Этот тест со-
ставлен из семи 30-минутных разделов, дающих возможность оценить
общий уровень тестируемого, проследить соответствие его вербаль-
ных, математических и аналитических способностей уровню требова-
ний, предъявляемых к аспирантам. В 16 областях знаний разработан
GRE Subject Test (предметный тест), призванный оценить уровень
знаний тестируемого в конкретной области, в которой он собирается
специализироваться в аспирантуре.
TWE (Test of Written English) — тест на письменный английский
язык. Дает возможность тестируемым продемонстрировать способно-
сти в написании короткого эссе по-английски на заданную тему. Ис-
пользуется в дополнение к трем разделам TOEFL или самостоятельно.
TSE (Test of Spoken English) — тест на английский разговорный
язык. Некоторые университеты требуют сдачи TSE в качестве допол-

152
2.2.  Тесты по английскому языку

нения к результатам TOEFL. Процедура сдачи экзамена такова: тести-


руемым в письменном и устном виде предлагаются вопросы на общие
темы, а их устные ответы записываются на магнитофон для последу-
ющего их оценивания.
TOEIC (Test of English for International Communication) ори-
ентирован на проверку знаний и  умений по деловому английскому
языку. Сертификат этого теста признается достаточным для бизнес-
персонала, инженерных кадров, работников промышленных пред-
приятий, торговли, обслуживающего персонала больниц, гостиниц,
ресторанов, спортивных мероприятий и  организаций, международ-
ных конференций при приеме на работу. Кроме того, этот тест ква-
лифицирует медиков, имеющих иностранный диплом о высшем или
среднем медицинском образовании, которые собираются учиться
дальше или практиковать в США в области медицины.
В США большое число выпускников школ сдают тесты SAT
(Scholastic Aptitude Test). С 1994 г. различают SAT I (Reasoning test),
который включает вербальный и математический разделы (Verbal and
Mathematical sections) и определяет общие вербальные и математиче-
ские способности тестируемых, независимо от выбранной ими специ-
альности, и SAT II (Subject Test), который определяет уровень знаний
в той конкретной области, в которой тестируемый собирается специ-
ализироваться.
Foreign Language Prognosis Test, прогностический тест Симонд-
са, был специально разработан для исследования проблемы перевода.
MLAT (Modern Language Aptitude Test), прогностический тест
Джона Кэррола, создан в  соавторстве со Стэндли Сэпоном с  целью
определения возможной степени успеха в освоении английского язы-
ка. В настоящее время MLAT является единственным широко исполь-
зуемым прогнозирующим тестом по иностранным языкам в  миро-
вой методике обучения, не считая теста Пимслера «Language Aptitude
Battery», который еще не нашел такого широкого признания и приме-
нения, как MLAT. 
Большая работа по составлению и  применению тестов ведет-
ся в  Мичиганском университете, в  Институте английского языка,
где разрабатываются тесты типа Michigan Test of English Language
Proficiency  — теста, оценивающего знания, умения и  навыки по ан-
глийскому языку7. Он включает три варианта — А, В и С (Forms A, В,

7
Upshur J., Palmer L., Harris J., May G. Michigan test of English language profi-

153
Глава 2.  Системы тестирования по иностранным языкам

С), составленные идентично, равные по трудности, но различные по


языковому наполнению.
Каждый вариант теста (А, В, С) состоит из следующих частей:
•• письменное сочинение;
•• проверка понимания речи на слух;
•• проверка лексики и грамматики;
•• проверка чтения.
Тест начинается с написания сочинения, для того чтобы дать воз-
можность испытуемым собраться с мыслями, сосредоточиться на бо-
лее привычном для них виде работы. Затем следуют остальные, пере-
численные выше виды работы.
Самый распространенный из вышеперечисленных экзаменов —
тест по английскому языку как иностранному, TOEFL (Test of English
as a Foreign Language). Сдают его студенты, для которых английский —
не родной язык. Сертификат признается в 5 тыс. университетов и кол-
леджей в  более чем в  90  странах, в  том числе в  Японии, Франции,
Швеции, Испании, Австралии, даже в Великобритании (где есть свои
экзамены по английскому языку). Этот тест валиден, когда речь идет
об учебе или стажировке на английском языке или когда знание ан-
глийского языка необходимо для работы.
Первоначально тест существовал в  бумажном варианте (Paper-
based TOEFL (PBT), в 1998 г. стал электронным (Computer-based TOEFL
(CBT), а с осени 2005 г. появилась интернет-версия теста (TOEFL iBT)8.
Для учебных заведений (организаций), участвующих в совмест-
ных обменных программах, продолжает использоваться бумажная
версия PBT (Institutional TOEFL).
Среди профессиональных тестов ETS предлагает серию PRAXIS
для учителей-предметников по принципам обучения, коммуникатив-
ным навыкам на английском языке и специальным знаниям в области
математики, химии, физики и других дисциплин.
Таким образом, системы тестирования английского языка пред-
ставлены чрезвычайно широко, проверяют как общие, так и  специ-
альные навыки и конкурируют между собой на международном рынке
образовательных услуг.

ciency. Ann Arbor (MI): The English Language Institute, University of Michi-
gan, 1961; The University of Michigan Examination for the Certificate of Profi-
ciency in English: Official Past Papers. Oxford: Oxford University Press, 1997.
8
Подробно эволюция этого теста описана в разделе 2.2.2.

154
2.2.  Тесты по английскому языку

2.2.2. 50 ЛЕТ TOEFL: СМЕНА ПАРАДИГМЫ И ЕЕ ПОСЛЕДСТВИЯ

В 2014 г. TOEFL (Test of English as a Foreign Language) исполнилось


50  лет. Еще несколько лет назад безо всякого преувеличения можно
было говорить, что TOEFL — это самый авторитетный и востребован-
ный тест на знание английского языка. Его успешная сдача являлась
не только обязательным условием обучения в высших учебных заведе-
ниях США и ряда других стран, но часто служила конкурентным пре-
имуществом при устройстве на работу в международные компании.
Сейчас приходится признать, что это детище ETS безвозвратно
проиграло в соперничестве с британским IELTS.
IELTS (International English Language Testing System) появился на
рынке языкового тестирования в  1989  г. и  поначалу не пользовался
особым спросом. В 1995 г. его сдавало всего 43 тыс. чел. Тем не менее
свойственное британцам терпение дало свои плоды: к  2007  г. число
ежегодно сдающих IELTS выросло почти в 25 раз и достигло 1 млн чел.
Через год их было 1,4 млн, через два — 1,7 млн, а в 2012 г. уже более
2 млн9.
Совсем иная ситуация с TOEFL. По официальным данным ETS,
в 2006 г. его сдавали «более 800 тыс. кандидатов»10, а в 2013 г. — «около
миллиона»11. Таким образом, за 7 лет увеличение контингента сдаю-
щих составило менее 200  тыс. Единственное, чем осталось гордить-
ся ETS, это тем, что «более 27 миллионов человек во всем мире сдали
TOEFL, чтобы продемонстрировать свой уровень владения англий-
ским языком»12. Но это статистика за пятьдесят лет. А самое обидное
для ETS, наверное, то, что результаты сдачи IELTS теперь принимают
более 3 тыс. учебных заведений и организаций в самих Соединенных
Штатах.
Очевидно, что для такого массового «дезертирства» потреби-
телей должны быть веские причины. Представляется, что главной

9
IELTS: [сайт]. URL: www.ielts.org/media_centre.aspx (дата обращения:
15.10.2016).
10
Taking on TOEFL // Inside Higher Ed: [сайт]. URL: www.insidehighered.com/
news/2006/08/07/ielts (дата обращения: 15.10.2016).
11
Test  of English as a Foreign Language (TOEFL) //  University of Cincinnati:
AESS Testing Services: [сайт]. URL: http://www.uc.edu/testingservices/Tests_
Offered/toefl_info.html (дата обращения: 15.10.2016).
12
About the TOEFL iBT® Test // ETS TOEFL: [сайт]. URL: www.ets.org/toefl/ibt/
about (дата обращения: 15.10.2016).

155
Глава 2.  Системы тестирования по иностранным языкам

из них является изменение идеологии и формата теста, имевшие ме-


сто в 2005 г.
Тестологически TOEFL образца 1964  г. представлял собой клас-
сический пример отборочного теста13, определяющего нижний порог
для зачисления в ту или иную группу или на тот или иной курс. Сам
по себе балл, полученный при сдаче таких тестов, значения не имеет.
Главное, чтобы он хоть на единицу был выше установленного поро-
га. Так, в  TOEFL-1964  550  баллов соответствовали уровню студента,
600 — аспиранта. Лица, получившие 551 балл и 599 баллов, все равно
попадали в одну и ту же категорию.
Идеологически TOEFL образца 1964 г. представлял собой класси-
ческий пример теста, ориентированного на проверку знания. Можно
по-разному классифицировать учебные дисциплины, но, с точки зре-
ния тестирования, их условно можно разделить на предметы, ориен-
тированные на знание фактов (knowledge or fact-oriented disciplines),
и  предметы, ориентированные на овладение навыками (command or
habit-oriented disciplines).
Примером дисциплин первого типа является история. Здесь
в учебной программе, и соответственно при оценке результатов обу-
чения, главенствует знание фактов (дат, имен, названий, количествен-
ных показателей и т. п.). Способность интерпретировать факты, давать
собственный анализ причинно-следственных связей не оценивается.
Отсюда вытекает и  принцип построения таких тестов: множествен-
ный выбор (multiple choice). Даже в тех случаях, когда сдающему пред-
лагается ответить на вопросы к  тексту, у  него нет никакой возмож-
ности дать свою собственную интерпретацию событий: правильным
может быть только один ответ, а именно тот, который предусмотрен
составителями теста. Кроме того, предметы, ориентированные на зна-
ние, предполагают обязательное владение значительным количеством
специальных терминов.
Обучение иностранным языкам относится к иному роду учебных
дисциплин. Безусловно, и здесь знание фактов (вокабуляра и грамма-
тических структур) является обязательным условием успешности про-
цесса обучения. Однако оно само по себе не гарантирует правильного,
т. е. соответствующего системе данного языка, использования языко-
вых единиц при порождении речевых высказываний. Известно, что
многие из тех, кто получал достаточно высокий балл, сдавая TOEFL

13
См.: Павловская И. Ю. Тестирование в учебном процессе… С. 6.

156
2.2.  Тесты по английскому языку

образца 1964 г., испытывали трудности при практическом общении на


английском языке.
И уж совсем никакого значения не имеет здесь знание или не-
знание терминов, описывающих языковые факты, поскольку обучение
иностранному языку и его изучение (языкознание) — вещи суть раз-
ные. Как убедительно показала дескриптивная лингвистика, научное
описание какого-либо языка вообще не требует владения этим язы-
ком. С другой стороны, знание того, каким лингвистическим терми-
ном принято обозначать то или иное языковое явление, ничего не дает
для использования его при порождении речи.
Лингвистически TOEFL образца 1964 г. представлял собой клас-
сический пример сегрегированного теста, который оценивал языковые
знания и языковые умения по отдельности. Тест состоял из четырех
частей: проверка понимания на слух (Listening comprehension), про-
верка знания лексики (Vocabulary), проверка знания морфологии
и синтаксиса (Structure and Written Expression), проверка понимания
письменного текста (Reading comprehension).
Но реальное использование языковых единиц при порождении
речевых высказываний может осуществляться только благодаря тому,
что языковые навыки существуют у «пользователя» в едином комплек-
се, интегрировано. Безусловно, иногда для практических целей впол-
не можно обойтись способностью понимать содержание письменно-
го текста, не умея правильно произнести ни единого слова из  этого
текста. «Читаю со словарем» можно считать видом владения языком,
но владения особого рода.
К чему может привести попытка оценивать уровень владения
языком (фр. langage), тестируя знание единиц языковой системы (фр.
langue), наглядно иллюстрируется содержанием таких разделов «ста-
рого» TOEFL, как Vocabulary и Structure and Written Expression.
В первом испытуемым предлагалось 30  коротких предложений
с одним подчеркнутым словом, к которому из четырех предлагаемых
вариантов надо было выбрать слово или словосочетание, «наилучшим
образом передающее значение подчеркнутого слова».
Сама по себе подобная методика проверки знания лексики впол-
не допустима. Другое дело, что словарный корпус этой части пред-
ставлял собой странный конгломерат слов совершенно разной частот-
ности и  стилистической принадлежности. Вот несколько примеров
из одного и того же теста. С одной стороны, проверяется знание зна-
чений слов system и abroad:

157
Глава 2.  Системы тестирования по иностранным языкам

Braille, the universally accepted system of writing used by blind persons,


consists of sixty-three characters.
A. catalog
B. method
C. committee
D. punctuation
Federica Von Stade has sung in opera houses throughout the United
States and abroad.
A. on the radio
B. on recordings
C. in private homes
D. in other countries
А с другой — ascertain и preeminence, которые в толковых слова-
рях сопровождаются пометкой formal.
Biologists have ascertained that specialized cells convert chemical energy
into mechanical energy.
A. determined
B. argued
C. exempted
D. hypothesized
The preeminence of the newspapers as a daily source of information has
been undermined as a result of the rapid expansion of the audiovisual media.
A. promotion
B. superiority
C. rank
D. utility
Было бы понятно, если бы знание более редких, книжных слов
оценивалось выше, чем знание слов повседневного обихода, но этого
не было. Все они с точки зрения начисляемых баллов «весили» одина-
ково. Поскольку ETS не склонна раскрывать свои принципы состав-
ления тестов, приходится только гадать, как отбиралась лексика для
этого раздела.
Еще больший интерес с рассматриваемой точки зрения представ-
ляет собой раздел Structure and Written Expression. В нем имелось две
части. В первой испытуемым предлагалось 15 коротких предложений,
в  которых надо было заполнить пропуски. Это было классическое
задание на подстановку, против которого, учитывая идеологию тог-
дашнего TOEFL, вряд ли можно возражать. Но анализ значительного

158
2.2.  Тесты по английскому языку

количества реальных тестов показывает, что три из четырех предла-


гаемых для вставки варианта в 70–75 % случаев были абсолютно бес-
смысленны. Вот примеры опять же из одного и того же теста.
1. The ancestors of the horse lived _____ and were about half a meter tall.
B. ago 60 million years
A. years ago 60 million
С. 60 million years ago
D. million years ago 60
5. In 1978 the United States National Air and Space Administration se-
lected Sally Ride the ____ first woman astronaut.
A. who being
B. to be
C. and being
D. was
11. The «confederation school» poets of nineteenth-century Canada
were primarily nature poets, _____a wealth of eulogies to Canadian rural
life.
A. and producing
B. producing
С. who they produced
D. whose production of
Можно только пожалеть составителей теста, которым приходи-
лось так издеваться над своим родным языком. Нам бы тоже, навер-
ное, было бы непросто сочинить нечто вроде:
TOEFL, введенный в  1964  г., является _____ тестов на знание
английского языка.
A. одним авторитетным из наиболее
B. одним наиболее из авторитетных
C. из наиболее одних авторитетных
D. одним из наиболее авторитетных
И в то же время в тестах той поры с загадочной регулярностью
появлялись предложения, предполагающие столь нехарактерную для
английского языка синтаксическую инверсию, причем особой любо-
вью составителей почему-то пользовалось словосочетание «not until».
Not until 1948_______ its start as a full-scale broadcasting service in the
United States.
A. television got

159
Глава 2.  Системы тестирования по иностранным языкам

B. when television got


C. that television did get
D. did television get
И опять же никакой градации по «балльному весу» не предпо-
лагалось.
Из ориентации на знание языка, а не на владение им, естественно,
вытекало еще одно следствие. Язык, представленный в  лексической,
грамматической и  текстовой частях TOEFL-1964, был языком пись-
менной нормы. Он не был тем языком, на котором люди говорят, а был
языком, на котором им предписывается говорить. Однако выдержать
ориентацию на норму во всех частях TOEFL-1964 по понятным при-
чинам не удавалось. Нередко диалоги в Listening comprehension содер-
жали такие формы и конструкции, которые трактовались как «непра-
вильные» в грамматической части теста.
Что же касается Reading Comprehension, то это была самая слабая
часть теста. Для успешного ответа на вопросы в этой части не нужно
было ни читать сами тексты, ни даже понимать, о чем они. Достаточно
было просто владеть техникой поиска правильных ответов.
Однако при всех указанных недостатках, связанных с упором на
проверку знания, TOEFL-1964  в  определенной степени позволял те-
стировать и  владение языком. Это касалось, прежде всего, Listening
comprehension и даже Reading comprehension. Ведь для того, чтобы от-
вечать на вопросы к тексту, не читая оный, необходимо было быстро
и точно понимать сами вопросы.
Важной особенностью TOEFL-1964 была ориентация на норма-
тивный общеупотребительный язык. Диалоги и монологи в Listening
comprehension касались ситуаций повседневной жизни, а  тексты
в  Reading comprehension имели общеобразовательный характер. По-
этому в содержательном плане тестовые задания вполне соответство-
вали возможностям выпускников средней школы.
Таким образом, TOEFL-1964  представлял собой пусть и  небез-
упречный, но более-менее приемлемый языковой тест, что и обеспечи-
вало ему популярность в течение нескольких десятилетий.
В 1998 г. он был переработан. Из теста исчезла лексическая часть
(Vocabulary) как особый раздел. Проверка знания лексики была пере-
несена в  Reading Comprehension и  стала составной частью вопросов
к текстам.
Это имело два следствия. Во-первых, для того, чтобы включить
задания на тестирование знания лексики, пришлось резко увеличить

160
2.2.  Тесты по английскому языку

длину текстов. Если в  старом варианте использовались тексты, со-


стоящие из  250–300  слов, то теперь они стали включать в  себя 350–
450  слов. Во-вторых, для экзаменуемых ситуация дополнительно ус-
ложнилась тем, что теперь искомое слово часто выступало не в своем
первичном значении, как это было раньше, а реализовывало вторич-
ные и окказиональные значения.
Действительным новшеством в  TOEFL-1998  было введение та-
кого задания, как написание эссе. Это был шаг на пути перехода от
тестирования знания языка к  тестированию порождающего аспекта
речевой деятельности. Балльный вес Writing был равен весу Structure,
что указывало на значимость, которую придавали этому виду речевой
деятельности составители теста.
Особый интерес представляет собой языковая ориентация
TOEFL-1998. Здесь очевиден резкий крен в  сторону его «академиза-
ции». В Listening comprehension появились отрывки из лекций на раз-
личные, часто сложные научные темы, содержащие научные термины
и  обороты, свойственные научному стилю речи. Резко усложнились
тексты; они стали узко-специальными, нередко перенасыщенными
специфической терминологией. Наконец, хотя темы для эссе носили
общей характер, предпочтение отдавалось сочинениям, написанным
стилем, близким к академическому14.
Существенно увеличилась и  продолжительность теста. Если
в  TOEFL-1964  на выполнение всех заданий отводился 1  час 50  мин.,
то теперь — от 2 ч. 35 мин. до 3 ч. 20 мин. «Люфт» в продолжитель-
ности TOEFL-1998 был обусловлен тем, что теперь разделы Listening
и Structure стали компьютерно-адаптивными (computer-adaptive).
Такие разделы начинаются с  вопросов средней сложности. По
мере того, как сдающие отвечают на каждый вопрос, компьютер оце-
нивает вопрос и использует эту информацию, чтобы определить, ка-
кой следует предложить следующим. До тех пор, пока кандидаты отве-
чают правильно, компьютер выдает вопросы более высокой или такой
же сложности. Если же ответ неверный, то компьютер выдаст вопрос
меньшей или равной сложности15.
Смысл нововведения заключался в том, чтобы устранить «урав-
ниловку» в оценке заданий разной степени сложности, характерную

14
TOEFL Tips: Preparing Students for the Computer-Based TOEFL. S. l.: Educa-
tional Testing Service, 1998. P. 23–25.
15
Ibid. P. 14.

161
Глава 2.  Системы тестирования по иностранным языкам

для старого TOEFL, и сократить время сдачи теста тем, кто имеет бо-
лее высокий уровень владения языком. Сложные вопросы оценива-
лись выше, а потому отвечающий на них правильно быстрее набирал
итоговую сумму баллов. На первый взгляд, идея вполне разумная,
но только на первый взгляд.
Подобный подход вполне применим при оценке знания лексики.
Здесь критерием служит частотность слов. Иное дело грамматика. Как
определить, какой вопрос более сложный, а какой менее? Безусловно,
склонение количественных числительных в  русском языке являет-
ся намного более сложной задачей, чем склонение существительных.
Даже образованные носители этого языка не всегда могут сходу пра-
вильно прочитать фразу «Фермер владел 6748 акрами земли».
Это действительно сложно, но для кого? Для русскоязычных. Но
отсюда никак не следует, что те же затруднения будут обязательно ис-
пытывать иностранцы, которые учат русский язык. Вполне вероятно,
что для них более сложными окажутся те особенности русского языка,
которые нам кажутся естественными и простыми.
Кроме того, следует учитывать, что любой тест на знание того
или иного языка характеризуется дискриминацией по национально-
му признаку, поскольку предоставляет конкурентные преимущества
носителям одних языков перед носителями других. Совершенно оче-
видно, что сдать тот же TOEFL шведу значительно проще, чем русско-
му или венгру. Английский и шведский — языки близкородственные,
имеющие много общего в грамматике и лексике. Даже если слова со
сходным значением произносятся по-разному, «на письме» они часто
выглядят похоже.
С другой стороны, сдача письменного теста на знание англий-
ского, как и  любого другого языка, тексты которого фиксируются
с помощью латиницы, создает дополнительные трудности для носи-
телей языков, где используется иная система письменной фиксации.
Так, для араба, чтобы работать с английскими текстами, необходимо
не только перейти на чуждый алфавит, но  и  научиться читать «за-
дом наперед». Соответственно, при сдаче письменных тестов пред-
ставители разных наций находятся в неравном положении, а посему
компьютерная аранжировка вопросов по степени их «сложности» не
выглядит ни валидной, ни надежной. Следует отдать должное соста-
вителям TOEFL: они очень скоро отказались от компьютерно-адап-
тивной системы.

162
2.2.  Тесты по английскому языку

Оценивая TOEFL-1998 в целом, можно сказать, что он представ-


лял собой языковой тест с  явным уклоном в  сторону академической
тематики.
Эта версия теста продержался всего 7 лет. В 2005 г. грянула ре-
волюция. TOEFL был не просто переработан; он получил совершенно
новый формат. В значительной степени было покончено с ориентаци-
ей на проверку знания языка. Из теста был полностью исключен раз-
дел, связанный с тестированием отвлеченного знания грамматических
форм и конструкций. Другим революционным изменением, делавшим
TOEFL iBT поистине уникальным, являлось тестирование речевых
навыков сдающих онлайн, что стало возможным благодаря разви-
тию информационных технологий. Речь экзаменуемого записывается
и передается независимым асессорам, что резко повышает объектив-
ность оценки.
Исключительно важным являлось введение многофокусных зада-
ний (integrated tasks), при выполнении которых тестируемый должен
задействовать все или большинство из  видов речевой деятельности.
Например, сдающему предлагается текст по какой-то проблеме. Затем
он прослушивает 5–6-минутное сообщение по той же теме, но излага-
ющее иную точку зрения на вопрос. Задание: в письменной или устной
форме дать краткое изложение прочитанной и прослушанной инфор-
мации и сформулировать, чем отличаются представленные подходы.
Это в чистом виде многофокусное тестирование всех речевых навы-
ков, позволяющее преодолеть разрыв между реальной речевой дея-
тельностью и параметрами оценки речевых навыков.
Отказ от ориентации на знание закономерно привел и к измене-
нию языковой ориентации. Язык диалогов и лекций предельно при-
ближен к реальной речи носителей языка со всем ее аграмматизмом,
повторами, незаконченностью высказываний и т. п.
Сохранились в тесте и однофокусные задания (independent tasks),
тестирующие языковые навыки по отдельности.
Вне всякого сомнения, Internet-based TOEFL, введенный в 2005 г.,
представлял собой прорыв в практике языкового тестирования и од-
новременно был блестящим маркетинговым ходом. Ведь именно в се-
редине нулевых годов Интернет распространился на весь мир и вме-
сте с сотовыми телефонами стал доступен каждому.
Технологически TOEFL-2005 обогнал всех конкурентов, но тесто-
логически тут же стали очевидны его недостатки.

163
Глава 2.  Системы тестирования по иностранным языкам

Во-первых, неоправданно возросла продолжительность самого


теста и количество предлагаемых заданий. Сдача TOEFL iBT походит
непрерывно в течение более 4 ч. (см. табл. 9).
Таблица 9
Разделы теста TOEFL iBT
Количество
Время,
Раздел вопросов /  Задание
мин.
заданий
Чтение 60–80 36–56 вопросов Прочитать 3 или 4 текста и ответить
на вопросы
Аудирование 60–90 34–51 вопросов Прослушать отрывки из лекций,
дискуссий и обсуждений в учебной
аудитории и ответить на вопросы
Перерыв 10 — —
Говорение 20 6 заданий Выразить свое мнение по теме;
обобщить прочитанный текст
и прослушанный отрывок лекции на
ту же тему
Письмо 50 2 задания Написать эссе на основе текста
и прослушанного отрывка лекции на
ту же тему; выразить свое мнение по
предложенной теме

Следует отметить, что длина текстов по сравнению с  предыду-


щим форматом выросла почти вдвое. Время на выполнение заданий
по аудированию увеличилось чуть ли ни втрое. Это не означает, что
сдающим тест стало предоставляться больше времени на подготовку.
Просто усложнились задания. Крайне скупо выделяется время на вы-
полнение заданий по говорению: на 6 заданий всего 20 мин. Все это
вместе взятое превращает TOEFL iBT из  языкового теста в тест на
выносливость.
Резко возросла сложность самих заданий. Это касается как одно-
фокусных, так и многофокусных заданий. Темы для эссе или монолога
очень часто требуют не столько хорошего владения языком, сколько
эрудиции. В самом деле, подготовиться за 15 секунд, а потом в тече-
ние 45 мин. рассуждать на тему о различиях между эгоизмом и аль-
труизмом, как это предлагалось в одном из тестов, по плечу даже не
каждому носителю языка. Сопоставление же двух разных точек зре-
ния, представленных в тексте и в лекции, требует еще и недюжинных

164
2.2.  Тесты по английскому языку

аналитических способностей. В итоге TOEFL iBT из языкового теста


превращается в  тест на интеллект (IQ test). Наверное, подобного
рода задачи правомерно ставить перед будущими аспирантами, чтобы
определить степень их готовности к научной деятельности, но вряд ли
они уместны в тесте, проверяющем уровень владения языком абиту-
риентов.
Нельзя не отметить и  очевидное снижение качества заданий.
Скорее всего, обусловлено это тем, что ежегодно тест проводится бо-
лее 50  раз, т. е. каждую неделю, что вызывает необходимость посто-
янно разрабатывать все новые и  новые задания. Однако даже у  со-
трудников ETS, известных своим высочайшим профессионализмом,
фантазия небезгранична. В результате в тестах можно встретить такие
странные темы для эссе или устного высказывания, как «По вашему
мнению, что важнее в современном мире: уметь говорить или уметь
писать?»
Не менее странно требовать от 17-летних абитуриентов рассуж-
дений на такую тему: «Как, по-вашему, сложится ваша жизнь, когда вы
выйдете на пенсию?»
Подводя итог, можно сказать, что TOEFL третьего поколения —
это не столько языковой тест, сколько тест на адаптированность
к американской академической среде, что, конечно, нимало не умаляет
его достоинств как таковых.
Однако следствием такой парадигмы являются чрезмерная гро-
моздкость и продолжительность теста, излишняя сложность заданий
и  нередко сомнительная релевантность их содержания. Представля-
ется, что именно стремление создать тест, способный оценить всю ре-
чевую деятельность человека, ограничившись одной областью ее реа-
лизации — университетской аудиторией, — и положило начало про-
цессу утраты TOEFL своего ведущего положения в сфере языкового
тестирования.

2.2.3. НЕКОТОРЫЕ ОСОБЕННОСТИ ФОРМАТА И ПРИНЦИПОВ ОЦЕНКИ


МЕЖДУНАРОДНОГО ЭКЗАМЕНА IELTS

Экзамен IELTS, или экзамен Международной системы тестиро-


вания по английскому языку, был введен в  действие в  1989  и в  на-
стоящее время поддерживается тремя ведущими в  области языко-
вого тестирования организациями: Британским Советом (the United
Kingdom’s international organization for cultural relations and educational

165
Глава 2.  Системы тестирования по иностранным языкам

opportunities), Кембриджским центром языкового тестирования


(Cambridge English Language Assessment) и  экзаменационным цен-
тром образовательной компании «Международная программа раз-
вития университетов и колледжей Австралии» (IDP: IELTS Australia).
В 2012 г. восемью тысячами экзаменационных центров в 135 странах,
признающих экзамен, было проведено более 2 млн тестов IELTS. Эти
статистические данные говорят о высокой популярности и мировом
признании IELTS в качестве теста языкового мастерства.
Тест проверяет навыки в области всех четырех видов речевой де-
ятельности: двух рецептивных (слушание и чтение) и двух продуктив-
ных (говорение и  письмо). Тест представлен в  двух модулях: общем
и академическом. Отличительной чертой данного экзамена является
то, что в обоих модулях используется один формат заданий, проверя-
ющих слушание и говорение, но разные форматы заданий, проверяю-
щих навыки в области чтения и письма. Как правило, модуль на зна-
ние общего английского языка сдают люди, которые планируют им-
миграцию (в качестве специалистов, требующихся на работу в одной
из  стран, участвующих в  данном проекте тестирования), в  то время
как академический модуль сдают люди, планирующие обучение в выс-
ших учебных заведениях за рубежом.
Ответы кандидатов оцениваются по следующему принципу: за
ответы на задания каждого компонента теста (чтение, письмо, слу-
шание, говорение) выставляется балл по шкале от 1  (beginner) до
9 (native-speaker-like). В табл. 10 приводятся данные о результатах эк-
замена представителями России, Украины и Германии за 2012 г.16
Таблица 10
Сопоставительные результаты сдачи IELTS гражданами России, Украины
и Германии
Страна Слушание Чтение Письмо Говорение Общий балл
Академический модуль
Россия 6,6 6,6 5,9 6,5 6,4
Украина 6,6 6,6 6,0 6,6 6,5
Германия 7,5 7,3 6,6 7,3 7,2

16
Test taker performance 2012  //  IELTS:  Researchers: [сайт]. URL: www.ielts.
org/researchers/analysis-of-test-data/test-taker-performance-2012.aspx (дата
обращения: 10.01.2014).

166
2.2.  Тесты по английскому языку

Страна Слушание Чтение Письмо Говорение Общий балл


Общий модуль
Россия 6,5 6,4 6,1 6,4 6,4
Украина 6,6 6,5 5,9 6,6 6,5
Германия 7,5 7,3 6,6 7,3 7,2

Обзор особенностей оценивания компонента «говорение»


Рассмотрим 4  аспекта критериев оценки раздела «Говорение»,
представленные для публичного ознакомления на официальном сайте
IELTS17. Кроме того, приводятся результаты исследований, посвящен-
ных анализу показателей по разным компонентам экзамена и аспек-
там, работа над которыми поможет улучшить результаты сдающих
IELTS.
При оценивании ответов экзаменаторы руководствуются четырь-
мя критериями: беглость и  связность речи (Fluency and Coherence),
объем активного лексического запаса (Lexical Resource), грамматиче-
ский диапазон и точность (Grammatical Range and Accuracy) и произ-
ношение (Pronunciation). Стоит отметить, что чем выше уровень язы-
ковой подготовки экзаменуемого, тем сложнее ему добиться перехода
на более высокий уровень, т. е. получить более высокий балл. Ю. Кра-
вен в своем исследовании сопоставил и проанализировал результаты
группы зарубежных студентов на разных этапах: первичное прохож-
дение экзамена IELTS для поступления в учебные заведения и повтор-
ное прохождение этого экзамена после трех лет обучения в вузах Ав-
стралии. Кравен обнаружил, что по разделу «говорение» результаты
студентов при повторном тестировании были незначительно выше их
предыдущих достижений. На основании этих данных Кравен считает,
что студенты должны быть осведомлены о том, что даже после трех
лет высшего образования в Австралии их экзаменационные результа-
ты не повысятся сами собой. Для повышения показателей необходи-

17
IELTS Speaking band descriptors: (public version). URL: http://takeielts.bri-
tishcouncil.org/sites/default/files/IELTS_Speaking_band_descriptors.pdf (да-
та обращения: 15.10.2016); Teaching English qualifications and resources:
Cambridge English: [сайт]. URL: https://www.teachers.cambridgeesol.org/ts/
digitalAssets/114292_IELTS (дата обращения: 10.10.2016).

167
Глава 2.  Системы тестирования по иностранным языкам

ма специальная подготовка с учетом формата устной части экзамена


и критериев оценки18.

Беглость и связность речи (Fluency and Coherence — FC)


При анализе публичных дескрипторов можно выделить различ-
ные аспекты, которые учитываются при формулировании и критери-
ев оценивания беглости и связности речи. Первый — «развитие темы»
и  «длина высказывания». Для двух верхних уровней FC  8  и  9  есть
ссылка на «развитие темы», но при этом для FC 7 требование форму-
лируется иначе: «выражается развернутыми, достаточно длинными
высказываниями без заметного усилия»; эта формулировка достаточ-
но близка и для FC 6: «способны к развернутому высказыванию», а за-
тем в описании требований к уровню FC 5 говорится: «способен под-
держивать поток речи». В своей исследовательской статье П. Сидхаус
и А. Харрис поддержали идею расширения и детализации критериев,
когда они обнаружили, что кандидаты более высокого уровня чаще го-
ворят более продолжительно, используя развернутые высказывания,
подкрепленные примерами19.
Второй аспект, определяющий критерии FC для каждого уровня,
учитывает «колебания / повторения / самокоррекцию», допускаемые
кандидатом при ответе. Так, для FC  7  критерии допускают «некото-
рые» из вышеназванных явлений, FC 8 — «только случайные», FC 9 —
«только чтобы определить содержательные компоненты темы, а  не
подобрать слова». Нужно отметить, что для FC 6 допустимо «случай-
ное повторение / самокоррекция», которое влечет за собой снижение
беглости и «приводит к потере последовательности в развертывании
темы». Для уровня FC 5 считается допустимым, что кандидат «исполь-
зует повтор, самокоррекцию и / или медленный темп речи», чтобы за-
кончить раскрытие темы.
Последний аспект включает использование соединительных
слов / дискурсивных маркеров / средств связности. Ключевыми сло-

18
Craven E. The quest for IELTS Band 7.0: Investigating English language pro-
ficiency development of international students at an Australian universi-
ty //  IELTS Research Reports. 2012. Vol. 13. URL: https://www.ielts.org/~/
media/research-reports/ielts_rr_volume13_report2.ashx (дата обращения:
15.10.2016).
19
Seedhouse P., Harris A. Topic development in the IELTS Speaking Test // IELTS
Research Reports. 2011. Vol. 12. URL: https://www.ielts.org/~/media/research-
reports/ielts_rr_volume12_report2.ashx (дата обращения: 15.10.2016).

168
2.2.  Тесты по английскому языку

вами для отнесения ответа к уровню FC 7 являются «использование


широкого диапазона» таких средств связности с  «некоторой гибко-
стью», тогда как FC на уровне 6 допускает «использование широкого
диапазона, но не всегда соответственно контексту». FC уровня 5 ха-
рактеризуется тенденцией к однообразному (и не всегда уместному)
использованию дискурсивных маркеров.
Анализируя критерии оценки FC по уровням с учетом трех вы-
шеупомянутых аспектов, можно сделать вывод, что большинству сту-
дентов для успешной сдачи теста в процессе подготовки необходимо
развивать навыки развернутого, подкрепленного примерами раскры-
тия темы, расширяя диапазон дискурсивных маркеров и соединитель-
ных слов. Кроме того, Крейвен отмечает, что одна явная причина от-
сутствия существенного улучшения показателей устной части IELTS
в группе после 3 лет обучения в вузах Австралии заключается в том,
что темы во втором тесте IELTS были многоаспектными, сложными
для детального освещения, что, в свою очередь, выразилось в относи-
тельно невысоком качестве ответов20. Таким образом, студенты долж-
ны не только практиковать развитие монологической речи на множе-
стве разнообразных тем, но также и много читать, развивать навыки
слушания и обмена мнениями с другими, чтобы аккумулировать идеи.

Активный лексический запас (Lexical Resource — LR)


и грамматическая корректность
(Grammatical Range and Accuracy — GRA)
Анализируя описание критериев, мы можем отметить, что есть
два главных аспекта, лежащих в  основе их определения: диапазон
и  точность. Например, в  формулировке лексического ресурса (LR)
уровня 8 фигурируют «случайные погрешности», а для LR уровня 7 до-
пустим «несколько неподходящий выбор». Формулировка критериев
LR уровня 6 учитывает влияние ошибок на понимание речи собесед-
ником: «значение ясно, несмотря на погрешности»; в описании крите-
риев оценки LR уровня 5 фактор погрешности не фигурирует. Таким
образом, мы видим, что частота ошибок и эффект, который они ока-
зывают на степень понимания речи, являются ключевыми аспектами
в критериях LR. 
Критерии диапазона и точности грамматических структур (GRA)
подобны в этом отношении. Так, для ответов уровня 8 ошибки «очень

20
Craven E. Op. cit.

169
Глава 2.  Системы тестирования по иностранным языкам

случайны», «большинство предложений грамматически корректны»,


на уровне 7 GRA «встречаются частные ошибки, предложения постро-
ены в  соответствии с  правилами», для уровня  6  формулировка GRA
также, как и LR 6, учитывает влияние грамматических ошибок на по-
нимание: «может делать частые ошибки в  сложных структурах, хотя
они редко вызывают проблемы понимания». Формулировка критериев
оценки GRA уровня 5 также включают этот аспект: «ошибки <…> мо-
гут вызвать некоторые проблемы понимания». Из чего следует, что ос-
новными факторами, влияющими на оценку, является повторяемость
грамматических и лексических ошибок или их влияние на понимание.
Другим аспектом, характерным и для критериев LR и для крите-
риев GRA, является диапазон. Формулировки критериев оценки GRA
уровней 7–9 включают указание на спектр используемых лексических
единиц и  грамматических структур: «некоторый диапазон сложных
структур» (7), «широкий диапазон структур» (8), и  «полный спектр
структур» (9). Стоит отметить указание на такие характеристики речи,
как точность и диапазон, в описании требований к уровню 6. Канди-
дат, претендующий на 6-й уровень, «использует соединение простых
и сложных структур» (диапазон), но при этом «может делать частые
ошибки в сложных структурах» (точность). Идея о сочетании уровня
сложности употребляемых конструкций с точностью их употребления
отражена в GRA 4: «продуцирует основные формы предложения с до-
статочной точностью» и «обычно допускает ошибки в употреблении
сложных структур». Требования к диапазону LR описаны следующим
образом: LR 8 — «широкий диапазон словарного запаса»; LR 7 — «гиб-
кое использование словарного запаса» (что коррелирует с требовани-
ями критериев GRA  7); LR  6  коррелирует с  FC  6: «имеет достаточно
широкий словарный запас для раскрытия темы».
Дополнительными аспектами критериев оценки LR являются
употребление перефразирования, словарный запас, включающий
специфическую лексику и  идиоматические выражения, а  также зна-
ние сочетаемости слов, относящихся к разным частям речи. В отно-
шении аспекта перефразирования оценка повышается по уровням
следующим образом: LR 5 — «попытки использовать перефразирова-
ние, не всегда успешные», LR 6 —«обычно успешно использует пере-
фразирование», LR 7 и LR 8 — «перефразирование используется эф-
фективно». Аспект оценивания с точки зрения употребления лексики
с относительно невысокой частотностью и идиоматики учитывается,
начиная с  уровня LR  7: «Использование некоторого объема лексики

170
2.2.  Тесты по английскому языку

с невысокой частотностью, включая идиоматические выражения <…>


понимание принципов сочетаемости слов».
Таким образом, мы можем сказать, что если целью является по-
лучение оценки GRA, необходимой для 7-го уровня и выше, студенты
должны быть подготовлены использовать широкий диапазон грамма-
тических конструкций с высокой степенью точности. Для достижения
уровня LR  7  или выше они должны активировать более специфиче-
скую и идиоматическую лексику, а также акцентировать внимание на
словосочетаниях и  перефразировании. Исследования выступлений
кандидатов на высоких уровнях (7–9) показывает, что лексический
компонент ответов характеризуется широким спектром употребляе-
мых лексических единиц и разнообразием прагматических средств21.
Эта закономерность в определенной степени подтверждается резуль-
татами наблюдений, описанных в статье Дж. Рида и П. Нейтона22, что
говорит о том, что именно на этом аспекте LR следует фокусировать
внимание при подготовке студентов к экзамену.

Произношение (Pronunciation)
Критерии оценки произношения (P) определены только для уров-
ней 9, 8, 6, 4 и 1. Произношение уровней 7 и 5 оценивается по принци-
пу отсылки: «произношение демонстрирует все положительные черты
[более низкого уровня], и некоторые, но не все, положительные черты
[более высокого уровня]». Одним из  ключевых выражений в  крите-
риях оценки произношения является «особенности произношения»:
P 6 — «использует диапазон особенностей произношения с неустой-
чивым контролем», P 8 — «выдерживает правильность произношения
и использует широкий диапазон интонационных конструкций». IELTS
делит эти особенности на конкретные (звуки речи, ритм, логическое
ударение, фразовое ударение, интонация, регистр) и  общие (акцент,
усилия, прилагаемые слушателем, доступность для восприятия)23.

21
Seedhouse P., Harris A. Op. cit. P. 17.
22
Read J., Nation P. An investigation of the lexical dimension of the IELTS speak-
ing test // IELTS Research Reports. 2006. Vol. 6. P. 207–231.
23
Yates  L., Zielinsky  B., Pryor  E. The assessment of pronunciation and the new
IELTS Pronunciation Scale //  IELTS Research Reports. 2011. Vol. 12. P. 14;
Brown  A. Pronunciation and Phonetics: A Practical Guide for English Lan-
guage Teachers. New York; London: Routledge, 2014. URL: https://www.goo-
gle.ru/search?hl=ru&tbo=p&tbm=bks&q=isbn:1317935691 (дата обращения:
15.10.2016).

171
Глава 2.  Системы тестирования по иностранным языкам

В одной из статей, посвященных исследованиям IELTS, был опи-


сан интересный факт, касающийся критериев оценки, а  именно: на-
ложение параметров «беглость и связность речи» и «произношение»
при оценке скорости речи и деления на синтагмы24. В целом улучше-
ние произношения у каждого конкретного студента будет зависеть от
отдельных проблем с вышеупомянутыми особенностями. Можно сде-
лать вывод, что, работая над беглостью речи студента, особое внима-
ние надо уделять прагматическим установкам и выбору соответству-
ющей интонации и фразового ударения, что повысит шансы получить
более высокий балл.

2.3.  ТЕСТИРОВАНИЕ ПО ФРАНЦУЗСКОМУ ЯЗЫКУ

Наряду с  тестированием по английскому языку у  изучающих


иностранные языки всё большую популярность приобретают подго-
товка и сдача тестов для получения сертификатов международного об-
разца по французскому языку.

Международные дипломы по французскому языку


Существует несколько типов тестов и дипломов для изучающих
французский язык.

1. Тест на знание французского языка (Test de connaissance de


français — TCF)
Этот тест был создан в 1999 г. Международным центром педаго-
гических исследований (Centre international d’études pédagogiques  —
CIEP) по просьбе министерства образования Франции. TCF представ-
ляет собой стандартизированный тест, который показывает уровень
владения французским языком не-франкофонами, т. е. людьми, не
являющимися носителями французского языка. Он разработан в со-
трудничестве с Департаментом экзаменов по английскому языку Кем-
бриджского университета и определяет уровень кандидата по 6 уров-
ням, установленным Европейским советом и ассоциацией ALTE. Тест
состоит из  80  вопросов различного направления, проверяет знание
грамматических структур и понимание устной речи и организован по
принципу прогрессивного усложнения заданий. Кроме первой части
тест содержит еще две факультативные: на понимание устной речи
24
Yates L., Zielinsky B., Pryor E. Op. cit. P. 33; Brown A. Op. cit.

172
2.3.  Тестирование по французскому языку

и письменную часть. CIEP предлагает центрам DELF / DALF (см. о них


ниже) использовать полный тест TCF (обязательное задание + фа-
культативные задания) в качестве теста кандидатов на допуск к сдаче
экстерном экзаменов DELF второго уровня и DALF. TCF можно сдать
только в центрах проведения экзаменов, одобренных CIEP. 
Существуют следующие варианты TCF:
•• TCF tout public — этот экзамен открыт для всех кандидатов;
•• TCF DAP (тест на знание французского языка для поступле-
ния в  вуз)  — экзамен для тех, кто хочет учиться в  высшем
учебном заведении во Франции;
•• TCF Québec — экзамен для тех, кто хочет уехать жить и рабо-
тать в Канаду;
•• TCF ANF — экзамен для тех, кто хочет получить французское
гражданство.

2. Экзамены DELF / DALF
•• Диплом о  знании французского языка (Diplôme d’Etudes en
Langue Française — DELF).
•• Диплом о  об углубленном знании французского языка (Di-
plôme Approfondi de Langue Française — DALF).
Эти международные дипломы по французскому языку призна-
ны во всем мире, выдаются министерством народного образования
Франции, подтверждая знание французского языка иностранцами.
Экзамены принимаются в  сертифицированных экзаменационных
центрах в 130 странах мира.

Общие сведения о дипломах DELF / DALF


Эти экзамены созданы в 1985 г. В течение времени они претерпе-
ли значительные изменения. С 1 сентября 2005 г. тесты DELF / DALF
были приведены в соответствие со стандартами Совета Европы (Cadre
européen commun de référence pour les langues du Conseil de l’Europe),
на сегодняшний день существует 4 уровня DELF: DELF A1, DELF A2,
DELF B1, DELF B2 и 2 уровня DALF: DALF C1 и DALF C2. Пересдать
экзамен при проходном балле возможно при отказе от предыдущих
результатов диплома.
•• DELF tout public и DALF tout public открыты для всех канди-
датов.

173
Глава 2.  Системы тестирования по иностранным языкам

•• DELF Prim предназначен для детей от 8 до 12 лет, которые хо-


тят подтвердить знания, полученные на начальном этапе из-
учения языка.
•• Для учащихся средних школ с 12 лет до окончания 11-го клас-
са включительно экзамены DELF проводятся в адаптирован-
ной версии DELF Junior по уровень В2 включительно. Экзамен
предлагает те же задания, что и DELF tout public, но в рамках
тем, интересующих подростков.
•• DELF Pro — это версия экзамена для профессиональных це-
лей. Он создан для тех кандидатов, которые собираются рабо-
тать во франкоговорящей среде.
Подготовиться к экзаменам DELF A1 и A2 можно самостоятель-
но, используя соответствующие пособия из  предложенного списка.
Начиная с уровня B1 лучше готовиться вместе с преподавателем ин-
дивидуально или в группе на курсах.

Diplôme d’Etudes en Langue Française (DELF)


DELF уровней A1–B2 подтверждает способность коммуникации
на французском языке, письменной и устной, в жизненных бытовых
ситуациях. Начиная с уровня B1 каждый уровень состоит из 4 разде-
лов, в случае сдачи всех разделов выдается диплом.
Коллективная часть экзамена состоит из  трёх аспектов (разде-
лов):
•• письмо;
•• аудирование;
•• чтение (понимание письменного текста).
Четвёртый аспект  — говорение  — составляет индивидуальную
часть экзамена.

Diplôme Approfondi de Langue Française (DALF)


DALF подтверждает способность обладающего дипломом обу-
чаться в университетах Франции или других франкоговорящих стран.
Так же, как и DELF, состоит из 4 разделов: письмо, аудирование, чте-
ние (понимание письменного текста) и говорение (первые три выпол-
няются коллективно, последний — индивидуально).
Содержание и  продолжительность экзаменов на получение ди-
пломов DELF и DALF представлены в табл. 11 и 12.

174
2.3.  Тестирование по французскому языку

Таблица 11
Содержание и продолжительность экзаменов DELF

Продолжи-
Аспект
Уровень Содержание экзамена тельность,
обучения
мин.
Понимание Ответы на вопросы по 3–4 сюжетам
устной речи из повседневной жизни, записанным на около 20
пленку (после двух прослушиваний)
Понимание Ответы на вопросы на понимание по
письменного 4–5 текстам, касающимся ситуаций 30
текста повседневной жизни

DELF A1 Умение Испытание состоит из двух заданий:


писать на — заполнить карточку, бланк;
языке — составить простые фразы (открытка, 30
сообщение, подпись под рисунком и т. д.)
на темы повседневной жизни
Умение Испытание состоит из трех заданий: 5–7
говорить на беседа с экзаменатором, обмен подготовка:
языке информацией и моделирование диалога 10
Понимание Ответы на вопросы по 3–4 записанным
устной речи на пленку сюжетам из повседневной около 25 
жизни (после двух прослушиваний)
Понимание Ответы на вопросы на понимание по
письменного 3–4 коротким текстам, касающимся 30 
текста ситуаций повседневной жизни
Умение Составить 2 коротких текста (письмо
писать на другу / сообщение):
DELF A2 языке — описать событие или извлеченные
из личного опыта уроки;
45 
— составить приглашение, текст со
словами благодарности, извинение,
написать просьбу, текст для
информирования, поздравление
Умение Испытание состоит из трех заданий:
6–8
говорить на беседа с экзаменатором; логически
подготовка:
языке выстроенный монолог, рассказ; ролевая
10 
игра

175
Глава 2.  Системы тестирования по иностранным языкам

Окончание табл. 11
Продолжи-
Аспект
Уровень Содержание экзамена тельность,
обучения
мин.
Ответы на вопросы по трем
Понимание
записанным на пленку сюжетам (после около 25 
устной речи
2 прослушиваний)
Ответы на вопросы по двум письменным
Понимание текстам: найти в тексте полезную
письменного информацию для ответа на поставленный 35 
текста вопрос — проанализировать содержание
текста общей направленности
DELF B1
Умение Описать свою точку зрения на
писать на предложенную тему общего характера 45
языке (очерк, письмо, статья)
Испытание состоит из трех заданий: около 15
Умение — беседа с экзаменатором; подготовка:
говорить на — ролевая игра; 10 (только
языке — представление своей точки зрения на к 3-му
предложенный документ заданию)
Ответы на вопросы по двум записанным
на пленку сюжетам:
— интервью, информационный выпуск
Понимание
(1 прослушивание); около 30
устной речи
— доклад, конференция, речь,
документальный фильм, телевизионная
или радиопередача (2 прослушивания)
Ответы на вопросы на понимание двух
Понимание текстов:
DELF B2 письменного — информационный текст или 60
текста франкоязычном пространстве;
— текст, содержащий аргументацию
Изложение личной аргументированной
Умение
позиции (при обсуждении какого-
писать на 60
либо вопроса, в официальном письме,
языке
критической заметке)
Умение Презентация или защита позиции, 20
говорить на изложенной в предлагаемом небольшом подготовка:
языке документе 30

176
2.3.  Тестирование по французскому языку

Таблица 12
Содержание и продолжительность экзаменов DALF

Продол-
Аспект
Уровень Содержание экзамена житель-
обучения
ность, мин.
Понимание Ответы на вопросы по двум записанным на
устной речи пленку сюжетам:
— длинный текст (интервью, конференция)
(2 прослушивания); около 40
— несколько коротких радиопередач
(информационный выпуск, рекламный
ролик) (1 прослушивание)
Понимание Ответы на вопросы на понимание
письменного одного текста (художественный или 50
текста публицистический)
DALF С1 Умение — Синтез нескольких текстов, общей
писать на длительностью в 1 000 слов.
языке — Аргументированное эссе (по сюжету
150
текстов для синтеза).
2 области на выбор кандидата: филология;
гуманитарные науки и естественные науки
Умение — Изложение позиции на основе
говорить на нескольких письменных текстов. 20
языке — Дискуссия с жюри. подготов-
2 области на выбор кандидата: филология; ка: 30
гуманитарные науки и естественные науки
Понимание Испытание состоит из трёх частей:
устной речи — рецензия к содержанию звучащего
и умение документа (двукратное прослушивание);
говорить на — самостоятельное развитие темы на
30
языке основе представленной проблематики
DALF C2 подготов-
в документе;
ка: 60
— дебаты с жюри.
Возможность выбора одной из двух
сфер: литература и гуманитарные науки;
естественные науки
Понимание Воспроизведение структурированного
письменной текста (статья, редакционная статья, отчёт,
речи беседа и т. д.) на основе документа объемом
и умение около 2000 слов. 210
писать на Возможность выбора одной из двух
языке сфер: литература и гуманитарные науки;
естественные науки

177
Глава 2.  Системы тестирования по иностранным языкам

Для подготовки к тестам по французскому языку DELF и DALF


рекомендуется ряд учебных пособий25.

3. Экзамены Торгово-промышленной палаты (ТПП) Парижа


(Chambre de Commerce et d’Industrie de Paris — CCIP)26
Восемь экзаменов ТПП Парижа тестируют уровень француз-
ского языка кандидатов в  различных областях: бизнес, деятельность
предприятия, туризм, право, секретарское дело, наука и техника. Это
практические тесты, которые показывают умение кандидата общаться
письменно и устно в основных ситуациях профессиональной деятель-
ности.
Первый уровень — Сертификат о владении профессиональным
французским языком (Le Certificat de Français Professionnel — CFP) —
является порогом — но не обязательным этапом — к двум экзаменам:
по деловому французскому (le français des affaires) и профессиональ-
ному французскому (le français des professions).

25
Barféty  M. 1)  Compréhension orale: B2  /  C1. S. l.: CLE International, 2007;
2)  Expression orale: Niveau 4  (B2–C1). S. l.: CLE International, 2009; Bar-
féty M., Beaujouin P. Expression orale: Niveau 1–3 (A1–B1). S. l.: CLE Interna-
tional, 2004–2006; Barféty M., Patricia B. Compréhension orale: Niveau 2 (B1).
S. l.: CLE International, 2005; Berther A., Louvel C. Alter Ego 3–5: (niveaux B1–
C2). S. l.: Hachette, 2009–2010; Causa M., Megre B. Production écrite (niveaux
C1–C2). S. l.: Didier, 2008; Chevallier D., Dayezz Y., Riba P. Réussir le DELF B1.
S. l.: Didier, 2009; Chevallier-Wixler D., Dupleix D., Jouette I., Megre B. Réus-
sir le DALF C1  et C2. S. l.: Didier, 2007; Chovelon  B., Barthe  M. Expression
et style B2–C1: Français de perfectionement. Grenoble: Presses Universitaires
Grenoble, 2009; Dupleix D., Megre B. Production écrite (niveaux B1–B2). S. l.:
Didier, 2007; Dupoux B., Havard A.-M., Martial M., Weeger M. Réussir le DELF
B2. S. l.: Didier, 2006; Jamet M.-Ch., Chantelauve O. Préparation à l’examen du
DELF A2 scolaire & junior. S. l.: Hachette, 2009; Kober-Kleinert C., Parizet M.-L.
Activites pour le cadre europeen commun de reference niveau C1–C2. S. l.: CLE
International, 2009; Lescure R., Chenard S., Mubanga Beya A., Rausch A. DALF
C1–C2 — 250 activités. S. l.: CLE International, 2007; Normand I. Référentiel
Pour Le Cadre Européen Commun: (A1–C2). S. l.: CLE International, 2007;
Poisson-Quinton S. Expression ecrite: Niveau 3. S. l.: CLE International, 2006;
Veltcheff C., Hilton S. Préparation à l’examen du DELF A1. S. l.: Hachette, 2006.
26
Более подробную информацию об экзаменах см. на сайтах: Globus: Stu-
dy and Travel: [сайт]. URL: http://www.globus-abroad.ru (дата обращения:
15.10.2016); La France au Maroc: Ambassade de la France à Rabat: [сайт]. URL:
www.ambafrance-ma.org (дата обращения: 15.10.2016); О Франции по-
русски: [сайт]. URL: www.infrance.ru/ (дата обращения: 15.10.2016); Study
french.ru: [сайт]. URL: www.studyfrench.ru/ (дата обращения: 15.10.2016).

178
2.3.  Тестирование по французскому языку

Далее существуют три уровня делового французского (le français


des affaires):
•• Диплом о  знании делового французского языка 1-й степени
(le Diplôme de français des affaires 1er degré — DFA1), средний
уровень (niveau intermédiaire avancé);
•• Диплом о  знании делового французского языка 2-й степени
(le Diplôme de français des affaires 2e degré — DFA2), продвину-
тый уровень (niveau avancé supérieur);
•• Диплом об углублённом знании делового французского языка
(le Diplôme approfondi de français des affaires — DAFA), наивыс-
ший уровень (niveau supérieur).
Также проводятся 4 экзамена французского профессионального
языка:
•• Сертификат о знании языка туризма и гостиничного дела (le
Certificat de français du tourisme et de l’hôtellerie);
•• Сертификат о знании языка делопроизводства (le Certificat de
français du secrétariat);
•• Сертификат о  знании юридического французского языка (le
Certificat de français juridique);
•• Сертификат о знании научного и технического французского
языка (le Certificat de français scientifique et technique).
Существует также новый экзамен, созданный ТПП Парижа, что-
бы быстро показать уровень знаний общего французского языка сту-
дентами и служащими, не являющимися носителями языка (не фран-
кофонами). Это так называемый Сертификат владения французским
языком (Test d’Evaluation en Français — TEF).
Для получения этого сертификата требуется выполнить 3 обяза-
тельных части заданий:
•• понимание письменного текста (Compréhension écrite);
•• устное понимание (Compréhension orale);
•• лексика и структура (Lexique et structure),
и есть еще два факультативных:
•• устная речь (Expression orale);
•• письменная речь (Expression écrite).

179
Глава 2.  Системы тестирования по иностранным языкам

В табл.  13 показано соответствие дипломов DELF, DALF, TCF


языковым уровням Совета Европы.
Таблица 13
Соответствие французских дипломов уровням Совета Европы

Уровни, принятые в Со­ Диплом


вете Европы DELF / DALF TCF
C2 DALF C2 6
C1 DALF C1 5
B2 DELF B2 4
B1 DELF B1 3
A2 DELF A2 2
A1 DELF A1 1

Проведение тестирования на курсах иностранных языков


Желание слушателей курсов иностранных языков, изучающих
французский язык, сдать экзамены международного формата, а также
повсеместное внедрение языкового тестирования в школах (включая
ЕГЭ по французскому языку) и вузах ставят преподавателя на курсах
иностранных языков перед необходимостью изучения не только те-
оретических основ современных методов тестирования, но и практи-
ческого опыта, накопленного в  этой области как зарубежными, так
и  отечественными коллегами, а  также создания своих тестирующих
программ.
Какими основными характеристиками должен обладать пра-
вильно составленный тест?
1. Каждый тест имеет определенную цель и  должен применяться
только с этой целью.
2. Тестовые задания должны содержать лишь одну, четко опреде-
ленную трудность.
3. Тест должен включать задачу, требующую однозначного (как
в языковом, так и в содержательном плане) решения.
4. Задания теста должны быть валидны (следует обратить внима-
ние на четкость формулировок заданий).
5. Тесты должны быть построены на изученном языковом матери-
але.

180
2.3.  Тестирование по французскому языку

6. Важным свойством хорошо составленного теста является его


экономичность. Под этим параметром подразумеваются малые
затраты времени как на выполнение теста в целом, так и на от-
дельные виды заданий.
7. Организация теста должна быть несложной, чтобы можно было
легко подсчитать его результаты.
8. Задания в тесте следует располагать по степени нарастания труд-
ностей.
9. Тесты как измерительное средство при разных видах контроля
должны соответствовать определенным критериям, адекватно
удостоверенным в паспорте измерительного средства.
10. Задания могут предлагаться как на иностранном, так и на родном
языке учащихся.
11. В зависимости от уровня обученности и условий обучения тест
может содержать от 40 до 100 позиций.
Именно такие принципы использовались при составлении те-
стов на курсах иностранных языков СПбГУ. 
Безусловно, надежность тестового контроля снижают следующие
факторы:
•• бессистемное использование тестов; тесты зачастую рассма-
триваются лишь как способ «развлечь» учащихся, сэкономить
учебное время и  как модное нововведение,  — такой подход
часто обнаруживает полное несоответствие содержания теста
учебной программе;
•• абсолютизация письменного тестирования и подмена им уст-
ных форм контроля;
•• использование преимущественно одного, самого распростра-
ненного, вида теста  — с  выборочными вариантами ответа
(multiple choice), обнаруживающего существенные недостат-
ки, а именно:
—— задание содержит подсказку правильного ответа, суще-
ствует большая вероятность его угадывания;
—— с таким заданием может справиться и человек, вообще не
знающий языка, так как путем простого угадывания мож-
но «выдать» определенный процент правильных ответов;
—— наличие готовых ответов и общая ориентированность те-
стируемого лишь на итоговую оценку обусловливает недо-

181
Глава 2.  Системы тестирования по иностранным языкам

статочную мыслительную активность в процессе выполне-


ния теста;
—— тест недостаточно информативен и коммуникативен ввиду
своей сжатости, поскольку тестовое задание, как правило,
состоит из 1–2 предложений;
—— из-за ограниченного количества предложенных ответов не
представляется возможным применение творческого под-
хода к  решению поставленной задачи, хотя потенциально
в языковом арсенале тестируемых могут быть и другие сред-
ства, не предложенные в задании (см. также раздел 1.3.2.).
Тем не менее языковые тесты с выборочными вариантами ответа
чаще других используются в письменном тестировании и применяют-
ся в основном при обучении грамматике, реже — при обучении лекси-
ке. Это не совсем надежная форма проверки.
Преодоление недостатков языковых тестов возможно при очень
внимательном подходе к составлению тестовых заданий. Так, при со-
ставлении письменного теста рекомендуется обращать внимание:
а) на исключение нескольких правильных ответов в  одном те-
стовом задании;
б) на сведение к  минимуму возможности угадывания правиль-
ного ответа по внешним и другим признакам;
в) в лексических тестах — на соблюдение семантического равно-
весия среди вариантов ответов тестового задания;
г) на улучшение смысловой и  экстралингвистической стороны
задания;
д) на возможность (в некоторых случаях) творческого решения
языковой задачи, свободного конструирования ответа, что
позволит сделать более активной роль тестируемого при вы-
полнении теста.
Помимо этого, если итоговый контроль знаний, навыков и уме-
ний проводится в форме теста, необходима систематическая наработ-
ка опыта выполнения тестовых заданий в ходе учебного процесса.
Так, первоначально при составлении тестов на курсах иностран-
ных языков были задания, формат которых для студентов изначально
был непривычен. В  этом аспекте наибольшую сложность представ-
ляло собой письмо. Поэтому в  процессе апробации тестов были из-
менены ряд заданий и время, выделяемое первоначально на каждый
аспект. Все задания тестов носят коммуникативный характер. При ра-

182
2.3.  Тестирование по французскому языку

боте с текстом предпочтение отдаётся ответам на вопросы по тексту,


а не пересказу. В грамматических заданиях отсутствует перевод с рус-
ского языка. Это, как правило задания, в  которых нужно заполнить
пропуски в предложениях, используя приведенные в списке глаголы
в  неопределенной форме, в  соответствии с  контекстом употребить
глаголы в  нужной видо-временной форме или вставить глагол в  од-
ной из видо-временных форм. Это также упражнения на подстановку
форм предлогов или местоимений (в скобках обычно указывается ко-
личество раз употребления). В письменных заданиях студенты долж-
ны заполнить анкеты, документы, которые им предстоит заполнить
в странах изучаемого языка.
Тестирование проводится в два этапа. В первый день проведения
теста могут быть совмещены такие аспекты, как чтение, говорение
и аудирование, во второй — грамматический тест и задание по пись-
му. На устном аспекте тестирования обычно присутствует препода-
ватель, не работавший с группой, для создания объективных условий
оценки знаний.
Перечислим наиболее часто встречаемые ошибки у  слушателей
курсов, на которые следует обратить внимание при подготовке к те-
стам.
1. Чтение и понимание текста. Неправильно произносятся зву-
ки /ã/, /õ/, /œ/, неправильно даются ответы на ключевые вопросы, что
обусловлено незнанием основных лексических единиц курса, так как
тексты построены на базовой лексике.
2. Письмо. Слишком маленький либо слишком большой объем,
несоответствие заданной теме, отражение не всех аспектов, указанных
в задании, использование грамматических структур и словарного за-
паса, не соответствующих поставленной задаче (так, при написании
писем не следует путать деловой и дружеский стили переписки);
3. Грамматика и лексика. Перевод с русского языка на француз-
ский отсутствует, задания приводятся в виде тестов множественного
выбора. Следует отметить, что на начальном этапе тестирования наи-
большую сложность представляет собой выбор правильной формы
артикля и предлогов, зачастую путаются формы определенного и не-
определенного артиклей, а также вспомогательные глаголы и Participe
Passe глаголов при использовании Passe Compose.
Пример:
En été j’irai __ Mexique.
(a) au (b) en (c) à

183
Глава 2.  Системы тестирования по иностранным языкам

Правильный вариант ответа  — «au». Неправильные варианты


ответа связаны с отсутствием знания правила употребления предло-
га и незнанием рода названия страны, в данном случае «Mexique» по-
французски мужского рода.
4. Аудирование. Это наиболее сложный этап тестирования, так
как восприятие текста затруднено сравнительно высоким темпом
речи и  различными шумами. На начальном этапе тестирования по
этому аспекту значительно облегчает задание таблица, которую нуж-
но заполнить.

2.4.  ТЕСТЫ ПО НЕМЕЦКОМУ ЯЗЫКУ

2.4.1. ТЕСТЫ ПО НЕМЕЦКОМУ ЯЗЫКУ:


СОВРЕМЕННОЕ СОСТОЯНИЕ

При рассмотрении современного состояния системы экзаменов


по немецкому языку прежде всего следует обратиться, естественно,
к опыту Федеративной Республики Германии, которая из всех немец-
коговорящих стран проводит наибольшее количество языковых те-
стов. Тесты, проводимые в Австрии и Швейцарии, по своей структуре
подобны немецким, и  изменения в  них вносятся также преимуще-
ственно по немецкому образцу, хотя и с некоторым запозданием. Речь
идет прежде всего об экзаменах ÖSD (Österreichisches Sprachdiplom)27
и  экзамене по немецкому языку (Deutschprüfung) университета Цю-
риха28. Что касается российских тестовых испытаний, то, разумеется,
самым крупным и заметным явлением последнего десятилетия стало
введение и развитие ЕГЭ по немецкому языку. Материалы олимпиад-
ных испытаний, в частности Всероссийских олимпиад по немецкому
языку, остаются вне поля рассмотрения в данном обзоре, поскольку
наряду с собственно языковыми заданиями в них входят также зада-
ния страноведческого характера и креативные.
Экзамены по немецкому языку как иностранному, организуемые
на территории Германии, а отчасти и за ее пределами, можно разде-
лить на пять групп:

27
ÖSD: Österreich Schweiz Deutschland: [сайт]. URL: http://www.osd.at/ (дата
обращения: 15.10.2016).
28
Universität Zürich: Sprachenzentrum: [сайт]. URL: http://www.sprachenzen-
trum.uzh.ch/deutsch/index.php (дата обращения: 15.10.2016).

184
2.4.  Тесты по немецкому языку

1) экзамены Института Гёте (Goethe Institut);


2) экзамены TELC (The European Language Certificates), а  так-
же иные экзамены, проводимые Народными университетами
(Volkshochschulen), частными языковыми школами, языковы-
ми курсами при различных учебных заведениях, включая эк-
замены для мигрантов, проживающих в ФРГ;
3) единый экзамен для абитуриентов TestDaF (Deutsch als
Fremdsprache);
4) вступительные экзамены немецких вузов DSH (Deutsche
Sprachprüfung für den Hochschulzugang);
5) школьные экзамены DSD (Deutsches Sprachdiplom), организу-
емые под эгидой Конференции министров образования феде-
ральных земель Германии (Kultusministerkonferenz).
1. Экзамены Института Гёте. Институт Гёте определяет себя
как «культурную организацию ФРГ, действующую по всему миру»
и имеющую своей целью стимулирование изучения немецкого языка
за рубежом, а также налаживание и укрепление культурных связей29.
Московский филиал Института Гёте использует определение «куль-
турный институт Федеративной Республики Германия»30, в  Санкт-
Петербурге действует «Немецкий культурный центр им. Гёте», явля-
ющийся «подразделением отдела культуры Генерального консульства
Германии»31.
По количеству экзаменов по немецкому языку, проводимых за
пределами ФРГ, Институт Гёте занимает безусловно лидирующее по-
ложение среди всех немецких организаций. Он является многолетним
членом ALTE. При его непосредственном участии были созданы по-

29
Данное описание представлено на основном (немецкоязычном) сайте Гё-
те-института: «Das Goethe-Institut ist das weltweit tätige Kulturinstitut der
Bundesrepublik Deutschland. Wir fördern die Kenntnis der deutschen Sprache
im Ausland und pflegen die internationale kulturelle Zusammenarbeit. <…>
Mit unserem Netzwerk aus Goethe-Instituten, Goethe-Zentren, Kulturgesell-
schaften, Lesesälen sowie Prüfungs- und Sprachlernzentren nehmen wir seit
über sechzig Jahren weltweit zentrale Aufgaben der auswärtigen Kultur- und
Bildungspolitik wahr» (Goethe Institut: [сайт]. URL: http://www.goethe.de/
uun/deindex.htm (дата обращения: 15.10.2016).
30
О нас: Москва // Goethe Institut: Russland: [сайт]. URL: http://www.goethe.
de/ins/ru/mos/uun/ruindex.htm (дата обращения: 15.10.2016).
31
О нас: Петербург // Goethe Institut: Russland: [сайт]. URL: http://www.goe-
the.de/ins/ru/pet/uun/ruindex.htm (дата обращения: 15.10.2016).

185
Глава 2.  Системы тестирования по иностранным языкам

собия «Profile Deutsch»32, содержащие детальное переложение описа-


ний уровней Common European Framework of Reference (CEFR) для не-
мецкого языка — GER (Gemeinsamer Europäischer Referenzrahmen für
Sprachen), а  также комплексы соответствующих дескрипторов. При
участии Института Гёте разрабатывается большая часть международ-
ных сертификационных тестов по немецкому языку, а также банки де-
скрипторов для специальных задач.
В настоящий момент Институт Гёте предлагает следующие экза-
мены.
A1 Goethe-Zertifikat A1: Fit in Deutsch 1.
Goethe-Zertifikat A1: Start Deutsch 1.
A2 Goethe-Zertifikat A2: Fit in Deutsch 2.
Goethe-Zertifikat A2.
B1 Goethe-Zertifikat B1.
Zertifikat Deutsch für den Beruf (специализированный тест
для коммуникации в профессиональной сфере).
B2 Goethe-Zertifikat B2.
C1 Goethe-Zertifikat C1.
C2 Goethe-Zertifikat C2: GDS.
Все тесты являются своего рода эталоном реализации GER, по-
стоянно дорабатываются и проверяются на соответствие заданий как
заявленным уровням в целом, так и отдельным компетенциям.
Помимо этого на базе Института Гёте принимаются следующие
экзамены:
•• TestDaF33  — уровень определяется в  ходе теста в  диапазоне
В2 / C1;
•• Goethe Test PRO Deutsch-Test für den Beruf  — специализи-
рованный тест для бизнес-коммуникации34. Экзамен может
проводиться в компьютерном формате. Уровень определяется
в ходе теста.

32
Glaboniat M., Müller M., Rusch P. et al. Profile Deutsch. Berlin; München; Wi-
en; Zürich; New York, 2005; 2013.
33
TestDaF Institut: [сайт]. URL: http://www.testdaf.de/ (дата обращения:
15.10.2016). Подробнее об этом экзамене ниже.
34
BULATS: Business Language Testing Service: [сайт]. URL: http://www.bulats.
org/de (дата обращения: 15.10.2016).

186
2.4.  Тесты по немецкому языку

2. TELC GmbH (The European Language Certificates)35 была соз-


дана в  2006  г.  — является дочерней организацией Союза немецких
народных школ  — крупнейшей в  ФРГ сети образовательных курсов
для взрослых. В отличие от Института Гёте, основное направление ее
работы сконцентрировано преимущественно на внутригерманском
рынке. TELC GmbH сотрудничает с  десятками аккредитованных те-
стирующих организаций (только в Берлине их около 15), преимуще-
ственно частных языковых школ и курсов языка при различных обра-
зовательных учреждениях. Одним из основных направлений работы
TELC GmbH является сотрудничество с  организациями, предлагаю-
щими языковые курсы для мигрантов, живущих в Германии постоян-
но. В отличие от Института Гёте, TELC предлагает специализирован-
ные тесты для мигрантов, предусмотренные программой интеграци-
онных курсов и необходимые, в частности, для получения немецкого
гражданства: Deutsch-Test für Zuwanderer A2  /  B1  и  Deutsch-Test für
Zuwanderer A2 / B1 Jugendintegrationskurs. Форматы данных экзаменов
были разработаны TELC совместно с Институтом Гете по поручению
Министерства внутренних дел Германии в лице Федеральной службы
по делам миграции и беженцев.
Разработка тестов проводится в кооперации с Институтом Гёте
и в  строгом соответствии с  GER. Поскольку тесты TELC часто про-
водятся во внешних учебных учреждениях, особое внимание уделя-
ется контролю качества, включая внешний контроль по линии ALTE,
полноправным членом которой является TELC36.
В настоящий момент TELC предлагает следующие экзамены.
Start Deutsch 1 (TELC Deutsch A1).
A1 TELC Deutsch A1 Junior— для детей 10–12 лет и младших подростков.
TEST Deutsch A1 für Zuwanderer — для мигрантов.
Start Deutsch 2 (TELC Deutsch A2).
TELC Deutsch A2 Schule — для школьников 12–16 лет (7–10-х классов).
A2
TELC Deutsch A2+ Beruf — специализированный тест для базовой
коммуникации в профессиональной сфере.

35
TELC: Language Tests: [сайт]. URL: http://www.telc.net/unser-angebot/
deutsch/ (дата обращения: 15.10.2016).
36
Qualitätssicherung  //TELC: Language Tests: [сайт]. URL: http://www.telc.
net/ueber-telc/was-wir-machen/qualitaetssicherung/  (дата обращения:
15.10.2016).

187
Глава 2.  Системы тестирования по иностранным языкам

Deutsch-Test für Zuwanderer A2 / B 1 — специализированный тест для


мигрантов.
A2 / B1
Deutsch-Test für Zuwanderer A2 / B1 Jugendintegrationskurs —
специализированный тест для подростков из семей мигрантов.
Zertifikat Deutsch (TELC Deutsch B1).
Zertifikat Deutsch für Jugendliche B1 (TELC Deutsch B1 Schule).
TELC Deutsch B1+ Beruf — специализированный тест для несложной
коммуникации в профессиональной сфере.
B1
TELC Deutsch B1 / B2 Beruf — специализированный тест для
самостоятельной коммуникации в профессиональной сфере.
TELC Deutsch B1 / B2 Pflege — специализированный тест для среднего
медицинского персонала.
TELC Deutsch B2.
TELC Deutsch B2+ Beruf — специализированный тест для коммуникации
в профессиональной сфере, включающий в себя расширенный круг
коммуникативных ситуаций.
TELC Deutsch B2 Medizin — специализированный тест для врачей-
иностранцев, ориентированный на коммуникацию в рамках рутинных
B2 больничных ситуаций.
TELC Deutsch B2 / C1 Medizin — специализированный тест для врачей-
иностранцев, ориентированный на коммуникацию в профессиональной
сфере.
TELC Deutsch B2 / C1 Medizin Fachsprachprüfung — специализирован-
ный тест для врачей-иностранцев, ориенти-рованный на коммуникацию
в различных ситуациях данной профессиональной сферы.
TELC Deutsch C1.
TELC Deutsch C1 Beruf — специализированный тест для коммуникации
в профессиональной сфере, требующей высокого уровня владения
C1
языком.
TELC Deutsch C1 Hochschule — специализированный тест для обучения
в вузах.
C2 TELC Deutsch C2.

3. Тест по немецкому языку как иностранному DaF является


специализированным тестом для широкого круга желающих обучать-
ся в немецких вузах, разработан и проводится Институтом Тест-ДаФ
(TestDaF-Institut), являющимся учреждением Общества по разработ-
ке и  проведению тестов для желающихся обучаться в  немецких ву-

188
2.4.  Тесты по немецкому языку

зах (g.  a.  s.  t.  — Gesellschaft für Akademische Studienvorbereitung und
Testentwicklung e. V), Институтом при Заочном университете в Хагене
и Рурским университетом в Бохуме. Сдавать этот экзамен можно и за
пределами Германии. В Санкт-Петербурге уполномоченной организа-
цией по проведению теста является Немецкий культурный центр им.
Гёте, проверка тестов осуществляется только Институтом Тест-ДаФ
в  Хагене. Особенностью этого теста является его полиуровневость:
сданный на оценку TDN-3 (TestDaF Note 3), он свидетельствует о вла-
дении немецким языком на уровне В2.2, в  то время как наивысшая
возможная оценка TDN-5  (Test DaF Note  5) соответствует уровню
С1.2. Результаты теста DaF с отличными и хорошими оценками без-
оговорочно принимаются всеми высшими учебными заведениями
ФРГ, оценки TDN-3 такого права формально не дают, но в отдельных
случаях могут засчитываться как достаточные для отдельных специ-
альностей по усмотрению руководства вуза.
4. DSH (Deutsche Sprachprüfung für den Hochschulzugang)  —
существующий уже несколько десятилетий экзамен, также необходи-
мый для допуска к обучению в высших учебных заведениях, в отли-
чие от теста DaF разрабатывается хотя и  по единому установленно-
му стандарту (Rahmenordnung37), но  каждым вузом самостоятельно.
Проверка также осуществляется языковой комиссией соответствую-
щего вуза, что приводит иногда к расхождениям в оценке уровня зна-
ний. Отсутствие унификации также затрудняет установление точного
соответствия экзамена конкретным дескрипторам GER. Экзамен DSH
сдается исключительно на территории Германии, до недавнего про-
шлого сданный в одном университете экзамен даже не имел законной
силы при поступлении в  другой. Поэтому оптимальным способом
подготовки к его сдаче было и остается посещение курсов при языко-
вой комиссии соответствующего учебного заведения.
5. Экзамены DSD (Deutsches Sprachdiplom)38 Конференции ми-
нистров образования федеральных земель Германии (Kultusminister­

37
Rahmenordnung über Deutsche Sprachprüfungen für das Studium an deut-
schen Hochschulen (RO-DT). ULR: https://www.kmk.org/fileadmin/Dateien/
veroeffentlichungen_beschluesse/2004/2004_06_25_RO_DT.pdf (дата обра-
щения: 15.10.2016).
38
Das Deutsche Sprachdiplom der Kultusministerkonferenz  //  Bundesverwal-
tungsamt: [сайт]. URL: http://www.bva.bund.de/DE/Organisation/Abteilun-
gen/Abteilung_ZfA/Auslandsschularbeit/DSD/node.html (дата обращения:
15.10.2016).

189
Глава 2.  Системы тестирования по иностранным языкам

konferenz)39 тоже разработаны для абитуриентов, но  отличаются от


Теста DaF и DSH тем, что ориентированы исключительно на школь-
ников (как в  Германии, так и  за рубежом) и  проводятся (после со-
ответствующего курса подготовки) непосредственно на базе школ,
в которых обучаются потенциальные абитуриенты. Проводится этот
экзамен и в некоторых школах Санкт-Петербурга. Экзамен имеет две
ступени: DSD-1  (уровень заявлен как А2–В1)  и  DSD-2  (заявленный
уровень  — В2–С1), но  соответствие GER не столь строгое, как у  эк-
заменов Института Гёте. DSD der Stufe I является подтверждением
владения немецким языком на уровне, необходимом для поступления
в  подготовительные курсы (Studienkolleg) в  Германии. Экзамен DSD
der Stufe II является подтверждением владения немецким языком на
уровне, необходимом для учебы.
И, наконец, описывая языковые экзамены, интегрированные
в школьную систему обучения, нельзя не упомянуть российский Еди-
ный государственный экзамен по иностранному (в данном случае —
немецкому) языку, тем более, что самые мотивированные школьники
в  России сдают и  ЕГЭ и  DSD (Test DaF, DSH), получая возможность
сравнить эти испытания на собственном опыте.
Российский ЕГЭ (ГИА-11) явился значительным шагом к унифи-
кации требований, типов заданий и критериев оценки. Но даже заяв-
ленный уровень соответствия CEFR по разным источникам оценива-
ется по-разному: «В ЕГЭ также используются задания разного уровня
сложности. Во все разделы включаются наряду с заданиями базового
уровня задания более высоких уровней сложности. Базовый, повы-
шенный и высокий уровни сложности соотносятся с уровнями владе-
ния иностранными языками, определенными в документах Совета Ев-
ропы: базовый уровень — A2+; повышенный уровень — В1; высокий
уровень — В2»40. Для сравнения: «Все задания имеют разные уровни
сложности — от базового до повышенного и высокого — и соотносят-

39
Das Deutsche Sprachdiplom der Kultusministerkonferenz  //  Kulturminister
Konferenz: [сайт]. URL: http://www.kmk.org/bildung-schule/auslandsschul-
wesen/deutsches-sprachdiplom.html (дата обращения: 15.10.2016).
40
Из интервью заместителя декана факультета иностранных языков и ре-
гионоведения МГУ им. М. В. Ломоносова, руководителя Федеральной
комиссии разработчиков КИМ по иностранным языкам М.  В. 
Вер-
бицкой: Вербицкая: ЕГЭ по иностранным языкам отвечает мировым
стандартам. 15.02.2012  //  РИА Новости: [сайт]. URL: https://ria.ru/edu_
egrus/20120215/566490858.html (дата обращения: 15.10.2016).

190
2.4.  Тесты по немецкому языку

ся с уровнями владения иностранным языком, определенными в до-


кументах Совета Европы следующим образом: базовый уровень  —
A2(+), повышенный уровень  — В1(+), высокий уровень  — В2(+).
Каждый уровень отличается повышенной сложностью по содержа-
нию, лексико-грамматическому наполнению заданий и проверяемым
умениям и поэтому может быть помечен знаком (+)»41. Реальный же
уровень сложности в  отдельных заданиях может быть и  значитель-
но выше: так, задание из  блока  А по аудированию имеет формат, не
встречающийся ни в одном из вышеперечисленных немецких тестов.
Экзаменуемым предлагается определить на слух после двух предъяв-
лений аудиотекста, соответствует ли утверждение, приведенное в за-
дании, прозвучавшему фрагменту, не соответствует, или же в  ауди-
отексте ничего на эту тему не было сказано. Решение этого задания
в части «в тексте не сказано» предполагает полное и порой пословное
понимание абсолютно всего прозвучавшего аудиотекста, чего не тре-
бует ни одно из заданий ни одного немецкого экзамена даже уровня С. 
Другой пример — письменная часть ЕГЭ по иностранному язы-
ку, критерии оценки которой разрабатывались для английского языка
и переносились стереотипно на все остальные языки. Однако, напри-
мер, «квоты» допустимых грамматических ошибок для получения того
или иного количества баллов совершенно не учитывают флективного
характера строя немецкого языка и его падежной системы. Школьник
с уровнем знания английского языка В1 имеет шанс сделать меньше
ошибок при выполнении коммуникативного письменного задания,
чем его «немецкий коллега», просто потому, что в английском отсут-
ствуют падежные окончания.
Тем не менее несомненно положительным фактором является
большая транспарентность ЕГЭ по сравнению с  экзаменами, суще-
ствовавшими ранее, а также заметная работа над качеством заданий:
за последние годы были уточнены формулировки заданий, доработа-

41
Результаты единого государственного экзамена по немецкому языку
в  2014  году в  Санкт-Петербурге: Аналитический отчет предметной ко-
миссии. СПб.: Региональный центр оценки качества образования и  ин-
формационных технологий, 2014. С. 8. См.: Основные итоги проведения
ЕГЭ в Санкт-Петербурге в 2014 году // ГИА 9–11 Санкт-Петербург: Офи-
циальный информационный портал государственной итоговой аттеста-
ции выпускников 9  и  11  классов в  Санкт-Петербурге. URL: http://www.
ege.spb.ru/index.php?option=com_k2&view=item&layout=item&id=222&Ite
mid=478 (дата обращения: 15.10.2016).

191
Глава 2.  Системы тестирования по иностранным языкам

ны критерии, снизилось количество «дуалов» (заданий, имеющих бо-


лее одного решения) в тестовой части и т. д. Остается надеяться, что
опыт немецких экзаменов соответствующего уровня еще больше по-
может в деле совершенствования экзаменов российских.

2.4.2. ФОРМАТ УСТНОГО ЭКЗАМЕНА ПО НЕМЕЦКОМУ ЯЗЫКУ НА ОСНОВНОЙ


СТУПЕНИ ОБУЧЕНИЯ

Данный раздел ставит целью описание устной части экзамена


по немецкому языку на основной ступени обучения (Grundstufe) для
взрослых слушателей курсовой сети, сопоставление реального напол-
нения этого формата на различных этапах обучения, а также рассмо-
трение критериев оценки экзамена (Bewertung). Проанализируем опыт
приема экзаменов по немецкому языку в формате, принятом с 2000 г.
на кафедре повышения квалификации филологического факультета
СПбГУ, и выдвинем некоторые альтернативные предложения.
Устный экзамен по немецкому языку на основной ступени обуче-
ния (Grundstufe) для взрослых состоит из трех частей и продолжается
около 15 мин., он включает в себя следующие составные части:
•• ознакомительное общение (Kontaktaufnahme) — 3 мин.;
•• беседа по теме (Gespräch zum Thema) — 6 мин.;
•• решение коммуникативной задачи (Lösen einer Aufgabe)  —
6 мин.42
Экзамен может проводиться в  двух режимах  — в  режиме бесе-
ды преподавателя со слушателем курсов (Einzelprufung) или режиме
беседы двух слушателей друг с  другом (Paarprüfung). В  отделениях
Института Гёте в Германии и за рубежом экзамен проводится в режи-
ме «экзаменатор — слушатель»; другим учебным заведениям и тести-
рующим организациям предоставлено право самим решать, в  каком
режиме проводить экзамен43. Режим проведения экзамена «препода-

42
См.: Diesel  S., Raimann  М. Fit furs Zertifikat Deutsch. München, 2002; Об-
разец экзамена на Goethe-Zertifikat A1: Start Deutsch 1 // Goethe Institut:
Экзамены по немецкому языку: [сайт]. URL: http://www.goethe.de/lrn/prj/
pba/bes/sd1/mat/ruindex.htm (дата обращения: 15.10.2015); Образец экза-
мена на Goethe-Zertifikat A2: Start Deutsch 2 // Goethe Institut: Экзамены по
немецкому языку: [сайт]. URL: http://www.goethe.de/lrn/prj/pba/bes/sd2/
mat/ruindex.htm (дата обращения: 15.10.2015).
43
Cm.: Diesel S., Raimann М. Op. cit. S. 65.

192
2.4.  Тесты по немецкому языку

ватель  — слушатель», по мнению его сторонников, дает слушателю


возможность более полно раскрыться в  языковом плане, беседа но-
сит сбалансированный характер; организуя и направляя беседу, пре-
подаватель в  общем-то ставит слушателя в  более легкое положение,
поскольку последнему не надо тратить свои силы на инициирование
беседы; преподаватель помогает экзаменуемому и  тем, что он стро-
ит достаточно короткие фразы с отобранной лексикой, говорит ясно
и  четко. Однако общение такого рода, страдая определенной долей
авторитарности, несколько удалено от реальной ситуации общения
в жизни.
Выставленные на сайте Института Гёте в Интернете аудиозапи-
си устной части экзамена в режиме «преподаватель — слушатель» на-
глядно демонстрируют эту удалённость от реальной ситуации обще-
ния, которая проявляется, в частности, в том, что участники беседы
не находятся в  партнёрских отношениях: преподаватель выступает
в роли «ведущего», в то время как экзаменуемый — всего лишь «ведо-
мый», в речи преподавателя прослеживается оценочность и т. п.44
Как и для английского языка (см. раздел 4.4.2), применение выше-
указанного формата экзамена более обосновано на низких ступенях
обучения (А1 и А2), когда у слушателя курсов часто не хватает языко-
вых средств, чтобы сформулировать свою мысль; часто он находится
в затруднительной ситуации, ему нужны помощь и поддержка со сто-
роны преподавателя. На более высоких ступенях обучения, начиная
с уровня В1, как показывает опыт, более целесообразно переходить на
другой формат экзамена — «слушатель — слушатель»; отрабатывается
этот режим на занятиях по языку в парной работе с обязательной сме-
ной партнеров в паре.
При проведении экзамена в  режиме «слушатель  — слушатель»
важно, чтобы ни один из партнеров не пытался доминировать в бесе-
де, оба партнера должны говорить одинаковое количество времени, их
реплики должны сменять друг друга. Экзаменатор в данной ситуации
выступает лишь в роли наблюдателя, который слушает экзаменуемых;
он может лишь слегка подправить беседу, если, например, один из слу-
шателей будет сильно «забивать» партнера или если беседа «зависнет»
и т. п.
Умение вести беседу, с уважением относясь к собеседнику, уме-
ние услышать высказанные им мысли и  быстро на них реагировать,

44
См., например: Образец экзамена на Goethe-Zertifikat A2…

193
Глава 2.  Системы тестирования по иностранным языкам

бесспорно, относятся к  сфере коммуникативных навыков, которые


частично даны от природы, а частично зависят от неопределенности
беседы, когда слушатели импровизируют диалог друг с  другом, ведь
в  реальной ситуации общения, в  реальных диалогах мы не знаем,
«куда кривая выведет», как сложится диалог, какой оборот он примет.
При проведении экзамена можно сочетать оба режима, проводить об-
суждение темы с преподавателем, а решение коммуникативной задачи
отдавать на «откуп» двум слушателям, что, кстати, и коммуникативно
более оправданно.
На протяжении жизни одного поколения устная форма экзамена
по иностранному языку претерпела довольно большие изменения: от
полностью жестко детерминированной формы, когда зазубривалось
несколько устных тем, а затем одна из них «отбарабанивалась» на эк-
замене, создавая иллюзию владения устными навыками, через некото-
рое подобие свободы, проявляющееся в том, что темы заранее прора-
батывались по определенным вопросам, а затем эти же самые вопросы
задавались на экзамене, до свободной интерпретации темы, которая
имеет место на современном этапе.
Остановимся более подробно на составных частях экзамена.
Первая часть экзамена включает в себя беседу, направленную на вы-
яснение личных данных экзаменуемого (кто он, откуда родом, какова
его семья, где он работает, чем любит заниматься в свободное время
и  т. п.). Круг вопросов существенным образом варьируется в  зави-
симости от уровня обучения, от социального и  возрастного состава
слушателей (например, при работе с  преподавателями университета
уместны вопросы об их научной деятельности, участии в совместных
проектах, стажировках за рубежом и  т. п.). Отличие по уровням ка-
саются как перечня вопросов, так и степени их детализированности.
Слушатели не всегда хотят отвечать на некоторые вопросы, касающи-
еся частной сферы их жизни, необходимо научить их языковым сред-
ствам, которые дают возможность вежливо уклониться или избежать
ответа на эти вопросы.
Первая часть экзамена — единственная более или менее извест-
ная экзаменуемому заранее, хотя и здесь собеседник может позволить
себе поинтересоваться какими-либо частностями из биографии экза-
менуемого. Две последующие части экзамена — беседа по теме и реше-
ние коммуникативной ситуации — слушателям заранее, до экзамена,
неизвестны, и это правильно, поскольку в реальной жизни в общении
всплывают самые различные ситуации, и слушатели должны с ними

194
2.4.  Тесты по немецкому языку

справляться. Справедливости ради надо заметить, что круг тем и си-


туаций на экзамене с пройденными на основной ступени темами со-
пряжен, но не более того.
Вторая часть экзамена сводится к  беседе по какой-либо теме.
В качестве отправной точки для проведения беседы могут выступать
либо фотография, либо небольшие графики и таблицы, либо, как это
представлено в последних образцах экзамена, и то и другое45.
Фотографии и  графики, снабженные небольшим текстом, вы-
полняют роль «затравки» (Sprechanlaß): фотографии будят фантазию
слушателя и  позволяют легко «разговорить» экзаменуемого; графи-
ки снабжают его фактографическим материалом сопоставительного
плана и также помогают вхождению в тему. Обращение при помощи
фотографии к эмоциональной сфере слушателя, а при помощи графи-
ка  — к  логической, придают вхождению в  тему элемент стабильно-
сти (сработает либо то, либо другое) и исключают элемент зыбкости
и  неопределенности, который имеет место при предъявлении фото-
графий, как, например, в формате английского экзамена Первый кем-
бриджский сертификат (FCE).
Некоторые русскоязычные кандидаты, сдающие экзамен по ан-
глийскому языку, жалуются, что им не всегда удается понять идею,
стоящую за двумя фотографиями, предъявляемыми на экзамене
(фотографии эти либо взаимно дополняют друг друга, либо содержат
противопоставление). Трудности, связанные с пониманием или непо-
ниманием, обусловлены либо социокультурными моментами (то, что
близко и  понятно англичанам-составителям, может быть абсолютно
непонятно русскоязычным слушателям), либо социально-возрастны-
ми моментами: сюжеты, вызывающие какие-то мысли и  ассоциации
у составителей — людей, как правило, старшего поколения, — могут
быть чужды и непонятны людям молодого поколения, сдающим экза-
мен.
Не стоит очень детально описывать фотографии, «зависать» на
них, их роль заключается лишь в том, чтобы дать определенный им-
пульс к  проведению беседы. Для того чтобы фотографии могли вы-
полнять роль «затравки», они должны как-то задеть собеседника, вы-
сечь у него «искру».
Разные ступени обучения предполагают и  разный подход к  ос-
вещению темы. Скажем, при прохождении темы «Отдых» на низких

45
См.: Diesel S., Raimann М. Op. cit. S. 70.

195
Глава 2.  Системы тестирования по иностранным языкам

ступенях обучения уместен диалог с описанием, как слушатели прово-


дят свой отпуск, а на продвинутых ступенях обучения предполагает-
ся, что слушатели в диалоге сопоставляют и сравнивают отдых людей
разных поколений, традиционные и вновь появившиеся виды отдыха
(осмотр достопримечательностей и экотуризм и т. п.). Сопоставитель-
ная и  сравнительная подача материала рождает дискуссию, которая
может быть представлена на экзамене в виде карточек с аргументами
«за» и «против», «раньше» и «теперь», «старшее поколение» и «моло-
дое поколение» и т. п. в виде ключевых слов и выражений. Карточки
сразу погружают слушателя в тему, контрастивная подача материала
будит мысль, рождает догадки и создает интересную живую беседу.
Diskussion.
«Sind Sie mit Ihrem Beruf zufrieden?»
Ja / Nein
gut verdienen / wenig verdienen / Nebenjob haben
Arbeit interessant; viel Neues erfahren
Arbeit monoton, anstrengend
Zeit für die Familie haben / überfordert sein, eine große Belastung haben
flexible Arbeitszeiten haben / am Wochenende arbeiten / Űberstunden
machen
Третья часть экзамена представляет собой решение какой-либо
коммуникативной задачи. Например, по окончании курса слушатели
хотят организовать вечеринку, чтобы отметить это событие. Им пред-
лагается остановиться на следующих аспектах: Когда? Где? Еда? На-
питки? Кто за что платит? Кого еще можно было бы пригласить?46.
Достаточно трудно придумать большое количество коммуника-
тивных ситуаций, в которых слушатели были бы поставлены в одина-
ковое положение, т. е. в равной степени владели бы знаниями о тех или
иных реалиях. Так, например, предложение обсудить совместный по-
ход по Сахаре или подготовиться к прогулке на яхте, иногда встреча-
ющиеся в английских пособиях, могут поставить русскоязычного слу-
шателя в затруднительное положение, поскольку он может быть и не
знаком с этими реалиями ни по собственному опыту, ни по фильмам.
Можно помочь слушателю преодолеть незнакомую для него си-
туацию и сориентироваться в ней особой подачей экзаменационного
материала: на карточке предлагается схема решения ситуации или

Пример заимствован из  «Start II», представленного на веб-сайте Института


46

Гёте: Образец экзамена на Goethe-Zertifikat A2…

196
2.4.  Тесты по немецкому языку

указывается аспект ее рассмотрения с  приведением ключевых слов.


Например, составители пособия «So gecht’s», ставя перед слушателем
задачу спланировать и обсудить акцию «За здоровый образ жизни»,
предлагают следующее (приводим лишь два момента для иллюстра-
ции):
Welche Themen?  → Ernährung  /  Gewichtsprobleme  /  Suchtgefahren
Sport und Gesundheit / alternative Methoden /…
Wo? → in der Fußgängerzone / im Einkaufszentrum, in einer Schule / in
einem Betrieb /…47
Далее встаёт вопрос, насколько вообще оправдано предлагать
слушателям на первых этапах обучения (А1  и  А2)  это задание, по-
скольку их уровень владения иностранным языком не позволяет им
свободно обсудить подходы к решению той или иной задачи. Тут воз-
можны несколько вариантов.
Первый вариант предполагает максимальное упрощение реше-
ния задания и  снабжение слушателей вспомогательным материалом.
Можно предложить слушателям карточки:
а) один слушатель получает карточку с  описанием какой-либо
реалии (объявление о воскресной экскурсии, компьютерную
распечатку о  поездке на поезде и  т. п.), а  другой  — карточку
с  кратко обозначенными вопросами (например: «Когда отъ-
езд? Когда прибытие? Что взять с собой?» и т. п.);
б) оба слушателя получают одну и ту же карточку, где задан ха-
рактер диалога и указаны ключевые слова.
Eine neue Wohnung
Sie ziehen bald um. Ihr Freund  /  Ihre Freundin fragt Sie danach. Er-
zählen Sie ihm / ihr über die neue Wohnung.
Lage?.........................Laut, nicht weit vom Bahnhof
Haus?........................Reihenhaus
Räume?.....................3 Zm —Kü — Bd / WC
Fläche?......................95 m2
Renovieren?.............Neue Tapeten
Miete?.......................Miete 1300€ + Nebenkosten
Второй вариант предполагает не снабжение слушателей вспомо-
гательным материалом, а  вообще замену одного задания на другое:

Fischer-Mitziviris A., Janke-Papanikolaou S. So geht’s. Fertigkeitstraining.Grundstu-


47

fe Deutsch. Stuttgart: Ernst Klett International, 2001. S. 128.

197
Глава 2.  Системы тестирования по иностранным языкам

предлагается заменить задание «совместное решение коммуникатив-


ной задачи» на задание «реагирование в коммуникативной ситуации».
Слушателю выдается карточка с описанием коммуникативной ситуа-
ции и предлагается на нее прореагировать, например: «Вы пришли на
день рождения без подарка», «Вы случайно встречаетесь со школьным
приятелем, с  которым не виделись несколько лет» и  т. п.  — «Что вы
скажете в этой ситуации?»
Некоторые языковые трудности, с  которыми может столкнуть-
ся слушатель при чтении описания ситуации, вероятно, и  привели
к  тому, что решено было заменить описание ситуации на карточку,
где представлена эта ситуация. Однако это иллюзорное облегчение за-
дачи, поскольку схематичные картинки с  большим трудом поддают-
ся дешифровке и бывает весьма трудно догадаться, какую конкретно
коммуникативную ситуацию имел в виду автор.
Третий вариант представлен в разработках Института Гёте «Fit in
Deutsch» и «Start Deutsch»48 и состоит в следующем: слушателям раз-
дают карточки с  пиктограммами различных предметов, с  помощью
которых нужно задать вопрос или сформулировать побуждение и со-
ответствующим образом на него прореагировать.
Например, на пиктограмме изображен стакан, и слушателю нуж-
но сформулировать просьбу:
Zum Beispiel:
Ein Glas Wasser, bitte / Könnte ich ein Glas Wasser haben? —
и отреагировать на нее:
Zum Beispiel:
Hier bitte. / Tut mir Leid. Ich habe keins.

Существует еще и четвертый вариант, по которому на первона-


чальных этапах обучения (А1 и А2) можно проводить ролевую игру,
что присутствовало и в старом формате экзамена. Ролевая игра дает
слушателю возможность продемонстрировать владение языком по
определенным бытовым темам, позволяет построить диалог творче-
ски и свободно и даже при небольшом количестве языковых средств
решить какую-либо коммуникативную задачу — заказать номер в го-
стинице, сделать заказ в ресторане и т. п.

48
Наши экзамены // Goethe Institut: Экзамены по немецкому языку: [сайт].
URL: http://www.goethe.de/lrn/prj/pba/bes/ruindex.htm (дата обращения:
15.10.2016).

198
2.4.  Тесты по немецкому языку

Представляется, что наиболее интересными из вышеперечислен-


ных вариантов являются первый и последний; первый позволяет вы-
держать формат экзамена на всех уровнях в одном ключе и проверяет
знания слушателя в  довольно широком объеме, чего нельзя сказать
о  третьем варианте, где коммуникативные интенции представлены
в  очень суженном виде и  скорее напоминают упражнения-тренинг.
Второй вариант хорошо выявляет умение слушателя быстро реагиро-
вать в неожиданных ситуациях и хорошо проверяет знание языковых
средств, однако это задание не предполагает ведение диалога. Четвер-
тый вариант, ролевая игра, является, на наш взгляд, очень хорошей на-
работкой прошлого и с успехом может применяться на экзамене; это
хорошее творческое задание, предоставляющее слушателю определен-
ный люфт и хорошо выявляющее владение им языковыми средствами.
Перейдем к критериям оценки. Критерии оценки устной речи на
данном этапе не являются хорошо разработанными, они требуют су-
щественного дополнения и уточнения49.
Авторы основополагающего труда «Gemeinsamer europäischer Re-
ferenzrahmen für Sprachen» предлагают при оценке разговорных навы-
ков принимать во внимание следующие 14 категорий:
•• стратегии ведения диалога (Sprecherwechsel);
•• стратегии сотрудничества (Kooperation);
•• просьба разъяснять (Um Klärung bitten);
•• беглость (Flüssigkeit);
•• гибкость (Flexibilität);
•• смысловая связность (Koharenz);
•• развитие темы (Themenentwicklung);
•• точность (Genauigkeit);
•• социолингвистическая компетенция (Soziolinguistische Kom­
petenz);
•• общий диапазон устной речи (Spektrum sprachlicher Mittel all-
gemein);
•• объем словаря (Wortschatzspektrum);
•• грамматическая правильность (Grammatische Korrektheit);
•• владение лексическим материалом (Wortschatzbeherrschung);

Интересную попытку подробного описания критериев оценки дает Т. А. Кузь-


49

мина: Кузьмина  Т. А. FCE: первый кембриджский сертификат» М.: Цен-


трКом, 2003.

199
Глава 2.  Системы тестирования по иностранным языкам

•• контроль фонетических навыков (Beherrschung der Aussprache


und Intonation)50.
Однако они тут же делают оговорку, что 14  категорий  — это
слишком много для оценки любого речевого навыка, на практике этот
список требует избирательного подхода: количество категорий может
сокращаться или варьироваться в зависимости от определенной педа-
гогической традиции, вида речевой деятельности и уровня владения
языком. Остановимся на некоторой специфике данных положений.
1. Педагогическая традиция в немецком языке, в частности, про-
является в том, что при оценке рассмотрению в первую очередь под-
вергаются чисто языковые навыки (владение лексикой, грамматикой
и произношением)51.
Языковые навыки включают в себя не только владение слушате-
лем лексикой по той или иной теме, но  и  знание основных речевых
средств для выражения коммуникативных интенций, т. е. умение обо-
сновать, сравнить, сделать предложение, согласиться, опровергнуть
и т. п. Помимо этого, принимаются во внимание:
•• соблюдение формальной грамматической правильности,
причем при оценке учитывается, насколько грамматические
ошибки искажают смысл, мешают коммуникации и т. п.;
•• владение слушателем хорошим произношением и  интонаци-
ей, и  тут опять на передний план выступает тот фактор, за-
трудняют ли фонетические ошибки коммуникацию (кстати,
интересно отметить, что фонетические ошибки, как ни стран-
но на первый взгляд, осложняют и  затрудняют коммуника-
цию чаще, чем грамматические).
2. Говорение и, в частности, диалог как вид речевой деятельно-
сти предполагают обязательное рассмотрение таких категорий, как
стратегия ведения диалога, стратегия сотрудничества и  взаимодей-
ствия (Sprecherwechsel, Kooperation, um Klarung bitten); владение эти-
ми стратегиями в конечном счете и обеспечивает успешность комму-
никации.
Вышеперечисленные стратегии на практике проявляются в таких
коммуникативных навыках, как умение реагировать на идеи и мнения

50
Trim J., North B., Coste D. et al. Gemeinsamer europäischer Referenzrahmen
für Sprachen: lernen, lehren, beurteilen. Straßburg: Europarat, 2000. S. 176.
51
Diesel S., Raimann М. Op. cit. S. 74.

200
2.4.  Тесты по немецкому языку

собеседника, умение активно участвовать в  диалоге, умение «выхо-


дить из положения» при недостаточном вокабуляре. Постараемся дать
более детальное описание данных коммуникативных навыков, по-
скольку они весьма важны при оценке говорения.
Умение сотрудничать и взаимодействовать с собеседником про-
является в следующих трех моментах:
а) сбалансированность:
•• умение партнеров говорить по очереди (Sprecherwechsel, turn-
taking), не стремясь доминировать, перехватывать все время
инициативу, с одной стороны, и с другой — уметь дать отпор
собеседнику, вежливо перебить его, перехватить инициативу
или перевести разговор в другое русло;
б) обратная связь:
•• умение слушать и слышать собеседника и строить свои выска-
зывания в  соответствии с  его высказываниями, соглашаясь
с собеседником или возражая ему;
•• умение не «обрушивать» на собеседника всю информацию
сразу, а  выдавать ее небольшими кусочками, порциями, все
время учитывая реакцию собеседника;
в) «корректировка»:
•• умение справляться с ситуациями, возникающими в результа-
те непонимания партнеров, т. е. умение уточнить, переспро-
сить, попросить собеседника объяснить непонятные вещи,
связанные как с реалиями, так и лексикой и т. п.
3. Учет уровня владения языком. При оценке важным моментом
является осознание того факта, что уровень сформированности рече-
вых умений на разных этапах обучения у слушателей абсолютно раз-
ный. Раньше преподавателю, проводившему экзамен по языку, при-
ходилось руководствоваться лишь здравым смыслом, теперь же он мо-
жет опереться на материалы Совета Европы, где чётко прописано, что
же конкретно может и должен уметь слушатель по всем видам речевой
деятельности, и в частности в плане говорения, на каждом из этапов
обучения52.
Если уровень С2 предполагает свободное владение языком, уме-
ние с разных сторон осветить тему, сравнить и сопоставить жизнен-

52
См: Trim J., North B., Coste D. et al. Op. cit. S. 110–111.

201
Глава 2.  Системы тестирования по иностранным языкам

ные реалии в разных странах, в разных социально-возрастных груп-


пах и т. п., то уровень А1 предполагает умение слушателя изъясняться
в простой ситуации на заранее известные бытовые темы, даже обра-
щаясь к партнеру или преподавателю за языковой подсказкой.
При оценке навыков устной речи необходимо учитывать владение
стратегиями развития темы (дискурсные моменты — Themenentwick-
lung). Попробуем дать их детальную разверстку.
Умение хорошо построить дискурс преполагает:
•• умение говорить по теме;
•• умение логично, связно и последовательно излагать свои мыс-
ли;
•• умение показать интересные повороты темы, новые ракурсы
ее рассмотрения;
•• умение сравнивать и  сопоставлять разные социокультурные
моменты;
•• умение приводить интересные аргументы в защиту своей точ-
ки зрения;
•• умение соглашаться с  точкой зрения собеседника или опро-
вергать ее;
•• умение высказать свою точку зрения о том, о чем идет речь.
Подводя итог рассмотрению критериев оценки, нужно сказать,
что коммуникативные факторы — умение реагировать на идеи и мне-
ния собеседника, умение активно участвовать в диалоге, умение «вы-
ходить из положения» при недостаточном вокабуляре и незнании не-
которых жизненных реалий, а также дискурсные моменты — умение
интересно, аргументированно, логично, связно построить свое вы-
сказывание — играют очень большую роль в общении, часто гораздо
бóльшую, чем формально языковые.
Формат экзамена по проверке навыков говорения по немецкому
языку на заключительном уровне основной ступени (В1), сдача кото-
рого дает право на получение сертификата ZD, является определенным
и четко прописанным. Экзамены на более низких этапах обучения же-
лательно проводить в том же формате, однако недостаточно высокий
уровень владения языком вносит свою корректировку: например, на
ступенях А1 и А2 третье задание «решение коммуникативной задачи»
либо вообще исключается из экзамена («So geht’s»), либо заменяется

202
2.4.  Тесты по немецкому языку

на задание «составление мини-диалогов по пиктограмме» («Start I»)53,


или «реагирование в  коммуникативной ситуации» (Goethe-Zer-
tifikat)54, либо заменяется ролевой игрой (авторское предложение).
Есть определенная вариативность и во второй части экзамена —
беседа по теме: «вхождение» в  тему осуществляется либо при помо-
щи фотографий и графиков, использующихся вместе или поперемен-
но (Fit fürs Goethe-Zertifikat), либо при помощи ассоциограмм («So
geht’s»), либо при помощи карточек с  контрастивной подачей темы
и  приведением некоторых ключевых слов и  выражений (авторское
предложение).
Сдача устного экзамена — дело непростое. Основная трудность
для экзаменуемого заключается в том, что заранее ему неизвестны ни
темы, ни коммуникативные задания, хотя они в какой-то мере и со-
пряжены с пройденным материалом, но поданы в новом, необычном
ракурсе, предугадать который невозможно. Важным моментом, кото-
рый помогает экзаменуемому раскрепоститься и продемонстрировать
свои знания в полном объеме, является спокойная, доброжелательная
атмосфера на экзамене. На наш взгляд, снятию напряжения и созда-
нию условий для раскрытия творческих возможностей экзаменуемого
способствует и проведение экзамена в режиме «слушатель — слуша-
тель». Экзаменатору надо отказаться от роли гиперконтролера, все
время организующего и регулирующего экзамен, он как опытный ве-
дущий лишь слегка подправляет и направляет беседу экзаменуемых.
При оценке ответа слушателя на экзамене все его навыки — соб-
ственно языковые, коммуникативные и  экстралингвистические  —
должны учитываться в  совокупности. Коммуникативный метод об-
учения языку предполагает оценку устной речи в  первую очередь
с  точки зрения выполнения коммуникативной задачи и  успешности
общения. Это вовсе не отменяет необходимости оценки чисто языко-
вых навыков — владения лексическими единицами, грамматическими
правилами и фонетическими правилами построения речи. Овладение
этими языковыми моментами свидетельствует о  сформированности
навыков говорения и лежит в основе построения высказываний; это
53
Goethe-Zertifikat A1: Start Deutsch 1 // Goethe Institut: Übungsmaterialien:
[сайт]. URL: https://www.goethe.de/de/spr/kup/prf/prf/gzsd1/ueb.html (дата
обращения 12.06.2017).
54
Goethe-Zertifikat A2  //  Goethe Institut: Übungsmaterialien: [сайт]. URL:
https://www.goethe.de/de/spr/kup/prf/prf/gzsd2/ub2.html (дата обращения
12.06.2017).

203
Глава 2.  Системы тестирования по иностранным языкам

базовые моменты, которые никак нельзя сбрасывать со счета, но вме-


сте с тем никак нельзя ограничиваться только ими. Экстралингвисти-
ческие моменты (беглость, темп речи) тоже частично свидетельствуют
о сформированности речевых навыков, однако их оценка весьма за-
труднительна в  связи с  тем, что в  первую очередь они обусловлены
психологическими факторами.

2.5.  ЭКЗАМЕНЫ ПО ИСПАНСКОМУ ЯЗЫКУ

Испанский язык является в  настоящее время единственным


официальным языком Испании на всей ее территории. Однако ряд
провинций и  исторических областей Испании обладают значитель-
ной автономией, включая наличие второго официального языка, рас-
пространенного в  пределах данной территории. Такими основными
языками являются: баскский (euskera) в Стране Басков, галисийский
(galego) в Галисии и каталанский (català) в Каталонии и Валенсии. Все
они представлены в ALTE Секретариатами по языковой политике или
образованию автономных правительств Галисии, Каталонии и Стра-
ны Басков, а  собственно испанский язык (español, или castellano)  —
Институтом Сервантеса и  Университетом Саламанки55. В  последние
годы экзаменационная шкала ALTE была приведена в  соответствие
с  «Общеевропейскими компетенциями владения иностранным язы-
ком» и также состоит из 6 основных уровней, имеющих несколько иное
обозначение: Breakthrough, Level 1, Level 2, Level 3, Level 4 и Level 5 (см.
выше), что отразилось в новых названиях соответствующих языковых
экзаменов и  сертификационных документов. Национальные языки
Испании представлены в ней пока с разной степенью полноты; кроме
того, только часть экзаменов прошла процедуру корпоративного ауди-
та на соответствие формата и материалов экзаменов 17 качественным
критериям ALTE (так называемая Q-mark). См. табл. 14 (четыре экза-
мена, отвечающие критерию качества и одобренные ALTE, выделены
в таблице курсивом).
К настоящему времени экзамены по испанскому языку как ино-
странному (Diploma de Español como Lengua extranjera — DELE) рас-
пределены по 6 уровням. Всего существуют два вида оценок за экза-
мен по испанскому языку как иностранному: «Сдано» («Apto») и «Не

55
ALTE: [сайт]. URL: http://www.alte.org (дата обращения 20.10.2016).

204
Таблица 14
Распределение основных национальных языковых экзаменов Испании в соответствии с уровнями Совета Европы

A1 A2 B1 B2 C1 C2
Уровень
ALTE
ALTE ALTE ALTE ALTE ALTE
Язык Level Break
Level A1 Level 2 Level 3 Level 4 Level 5
through

Certificat de Certificat de Certificat de nivell Certificat de


Certificat de nivell
Каталанский — nivell bàsic nivell elemental intermedi nivell superior
suficiència (C)
(A bàsic) (A elemental) (B) (D)

Diploma de Diploma de Diploma de Diploma de Diploma de Diploma de


Español como Español como Español como Español como Español como Español como
Испанский
Lengua extranjera Lengua extranjera Lengua extranjera Lengua extranjera Lengua extranjera Lengua extranjera
(DELE), Nivel A1 (DELE), Nivel A2 (DELE), Nivel B1 (DELE), Nivel B2 (DELE), Nivel C1 (DELE), Nivel C2
Euskarazko
Баскский — — — — Gaitasun Agiria —
(EGA)
Certificado de Certificado de Certificado de Certificado de Certificado de
coñecimento de coñecimento de coñecimento de coñecimento de coñecimento de
Галисийский —
lingua galega lingua galega lingua galega lingua galega lingua galega
Celga 1 Celga 2 Celga 3 Celga 4 Celga 5

205
2.5.  Экзамены по испанскому языку
Глава 2.  Системы тестирования по иностранным языкам

сдано» («No apto»). Для получения общего положительного результата


в настоящее время необходимо дать не менее 60 % правильных ответов
в  каждой из  двух отдельно оцениваемых частей, которые несколько
отличаются по составу в зависимости от уровня экзамена. По резуль-
татам успешно сданного экзамена выписывается соответствующий
диплом. Экзамены DELE являются единственными официально при-
знанными Министерством образования Испании экзаменами во всех
областях деятельности, включая поступление в  вуз (диплом  — Nivel
B2  или выше) или трудоустройство в  государственной сфере. Зна-
чительное число крупных частных компаний, зарегистрированных
в Испании и за рубежом, также требуют при трудоустройстве диплом
DELE. 

Уровень А1 (Nivel A1)


Часть 1. Навыки чтения и письма / Grupo 1. Destrezas de lecto-escritura
Чтение (Comprensión de lectura).
•• 4 задания (25 вопросов) на понимание текстов, при необходи-
мости адаптированных, с заданиями множественного выбора
и на установление соответствия.
Письмо (Expressión e interacción escritas)
•• Задание 1. Заполнение формы с личными данными.
•• Задание  2.  Написание краткого сообщения (открытки, части
письма, электронного сообщения).

Часть 2. Устные навыки / Grupo 2. Destrezas orales


Слушание (Compensión auditiva).
•• 4 задания (25 вопросов) на понимание записи текстов, при не-
обходимости адаптированных, с заданиями множественного
выбора, на установление соответствия и  заполнение пропу-
сков.
Говорение (Expressión e interacción orales). Этот раздел экзамена
проходит в индивидуальном формате; результат складывается из двух
оценок (холистической — 40 % и аналитической — 60 %, включающей
произношение, грамматическую правильность, лексический запас
и когеренцию).
•• Задание 1. Монологическое высказывание (1–2 мин.) с целью
представления себя.

206
2.5.  Экзамены по испанскому языку

•• Задание 2. Монологическое высказывание (2–3 мин.) при воз-


можном незначительном участии экзаменатора для представ-
ления темы преимущественно личного характера.
•• Задание 3. Речевое взаимодействие (3–4 мин.) между экзаме-
нуемым и экзаменатором в развитие предыдущей темы.
•• Задание 4. Краткие диалоги (2–3 мин.) между экзаменуемым
и экзаменатором в стандартных коммуникативных ситуациях
на основе материала-стимула.

Уровень А2 (Nivel A2)


Часть 1. Навыки чтения и письма / Grupo 1. Destrezas de lecto-escritura
Чтение (Comprensión de lectura).
•• 5  заданий (30  вопросов) на общее понимание и  извлечение
информации из небольших, при необходимости адаптирован-
ных, текстов информативно-инструктивного характера, объ-
явлений, писем, описаний жизни и  деятельности известных
людей (задания с множественным выбором, на установление
соответствия и ответ на вопрос после текста).
Письмо (Expressión e interacción escritas).
•• Задание  1.  Внесение дополнительных данных, преимуще-
ственно личного характера, в  формуляры или электронные
документы в свободной форме (30–40 слов).
•• Задание  2.  Написание краткого ответного сообщения (от-
крытки, письма, электронного сообщения) из повседневного
домашнего или рабочего обихода (70–80 слов).
•• Задание 3. Ккраткое описание, повествование, биография или
дневниковая запись объемом 70–80  слов с  представлением
конкретных данных в текстовом или графическом формате.

Часть 2. Устные навыки / Grupo 2. Destrezas orales


Слушание (Compensión auditiva).
•• 5 заданий (30 вопросов) на прослушивание простых текстов
из  повседневного обихода или информативного характера,
в  форме монолога и  диалога, объявлений по громкой связи
и  разговоров по телефону с  заданиями множественного вы-
бора, на установление соответствия с текстовым или визуаль-
ным материалом.

207
Глава 2.  Системы тестирования по иностранным языкам

Говорение (Expressión e interacción orales). Этот раздел экзамена


проходит в индивидуальном формате; результат складывается из двух
оценок (холистической — 40 % и аналитической — 60 %, включающей
произношение, грамматическую правильность, лексический запас
и когеренцию).
•• Задание  1. Монологическое высказывание (3–4  мин.) на за-
данную тему в соответствии с материалом-стимулом.
•• Задание 2. Монологическое высказывание (2–3 мин.) для из-
ложения заданной темы повседневного обихода  — покупки,
транспорт и т. д. с опорой на фотографию.
•• Задание 3. Речевое взаимодействие (2–3 мин.) между экзаме-
нуемым и  экзаменатором на предварительно обозначенную
тему из предыдущего задания.
•• Задание  4.  Ролевая игра в  форме диалога (3–4  мин.) между
экзаменуемым и экзаменатором в повседневной коммуника-
тивной ситуации на основе материала-стимула.

Уровень B1 (Nivel B1)


Часть 1. Навыки чтения и письма / Grupo 1. Destrezas de lecto-escritura
Чтение (Comprensión de lectura)
•• 5  заданий (30  вопросов) на общее понимание и  извлечение
конкретной информации из  разнообразных по жанру, при
необходимости адаптированных, текстов информативно-ин-
структивного, делового или академического характера, ката-
логов, объявлений, писем, биографических очерков, скетчей,
деловых и  личных писем (задания с  множественным выбо-
ром, на установление соответствия, дополнение предложений
и заполнение пропусков в тексте).
Письмо (Expressión e interacción escritas)
•• Задание 1. Написание обычного или электронного письма или
сообщения на форум, содержащего описание или повествова-
ние (100–120 слов).
•• Задание  2.  Написание небольшого изложения, сочинения,
биографии или оформление дневниковой записи с  включе-
нием описания или повествования о  событии, информации
и личной оценки автора (130–150 слов).

208
2.5.  Экзамены по испанскому языку

Часть 2. Устные навыки / Grupo 2. Destrezas orales


Слушание (Compensión auditiva).
•• 5  заданий (30  вопросов) на прослушивание объявлений, со-
общений, коротких рассказов на личные, рабочие или ака-
демические темы, теле- и  радионовостей, коротких текстов
информативного характера, забавных историй в форме моно-
лога или диалога с  заданиями множественного выбора и  на
установление соответствия с визуальным материалом.
Говорение (Expressión e interacción orales). Этот раздел экзамена
проходит в индивидуальном формате; результат складывается из двух
оценок (холистической — 40 % и аналитической — 60 %, включающей
произношение, грамматическую правильность, лексический запас
и когеренцию).
•• Задание 1. Монологическое высказывание (2–3 мин.) на одну
из заранее предложенных двух тем по выбору и ответы на во-
просы по теме.
•• Задание 2. Речевое взаимодействие (3–4 мин.) между экзаме-
нуемым и экзаменатором на обозначенную тему из предыду-
щего задания с обсуждением собственного мнения и личного
опыта экзаменуемого.
•• Задание 3. Монологическое высказывание (2–3 мин.) по кар-
тинке или фотографии с  последующим ответом на вопросы
экзаменатора.
•• Задание  4.  Ролевая игра в  форме диалога (2–3  мин.) между
экзаменуемым и  экзаменатором в  повседневной коммуника-
тивной ситуации на тему, представленную фотографией в за-
дании  3  (возврат или обмен товара, просьба или жалоба на
услугу, получение информации и т. д.).

Уровень B2 (Nivel B2)


Часть 1. Навыки чтения и письма / Grupo 1. Destrezas de lecto-escritura
Чтение (Comprensión de lectura).
•• 4 задания (36 вопросов) на общее понимание и извлечение ин-
формации из сложных, при необходимости адаптированных,
текстов общественного или делового характера; историй, ком-
ментариев, скетчей с  выражением личной точки зрения; пу-
теводителей, текстов делового или академического характера,

209
Глава 2.  Системы тестирования по иностранным языкам

каталогов, биографических очерков, литературных произве-


дений (задания с множественным выбором, на установление
соответствия, дополнение абзацев и  заполнение пропусков
в тексте).
Письмо (Expressión e interacción escritas)
•• Задание  1.  Написание письма или электронного сообщения
свободного стиля, содержащего ясное и подробное изложение
собственной точки зрения на содержание прослушанного ин-
формативного материала в виде новостей, спортивной транс-
ляции или комментария (150–180 слов).
•• Задание 2. Написание по выбору: 1) газетной или журнальной
статьи в  литературном стиле или 2)  официальной публика-
ции в  блоге на основе ознакомления с  письменным текстом
и  информацией, содержащейся в  таблицах и  графиках (150–
180 слов).

Часть 2. Устные навыки / Grupo 2. Destrezas orales


Слушание (Compensión auditiva).
•• 5 заданий (30 вопросов) на извлечение конкретной информа-
ции из коротких диалогов, представленных разными стилями
речи; разговора собеседников на определенную тему; прослу-
шивание диалогов с детальным пониманием содержания бе-
седы и пониманием изменений в ходе беседы; прослушивание
обсуждений, дискуссий на общественно значимые, рабочие
или академические темы, в  которых высказываются различ-
ные точки зрения, оценки, даются советы с  заданиями мно-
жественного выбора, ответами на вопросы и на установление
соответствия с текстовым или визуальным материалом.
Говорение (Expressión e interacción orales). Этот раздел экзамена
проходит в индивидуальном формате; результат складывается из двух
оценок (холистической — 40 % и аналитической — 60 %, включающей
произношение, грамматическую правильность, лексический запас
и когеренцию).
•• Задание  1.  Монологическое высказывание на заданную тему
в  соответствии с  материалом-стимулом, указывающим на
проблему, и  несколькими предлагаемыми вариантами ее ре-
шения с  последующим обсуждением темы с  экзаменатором
(6–7 мин.).

210
2.5.  Экзамены по испанскому языку

•• Задание  2.  Короткое монологическое высказывание для из-


ложения заданной темы с опорой на фотографию или другой
материал-стимул с последующим ее обсуждением (5–6 мин.).
•• Задание 3. Речевое взаимодействие (3–4 мин.) между экзаме-
нуемым и экзаменатором на одну из двух предложенных тем
по выбору без предварительной подготовки на основе мате-
риала-стимула.

Уровень C1 (Nivel C1)


Часть 1
Тест 1. Чтение, лексика и грамматика / Prueba 1. Comprensión
de lectura y uso de la lengua
•• 5  заданий (40  вопросов) на чтение нескольких художествен-
ных или научно-популярных текстов информативно-ин-
структивного характера, научных публикаций или исследова-
тельских работ академической и  профессиональной направ-
ленности (задания и вопросы с множественным выбором, на
установление соответствия и дополнение).
Тест  3.  Интегрированные задания: слушание и  письмо  /
Prueba  3. Destrezas integradas: comprensión auditiva y expresión e
interacción escritas
•• Задание 1. Написание связного текста (220–250 слов) с вклю-
чением личностной оценки и аргументированных положений
на основании прослушанного аудиоматериала с учетом стиля
и жанра изложения.
•• Задание 2. Написание текста (220–250 слов) официального со-
держания по выбору из двух возможных: а) рецензия, сообще-
ние или статья в журнал или б) письмо с выражением жалобы,
обращением за стипендией или рекомендацией и  т. д. с  обо-
снованием претензии или просьбы.

Часть 2
Тест 2. Слушание, лексика и грамматика / Prueba 2. Comprensión
auditiva y uso de la lengua
•• 4  задания (30  вопросов) на прослушивание текстов лекций,
радио- или телевыступлений дискуссионного характера на
общественно значимые темы и диалогов и телефонных пере-
говоров учебно-профессиональной направленности с  целью

211
Глава 2.  Системы тестирования по иностранным языкам

уточнения мнения или точки зрения собеседника (задания


и вопросы на дополнение и множественный выбор).
Тест 4. Интегрированные задания: чтение и говорение / Prueba 4.
Destrezas integradas: comprensión de lectura y expresión e interacción
orales. Этот раздел экзамена проходит в индивидуальном формате; ре-
зультат складывается из двух оценок (холистической — 40 % и анали-
тической — 60 %, включающей когеренцию, беглость и естественность
речи, грамматическую правильность и лексический запас).
•• Задание 1. Устное представление (3–5 мин.) темы, предложен-
ной в письменном тексте, с кратким резюме по нему и его обо-
снованной оценкой.
•• Задание 2. Беседа (4–6 мин.) по теме с обсуждением аргумен-
тации и положений, предлагаемых кандидатом;
•• Задание  3.  Беседа (4–6  мин.) в  неформальном стиле  — язы-
ковое взаимодействие с экзаменатором на основе материала-
стимула.

Уровень C2 (Nivel C2)


Часть 1
Тест 1. Лексика и грамматика, чтение и слушание / Prueba 1. Uso
de la lengua, comprensión de lectura y auditiva.
•• 3  задания на чтение нескольких художественных, публици-
стических или учебных текстов научного характера, материа-
лов академической и профессиональной направленности раз-
ного объема (задания и вопросы с множественным выбором,
на установление соответствия и дополнение).
•• 2 задания на прослушивание радио- или телевыступлений на
общественно значимые и  учебно-профессиональные темы,
а  также понимание сути ведущихся дискуссий, интервью,
опросов, в  которых высказываются различные, в  том числе
неожиданные, точки зрения и мнения (задания и вопросы на
дополнение предложений и множественный выбор).
•• (Всего 52 вопроса.)

Часть 2
Тест  1.  Интегрированные задания: слушание, чтение и  пись-
мо / Prueba 2. Destrezas integradas: comprensión auditiva e de lectura y
expresión e interacción escritas.

212
2.5.  Экзамены по испанскому языку

•• Задание  1.  Написание хорошо структурированного, деталь-


но проработанного текста (сообщения, письма руководству,
учебного текста и  др. объемом 400–450  слов) на основании
прочитанного текста и прослушанного аудиоматериала с уче-
том официального или нейтрального стиля изложения.
•• Задание  2.  Редактирование и  преобразование текста (150–
200  слов) неопределенного жанра с  точки зрения его стили-
стического единообразия, соответствия правилам грамма-
тики, орфографии и  пунктуации, правильности и  широты
лексического наполнения и  т. д. (черновики, записи устных
выступлений, автоматизированного перевода текстов и др.).
•• Задание  3.  Написание статьи, отчета, письма руководителю,
обращения в блоге (200–250 слов) на основе текстового мате-
риала-стимула или визуального ряда (рисунки, графики, кар-
точки и т. д.).
Тест 1. Интегрированные задания: чтение и говорение / Prueba 3.
Destrezas integradas: comprensión de lectura y expresión e interac­ción
orales. Этот раздел экзамена проходит в индивидуальном формате; ре-
зультат складывается из двух оценок (холистической — 40 % и анали-
тической — 60 %, включающей когеренцию, беглость и естественность
речи, грамматическую правильность и лексический запас).
•• Задание 1. Устное выступление (6–8 мин.) на академическую,
профессиональную или общественную тему, предложенную
в  текстах и  сопроводительных материалах, с  рассмотрением
различных точек зрения, представленных в текстах, и их обо-
снованной оценкой.
•• Задание 2. Беседа с экзаменатором по предыдущей теме с об-
суждением аргументации и положений, предлагаемых канди-
датом.
•• Задание  3.  Беседа (5–6  мин.) в  неформальном стиле  — язы-
ковое взаимодействие с экзаменатором на основе нескольких
газетных заголовков, представляющих отдельные аспекты той
же самой темы.
Выше представлены данные, в  которых отражены соответствие
каждого экзамена «Общеевропейским компетенциям…», формат
и содержание экзамена по уровням, группы вопросов. Время, отводи-
мое на выполнение каждого из разделов, а также количество вопросов
и удельный вес каждого из них в общей оценке см. в табл. 15–16.

213
Глава 2.  Системы тестирования по иностранным языкам

Таблица 15
Тестирование DELE по испанскому языку. Уровни А1, A2, B1, B2

Удельный
Уро­вень

Часть

Число Число Продолжительность, вес в оценке


Раздел
заданий вопросов мин. за уровень,
%
Чтение 4 25 45 25
1
Письмо 2 — 25 25

A1 Слушание 4 25 20 25

2 15
Говорение 4 — (+15 мин. на подго- 25
товку заданий 3 и 4)
Чтение 5 30 60 25
1
Письмо 3 — 50 25

A2 Слушание 5 30 35 25

2 15
Говорение 4 — (+ 15 на подготовку 25
заданий 1–3)
Чтение 5 30 70 25
1
Письмо 2 — 60 25

B1 Слушание 5 30 40 25

2 15
Говорение 4 — (+ 15 на подготовку 25
заданий)
Чтение 4 36 70 25
1
Письмо 2 — 80 25

B2 Слушание 5 30 40 25

2 20
Говорение 3 — (+ 20 на подготовку 25
заданий)

Следует отметить, что разработчиками экзаменов DELE ведет-


ся интенсивная работа по пересмотру как содержания экзаменов, так
и их формата. Eще не так давно Институт Сервантеса предлагал для
сдачи всего три экзамена в системе ALTE — по уровням В1, В2 и С2.
В настоящее же время представлена не только вся шестиуровневая ли-

214
2.5.  Экзамены по испанскому языку

Таблица 16
Тестирование DELE по испанскому языку. Уровни C1, C2

Удельный
Уровень

Продолжи-
Часть

Число Число вес в оценке


Тест (раздел) тельность,
заданий вопросов за уровень,
мин.
%
1. Чтение, лексика
5 40 90 25
и грамматика
1 3. Интегрированные
задания: слушание 2 — 80 25
и письмо
C1 2. Слушание, лексика
4 30 50 25
и грамматика

2 20
4. Интегрированные
(+ 20 на
задания: чтение 3 — 25
подготовку
и говорение
заданий)
1. Лексика
1 и грамматика, чтение 5 52 105 33,33
и слушание
2. Интегрированные
задания: слушание, 3 — 150 33,33
C2
чтение и письмо
2 20
3. Интегрированные
(+ 20 на
задания: чтение 3 — 33,33
подготовку
и говорение
задания 1)

нейка экзаменов, но и сами экзамены приобрели более однородный по


составу частей вид. Все они ставят во главу угла тестирование комму-
никативных компетенций по 4 основным видам речевой деятельности
и состоят из 4 соответствующих разделов (кроме экзамена по уровню
С2, где они пока сведены в 3 раздела).
Такие «выпадавшие» из  общего ряда разделы экзаменов, как
«Грамматика и лексика» («Gramática y vocabulário») по уровню С2 и не-
однородный по целям тестирования и недостаточно проработанный
раздел «Коммуникативная компетенция» («Conciencia comunicativa»)
по уровню В1, были изъяты из формата экзаменов, а уровень владения
этими навыками учитывается теперь при оценке выполнения заданий
в других частях экзаменов. Однако, пожалуй, наиболее существенным

215
Глава 2.  Системы тестирования по иностранным языкам

моментом в новом формате экзаменов DELE является их переориента-


ция на высоких уровнях, начиная с В2, на тестирование интегратив-
ных навыков владения испанским языком как иностранным: говоре-
ние на основе прочитанного или прослушанного материала, письмо
на основе прослушанного материала и др. Интересно, что именно так,
интегративно, тестируются пассивные и активные коммуникативные
навыки в действующей сейчас интернет-версии американского экза-
мена TOEFL, что можно считать одним из последних трендов в совре-
менном языковом тестировании.
Испанский язык является официальным языком не только Ис-
пании, но  и  почти всех стран Латинской Америки. Однако наличие
языковых и  лингвокультурологических особенностей латиноамери-
канских вариантов испанского языка по сравнению с  европейским
испанским побуждает крупные университеты Нового Света, облада-
ющие автономным статусом, разрабатывать свои собственные квали-
фикационные экзамены, которые учитывали бы национально-реги-
ональную языковую специфику Латинской Америки. Так, например,
единственным официально признанным на государственном уровне
экзаменом по испанскому языку как иностранному в  Аргентине яв-
ляется экзамен Certificado de Español: Lengua y Uso (CELU). Тем не ме-
нее ни в  одной из  этих стран нет пока единой государственной или
частной системы экзаменов по испанскому языку, подобной DELE, что
делает затруднительным соотнесение сертификатов различных уни-
верситетов как между собой, так и с Общеевропейской шкалой ком-
муникативных компетенций.
Институт Сервантеса в настоящее время сотрудничает с несколь-
кими латиноамериканскими университетами в деле разработки экза-
менов по испанскому языку как иностранному, дополняет различные
части экзамена DELE материалами с латиноамериканской спецификой
и допускает возможность использования на экзамене не только евро-
пейского варианта испанского языка, но и любого другого националь-
ного варианта стран Латинской Америки. Еще одним шагом на пути
сближения испанской и латиноамериканских сертификационных ор-
ганизаций является создание в 2007 г. заинтересованными сторонами,
преимущественно университетами и их ассоциациями, Международ-
ной системы сертификации по испанскому языку как иностранно-
му (SICELE). В  рамках этой организации планируется осуществлять
централизованную экспертизу имеющихся и заново создающихся те-
стов, разрабатываемых членами SICELE, так как одним из основопо-

216
2.6.  Экзамены по португальскому языку

лагающих положений при ее создании было признание результатов


сертификационных испытаний всеми участниками Международной
системы.

2.6.  ЭКЗАМЕНЫ ПО ПОРТУГАЛЬСКОМУ ЯЗЫКУ

Лиссабонский университет (Португалия) является членом Ев-


ропейской ассоциации языковых экзаменаторов (ALTE) с момента ее
создания в 1990 г. восемью соучредителями. На данный момент толь-
ко несколько языков Европы, включая португальский, представлены
в ALTE полной «линейкой» из 6 международных экзаменов, из кото-
рых, однако, только французский язык имеет знак качества (ALTE
Q-mark) на все из  них от уровня А1  до С2. Тестирование по порту-
гальскому языку как иностранному осуществлялось до последнего
времени по уровням от А2 до С2, а тест на самом низком уровне А1 до-
бавился лишь в июле 2013 г. в связи с расширением уровневой шкалы
ALTE и приведением ее в соответствие с «Общеевропейскими компе-
тенциями владения иностранным языком». Окончательный формат
экзамена «Certificado Acesso» (A1) находится в настоящее время в ста-
дии апробации.
В основе современной многоуровневой системы оценива-
ния и  сертификации по португальскому языку как иностранному
(Português Língua Estrangeira  — PLE) лежит протокол, подписанный
2  марта 1999  г. Министерством иностранных дел, Министерством
образования Португалии и Лиссабонским университетом, в соответ-
ствии с  которым Центр тестирования по португальскому языку как
иностранному (Centro de Avaliação de Português Língua Estrangeira —
CAPLE)56, созданный при филологическом факультете Лиссабонского
университета, отвечает за осуществление следующих видов деятель-
ности:
•• подготовка экзаменационных материалов;
•• проведение экзаменов;
•• оценка, классификация и анализ результатов проведенных эк-
заменов;
•• выдача сертификатов и дипломов;

56
Português Língua Estrangeira: Exames: 2005. Lisboa: CAPLE —Universidade
de Lisboa, 2005.

217
Глава 2.  Системы тестирования по иностранным языкам

•• оказание помощи как желающим пройти тестирование при


подготовке к  сдаче экзамена, так и  самим экзаменаторам на
любом из этапов подготовки экзаменационных материалов;
•• теоретические и прикладные аттестационные исследования;
•• подготовка кадров в области тестирования.
Помимо этого, CAPLE курирует экзаменационные центры, соз-
даваемые в странах Европы, в том числе и два Экзаменационных цен-
тра по португальскому языку, которые действуют на филологическом
факультете Санкт-Петербургского государственного университета и
в  Московском университете международных отношений и  осущест-
вляют прием экзаменов по всем уровням.
Центр тестирования при Лиссабонском университете участво-
вал также в разработке, в соответствии с проектом ALTE, так называ-
емых положений «CAN-DO» для португальского языка, т. е. системы
из 400 утверждений, определяющих, какими знаниями должен обла-
дать обучаемый на каждом уровне и в каждом из 4 основных видов
речевой деятельности: слушании, говорении, чтении и  письме. Эта
система охватывает 4  сферы применения иностранного языка: об-
щую, туристическую, трудовую и образовательную. В планах CAPLE
на ближайшее будущее значится завершение работы над трехуровне-
вой серией тестов по португальскому языку как иностранному, рас-
считанных на детей младшего и  среднего школьного возраста (ана-
логично тестам «Young Learners’ English» по английскому языку), так
как к экзаменам PLE допускаются, согласно положению, лица старше
14 лет.
Ниже приводятся описания экзаменов по уровням, где отраже-
ны соответствия каждого экзамена «Общеевропейским компетенци-
ям…» (A1–C2), формат экзамена; время, отводимое на выполнение
каждого из  разделов, а  также удельный вес каждого из  них в  общей
оценке см. в табл. 17. Всего существуют три вида положительных оце-
нок за экзамен по португальскому языку как иностранному: Muito
Bom  — «отлично» (85–100  правильных ответов), Bom  — «хорошо»
(70–84)  и  Suficiente  — «удовлетворительно» (55–69). Для получения
общего положительного результата необходимо дать в целом не менее
55 % правильных ответов. По результатам успешно сданного экзамена
выписывается соответствующий диплом.
Экзамены по португальскому языку как иностранному (PLE) на
уровнях А2–С2 имеют достаточно однородный состав частей и теперь

218
Таблица 17
Сертификат владения португальским языком как иностранным.
Уровень «Начальный» (Certificado Inicial de Português Língua Estrangeira). Формат экзамена: CIPLE (A2)

Продолжительность, Соотношение,
Аспект Часть Содержание экзамена
мин %
Понимание содержания объявлений
Чтение / Письмо в общественных местах и небольших текстов
1
(Compreensão da (задания с множественным выбором и на
установление соответствия) 75 22,5 + 22,5
Leitura e Expressão
Escrita) Заполнение анкеты. Написание записки или
2
открытки другу. Написание письма
Прослушивание небольших диалогов
неформального характера (задания
1 с верными / неверными утверждениями, на
установление соответствия и с множественным
Аудирование выбором) 30 30
(Compreensão do Oral)
Прослушивание небольших текстов
из повседневного обихода (задания на
2
множественный выбор, с верными/неверными
утверждениями и на установление соответствия)
Речевое взаимодействие между экзаменатором
1
и экзаменуемыми в форме знакомства
Говорение (Expressão Диалог между экзаменуемыми с целью обмена
2 20 на пару 25
Oral) фактической информацией
Диалог между экзаменатором и экзаменуемыми на
3
одну из актуальных тем

219
2.6.  Экзамены по португальскому языку
Диплом владения португальским языком как иностранным.

220
Уровень «Элементарный» (Diploma Elementar de Português Língua Estrangeira). Формат экзамена: DEPLE (B1)

Продолжительность, Соотношение,
Аспект Часть Содержание экзамена
мин. %
Общее понимание текстов: объявлений, газетных и журналь-
ных статей, медицинских и кулинарных рецептов, писем,
1
отчетов (задания с множественным выбором, вернымия / не-
Чтение верными утверждениями и на установление соответствия)
(Compreensão 30 25
da Leitura) Чтение газетного или журнального текста с извлечением
полной информации (задания с множественным выбором
2
верными / неверными утверждениями и на установление соот-
ветствия)
Написание высказывания с элементами рассуждения / с запро-
Письмо 1 сом или предоставлением информации или письма личного
(Expressão или делового характера 60 25
Escrita)
2 Написание электронного письма или открытки
Прослушивание диалогов (задания с множественным выбором
1 верными / неверными утверждениями и на установление соот-
Глава 2.  Системы тестирования по иностранным языкам

ветствия)
Аудирование
(Compreensão Прослушивание радиосообщений информационного характе- 40 25
do Oral) ра (новости, прогноз погоды, репертуар театров и кино) или
2 инструктивных и информационных текстов (задания с множе-
ственным выбором верными / неверными утверждениями и на
установление соответствия)
Речевое взаимодействие между экзаменатором и экзаменуемы-
1
ми в форме знакомства
Ролевая игра между экзаменуемыми в профессиональной или
Говорение 2
академической коммуникативной ситуации
(Expressão 20 на пару 25
Oral) Речевое взаимодействие между экзаменуемыми и между
экзаменатором и экзаменуемыми с целью обмена оценочной
3
информацией по предварительно полученному материалу-сти-
мулу

Диплом владения португальским языком как иностранным. Уровень «Промежуточный» (Diploma Intermédio de
Português Língua Estrangeira). Формат экзамена: DIPLE (B2)

Продолжительность, Соотношение,
Аспект Часть Содержание экзамена
мин. %
Чтение небольших газетных текстов с пониманием основного
1 содержания (задания с множественным выбором, с верными/
Чтение неверными утверждениями и на установление соответствия)
(Compreensão 45 20
da Leitura) Чтение двух текстов с извлечением полной информации
2 (задания с множественным выбором, с верными/неверными
утверждениями и на установление соответствия)
Написание письма личного или делового характера объемом
1
160–180 слов
Письмо
Написание повествовательного, описательного или аргументи-
(Expressão 75 20
2 рующего текста (на выбор из трех предложенных тем) объемом
Escrita)
160–180 слов
3 Дополнение предложений на основе текста

221
2.6.  Экзамены по португальскому языку
Продолжительность, Соотношение,

222
Аспект Часть Содержание экзамена
мин. %
Грамматика 1 Дополнение текстов и трансформация предложений
и лексика
45 20
(Competência 2 Переработка, компрессия или расширение текста
Estrutural)
1 Прослушивание небольших текстов из повседневного обихода
2 Прослушивание радиосообщений
Аудирование
(Compreensão Прослушивание части лекции, экскурсионного сопровождения 45 20
do Oral) или текста с запросом/предоставлением информации, ин-
структивного или аргументирующего текста (задания с верны-
ми/неверными утверждениями, на установление соответствия
и с множественным выбором)
Речевое взаимодействие между экзаменатором и экзаменуемы-
1
ми в форме ознакомительного собеседования
Говорение Диалог между экзаменуемыми с целью планирования совмест-
(Expressão 2 ной деятельности или решения совместной задачи, требующей 20 на пару 20
Oral) обсуждени
Глава 2.  Системы тестирования по иностранным языкам

Речевое реагирование экзаменуемых на предварительно вы-


3
данные материалы-стимулы
Диплом владения португальским языком как иностранным. Уровень «Продвинутый» (Diploma Avançado de Português
Língua Estrangeira). Формат экзамена: DAPLE (C1)

Продолжительность, Соотношение,
Аспект Часть Содержание экзамена
мин. %
1 Чтение двух текстов с извлечением полной информации
Чтение
(Compreensão Чтение двух текстов с детальным пониманием содержания 60 20
da Leitura) 2 (задания на установление соответствия, с множественным вы-
бором и с верными / неверными утверждениями)
Написание текста для решения задачи в общественной, про-
1
Письмо фессиональной или академической сферах
(Expressão Написание одного или нескольких текстов объемом 200– 90 20
Escrita) 2 230 слов на заданные темы или с опорой на подобранные
тексты
Грамматика Заполнение пропусков в тексте и трансформация предложе-
1
и лексика ний
60 20
(Competência
Estrutural) 2 Переработка, компрессия или расширение текста

Прослушивание одного пространного или нескольких кратких


1
радиосообщений
Аудирование Прослушивание одного пространного или нескольких кратких
2
(Compreensão диалогических высказываний 40 20
do Oral)
Прослушивание текста, лекции или постановления собрания
3 (задания с верными / неверными утверждениями, на установ-
ление соответствия и с множественным выбором)

223
2.6.  Экзамены по португальскому языку
Продолжительность, Соотношение,

224
Аспект Часть Содержание экзамена
мин. %
Речевое взаимодействие между экзаменатором и экзаменуе-
1
мыми в форме ознакомительного собеседования
Говорение Диалог между экзаменуемыми с целью планирования совмест-
(Expressão 2 ной деятельности или решения совместной задачи, требующей 20 на пару 20
Oral) обсуждения
Представление точек зрения на предварительно выданные
3
материалы-стимулы

Диплом владения португальским языком как иностранным. Уровень «Универсальный» (Diploma Universitário de
Português Língua Estrangeira). Формат экзамена: DUPLE (C2)

Продолжительность, Соотноше­
Аспект Часть Содержание экзамена
мин. ние, %
1 Чтение трех текстов с пониманием основного содержания
Чтение
(Compreensão Чтение двух-трех текстов с извлечением подробной инфор- 75 20
da Leitura) 2 мации (задания с верными / неверными утверждениями, на
Глава 2.  Системы тестирования по иностранным языкам

установление соответствия и с множественным выбором)


Написание комментария на одну из двух предложенных тем
1 объемом 250–280 слов
Письмо
(Expressão 105 20
Escrita) Написание одного или двух текстов на общественную, про-
2 фессиональную или образовательную тематику объемом
250–280 слов
Грамматика Дополнение текстов и трансформация предложений
1
и лексика
75 20
(Competência Редактирование, переработка, компрессия или расширение
Estrutural) 2
текста
Прослушивание части лекции, выступления или монологиче-
1 ского текста на радио
Аудирование
(Compreensão 40 20
do Oral) Прослушивание текстов (задания с верными / неверными
2 утверждениями, на установление соответствия и с множе-
ственным выбором)
Речевое взаимодействие между экзаменатором и экзаменуе-
1 мыми в форме ознакомительного собеседования
Говорение
(Expressão
Монологическое высказывание с представлением различных 20 на пару 20
Oral) 2
точек зрения по предварительно предложенной теме
Речевое взаимодействие между экзаменуемыми по планирова-
3
нию совместной деятельности

225
2.6.  Экзамены по португальскому языку
Глава 2.  Системы тестирования по иностранным языкам

уже становящийся традиционным формат, в рамках которого тестиру-


ются 4 основные речевые компетенции: слушание, говорение, письмо
и чтение. Однако в отличие от испанских экзаменов DELE португаль-
ские экзамены не имеют интегративных заданий на высоких уровнях
В2–С2, а их форматы дополнены на тех же самых уровнях отсутствую-
щим в испанских экзаменах пятым разделом, тестирующим граммати-
ческие и, в меньшей степени, лексические навыки экзаменуемых.
Помимо самой Португалии, португальский язык является офи-
циальным языком Бразилии и  пяти африканских государств, где он
приобрел ярко выраженную национально-региональную специфику.
Исторически оформившийся в качестве полноценного национального
варианта, португальский язык Бразилии обладает многочисленными
особенностями по сравнению с европейским португальским, что при
наличии в Бразилии сильной школы лингвистов не могло не мотиви-
ровать их к созданию собственного аттестационного экзамена по пор-
тугальскому языку как иностранному. Первый экзамен на получение
бразильского сертификата Сelpe-Bras (Certificado de Proficiência em
Língua Portuguesa para Estrangeiros) прошел при поддержке Министер-
ства образования Бразилии в 1998 г., а с 2009 г. разработку материалов
и проведение экзаменов в самой Бразилии и за рубежом осуществля-
ет Национальный исследовательский институт образования (Instituto
Nacional Do Encino Da Lingua Portuguesa — INELP).
В настоящее время экзамен Сelpe-Bras, единственный официаль-
но признанный в  Бразилии, оценивает компетенции кандидатов по
4 уровням: промежуточный (intermediário), средний и выше среднего
(intermediário superior), продвинутый (avançado) и выше продвинуто-
го (avançado superior).  Экзамен имеет 2  части: письменную, продол-
жительностью 3 ч., и устную, продолжительностью 20 мин., и тести-
рует 4  основные вида речевой деятельности: слушание (compreensão
oral), чтение (сompreensão escrita), говорение (produção oral) и письмо
(produção escrita).
Тестовые задания письменной части носят интегративный ха-
рактер. Так, в этой части экзамена присутствуют 2 задания на письмо
на основе прослушанного материала и 2 задания на письмо на основе
прочитанных текстов. В  устной части экзамена речевое взаимодей-
ствие экзаменуемого и экзаменатора происходит на основе предвари-
тельного ознакомления с личностной информацией, предоставленной
кандидатом при записи на экзамен, и в ходе последующей беседы на
общезначимые повседневные темы на основе материала-стимула.

226
2.7.  Структураи особенностисертификациипоитальянскомуязыкукакиностранному

2.7.  СТРУКТУРА И ОСОБЕННОСТИ СЕРТИФИКАЦИИ


ПО ИТАЛЬЯНСКОМУ ЯЗЫКУ КАК ИНОСТРАННОМУ

По сравнению с другими языками тестирование по итальянскому


языку как иностранному начало разрабатываться относительно недав-
но, только в начале 1990-х годов. Несомненно, это связано с тем, что
итальянский язык не являлся в те годы одним из самым популярных
и востребованных. Однако за последние два десятилетия ситуация из-
менилась. Хотя итальянский язык по-прежнему не входит в  десятку
самых изучаемых языков, тем не менее число желающих на нем гово-
рить неуклонно растет с каждым годом. Причина заключается в том,
что в последние годы Италия активно развивает свою внешнеэконо-
мическую, культурную и образовательную деятельность, что привле-
кает в страну значительный поток туристов. Кроме того, секрет такой
популярности заключается в  необыкновенной мелодичности языка,
которая объясняется тем, что почти все слова в этом языке заканчива-
ются на гласную букву. Сложившаяся ситуация потребовала создания
тестов, которые бы подтверждали уровень коммуникативной компе-
тенции по итальянскому языку и при этом соответствовали бы обще-
европейским стандартам владения языком.
В результате было разработано несколько языковых сертифика-
тов, среди которых заслуживают особого внимания Сертификат вла-
дения итальянским языком как иностранным (Certificato di Italiano
come Lingua Straniera — CILS), разработанный Университетом для ино-
странцев г. Сиены, Сертификат знания итальянского языка (Certificato
di conoscenza della Lingua Italiana — CELI), созданный в стенах Универ-
ситета для иностранцев г. Перуджа, а также сертификат Проект Обще-
ства Данте Алигьери по итальянскому языку (Progetto Lingua Italiana
Dante Alighieri — PLIDA), права на который принадлежат Обществу
Данте Алигьери — старейшей организации в Италии в сфере распро-
странения итальянского языка за границей.
Необходимо отметить, что вышеуказанные университеты горо-
дов Перуджа и Сиена являются авторитетными вузами Италии, соз-
данными специально для иностранцев и  занимающимися не только
обучением и  исследовательской работой, но  и  продвижением ита-
льянского языка и культуры за рубежом.
Каждая из рассматриваемых систем тестирования предполага-
ет наличие шестиуровневой шкалы, отображающей основные этапы
освоения иностранного языка (от A1 до С2). Для получения любо-

227
Глава 2.  Системы тестирования по иностранным языкам

го сертификата необходимо сдать экзамен, состоящий из 4 (PLIDA,


CELI A1–B1) или 5 частей (CILS, CELI B2–C2): аудирования, чтения,
грамматики и структуры языка, письма, разговорной речи — различ-
ной сложности и продолжительности в зависимости от уровня.
Помимо модулей, ориентированных на взрослую иностранную
аудиторию, итальянская система тестирования предусматривает
специальные модули для детей и  подростков. Так, существует CILS
Bambini A1–A2  для детей от 8  до 11  лет, CILS adolescenti A1–B1  для
подростков 12–15 и 14–18 лет. Университет Перуджи разработал CELI
adolescenti A2–B2  для подростков от 13  до 17  лет. Общество Данте
Алигьери предлагает подросткам модули PLIDA Junior A1–B2.
Было также создано множество специальных сертификатов, ори-
ентированных на различные категории граждан, как с  социальной,
так и с  профессиональной точки зрения. Например, CELI immigrati
A1–B2 разработан специально для эмигрантов, не имеющих высшего
образования, с целью создать определенный стимул для продолжения
образовательного процесса. Тестовые задания подбираются с учетом
анализа лингвистических потребностей данной категории граждан.
Сертификат CELI 5 DOC создан для иностранцев с высшим педа-
гогическим образованием, желающих преподавать предметы, по ко-
торым они специализированы, в итальянских школах в Италии и за
рубежом. Целью тестирования становится не только проверка уровня
владения грамматическими и лексическими формами языка, но и спо-
собности воспринимать и воспроизводить речь в соответствии с при-
нятыми в определенной среде риторическими нормами. Похожий сер-
тификат разработал Сиенский университет  — CILS DIT (didattica in
italiano).
Желающие определить уровень своей языковой подготовки
в  торгово-финансовой сфере деятельности имеют возможность сда-
вать экзамены на получение таких специфических сертификатов, как
CIC B1–C1 (Certificato di conoscenza dell’italiano Commerciale, Универ-
ситет Перуджи) и PLIDA Commerciale (B1, B2, C1). Несмотря на то, что
предлагаемые здесь материалы в основном связаны с торгово-финан-
совой сферой деятельности, от кандидата не требуется знание лексики
узких технических областей.
Среди существующих итальянских систем тестирования серти-
фикат CILS является наиболее признанным и востребованным. При-
чина тому  — психологические факторы: CILS первым появился на
арене итальянского сертифицирования, в относительно короткое вре-

228
2.7.  Структураи особенностисертификациипоитальянскомуязыкукакиностранному

мя открыл более 600  филиалов в  Италии и  во всем мире и  получил


больше премий, чем CELI или PLIDA. В связи с этим представляется
актуальным более детально рассмотреть его структуру и особенности.
Прежде всего стоить отметить, что сертификат CILS предполага-
ет наличие 4  модулей, разграничение на которые существует только
для первых двух уровней A1 и A2, соответствующих базовым знани-
ям языка. Первый модуль Adulti («взрослые») адресован всем взрос-
лым гражданам, не живущим на территории Италии. Второй  — Per
l’integrazione in Italia — разработан специально для взрослых граждан,
живущих и работающих в Италии, иными словами — для иммигран-
тов. Третий модуль, Bambini, создан для детей 8–11 лет, имеющих не-
обходимость общаться на итальянском языке в школе в Италии или за
рубежом. Четвертый модуль, Adolescenti, — для подростков в Италии
и за рубежом в возрасте 12–15 лет и 14–18 лет.
Необходимость создания различных модулей в  зависимости от
типа кандидата обусловлена тем, что освоение языка тесно связано
с  такими внутренними и  внешними факторами, как возраст, окру-
жение и мотивация. Имея одинаковую структуру, они отличаются по
своим коммуникативным ситуациям, типам текстов и содержанию.
Как уже было сказано выше, экзамен CILS состоит из 5 частей: ау-
дирования, чтения, анализа коммуникативных структур (analisi delle
strutture di comunicazione), письма и разговорной речи. При этом для
второго и  третьего модулей (т. е. для эмигрантов и  детей) предпола-
гается сдача экзамена только по 4 частям (все, кроме грамматической
части).
Рассмотрим подробнее каждую из  частей экзамена на примере
CILS UNO, соответствующего уровню B1. Для анализа был выбран
первый пороговый уровень, который подтверждает способность че-
ловека понимать основные идеи четких сообщений, общаться в боль-
шинстве повседневных ситуаций, излагать и обосновывать собствен-
ные мнения. Начиная с этого уровня, структура экзамена, количество
заданий и типы упражнений будут идентичны для последующих трех
уровней.
Первая часть экзамена — аудирование — длится в целом 30 мин.,
за которые предлагается выполнить 3 задания. Все тексты звучат два
раза в среднем темпе. Общая длина текстов во всех трех заданиях от
600 до 800 слов.
Первое задание для всех четырех уровней  — диктант (от 60–
80 слов), который произносится в очень медленном темпе и со всеми

229
Глава 2.  Системы тестирования по иностранным языкам

знаками пунктуации (на более высоких уровнях темп незначительно


увеличивается). После написания диктанта дается 2 мин. для провер-
ки написанного. При этом сам текст диктанта звучит помимо этого
еще 2  раза  — в  начале для ознакомления в  темпе, соответствующем
темпу среднего носителя языка, и в конце в более размеренном темпе
для очередной проверки. Таким образом, тестируемый имеет возмож-
ность проверить свой текст 2 раза.
Задание такого рода для уровня B1 (а тем более для последующих
уровней) представляется необоснованным и  нецелесообразным, так
как на этом этапе владения языком кандидаты уже обладают уверен-
ными орфографическими навыками.
Во втором задании предлагается диалог, отражающий язык по-
вседневного общения или СМИ, прослушав который, требуется до-
полнить 7 фраз, выбрав один из 4 вариантов ответа.
Диалог, длина которого составляет 350–370 слов, звучит пример-
но 4  мин. в  очень размеренном темпе (иными словами, это не есте-
ственный для носителя языка темп). После первого прослушивания
дается 1 мин. для того, чтобы ознакомиться с предложениями. Затем
текст звучит второй раз, после чего за 2  мин. нужно выполнить за-
дание.
Из опыта сдачи русскоговорящими студентами этой части эк-
замена можно сказать, что это задание по аудированию представля-
ется неоправданно длинным. Диалог, звучащий 4 мин., пусть и в за-
медленном темпе, все равно заставляет слушающего терять внимание
и концентрацию уже на второй, третьей минуте. Возможно, было бы
правильнее дать время кандидату ознакомиться с  заданием еще до
первого прослушивания. Тогда первое аудирование приобрело бы бо-
лее целенаправленный характер.
Третье задание представлено монологами: отрывок из радиопе-
редачи, аудиогид, инструкция и пр. После прослушивания необходи-
мо выполнить упражнение на выделение информации, соответству-
ющей содержанию прозвучавшего текста. Предлагаются 14–15 пред-
ложений, из которых половина будет являться верной.
Текст звучит приблизительно 3 мин. в замедленном темпе (длина
300–350 слов). Текст звучит 2 раза. Время на ознакомление с заданием
и на его выполнение распределено так же, как и в предыдущем диало-
ге. При этом уровень сложности как текста, так и задания значительно
отличается.

230
2.7.  Структураи особенностисертификациипоитальянскомуязыкукакиностранному

Трудность в  понимании тестов в  этой части аудирования зача-


стую связана, как ни странно, с медленным темпом их воспроизведе-
ния. Многие тестируемые отмечают, что медленный темп лишает речь
изначальной эмоциональности и нивелирует разницу между интона-
ционными конструкциями, что приводит к быстрой потере внимания
и не дает возможности выделить значимые, акцентные в смысловом
отношении единицы.
Несмотря на замечания, можно выделить ряд очевидных поло-
жительных моментов в  этой части экзамена. Как пишут авторы ру-
ководства по тестированию CILS, с  которым можно ознакомиться,
в  частности, на сайте Сиенского университета57, составители этого
теста уделяют в части по аудированию особое внимание инструкци-
ям по выполнению заданий, которые сформулированы четко и про-
зрачно.
Отдельно подчеркнем, что одним из  факторов, определяющим
успех выполнения этой части экзамена, является достаточное количе-
ство времени, за которое необходимо выполнить то или иное задание.
В конце экзамена дается еще 3 мин. для того, чтобы перенести ответы
по второму и третьему заданию в ответный лист.
Второй частью экзамена является чтение (длительность этой
части — 50 мин.). Во время тестирования навыков чтения на уровне
B1 предлагается выполнить 3 задания.
В первом задании представлен текст, состоящий из 4–5 больших
абзацев (длина текстов от 600 до 1000 слов). В основном это журналь-
ная статья на популярную тему или статья, освещающая какое-нибудь
актуальное событие. После текста необходимо закончить 7 фраз, вы-
брав один из 4 вариантов ответов. Следует отметить, что задание это
нацелено в основном на проверку понимания лексического и грамма-
тического уровня текста.
Во втором задании тестируемый сталкивается с не менее длин-
ным текстом (по сравнению с  тестами более ранних лет тесты по
чтению последних лет значительно увеличиваются в  объеме, дости-
гая 900–1000 слов на каждый текст). Предлагается прочитать статью
информационного характера (объявление, новость). Далее в  после-
текстовом задании необходимо выбрать из  15  предложений те, ко-
торые соответствуют содержанию прочитанного текста. При этом

57
Università per Stranieri di Siena: [сайт]. URL: http://www.unistrasi.it/  (дата
обращения: 20.11.2016).

231
Глава 2.  Системы тестирования по иностранным языкам

совершенно очевидно, что, помимо проверки понимания на поверх-


ностном уровне, проверяется также и понимание текста на семанти-
ческом уровне. Сообщения, содержащиеся в этих текстах, часто свя-
заны с  пресуппозицией и  фоновыми знаниями тестируемого. Опыт
выполнения этого задания показал, что информация, содержащаяся
в  предложениях данной части теста, сформулирована некорректно.
Это влечет за собой неоднозначность ее понимания.
В третьем задании кандидат должен восстановить правильную
последовательность текста, разбитого на 11  фрагментов. Основной
жанр текста — рассказ от 1-го лица, повествующий о каком-либо при-
ключении, путешествии, смешном или неприятном случае.
С содержательной точки зрения текстовый материал для чтения
для уровня B1 по своей тематике, связности и когерентности отвечает
критериям отбора текстов для тестовых заданий по чтению. На наш
взгляд, все тексты, предлагаемые в  этой части экзамена, достаточно
интересные. Этот факт, безусловно, является хорошей внутренней мо-
тивацией тестируемого для получения лучшего результата.
Очевидным минусом текстов данного раздела с  формально-
структурной стороны является их необоснованная длина (почти все
имеют длину в среднем от 800 до 1000 слов). При этом многие из них
изобилуют стилистически перегруженными конструкциями, что ча-
сто приводит к затруднению понимания содержательной формы тек-
ста. Создается ощущение, что некоторые тексты не соответствуют
уровню B1, а предназначены для более продвинутых уровней.
Третий блок экзамена CILS называется анализ структур комму-
никации (analisi delle strutture di comunicazione).
Продолжительность теста  — 60  мин., за которые тестируемому
предлагается проанализировать, синтезировать, трансформировать
лингвистические структуры на лексическом и морфосинтаксическом
уровнях. В целом необходимо выполнить 4 задания.
В первом задании дается текст, в  котором нужно заполнить
24 пробела, вставив правильную форму артикля. Иногда артикль нуж-
но соединить с уже данным в тексте предлогом. При этом в задании не
сказано поставить артикль именно там, где это необходимо, что зна-
чительно усложнило бы упражнение. От кандидата требуется лишь
выбрать правильный артикль и при необходимости грамотно его со-
единить с предлогом.
Артикли в  итальянском языке  — очень важная тема. Особую
сложность она представляет в  основном для начинающих изучать

232
2.7.  Структураи особенностисертификациипоитальянскомуязыкукакиностранному

язык на уровнях A1 и A2. Достигая уровня B1, изучающие итальян-


ский язык, как правило, твердо владеют навыками выбора правильно-
го артикля, однако они не всегда могут адекватно определить необхо-
димость постановки или отсутствия того или иного артикля, посколь-
ку эта тема очень многогранна. Учитывая это, было бы не лишним
усложнить это упражнение, предоставив тестируемому возможность
самому оценивать необходимость употребления артикля.
Что касается итальянских предлогов, то они не всегда вписыва-
ются в какие-то схемы или правила и тем самым становятся камнем
преткновения для многих иностранцев. Во многих случаях необходи-
мость употребления того или иного предлога зависит от конкретного
слова, и предлог следует просто запоминать. Встает вопрос о том, по-
чему же авторы этого упражнения не проверяют навыки употребле-
ния предлогов, а ставят их в качестве уже заданной единицы, заведомо
упрощая задание.
Во втором задании этой части предлагается текст (часто это рас-
сказ, воспоминание или письмо от 1-го лица о  каком-либо событии
в прошлом), в котором необходимо поставить глаголы, данные в скоб-
ках, в нужное время. При выполнении этого упражнения в тестах раз-
ных лет тестируемые часто сталкиваются с неоднозначностью при вы-
боре того или иного времени глагола. Например:
La Calabria e’ un posto meraviglioso che vi consiglio di visitare. Adesso
purtroppo (ricominciare) ___________ il mio lavoro, la vita di tutti i gior-
ni58.
Калабрия — это чудесное место, которое я советую вам посетить.
Сейчас, к  сожалению, (вновь начинать) __________ мою работу,
повседневную жизнь).
Из контекста, предшествующего этим двум предложениям, мы
узнаем о том, что героиня письма побывала в Калабрии, которую она
и советует посетить, и что теперь она:
1) опять должна выйти на работу (в случае, если она еще не вы-
шла) — ricomincio il mio lavoro (Presente Indicativo);
2) или уже вышла на работу (вчера приехала и сегодня утром вы-
шла) — ho ricominciato il mio lavoro (Passato Prossimo);

58
Certificazione di Italiano come Lingua Straniera. Sessione: Dicembre 2012. Liv-
ello: UNO  — B1. URL: http://www.twirpx.com/file/1819230/  (дата обраще-
ния 15.04.2017).

233
Глава 2.  Системы тестирования по иностранным языкам

3) или работа началась  — e’ ricominciato il mio lavoro (исполь-


зование вспомогательного глагола essere придает глаголу
ricominciare непереходное значение и  означает, что действие
происходит независимо от нас).
Таким образом, учитывая предложенный контекст, становит-
ся очевидным, что глагол в скобках можно поставить в разные фор-
мы, и  все они будут грамматически верными. При этом составите-
ли теста в  ответах предлагают только один возможный вариант «ho
ricominciato», руководствуясь не только грамматическими, но  и  сти-
листическими критериями выбора правильной формы.
Возможно, это не совсем корректно, ведь на уровне B1 основным
критерием выбора правильного варианта является именно грамма-
тическое соответствие контексту (стилистическое соответствие при
этом не учитывается). В таком случае в текстах этого уровня следовало
бы предложить в ответах несколько возможных вариантов.
В третьем задании необходимо дополнить текст, выбрав одну
из 4 предложенных лексических единиц. Предлагаются небольшие по
объему и достаточно интересные заметки или статьи из газет и жур-
налов.
Последнее, четвертое задание теста определяет степень сфор-
мированности коммуникативно-речевых умений. В  нем требуется
из  4  вариантов выбрать тот, который наиболее точно объясняет за-
данную коммуникативную ситуацию (всего предложено 10 ситуаций).
Например:
Mi scusi, signore, provvedo subito a portarle gli spaghetti. Mi dispi-
ace.
A. Al ristorante ordini un piatto di spaghetti al cameriere.
B. Al ristorante il cameriere chiede conferma della tua ordinazione.
C. Al ristorante richiami il cameriere che non ti ha ancora portato il
primo.
D. Al ristorante il cameriere si scusa per aver sbagliato l’ordine59.
Извините меня, синьор, я немедленно позабочусь о том, чтобы
принести Вам спагетти. Мне очень жаль.
А. В ресторане ты заказываешь спагетти официанту.
В. В ресторане официант просит тебя подтвердить заказ.
Г. В  ресторане ты опять зовешь официанта, который все еще не
принес тебе первое блюдо.
59
Ibid.

234
2.7.  Структураи особенностисертификациипоитальянскомуязыкукакиностранному

Д. В ресторане официант извиняется за то, что он перепутал заказ


(правильный ответ).
Подводя итоги описания данной части экзамена, отметим, что
в целом по своей структуре она похожа на аналогичные разделы в те-
стировании по другим языкам. Предложенные здесь задания в доста-
точной степени проверяют грамматические, лексические и коммуни-
кативно-речевые навыки кандидата. Однако, на наш взгляд, требуется
более тщательное отношение к  отбору грамматического материала
и его соответствию заявленному уровню.
Четвертый блок экзамена  — письмо. За 1  ч.  10  мин. кандидату
необходимо выполнить 2 задания.
Темой первого задания (100–120 слов) может являться описание
людей или мест, рассказ о традиционном празднике или блюде своей
страны, о проведенных выходных или об особенном событии в твоей
жизни.
Во втором задании (50–80  слов) предлагается написать письмо
родственникам или друзьям, в котором кандидат благодарит за что-
то или узн