Академический Документы
Профессиональный Документы
Культура Документы
Вопросы:
• Типы и виды валидности
• Разновидности теоретической валидности
• Разновидности эмпирической валидности
2
Валидность тестов Мальцев А. В.
Валидность
• Характеристика качества теста, ориентированная на оценку его
адекватности целям и задачам тестирования
• Это характеристика теста служит целям и задачам тестирования.
• Валидность может быть:
• Теоретическая
• Эмпирическая
Валидность тестов Мальцев А. В.
4
Валидность тестов Мальцев А. В.
Содержательная валидность
• Могут ли задания адекватно представлять проверяемую
содержательную область или конструкт, представляющий
интерес.
• Чем глубже и полнее отображение в тесте содержание, тем выше
его содержательная валидность
Валидность тестов Мальцев А. В.
Содержательный анализ
1. Определение интересующей нас содержательной области
выполнения теста.
2. Отбор группы экспертов, компетентных в содержательной
области.
3. Обеспечение структурированной основы для процесса
установления соответствия между заданиями и содержательной
областью выполнения теста.
4. Сбор и суммирование итоговых данных по процессу
установления соответствия.
Валидность тестов Мальцев А. В.
Планирование исследования
содержательной валидности
1. Должны ли быть взвешены цели для отражения их важности?
Необходимость ранжирования важности содержания учебного
материала. Две точки зрения:
• учебный материал равнозначен;
• учебный материал необходимо ранжировать по значимости.
Планирование исследования
содержательной валидности
2. Должна быть структурирована задача установления соответствия
между заданиями и целями тестирования.
• опытный эксперт читает задание и находит правильный ответ, так
же как это должен был бы сделать испытуемый;
• расположить каждое задание на отдельной карточке, сравнить
каждое задание со списком учебных целей и записать результат
решения по соответствию в стандартной форме
• оценивают степень соответствия каждого задания определенной
цели с помощью шкалы с пятью баллами, где 1 означает плохое
соответствие, а 5 – превосходное.
Валидность тестов Мальцев А. В.
Планирование исследования
содержательной валидности
3. Эксперты должны проверить характеристики заданий.
Соответствие спецификации теста цели тестирования и
соответствие разработанных заданий по спецификации.
Релевантные характеристики заданий:
• предмет,
• познавательный процесс,
• уровень сложности требуемого процесса выполнения задания,
• форма задания (оформление и формат),
• способы представления ответа.
Валидность тестов Мальцев А. В.
Планирование исследования
содержательной валидности
4. Должны быть просуммированы итоговые результаты содержательной
экспертизы.
Итоговыми показателями, могут быть:
1) процент заданий, соответствующих целям;
2) процент заданий, соответствующих целям с высокими оценками
важности;
3) корреляция между весами важности целей и числом заданий
измеряющих эти цели;
4) показатель конгруэнтности (сравнимости) заданий и целей;
5) процент целей, не оцененных ни одним заданием теста.
Валидность тестов Мальцев А. В.
Проблемы содержательной
валидизации
• Выбранные цели тестирования могут неадекватно представлять
область выполнения деятельности, для которой пользователь
теста хочет получить выводы.
• Задания могут иметь систематическую ошибку вследствие
этнических, расовых или гендерный различий в выборке
испытуемых.
• Соотношение между высокой внутренней согласованностью
(корреляцией заданий), определяющей надежность гомогенного
теста и необходимостью проверки широкой области содержания
знаний проверяемой области.
Валидность тестов Мальцев А. В.
Конструктная валидность
• Психологические конструкты не являются непосредственно
наблюдаемыми («интеллект», «креативность» «мотивация»
«аттитюд») .
• В образовании появление компетентностей или универсальных
учебных действий (УУД) также можно рассматривать как
конструкт.
• Компетенция (начальная школа): приобретение начальных
навыков общения в устной и письменной форме с носителями
иностранного языка на основе своих речевых возможностей и
потребностей; освоение правил речевого и неречевого
поведения (ФГОС).
Валидность тестов Мальцев А. В.
Определение конструкта
• Сначала он должен быть определен операционально (или
определен семантически) путем задания процедур,
используемых для измерения конструкта.
• Например «интеллект»: числовые расчеты, слова синонимы и
антонимы, логические задания, сравнение объектов.
• Затем определены конкретные связи между мерами конструкта: с
другими конструктами или с критериями реального мира. Для
интеллекта – школьные оценки, успехи на олимпиадах.
Валидность тестов Мальцев А. В.
• Критериальная
• Конкурентная
• Конвергентная
• Дискриминативная
17
Валидность тестов Мальцев А. В.
Критериально-ориентированная
валидность
• должны получить доказательства того, что есть связь между
критерием выполнения определенной деятельности и тестовыми
оценками (предиктор). Этот тип доказательств получается из
исследования критериально-ориентированной валидности.
• Например по результатам вступительных испытаний (ЕГЭ)
предвидеть успешность обучения в вузе или колледже.
Валидность тестов Мальцев А. В.
Алгоритм критериально-
ориентированной валидности
1) установить подходящий критерий поведения и выбрать метод
для измерения его;
2) сформировать подходящую выборку испытуемых,
репрезентативно представляющую тех, для кого будет в конечном
счете использоваться тест;
3) предъявить тест и вести учет оценок каждого испытуемого;
4) когда данные по критерию будут доступны, получить меру
выполнения критерия для каждого испытуемого;
5) определить силу связи между выполнением деятельности по
критерию и тестовыми оценками.
Валидность тестов Мальцев А. В.
Типы критериально-ориентированной
валидности
• Прогностическая - тестовые оценки предсказывают результаты
измерения по критерию в некоторый момент в будущем
проспективная или прошлом ретроспективная
• Текущая – данные по тесту и критерию относятся к одному
временному интервалу.
Валидность тестов Мальцев А. В.
Проблемы критериально-
ориентированной валидности
• подбор подходящего критерия,
• недостаточный размер выборки,
• контаминация критерия,
• ограничение диапазона и ненадежность предиктора или оценок
критерия.
Валидность тестов Мальцев А. В.
Проблема критерия
• Непосредственные критерии легко доступны и относительно
просты при измерении (оценка по предмету, экспертная оценка
работы). Но часто недостаточно полны или важны для
использования.
• Окончательные критерии обычно считаются имеющие
существенное значение, но могут быть чрезвычайно трудными в
процессе операционального определения и измерения
(«хирургическая компетентность», «эффективность работы
учителя» и т.п.)
Валидность тестов Мальцев А. В.
Размер выборки
• Для маленьких выборок, ошибки выборки становятся
относительно большими.
• Если выборка включает от 30 до 50 испытуемых, то критерий
вероятнее всего, будет обладать валидностью соответствия
генеральной совокупности только на 25 до 35%.
• Необходимы выборки, включающие до 200 (лучше 400) или
более испытуемых, чтобы точно отразить уровни валидности
данных генеральной совокупности, по крайней мере, на 90%.
Валидность тестов Мальцев А. В.
Контаминация критерия
• Люди, которые в состоянии влиять на оценки испытуемых,
используемые для установления критерия, не должны
иметь доступа к оценкам по предиктору для испытуемых.
• Этот эффект получил название контаминации критерия
Валидность тестов Мальцев А. В.
Ограничение диапазона
• Ограничение диапазона оценок по предиктору или критерию
может привести к занижению наблюдаемого коэффициента
валидности.
• Ситуация, в которой валидизируемый тест используется в целях
отбора до того, как его валидность была установлена:
• проведен отбор, а потом валидизация;
• «потолочный» результат по критерию (все выполнили на 100%).
Валидность тестов Мальцев А. В.
Измерение критериально-
ориентированной валидности
• Коэффициент корреляции Пирсона между тестовой оценкой и
мерой критерия. Такую статистическую величину называют
коэффициентом валидности.
• Если критерий имеет дихотемическую оценку (получил не
получил диплом), то достоверная разница средней тестовой
оценки предиктора для тех, кто получил диплом, и средней
тестовой оценки предиктора для тех, кто его не получил является
доказательством связи между предиктором и критерием.
Валидность тестов Мальцев А. В.
Оценка валидности
• Если внешний критерий экспертные оценки, то очень
важно чтобы они были согласованы.
σ𝑁
𝑖=1(𝑋𝑖 ‒𝑋)(𝑋𝑘 ‒𝑋)
• rв =
𝑀 𝑆𝑖2 𝑆𝑘2
Конвергентная валидность
Связь показателей по тесту с показателями по
«родственным» методикам, то есть, методикам, измеряющим
концептуально сходные качества. Например, при создании
методики, измеряющей феномен «Жизнестойкости», ее
валидность может быть проверена через корреляцию показателей
с результатами методик «нервно-психической устойчивости»,
«стрессоустойчивости» и ряда других.
29
Валидность тестов Мальцев А. В.
Дискриминативная валидность
Отсутствие связи с методиками, имеющими другое
основание. То есть, корреляции с тестом, измеряющим
концептуально независимое свойство, не обнаруживаются в
соответствующих эмпирических исследованиях. Например,
согласно модели Г. Айзенка, такие личностные черты как Экстра-
Интроверсия и Нейротизм не связаны между собой и
представлены в конкретной индивидуальности в различных
сочетаниях. В случае, если данные шкалы обнаруживают
корреляции между собой, измеряющие их инструменты считаются
не валидными.
30
Валидность тестов Мальцев А. В.
Конкурентная валидность
Взаимосвязь показателей по изучаемому тесту с
показателями по аналогичным тестом, валидность которого уже
установлена. В психологической диагностике существуют своего
рода «эталоны» методик, корреляцию с которыми необходимо
рассчитывать при разработке аналогичной методики. Например,
для тестов интеллекта – это методика «Прогрессивные матрицы
Равена».
Целесообразность рассмотрения данного вида валидности в
качестве отдельного продиктована тем, что методики, измеряющие
один и тот же феномен должны быть ориентированы на
измерение разных его аспектов.
31
Валидность тестов Мальцев А. В.
Литература
• Крокер Л. Введение в классическую и современную теорию тестов:
учебник / Л. Крокер, Дж. Алгина; под общей ред. В.И. Звонникова и М.Б.
Челышковой. – М.: Логос, 2010. – 668 с. Раздел III. Валидность. Глава 10.
Введение в валидность. (Содержательная валидность, Критериально-
ориентированная валидизация, Конструктная валидность, Пересечение
подходов к валидизации. Коэффициенты валидности для истинных оценок)
стр. 299-328. Упражнения № 5,6. стр. 332-333.
32
Валидность тестов Мальцев А. В.
33
Валидность тестов Мальцев А. В.
• https://forms.office.com/Pages/ResponsePage.aspx?id=-
Gw88sxc80iHg_dcfJ1l3yerZNLQvCFIskqeTEiMwpNUNUhKRzg
wSlM0NlpXQTFLQzZaSzZDSDBZMS4u
34