Вы находитесь на странице: 1из 17

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение


высшего образования
«Рязанский государственный университет имени С.А. Есенина»
Институт иностранных языков
Кафедра германских языков и методики их преподавания

Реферат
по дисциплине «Психодиагностика» на тему:
«Валидность и надёжность тестов как их главная научная
характеристика»

Выполнила:
Студентка 2 курса, группы 6704 (Г), направления
подготовки 44.03.05 Педагогическое образование
(с двумя профилями подготовки),
направленность (профили) Иностранный язык
(английский язык) и Иностранный язык
(испанский язык)
Гибтева Екатерина Александровна
Научный руководитель:
Доцент кафедры общей психологии
Ерёмкин Юрий Логинович

Рязань, 2018
Оглавление
Глава 1. Что такое тест............................................................................................3

Пункт 1. Понятие теста.......................................................................................3

Пункт 2. Типология тестов.................................................................................5

Глава 2. Что присуще тесту....................................................................................8

Пункт 1. Надёжность.........................................................................................10

Пункт 2. Валидность.........................................................................................12

Глава 3. Что делает надёжность и валидность тестов их основной научной


характеристикой....................................................................................................15

Список литературы...............................................................................................16
Глава 1. Что такое тест

Пункт 1. Понятие теста


Проблема понимания термина «тест» ведёт к последствиям, типичным для
нечётко сформулированных и слабо определённых понятий: ими пользуются,
не понимая значения, из-за чего имеет место спекулирование данным словом
в разного рода целях. Эту проблему освещает А. Войтов в учебном пособии
«Тестология гуманитариям» [1]: «Слово «тестирование» часто используют
вместо иных слов «испытания», «проверка» и т.п. В частности, это можно
видеть в следующем сообщении от 8 июня 2004 года: «Нынешний проход
Венеры ученые намереваются использовать для тестирования оборудования
космических телескопов для исследования отдаленных звезд и планет».

Многозначность термина «тестирование» затрудняет осмысление функции


учебных тестов. Скажем, называют тестированием проверку
функционирования разных изделий, в частности компьютеров (или «харда»,
как говорят образно) или их программных продуктов («софта»). <…> В
русском языке для этого обычно используют слово «испытания». Это не
имеет отношения к учебным тестам. И все это важно для соответствующих
специалистов».

Нас же интересует тест психологический, пригодный для использования в


рамках психодиагностики.

В книге «Практическая тестология» А. Шмелёв [2] определяет понятие теста


следующим образом: «Тест — это измерительная методика оценки,
основанная на стандартизованном наборе заданий и формализованных
правилах анализа ответов, дающая в результате объективированную оценку
испытуемого на определенной количественной шкале, указывающей на
выраженность измеряемого свойства или вероятностное отнесение к
определенной, заранее заданной диагностической категории».
Данное выше определение характеризует любые тесты, теперь перейдём
ближе к психодиагностике. Как же в таком случае определить, что такое
тест?

В учебнике «Психологическая диагностика» К. Гуревича и Е. Борисовой [3]


мы встречаем следующее определение: «Тесты (в переводе с английского
"испытание", "проверка", "проба") — это стандартизированные краткие и
чаще всего ограниченные во времени испытания, предназначенные для
установления количественных (и качественных) индивидуально-
психологических различий».
Пункт 2. Типология тестов
В ранее упомянутом учебнике Гуревича и Борисовой [3] приведена весьма
разумная классификация психологических тестов. Рассмотрим её.

По форме тесты могут быть индивидуальные и групповые; устные и


письменные; бланковые, предметные, аппаратурные и компьютерные;
вербальные и невербальные (практические).

Индивидуальные и групповые (коллективные) тесты. Индивидуальные тесты


— это такой тип методик, когда взаимодействие экспериментатора и
испытуемого происходит один на один.

Групповые тесты — это такой тип методик, который позволяет


одновременно проводить испытания с очень большой группой людей (до
нескольких сот человек).

Устные и письменные тесты. Эти тесты различаются по форме ответа.


Устными чаще всего бывают индивидуальные тесты, письменными —
групповые. Устные ответы в одних случаях могут формулироваться
испытуемым самостоятельно ("открытые" ответы), в других — он должен из
нескольких предложенных ответов выбрать и назвать тот, который считает
правильным ("закрытые" ответы). В письменных тестах ответы даются
испытуемым или в тестовой тетради, или на специально разработанном
бланке ответов. Письменные ответы также могут носить "открытый" или
"закрытый" характер.

Бланковые, предметные, аппаратурные, компьютерные тесты. Эти тесты


различаются по материалу оперирования. Бланковые тесты (другое широко
известное название — тесты "Карандаш и бумага") представлены в виде
тетрадей, брошюр, в которых содержится инструкция по применению,
примеры решения, сами задания и графы для ответов (если тестируются дети
младшего возраста). Бланковые тесты могут применяться как при
индивидуальном, так и при групповом тестировании.

В предметных тестах материал тестовых задач представлен в виде реальных


предметов: кубиков, карточек, деталей геометрических фигур, конструкций и
узлов технических устройств и т.п. Наиболее известные из них — кубики
Косса, тест сложения фигур из набора Векслера, тест Выготского—Сахарова.
Предметные теста в основном проводятся индивидуально.

Аппаратурные тесты — это такой тип методик, который требует применения


специальных технических средств или специального оборудования для
проведения исследования или регистрации полученных данных. В
большинстве случаев аппаратурные тесты проводятся индивидуально.

Компьютерные тесты. Это автоматизированный вид тестирования в форме


диалога испытуемого и ЭВМ. Тестовые задания предъявляются на экране
дисплея, а ответы испытуемый вводит в память ЭВМ с помощью
клавиатуры; таким образом, протокол сразу создается как набор данных
(файл) на магнитном носителе. Стандартные статистические пакеты
позволяют очень быстро проводить математико-статистическую обработку
полученных результатов по разным направлениям. При желании можно
получить информацию в виде графиков, таблиц, диаграмм, профилей.
Вербальные и невербальные тесты. Эти тесты различаются по характеру
стимульного материала. В вербальных тестах основным содержанием работы
испытуемых являются операции с понятиями, мыслительные действия,
осуществляемые в словесно-логической форме. Невербальные тесты — это
такой тип методик, в которых тестовый материал представлен в наглядной
форме (в виде картинок, чертежей, графических изображений и т.п.).

По содержанию тесты обычно делятся на четыре класса, или направления:


тесты интеллекта, тесты способностей, тесты достижений и тесты личности.

Тесты интеллекта. Предназначены для исследования и измерения уровня


интеллектуального развития человека. Они являются наиболее
распространенными психодиагностическими приемами.

Тесты способностей. Это тип методик, предназначенных для оценки


возможностей индивида в овладении знаниями, навыками, умениями,
необходимыми для одной или нескольких деятельностей.

Тесты достижений, или, как их можно назвать по-другому, тесты


объективного контроля успешности (школьной, профессиональной,
спортивной) предназначены для оценки степени продвинутости
способностей, знаний, навыков, умений после прохождения человеком
обучения, профессиональной и другой подготовки.

Тесты личности. Это психодиагностические приемы, направленные на


оценку эмоционально-волевых компонентов психической деятельности —
мотивации, интересов, эмоций, отношений (в том числе и межличностных), а
также способностей поведения индивида в определенных ситуациях. Таким
образом, тесты личности диагностируют неинтеллектуальные проявления.
Глава 2. Что присуще тесту
По Е.В. Рягузовой [4], существуют следующие характеристики
психологических тестов:

 валидность – соответствие результатов теста той характеристике, для


измерения которой он сконструирован;
 надёжность – отражает точность психодиагностических измерений и
устойчивость (стабильность) результатов теста к действию
посторонних случайных факторов;
 репрезентативность – соответствие между нормами, полученными на
изучаемой выборке испытуемых, и популяционными нормами;
 достоверность – устойчивость теста к намеренному или
неосознаваемому искажению результатов теста и их фальсификации;
 стандартность – соответствие получаемых с помощью
диагностического инструментария данных закону нормального
распределения и социокультурным нормам. В соответствии с нормами
формируются диапазоны значений, указывающие на силу
выраженности изучаемого признака.

По мнению Шмелёва, высказанному в «Практической тестологии» [2], тест


обладает следующими признаками:

1. Стандартизированный набор тестовых заданий (в крайнем случае, это


одно строго-определенное задание, как это редко, но бывает в тестах на
сложность, а не на скорость);
2. Исчерпывающее описание всех возможных ответов на каждое задание
(или, по крайней мере, всех, за которые присваиваются баллы по
измеряемой шкале);
3. Наличие определенной шкалы измеряемого свойства (в вырожденном
случае это качественная, номинальная шкала, построенная по
принципу «есть качество — нет качества», но тогда все-таки тестовая
оценка тоже должна выражаться неким числом, указывающим на
вероятность проявления качества);
4. Наличие измерительного правила или «ключа к тесту», то есть
формализованного алгоритма отображения возможных ответов на
шкалу измеряемого свойства (или нескольких свойств для
многошкального теста);
5. Независимость от профессионального опыта и личных предпочтений
оценщика (как следствие стандартизации и формализации), свобода от
ошибок, связанных с действиями оценщика.

Также, согласно его словам, основными психометрическими свойствами


теста являются надежность, валидность, репрезентативность и
достоверность. Рассмотрим данные свойства подробнее.
Пункт 1. Надёжность
У Шмелёва в «Практической тестологии» [2] надёжность определяется
следующим образом: «Надежность теста — это устойчивость результатов
теста к воздействию со стороны различных случайных факторов-помех, то
есть помехоустойчивость». По словам Райгородского в «Практической
психодиагностке» [5], под «надежностью» понимается относительное
постоянство, устойчивость, согласованность результатов теста при
первичном и повторном его применении на одних и тех же испытуемых. Но
степень надежности зависит от многих причин. Какие же факторы снижают
точность измерений? К ним относятся:

1. Нестабильность диагностируемого свойства.


2. Несовершенство диагностических методик.
3. Меняющаяся ситуация обследования.
4. Различия в манере поведения экспериментатора.
5. Колебания в функциональном состоянии испытуемого.
6. Элементы субъективности в способах оценки и интерпретации
результатов.

К. М. Гуревич в книге «Психическая диагностика. Ее проблемы и методы»


[6] предложил толковать надежность в трех смыслах:

1. Надежность самого измерительного инструмента.


2. Стабильность изучаемого признака.
3. Константность, т. е. относительная независимость результатов от
личности экспериментатора.

Как пишет Акимова М.К. в учебнике «Психологическая диагностика» [7],


одним из важнейших средств повышения надежности психодиагностической
методики является единообразие процедуры обследования, его строгая
регламентация: одинаковые для обследуемой выборки испытуемых
обстановка и условия работы, однотипный характер инструкций, одинаковые
для всех временные ограничения, способы и особенности контакта с
испытуемыми, порядок предъявления заданий и т. д. При такой
стандартизации процедуры исследования можно существенно уменьшить
влияние посторонних случайных факторов на результаты теста и таким
образом повысить их надежность.

По её же словам, стандартизация процедуры эксперимента подразумевает


унификацию инструкций, бланков обследования, способов регистрации
результатов, условий проведения обследования. К числу требований,
которые необходимо соблюдать при проведении эксперимента, можно
отнести такие:

 инструкции следует сообщать испытуемым одинаковым образом, как


правило, письменно; в случае устных указаний они даются в разных
группах одними и теми же словами, понятными для всех, в одинаковой
манере;
 ни одному испытуемому не следует давать никаких преимуществ перед
другими;
 в процессе эксперимента не следует давать отдельным испытуемым
дополнительные пояснения;
 эксперимент с разными группами следует проводить в одинаковое по
возможности время дня, в сходных условиях;
 временные ограничения в выполнении заданий для всех испытуемых
должны быть одинаковыми и т. д.

Обычно авторы методики в руководстве приводят точные и подробные


указания по процедуре ее проведения. Формулирование таких указаний
составляет основную часть стандартизации новой методики, так как только
строгое их соблюдение дает возможность сравнить между собой показатели,
полученные разными испытуемыми. Другим важным моментом в
стандартизации методики является выбор критерия, по которому следует
проводить сравнение результатов диагностических испытаний, поскольку
диагностические методики не имеют заранее определенных стандартов
успешности или неудачи в их выполнении.
Пункт 2. Валидность
Другим после надежности ключевым критерием оценки качества методик
является валидность. Вопрос о валидности методики решается лишь после
того, как установлена достаточная ее надежность, поскольку ненадежная
методика не может быть валидной. Но самая надежная методика без знания
ее валидности является практически бесполезной. Приведём несколько
определений валидности в рамках психодиагностики.

Шмелёв [2] пишет о валидности следующее: «Валидность теста — это


устойчивость результатов к воздействию со стороны других психических
свойств и компетенций (деловых качеств), не являющихся предметом
измерения (оценки, диагностики) в данном сеансе тестирования. Другими
словами, валидность отражает степень сфокусированности теста именно на
заявленном свойстве, степень соответствия целевой направленности
измерения (оценивания)».

А вот что о валидности можно найти у Немова [9]: «Термин «валидность» —


евроязычного происхождения. Он буквально означает: «полноценный»,
«пригодный», «соответствующий». Характеристика психодиагностической
методики как валидной свидетельствует о ее соответствии и пригодности для
оценивания именно того психологического качества, для которого она
предназначается.

Характеристика валидности методики включает в себя не только сведения о


том, что данная методика на самом деле измеряет, но также информацию об
условиях, о сфере ее применения».

Акимова [7] определяет валидность следующим образом: «Валидность по


своей сути — это комплексная характеристика, включающая, с одной
стороны, сведения о том, пригодна ли методика для измерения того, для чего
она была создана, а с другой стороны, какова ее действенность,
эффективность, практическая полезность». Она отмечает, что не существует
какого-то единого универсального подхода к определению валидности. В
зависимости от того, какую сторону валидности хочет рассмотреть
исследователь, используются и разные способы доказательства. Другими
словами, понятие валидности включает в себя разные ее виды, имеющие свой
особый смысл. Проверка валидности методики называется валидизацией.
Валидность в первом ее понимании имеет отношение к самой методике, т. е.
это валидность измерительного инструмента. Такая проверка называется
теоретической валидизацией. Валидность во втором понимании уже
относится не столько к методике, сколько к цели ее использования. Это
прагматическая валидизация. Обобщая, можно сказать следующее:

 при теоретической валидизации исследователя интересует само


свойство, измеряемое методикой. Это, по существу, означает, что
проводится собственно психологическая валидизация;
 при прагматической валидизации суть предмета измерения
(психологического свойства) оказывается вне поля зрения. Главный
акцент сделан на то, чтобы доказать, что «нечто», измеряемое
методикой, имеет связь с определенными областями практики.

Бурлачук в пособии «Психодиагностика» [8] пишет, что тест называется


валидным, если он измеряет то, для измерения чего предназначен. Он
выделяет разные виды валидности.

Очевидная валидность – описывает представление о тесте, сложившееся у


испытуемого. Тест должен восприниматься обследуемым как серьезный
инструмент познания его личности, чем-то схожий с вызывающим уважение
и в какой-то мере трепет медицинским диагностическим инструментарием.

Конкурентная валидность оценивается по корреляции разработанного теста с


другими, валидность которых относительно измеряемого параметра
установлена.

Прогностическая валидность устанавливается с помощью корреляции между


показателями теста и некоторым критерием, характеризующим измеряемое
свойство, но в более позднее время. Например, прогностическая валидность
какого-либо теста интеллекта может быть показана корреляцией его
показателей, полученных у испытуемого в возрасте 10 лет, с академической
успеваемостью в период окончания средней школы.

Инкрементная валидность имеет ограниченное значение и относится к


случаю, когда один тест из батареи тестов может иметь низкую корреляцию с
критерием, но не перекрываться другими тестами из этой батареи. В этом
случае данный тест обладает инкрементной валидностью.

Дифференциальная валидность может быть проиллюстрирована на примере


тестов интересов. Тесты интересов обычно коррелируют с академической
успеваемостью, но по-разному для разных дисциплин. Значение
дифференциальной валидности, так же как и инкрементной, ограничено.
Содержательная валидность определяется через подтверждение того, что
задания теста отражают все аспекты изучаемой области поведения.

Конструктная валидность теста демонстрируется полным, насколько это


возможно, описанием переменной, для измерения которой предназначается
тест.

Акимова [7] пишет, что для проведения прагматической валидизации


методики, т. е. для оценки ее эффективности, действенности, практической
значимости, обычно используется независимый внешний критерий —
показатель проявления изучаемого свойства в повседневной жизни. Такими
критериями могут быть:

1. успеваемость (для тестов способностей к обучению, тестов


достижений, тестов интеллекта);
2. производственные достижения (для методик профессиональной
направленности);
3. эффективность реальной деятельности — рисование, моделирование и
т. д. (для тестов специальных способностей);
4. субъективные оценки (для тестов личности).
Глава 3. Что делает надёжность и валидность тестов их основной
научной характеристикой
Как говорится в учебнике Гуревича и Борисовой [3], чего стоит методика,
если не ясно, надежна ли она сама по себе как измерительный инструмент
или не установлена стабильность измеряемого свойства? Чего стоит
диагностическая методика, если неизвестно, могут ли изменяться результаты
в зависимости от того, кто ведет эксперимент? Каждый в отдельности
показатель никак не заменит других способов проверки и, следовательно, не
может рассматриваться в качестве необходимой и достаточной
характеристики надежности. Только методика, располагающая полной
характеристикой надежности, наиболее пригодна для диагностико-
практического применения. <…>

Вопрос о валидности методик решается лишь после того, как установлена


достаточная ее надежность, поскольку ненадежная методика без знания ее
валидности является практически бесполезной. <…> Поиски адекватного и
легко выявляемого критерия относятся к очень важным и сложным задачам
валидизации. В западной тестологии много методик дисквалифицировано
только потому, что не удалось найти подходящего критерия для их проверки.
Например, у большей части анкет данные по их валидности сомнительны,
так как трудно найти адекватный внешний критерий, отвечающий тому, что
они измеряют.
Список литературы
1. Войтов А. Г. Тестология гуманитариям. Теория и практика учебного
тестирования. 2-е перераб. изд., руководство педагогам гуманитарных,
социальных и экономических наук; уч. пособие для студ. педвузов; –
М.: 2005. - с. 401
2. Шмелев, Александр Георгиевич. Практическая тестология.
Тестирование в образовании, прикладной психологии и управлении
персоналом [Текст] : [практическое руководство] / А. Г. Шмелев. -
Москва : Маска, 2013. - 687 с.
3. Введение в психодиагностику [Текст] : Учеб. пособие : Для студентов
сред. пед. учеб. заведений / Психол. ин-т РАО; Под ред. К. М.
Гуревича, Е. М. Борисовой. - 2-е изд., стер. - Москва : Academia, 1998. -
191 с.
4. Рягузова, Елена Владимировна. Введение в психодиагностику. Часть
1 : учебно-методическое пособие / Е. В. Рягузова ; Саратовский гос. ун-
т им. Н. Г. Чернышевского. - Саратов : Изд-во Саратовского гос. ун-та,
2013. - 94 с.
5. Практическая психодиагностика : Методики и тесты : [Учеб. пособие] /
[Ред-сост. - Д. Я. Райгородский]. - Самара : БАХРАХ-М, 2002 (ГУП
ИПК Ульян. Дом печати). - 667, [1] с.
6. Психологическая диагностика, ее проблемы и методы [Текст] :
Сборник науч. трудов / Акад. пед. наук СССР, Науч.-исслед. ин-т
общей педагогики ; [Ред. проф. К. М. Гуревич, В. И. Лубовский]. -
Москва : НИИ ОП, 1975 (вып. дан. 1976). - 177 с.
7. Психологическая диагностика : [По направлению и специальностям
психологии / Т. Д. Абдурасулова, М. К. Акимова, Е. И. Горбачева и
др.]; Под ред. М. К. Акимовой, К. М. Гуревича. - 3-е изд., перераб. и
доп. - СПб. и др. : Питер : Питер принт, 2003. - 650,[1] с.
8. Бурлачук, Леонид Фокич.
9. Психодиагностика [Текст] : [учебник для вузов] / Л. Ф. Бурлачук. - 2-е
изд., перераб. и доп. - Москва [и др.] : Питер, 2011. - 378, [1] с.
10. Немов, Роберт Семенович. Психология : В 3 кн. : Учеб. для студентов
высш. пед. учеб. заведений / Р. С. Немов. - 4. изд. - Кн. 3:
Психодиагностика : Введение в науч. психол. исслед. с элементами
мат. статистики. - М. : Владос, 2001. - 630, [1] с.

Вам также может понравиться