Вы находитесь на странице: 1из 11

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/327722749

Arguments and Evidence of Reliability Assessment of Students’ Competences

Article · January 2018


DOI: 10.31161/1995-0659-2018-12-2-43-50

CITATIONS READS

0 10

1 author:

Nadezhda Efremova
Don State Technical University
7 PUBLICATIONS   8 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Jean Monnet Chair on Best European Practices of Quality Assurance (JM4EQA) View project

All content following this page was uploaded by Nadezhda Efremova on 01 October 2018.

The user has requested enhancement of the downloaded file.


1 ••• Известия ДГПУ. Т. 12. № 2. 2018
••• DSPU JOURNAL. Vol. 12. No. 2. 2018

Педагогические науки / Pedagogical Science


Оригинальная статья / Original Article
УДК 371.263
DOI: 10.31161/1995-0659-2018-12-2-43-50

Аргументации и доказательства надежности


оценок компетенций студентов
© 2018 Ефремова Н. Ф.
Донской государственный технический университет,
Ростов-на-Дону, Россия; e-mail: nefremova61@donstu.ru

РЕЗЮМЕ. Целью данного исследования является новый подход к обеспечению надежного


оценивания компетенций обучающихся. Метод. Анализ возможностей нового метода проектирования
педагогических измерителей на основе паттерн-дизайна Evidence-Centered Design (ECD),
обеспечивающего доказательства и аргументацию оценок испытуемых. Метод ECD нашел широкое
применение в зарубежном образовании, но мало известен в отечественной системе образования.
Результаты. Предложен алгоритм проектирования средств оценки подготовленности студентов на основе
ECD путем сопряжения модели студента (знаний и компетенций) и модели значимого задания с набором
доказательств и аргументации наблюдаемых результатов деятельности обучающегося. Использование
доказательного дизайна при разработке оценочных средств создает надежную основу для установления
связи между оценкой и корректировкой образовательной политики. Выводы. Для эффективной
организации образовательного процесса существенную роль играет обратная связь, обеспечиваемая
достоверностью оценок, что в свою очередь требует разработки надежного оценочного инструментария.
Проблема связана с тем, что конструирование оценочных средств вызывает сложности у
преподавателей. Такой подход может успешно применяться как при оценке знаний обучающихся, так и
при оценке компетенций, обеспечивая повышение надежности результатов, связь между процессами
разработки системы оценки и обеспечением условий деятельности, чтобы с применением знаний
студенты показали, что и как могут делать.
Ключевые слова: оценка, компетенции, доказательный дизайн, оценочное средство, Evidence-
Centered Design.

Формат цитирования: Ефремова Н. Ф. Аргументации и доказательства надежности оценок


компетенций студентов // Известия Дагестанского государственного педагогического университета.
Психолого-педагогические науки. 2018. Т. 12. № 2. С. 43-50. DOI: 10.31161/1995-0659-2018-12-2-43-
50

Arguments and Evidence of Reliability Assessment


of Students’ Competences
© 2018 Nadezhda F. Efremova
Don State Technical University,
Rostov-on-Don, Russia; e-mail: nefremova61@donstu.ru

ABSTRACT. The aim of this study is a new approach to ensuring the reliable evaluation of the students’
competencies. Method. Analysis of the possibilities of the new method of designing the pedagogical meters
based on the pattern-design Evidence-Centered Design (ECD), providing the evidence and argumentation of
assessments of subjects. The ECD method has found wide application in foreign education, but is little known
in the domestic education system. Results. The algorithm for designing students' assessment tools based on
ECD is proposed by connecting the model of the student (knowledge and competences) and the model of a
significant task with a set of evidence and argumentation of the observed results of the student's activity.
The use of evidence-based design in the development of evaluation tools creates a reliable basis for
establishing a link between the assessment and adjustment of educational policies. Conclusions. For
effective organization of the educational process a feedback plays an important role, which is ensured by the
reliability of estimates, which in turn requires the development of a reliable evaluation tool. The problem is
related to the fact that the construction of evaluation tools causes difficulties for teachers. This approach can
be successfully applied both in the evaluation of students’ knowledge and in the evaluation of competencies,
ensuring the reliability of results, the relationship between the processes of developing the assessment
system and ensuring the conditions of activity, so that with the use of knowledge, students show what and
how they can do.
Keywords: assessment, competence, evidence design, evaluative tool, Evidence-Centered Design.

For citation: Efremova N. N. Arguments and Evidence of Reliability Assessment of Students’ Competences.
Dagestan State Pedagogical University. Journal. Psychological and Pedagogical Sciences. 2018. Vol. 12. No.
2. Pp. 43-50. DOI: 10.31161/1995-0659-2018-12-2-43-50 (In Russian)

Введение
Перед каждым преподавателем при ориентированного задания. Нужны такие
планировании и реализации рабочей методы оценки, которые позволили бы
программы дисциплины встает ряд вопросов. интегрировать весь набор атрибутов,
Какой комплекс знаний, навыков или других подтверждающих действительный уровень
атрибутов следует оценивать, какие подготовленности испытуемых путем
оценочные средства использовать для использования доказательств и
выявления латентных (когнитивных) и аргументации проявления трудно измеримых
глубоко латентных (компетентностных) латентных характеристик испытуемых. Это
результатов обучения. Какие действия или особенно актуально при оценке навыков 21
выступления могут раскрыть эти века как сложных результатов обучения.
результаты? Какие задачи или ситуации Разработка психометрических и
должны вызывать такое поведение технологических инструментов для этих
испытуемых, чтобы результат обучения стал целей требует новаторских подходов, нужны
явным? Получение ответов на эти вопросы, методы, позволяющие интегрировать
как показывает практика, сложная задача, а большое число качественных и
ее понимание обеспечивает разработчику количественных данных для рассуждения,
оценочных средств выбор необходимых доказательного вывода и аргументации
ситуаций и контролируемых рубрик, результирующей оценки.
обоснование критериев и шкал оценивания Целью исследования явилось изучение
результатов контроля. доказательного дизайна оценочных средств
Согласно С. Мессику (Messick S., 1994), для надежного выявления сформированности
оценка – это процесс рассуждения из компетенций студентов.
конкретных действий или продуктов Одним из таких методов, получивших
деятельности, которые люди могут сделать, распространение в зарубежной
сказать или предоставить, чтобы можно было образовательной практике, стал
сделать обоснованные выводы об их знаниях, предложенный Р. Мислеви (Mislevy R., 2003)
навыках и способностях [5]. Он отмечает, что метод доказательной аргументации Evidence
характер конструкта задания направляет Centered Design (ECD) [6; 7], опирающийся
выбор или построение соответствующих на конструкцию задания, предложенную
задач, определяет рациональное применение С. Мессиком. В ECD оценка определяется
критериев и показателей, основанных на как цепочка рассуждений, которая связывает
конструкции задания. Природа конструкта доказательства с утверждениями и
обусловливает создание релевантных опровержениями об уровне
заданий, а также разработку основанной на подготовленности обучающихся. Все
нем системы подсчёта баллов и оценочных принципы, структуры и инструменты ECD
рубрик. Особенно полезно следуют из этой основной
концептуализировать оценку как процесс концептуализации. Отличительной чертой
рассуждения из доказательств и ECD является разработка системы оценки
аргументации в случае неопределенности, путем формулирования цепочки
следующей из выполнения студентом рассуждений, связывающих доказательства
сложного компетентностно- выполнения конструкций заданий в
последовательных этапах их выполнения в Диаграмма Тулмина адаптирует
процессе работы со сложными представления аргументов оценки на основе
комплексными заданиями, что позволяет требований к выполнению заданий и
получать основания для доказательных возможности организовать элементы
рассуждений относительно обоснованности аргумента из информации о процессе
оценки. получения ответов на задание. Разработка
Методика паттерна в доказательной таких заданий основывается на
аргументации специализированных знаниях в области
В своей разработке ECD Р. Мислеви педагогических измерений и использовании
использовал также идеи и конструкции поддерживающих технологий, таких как
С. Тулмина (Toulmin S. 1958) о структуре цифровые симуляции, деловые и
аргументов в виде универсального паттерна имитационные игры, решение кейсов,
(многократно проверенного шаблона) [9], выполнение индивидуальных или групповых
показывающего, что данные становятся и многопрофильных проектов и др.
свидетельством только тогда, когда их Использование диаграммы Тулмина
значение для выводов однозначно позволяет охватить важные элементы
установлено. По логике Тулмина все эти необходимой информации в форме, которая
элементы аргументации взаимодействуют облегчает рассуждения и применения этой
согласно общей схеме (рис. 1). информации для аргументации оценки в
соответствии с той целью, которая
поставлена для контроля. Чем лучше задания
отображают цели проверки, тем эффективнее
процесс в контексте оценки [3].
Для применения новой модели и
построения надежной аргументации оценки
необходимы шаблоны проектирования
оцениваемых достижений студента,
психометрические модели оцениваемых
характеристик и шаблоны заданий с
наборами характерных задач и процессов их
Рис. 1. Общая схема выполнения (рис. 2). Шаблон
аргументации по Тулмину проектирования задает стандарт, на основе
которого оцениваются все проектные
Здесь D – данные (data); C – утверждение решения, в том числе, связанные с заданием
(claim); W – основание (warrant); B – и спецификацией задачи, дизайном и
поддержка (backing); R – опровержение администрированием тестовой или иной
(rebuttal); А – альтернативное объяснение формы, элементами задач в системе оценки,
(explanations). Опровержение или а также с обработкой результатов и
контраргумент в паттерне указывает на составлением отчета. Язык шаблонов
ограниченность утверждения. впервые заявлен в работах С. Александера
Альтернативное утверждение как набор слов (Alexander С., 1977). Используя его, Мислеви
(вероятно, возможно, поскольку, предложил многоуровневый подход
невозможно, безусловно, предположительно, Evidence-Centered Design, основанный на
всегда и др.) ограничивает достоверность моделях доказательного дизайна оценочного
утверждения и подчеркивает, при каких средства. Преимущество ECD в разработке
условиях утверждение может быть верным. оценки, в которой каждый шаг тщательно
Допущения и предположения служат строится на предыдущих этапах, чтобы
основанием тому, как и почему из поддержать спецификацию и выполнение
имеющихся данных следует именно следующих шагов для обеспечения общего
сделанное утверждение об оценке. аргумента оценки.
Поддержка усиливает основания за счет В ECD последовательно выстраиваются
дополнительных данных (контрольные модель компетенций обучающегося, модель
сбора свидетельств (доказательств), модель
вопросы, результаты анкетирования и др.).
оценочного средства и разработки его
дизайна, описание сценария оценочного
процесса (рис. 3). Такой подход может трудоемкими, существует настоятельная
применяться к разработке любой оценки, где потребность повторного использования
априорное определение конструкций и шаблонов дизайна, структура которых может
связанные с ними переменные имеют смысл. систематически связываться с конкретными
Именно в этих контекстах значение, наборами утверждений, которые являются
сложность и взаимосвязь решений, которые естественным мостом между моделью
необходимо принять в отношении дизайна студента и моделью конструируемого
оценки, является самым сложным. Более задания. Таких паттернов может быть
того, поскольку такие оценки являются предложено несколько.

Рис. 2. Расширенная диаграмма Тулмина в контексте оценки


5 ••• Известия ДГПУ. Т. 12. № 2. 2018
••• DSPU JOURNAL. Vol. 12. No. 2. 2018

Рис. 3. Структура аргументов в оценке ECD

Данные о выполнении обучающимся оценки глобальных компетенций и


задания становятся свидетельством его множества других важных характеристик
подготовленности только тогда, когда их согласно заданной модели будущего
значение для выводов установлено. Одни и те специалиста [4; 8].
же данные могут быть хорошим Алгоритм Evidence-Centered Design задает
доказательством для одного вывода, но все проектные решения по разработке
плохими для доказательства другого (Schum, оценочного средства, спецификацию задачи,
1994). При аргументации оценки необходимо элементы необходимых заданий и
тщательно рассмотреть альтернативные аргументацию качества их выполнения,
объяснения данных, например, когда студент свидетельства для обоснования оценки
предоставляет неверные данные на проблему студента, форматы выходных данных
не из-за недостатка знаний математики, а из- (рис. 5). Основные элементы паттерн-
за ограниченности понимания языка задания. дизайна: модель студента, модель
Более сложный и взаимосвязанный сбор свидетельства (доказательства), модель
доказательств и их интеграции полезны и задания.
необходимы для уточнения оценки. Сопряжение модели студента, модели
Построенная на паттерне оценка воплощает свидетельств и модели задания (выбор при
все эти основные этапы организации наличии проверенных шаблонов или
оценочного процесса и доказательства построение оригинального паттерн-дизайна),
надежности результатов. а также возможности перехода от баллов к
Для демонстрации принципа выводам об уровне сформированности
аргументации рассмотрим пример рубрик компетенций на уровневых шкалах
доказательств для задания множественного обеспечивает концептуальная рамка
выбора ответов на тестовое задание (рис. 4). оценивания (модель сборки).
Новая методология оценки навыков 21-го Модель студента описывает конструкт
века должна задать инструменты исследуемых характеристик: набор латентных
отслеживания работы студентов в группах и переменных (количество аргументов,
индивидуально, выявлять рефлексию в структура конструкта), виды деятельности,
самооценке и оценке достижений других, причинно-следственные связи между
ситуацией и деятельностью студента. Модель совместить наблюдения, доказательства и
студента определяет модель задачи и задает, свидетельства с баллами результирующей
что и как должно быть выявлено, как оценки.
представить ответы на задания и как

Рис. 4. Пример паттерна для задания множественного выбора

МОДЕЛЬ
СБОРКИ

Модель студента: Модель доказательств:


способности Модель Модель
таблицы оценочных задания: презентации
действовать на критериев по видам ситуация, результатов
основе усвоенных деятельности, полнота
и найденных в использования
источниках знаний информации, получение
планируемого ответа

Рис. 5. Модель сборки оценочного средства (концептуальная рамка оценивания)

Модель задания: создание конструкта, запланированной в задании деятельности,


отражающего структуру аргументов оценки симуляционные среды.
(валидные ситуации и сценарии, акцент на Модель свидетельств: оценочный
наиболее важном, ключевые аргументы, компонент задания, баллы по выполнению
принципы отбора заданий, спецификация, задач, общий балл по всему заданию,
планируемые действия испытуемого), связь продукты деятельности, сбор свидетельств и
оцениваемых аргументов с функциями аргументов по результатм выполнения
задания, обеспечивающие проявление задания и/или оценке продукта деятельности,
компетенций при выполнении правила оценки процессов или продуктов
деятельности, отображение результатов на результатов (протоколов, графиков,
уровневой шкале. В ECD планируются диаграмм и др.);
доказательства, опровержения и  создание комфортных условий
утверждения об уровне достижений взаимодействия студента с инструментами
студентов при выполнении сложных оценки при выполнении заданий,
заданий, позволяющих отражать, что знает и обеспечение условий, близких к реальным в
что может сделать студент после освоения профессиональной среде;
дисциплин / модулей / практик.  проведение оценочного процесса и
Анализ содержания дисциплины и поиск обеспечение его репрезентации, наблюдение
ситуаций для проектирования оценки и сбор свидетельств (систематический
являются необходимым предварительным процесс, связывающий цели, задачи,
условием для статистического обучение, оценочный процесс и данные
моделирования оценочных средств и результатов оценивания);
процессов, а формами организации  обработка результатов с учетом
деятельности студентов и оценки учебных доказательств, опровержений и
достижений могут быть компетентностно- аргументации свидетельств, оценка
ориентиро-ванные задачи, решения кейсов, измеряемых конструктов в баллах;
эпистемические игры, выполнение  отображение полученных данных на
индивидуальных и групповых проектов, уровневой шкале для заключения о
презентации, эссе и др. [1; 2]. Желаемый сформированности компетенций.
результат оценки может дать соблюдение Заключение
последовательности этапов проектирования Используя ECD можно попытаться
оценочного средства ECD: ответить на ряд вопросов обеспечения
 определение цели оценки и надежности оценок. Отражает ли содержание
формирование многомерного конструкта оценочного средства целевую установку
задания; проверки достижений студентов? Реагируют
 операционализация конструкта ли студенты на заложенные в заданиях
(представление элементов задания в удобном когнитивные и компетентностные процессы
виде для использования и обработки и действия? Отражает ли процесс подсчета
результатов); баллов способности взаимодействия
 выбор вида паттерна (шаблона) студентов с заданием? Можно ли
проектирования оценочного средства; использовать оценки доказательного дизайна
 разработка моделей студента (уровней для прогнозирования результата обучения и
компетенций и их профилей в терминах повышения интереса студентов к
дескрипторов), свидетельств (как измерить оценочному процессу? Выполняют ли
или оценить) и оценочного средства студенты аналогичные оценки в других
(индикаторы и критерии выполнения предметных областях? Можно ли обобщить
задания); результаты таких оценок через
 нахождение профессионально администрирование контекстов и образцов
интересных ситуаций для конструирования сложных заданий? Позволяет ли
сложных (комплексных) компетентностно- интерпретация таких оценок сделать
ориентированных заданий; справедливые и оправданные заключения об
 разработка дизайна оценочного уровнях сформированности компетенций
средства (каких и сколько заданий обучающихся? Какие свидетельства
необходимо, какие предполагаемые решения компетенций или знаний студента можно
могут дать студенты, спецификация); непосредственно наблюдать при выполнении
 разработка инструкций к выполнению заданий? Как структурировать ситуацию и
заданий и бланков ответов (в каком виде средство оценивания, чтобы увидеть эти
обучающийся дает ответ и где его свидетельства? Что еще предстоит сделать
фиксирует); для повышения надежности результатов
оценивания? Как дальше ключевые аспекты
 обоснование шкалы оценивания
оценки компетенций концептуализировать?
компетенций и критериев обоснования
Аутентичная оценка компетенций
достижений уровней, форм предъявления
студентов имеет решающее значение в
подготовке специалистов. Новые подходы к
проектированию оценочных процедур, инновационных задач относительно целей
направленных на определение компетенций оценки. Использование прошедших
и навыков 21-го века, только начинают проверку временем методик в виде паттернов
разрабатываться и развиваться. Для этих (проверенных шаблонов) проектирования
целей методология ECD может стать одной позволит облегчить разработку оценочных
из основных для обеспечения надежности и средств, их повторное применение и решение
валидности оценок при компетентностном проблем большой неопределенности в
обучении. оценке результатов обучения студентов.
Предложенные шаблоны проектирования
оценочных процессов полезны при создании

Литература
1. Ефремова Н. Ф. Подходы к оцениванию 6. Mislevy R. J., Almond R. G., & Lukas J. F.
компетенций студентов первого курса, (2003). A brief introduction to evidence-centered
приступающих к освоению основных design. (ETS Research Report RR-03-16).
образовательных программ // Вестник Донского Princeton, NJ: Educational Testing Service. 2003.
государственного технического университета. 37 p.
2010. Т. 10. № 5 (48). С. 774-782. 7. Mislevy R. J., Levy R. Bayesian psychometric
2. Ефремова Н. Ф. Учебные достижения как modeling from an evidence-centered design
объект тестирования и показатель качества в perspective. In: Rao, C.R., Sinharay, S. eds. Handbook
образовании // Вопросы тестирования в of statistics. Elsevier, Amsterdam, 2007. Pp. 839-
образовании. 2004. № 9. С. 39-50. 865.
3. Assessing model-based reasoning using 8. Sukin T., Dunn J. Validity Argument for a
evidence-centered design: a suite of research- Statewide Alternative Assessment. Addressing
based design patterns by R. J. Mislevy, G. Haertel, Inferences with Novel Approaches. National
M. Riconscente, D. Rutstein, C. Ziker. 2017, Council for Educational Measurement. Vancouver,
Springer Publ. 130 p. 2012. 33 p.
4. Griffin P., McGaw B., Editors E. Assessment and 9. Toulmin S. E. The uses of argument. Cambridge,
Teaching of 21st Century Skills. Springer Dordrecht Cambridge University Press Publ., 1958. 264 p.
Heidelberg. London, New York, 2014. 362 p. 10. Van der Linden, W. J., & Glas, C.A.W. (2010).
5. Messick S. The interplay of evidence and Elements of adaptive testing. New York, Springer
consequences in the validation of performance Publ., 2010. 462 p.
assessments. Education Researcher, 1994. 32 (2).
Pp. 13–23.
References
1. Efremova N. F. Approaches to assessing the
competence of first-year students, embarking on
the development of basic educational programs.
Vestnik Donskogo gosudarstvennogo
tekhnicheskogo universiteta [Bulletin of Don State
Technical University]. 2010. Vol. 10. No. 5 (48). Pp.
774-782. (In Russian)
2. Efremova N. F. Educational achievements
as an object of testing and an indicator of quality
in education. Voprosy testirovaniya v obrazovanii
[Issues of Testing in Education]. 2004. No. 9. Pp.
39-50. (In Russian)
3. Assessing model-based reasoning using
evidence-centered design: a suite of research-
based design patterns by R. J. Mislevy, G. Haertel,
M. Riconscente, D. Rutstein, C. Ziker. 2017,
Springer Publ. 130 p. (In Russian)
4. Griffin P., McGaw B., Editors E. Assessment
and Teaching of 21st Century Skills. Springer
Dordrecht Heidelberg. London, New York, 2014.
362 p. (In Russian)
5. Messick S. The interplay of evidence and
consequences in the validation of performance
assessments. Education Researcher, 1994. 32 (2).
Pp. 13–23. (In Russian)
6. Mislevy R. J., Almond R. G., & Lukas J. F.
(2003). A brief introduction to evidence-centered
design. (ETS Research Report RR-03-16).
Princeton, NJ: Educational Testing Service. 2003.
37 p.
7. Mislevy R. J., Levy R. Bayesian psychometric
modeling from an evidence-centered design
perspective. In: Rao, C.R., Sinharay, S. eds. Handbook
of statistics. Elsevier, Amsterdam, 2007. Pp. 839-865.
8. Sukin T., Dunn J. Validity Argument for a
Statewide Alternative Assessment. Addressing
Inferences with Novel Approaches. National Council for
Educational Measurement. Vancouver, 2012. 33 p.
9. Toulmin S. E. The uses of argument. Cambridge,
Cambridge University Press Publ., 1958. 264 p.
10. Van der Linden, W. J., & Glas, C.A.W. (2010).
Elements of adaptive testing. New York, Springer
Publ., 2010. 462 p.
СВЕДЕНИЯ ОБ АВТОРЕ INFORMATION ABOUT THE AUTHOR
Принадлежность к организации Affiliations
Ефремова Надежда Федоровна, доктор Nadezhda F. Efremova, Doctor of
педагогических наук, профессор, заведующая Pedagogy, professor, the head of the chair of
кафедрой педагогических измерений, Pedagogical Measurements, Don State Technical
Донской государственный технический University (DSTU), Rostov-on-Don, Russia, e-
университет (ДГТУ), Ростов-на-Дону, mail: nefremova61@donstu.ru
Россия, e-mail: nefremova61@donstu.ru

Исследование выполнено при поддержке The study was carried out with the support of
гранта программы ЭРАЗМУС+ 575456- the ERASMUS+program grant 575456-EPP-1-
EPP-1-2016-1-RU-EPPJMO-CHAIR 2016-1-RU-EPPJMO-CHAIR

Принята в печать 04.05.2018 г. Received 04.05.2018.

View publication stats

Вам также может понравиться