Валидность теста
Валидность теста (от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста.
Различают несколько видов валидность теста:
- валидность теста конструктная,
- валидность теста по критерию,
- валидность теста по содержанию,
- прогностическая валидность теста и др.
Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на в. В результате оказывается, что они бесполезны или даже вредны. Валидность теста – это показатель степени его эффективности. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности. Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.
Валидность теста конструктная
критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект», его структуры. Степень соответсвия нашего предварительного понимания и определения интеллекта реальной возможности конкретного теста, степень соответствия структуры интеллеткта структуре теста и есть в.т.к. Она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.
Валидность теста по критерию
критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Например, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых на протяжении достаточно продолжительного времени в интересующем нас аспекте. Оценка должна даваться по шкале порядковой, интервальной или отношений. В лучших тестах в. по критерию, измеренная коэффициентом корреляции, составляет от 0,3 до 0,8. Применение теста оправдано, если валидность по критерию оставляет 0,2-0,25.
Валидность теста по содержанию
критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с помощью теста математическую подготовку абитуриента вуза, то в предлагаемый тест должны быть включены математические задания, для решения которых необходимы знания по всем разделам математики, изучаемым в средней школе. Таким образом, степень соответствия структуры данного теста структуре программы математических дисциплин, изучаемых в школе, и является валидностью данного теста по содержанию. Естественно, что для обследования лиц, окончивших вузы, предназначаются тесты с иной вялидностью по содержанию.
Валидность теста прогностическая
критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у различных людей в будущем. Данный вид валидности является особо ценным с практической точки зрения.
Валидность эксперимента
критерий качества эксперимента, степень его точности, в зависимости от которой выводы, полученные в его ходе могут быть распространены на всю генеральную совокупность. В.э. позволяет определить насколько всеобщими могут быть выводы, полученные путем исследования ограниченной по времени и обьему выборки. Различают внутреннюю и внешнюю валидность эксперимента.
Валидность эксперимента внешняя
критерий качества эксперимента, в зависимости от которого выводы об определенной тенденции, закономерности развития конкретных психических явлений, личностей, видов деятельности и т.д. могут быть распространены на другие явления и т.д. в данной или иной сфере. Языком математики это можно сформулировать так: насколько закономерности данного подмножества характерны для всего множества. Для определения границ применения экспериментальных выводов и необходимо определять в.э.в.
Валидность эксперимента внутренняя
критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной совокупности. Допустим, исследуя степень влияния освещенности на эффективность производственной деятельности ткачих, психологи обнаружили статистическую зависимость их эффективности работы от частоты смены освещения. Что является основным фактором повышения эффективности деятельности: смена освещения, внимание экспериментаторов, особое поведение руководителей в период эксперимента или другие факторы? В данном случае психологи пришли к выводу: появление молодых мужчин-исследователй в цехе, где работали женщины, и послужило причиной повышения производительности их труда. Но ведь могла быть и принята гипотеза о росте производительности ткацкого труда в зависимости от смены освещенности. В.э.в. показывает в какой степени независимая переменная (производительность труда) связана с зависимой (освещенность). Строго научное проведение психологического эксперимента предполагает определение его валидности.
hr-portal.ru
Валидность (психология) — это… Что такое Валидность (психология)?
Вали́дность (англ. validity) — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.
Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.
Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).
Способы установления валидности теста
Существуют четыре основных способа установления валидности теста.
- I. Оценка очевидной валидности.
Очевидная валидность – валидность, при которой оценивается общее соответствие теста его назначению.
- II. Оценка содержательной валидности.
Содержательная валидность предполагает, что тест обнаруживает в себе полный набор заданий для измерения определенной черты.
- III. Оценка конструктной валидности.
Этот способ проверки заключается в проведении продуманных экспериментов. Подход первый — «конвергентная валидизация» — это проверка ожидаемой связи тестовых оценок с другими показателями. Например, если для измерения какой-либо черты существует несколько методик, целесообразным было бы провести эксперименты по хотя бы двум, и тогда при обнаружении высокой положительной корреляции их результатов между собой можно говорить о валидности. Основной целью конвергентной валидизации является определение того, будут ли оценки теста варьироваться в соответствии с ожиданиями. Подход второй — «дивергентная валидизация» (англ.). Проверка валидности здесь заключается в том, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.
- IV. Оценка прогностической валидности.
Прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.
Требования к идеальному тесту
- Минимальное количество заданий. Однако чем больше личностных факторов хочет измерить тестирующий, тем большее количество вопросов целесообразнее задать тестируемому.
- Тест должен соответствовать целевой группе, на которую он направлен. Верно то утверждение, что тест, направленный на одну группу, в результате тестирования которой были получены достоверные результаты, может быть невалидным в отношении другого целевого сегмента.
- Адаптация теста. Применяется в случае проведения теста в иноязычной стране.
Виды валидности
- Внешняя валидность
- Внутренняя валидность
- Экологическая валидность
- Дифференциальная валидность
- Иллюзорная валидность
- Инкрементная валидность
- Консенсусная валидность
- Критериальная валидность
- Очевидная валидность
- Валидность по возрастной дифференциации
- Прогностическая валидность
- Содержательная валидность
- Текущая валидность
- Эмпирическая валидность
См. также
Ссылки
dic.academic.ru
Валидность в психологии – понятие. Виды валидности. Валидность теста и методики
Человек пользуется различными методиками и инструментами, чтобы проверить или измерить какое-то качество. Насколько эта методика и инструмент способны качественно выдать результаты, обозначает их валидность. Что обозначает данное понятие в психологии? Какие существуют виды валидности? В психологии обычно данное свойство применимо к тестам и методикам, которыми пользуются специалисты.
Что такое валидность?
У рассматриваемого понятия существует много определений. Что такое валидность? Это пригодность и обоснованность применения какой-то методики или результата в конкретной ситуации. Прикладное значение данного слова – степень соответствия результатов и методик поставленным задачам.
Валидность – это измерение другого показателя, которое измеряет конкретные качества. Таким образом, методика направлена на измерение конкретного качества, например, интеллекта, а ее валидность должна показывать, насколько хорошо данная методика помогает в получении результатов.
Другим словом валидность можно назвать достоверностью. Она измеряет те тесты и методики, которые занимаются измерениями определенных психологических качеств. Чем лучше они измеряют те качества, которые измеряют, тем выше их валидность.
Валидность становится важной в двух случаях:
- Когда некая методика разрабатывается.
- Когда некая методика показывает результаты, и необходимо установить, насколько качественны данные результаты.
Таким образом, валидность – это характеристика, которая указывает пригодность конкретной методики для измерения какого-то качества и полезность, качественность, эффективность данной методики.
Обычно используется несколько видов валидности, чтобы провести проверку конкретного теста или методики. Здесь также происходит сравнение показателей, которые даются различными инструментами. Существует множество способов измерения того или иного психологического качества или характеристики. Чаще психологами будет использоваться та методика, которая дает более достоверные результаты. Это и будет показывать ее высокую валидность.
Вместе с валидностью часто рассматривается такое понятие, как надежность. Методики и тесты должны быть надежными, то есть они должны быть постоянными, достоверными. Экспериментатор должен быть уверен в том, что он рассматривает именно то качество, которое он желает рассмотреть. Вот почему надежность не всегда может быть валидной, однако валидность всегда должна быть надежной.
Валидность в психологии
Валидность используется во многих сферах жизни, где происходят измерения различных показателей. В психологии валидность также становится нужной, особенно в экспериментальной психологии. Валидность в психологии – это:
- уверенность экспериментатора в том, что он измеряет нужное ему качество;
- достоверность показателей, которые измеряют данное качество.
Если читатель хоть раз проходил психологические тесты, то он знает о внутреннем желании получить конкретный ответ на поставленный вопрос. Валидность теста показывает экспериментатору конкретный результат, которого он достигает путем тестирования. Здесь стоит конкретная задача, ответ на которую он должен получить после совершения всех нужных действий.
Методики и тесты должны быть полезными и достоверными, что и измеряется путем их валидности.
Существует три способа проверки на валидность:
- Оценивание содержательной валидности – соответствие результатам оценивания испытуемого реальным качествам, которые проявляются в действительности. Здесь используется такое понятие, как лицевая валидность – человек должен видеть реальную связь между содержанием самой методики и ее результатами и действительностью, в которой проявляется измеряемое качество.
- Оценивание конструктной валидности – определение того, что методика вычисляет научно обоснованные и заданные конструкты. Конвергентная валидизация позволяет использовать несколько методик, которые рассматривает схожие характеристики и дают более точные результаты рассматриваемого качества. Дискриминантная валидизация исключает другие методики, которые рассматривают качества, не имеющие корреляции с нужным качеством.
- Оценивание критериальной валидности – это соответствие результатам ожидаемым показателям, которые выявляются другими способами. Здесь используется прогностическая валидность, которая помогает спрогнозировать дальнейшее поведение.
Виды валидности
Существует несколько видов валидности, которые рассмотрим ниже:
- Внешняя валидность – обобщение вывода ситуации, популяции, независимых переменных. Она делится на:
- Операциональную валидность.
- Конструктную валидность – объяснение поведения человека в момент прохождения теста.
- Внутренняя валидность – изменение в процессе эксперимента под влиянием неизменяемых факторов.
- Дифференциальная валидность.
- Инкрементная валидность.
- Экологическая валидность – показатель того, что человек способен к совершению различных действий, которые в одной ситуации могут быть успешными, а в другой нет.
Данная классификация используется экспериментальной психологией. Организационной психологией и психодиагностикой используется другая классификация:
- Конструктная валидность. Она делится на:
- Конвергентную валидность.
- Дивергентную валидность.
- Критериальная (эмпирическая) валидность – подсчет корреляции по баллу по тесту внешнему параметру, который был выбран в качестве валидного показателя. Она делится на:
- Текущую валидность – изучение параметра в настоящем времени.
- Ретроспективную валидность – состояние или событие, которое было в прошлом.
- Прогностическую валидность – прогноз поведения, качества.
- Содержательная валидность – используется в экспериментах, где рассматривается некоторое взаимодействие, деятельность. Имеет подвид:
- Очевидная валидность.
Другими видами валидности являются:
- Априорная.
- Конгруэнтная.
- Сопутствующая.
- Конструктивная.
- Консенсусная.
- Факториальная.
- Теоретическая и пр.
Что такое валидность теста?
Многие люди проходят тесты. Есть специальные психологические тесты, применяемые психологами, и другие, бульварные тесты. Что такое валидность теста, которая является важным ее критерием? Это показатель соответствия характеристики, качества, свойства к тесту, который их измеряет.
Тесты бывают разными. Они используются для измерения психофизиологических параметров человека. Самым высоким показателем валидности остается 80%. Полезность применения тестов становится в том случае, когда они позволяют получить точные данные по тем или иным конкретным характеристикам. Существует несколько подходов при изучении валидности теста:
- Конструктивная валидность, которая позволяет более глубоко изучить качества человека в ситуации, деятельности, системе.
- Валидность за критерием – изучение параметра в настоящем времени и прогнозирование его в будущем.
- Содержательная валидность – соответствие психологических конструктов, их многообразие.
- Прогностическая валидность – предсказывает развитие конкретного качества в будущем, что является затруднительным, поскольку оно может развиваться по-разному у разных людей.
Пока надежность и валидность теста не определены, его не применяют в психологической практике. Многое зависит от того, в каких областях применяются тесты. Есть учебные, профессиональные и прочие тесты, которые применяются в отдельных учреждениях для прогнозирования и выявления характеристик претендентов.
На сайте психологической помощи psymedcare.ru вы также можете пройти тесты, которые уже обладают высокой валидностью и показывают достоверные результаты.
Что такое валидность методики?
Что такое валидность методики? Это показатель, который обозначает, занимается ли рассматриваемая методика изучением того качества, характеристики, для которой она предназначена. При этом делается акцент на том, что испытуемый, который проходит тестирование, может иначе видеть и характеризовать самого себя. Вот почему не всегда результаты учитывают мнение людей, которые могут не замечать за собой определенных характеристик.
Валидизацией называется проверка валидности методики. Чтобы определить действенность, эффективность, практичность используемой методики, применяется внешний независимый показатель – качество, которое наблюдается в повседневной жизни. Здесь выделяют 4 типа внешних показателей:
- Критерий исполнения – затраченное время, количество работы, уровень успеваемости, рост профессиональных навыков и т. д.
- Субъективные критерии – мнение, взгляды, предпочтение, отношение испытуемого к кому- или чему-либо. Здесь применяются анкеты, интервью, опросники.
- Физиологические критерии – влияние внешнего мира на психику и организм человека. Здесь измеряются пульс, частота дыхания, симптомы утомления и пр.
- Критерий случайности – возможен ли, к примеру, подбор лиц, которые не склонны к несчастным случаям? Изучение влияния определенного случая.
Теоретический поход в измерении валидности методов позволяет распознать, действительно ли технология изучает именно то качество, для которого она была предназначена.
Валидность также определяется встречаемостью изучаемого качества. Хорошо, если оно является распространенным, что и делает методику нужной и полезной. Также важными становятся этические и культурные изменения общества.
Итог
В психологической практике часто используются тесты и методики, которые помогают в изучении личности человека. Здесь речь идет в частности о внутренних параметрах, которые не видны глазом. Качества характера, манера поведения, возможный прогноз на будущее, каким человек будет и какова будет его жизнь, — все это изучается различными тестами и методиками, которые преследуют единый итог – изучение человека.
Итогом успешного определения валидности того или иного инструмента является успешное познание каждого человека, несмотря на то, как он смотрит сам на себя. Люди часто не замечают за собой определенных качеств, редко смотрят на себя трезвым взглядом. Тесты и методики позволяют раскрыть в себе отдельные параметры.
Прогноз валидных тестов и методик – быстрое и качественное познание другого человека с возможностью ему помочь в решении любой психологической проблемы. Это достигается нескоро, однако имеющиеся инструменты уже показали свою эффективность. Обычно данный вопрос интересует лишь тех людей, которые занимаются определением качества тестов и методик. Однако и простым людям будет полезно знать, каким упражнениям следует доверять, а каким нет.
psymedcare.ru
Билет 18. Валидность теста и ее виды.
Психометрика– область ПД, связанная с теорией, практикой и измерениями ПД.
Методологическая дисциплина(по отношению к ПД):
Обосновывает требования к…
— измерительным психодиагностическим методам;
— процедурам разработки теста;
— применению процедуры статистического анализа;
— адаптации методик к новым условиям их применения;
— интерпретации тестовых данных (пр: проблема критерия и т.п.).
Знание психометрики необходимо для критичности…:
— в понимании ограниченности методик;
— в понимании допущений, которые были сделаны при разработке;
— в понимании валидности и надежности
и т.д.
Основные психометрические характеристики:
— надежность;
— валидность.
ВАЛИДНОСТЬ– это характеристика, которая включает в себя сведения об области измеряемых свойств и репрезентативности диагностической процедуры по отношению к ним.
Валидность– это такая характеристика, которая показывает то, что измеряет данная методика и насколько хорошо она это делает.
Виды валидности:
СОДЕРЖАТЕЛЬНАЯ ВАЛИДНОСТЬ– характеризует степень соответствия заданий теста измеряемой области психических свойств.
Закладывается уже на стадии разработки теста.
Устанавливается экспертами.
Этапы валидизации теста:
1. Определяется круг измеряемых свойств и (или) видов деятельности. Происходит расчленение свойства/ деятельности на элементы.
2. Разрабатывается модель тестовой деятельности или модель свойства, содержание которой подбирается путем выделения наиболее важных элементов реальной деятельности.
3. Проводится анализ степени соответствия разработанной модели реальной деятельности/ свойству (степень соответствия результатов 1 и 2 этапов).
КРИТЕРИАЛЬНАЯ/ эмпирическая ВАЛИДНОСТЬ– включает в себятекущуюипрогностическуювалидность.
— отражает степень соответствия прогноза и диагноза определенному кругу критериев измеряемого свойства.
Текущая валидность– степень соответствия диагноза.
Прогностическая валидность– степень соответствия прогноза.
В качестве критерияможет выступатьуровень достиженийв какой-либо другой деятельности (производственная, научная, учебные успехи; степень развития какой-либо способности; степень выраженности какого-либо свойства личности; социально-демографические и географические данные и т.п.).
Подсчитывается корреляция двух рядов значений: баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.
Пр: Разработка методики Экстра-Интраверсии.
Экстраверсия (1)/Интраверсия (2) → определение, свойства (1 и 2) → экспертная оценка участником эксперимента этих параметров + оценка экстра-интраверсии с помощью разрабатываемой методики → корреляция (чем выше, тем валидность больше).
КОНСТРУКТНАЯ ВАЛИДНОСТЬ– отражает степень представленности измеряемого психологического конструкта в результатах теста.
Для того, чтобы доказать валидность представленности измеряемого свойства, необходимо найти уже проверенную конструкцию, направленную на измерение того же самого.
Если такой конструкции нет, то привлекаются эксперты. При этом они работают не с тестом (как это было в случае с содержательной валидностью), а с испытуемыми из выборки стандартизации (наблюдают).
Если и это не удается, тогда прибегают к оценкам особого типа – субъективным, которые выносят испытуемому люди из его круга, имеющие опыт реального общения с ним.
Виды конструктной валидности:
— конвергентная валидность(схождение) – для доказательства надо выбрать какое-то психологическое свойство, которое связано (прямо или обратно) с измеряемым свойством.
— дискриминативная валидность– доказывается отсутствием связи между измеряемым свойством и каким-либо другим свойством.
Различия:
Содержательная– соответствие заданий теста измеряемому свойству.
Критериальная– соответствие диагноза и/или прогноза какому-либо критерию.
Конструктная– соответствие результата теста психологическому конструкту.
КОНКУРЕНТНАЯ ВАЛИДНОСТЬ– оценивается по корреляции разработанного теста с другими, валдность которых относительно данного параметра установлена.
ОЧЕВИДНАЯ ВАЛИДНОСТЬ– описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься испытуемым как серьезный инструмент познания его личности.
studfile.net
критерий валидности — это… Что такое критерий валидности?
- критерий валидности
-
применительно методик означает независимые показатели и признаки, по коим можно судить о ее валидности. По этим критериям оцениваются результаты, получаемые при практическом применении методики. Критерии могут быть таковы:
1) поведенческие показатели — реакции, действия и поступки испытуемого в различных ситуациях жизни;
2) достижения испытуемого в различных видах деятельности — учебной, трудовой и пр.;
3) данные о выполнении различных контрольных проб и заданий;
4) данные, получаемые из других методик, валидность или же связь коих с проверяемой методикой считается твердо установленной.
Словарь практического психолога. — М.: АСТ, Харвест. С. Ю. Головин. 1998.
- аффекта аккумуляция
- взаимопонимание
Смотреть что такое «критерий валидности» в других словарях:
КРИТЕРИЙ ВАЛИДИЗАЦИИ — непосредственная и независимая от валидизируемого теста мера психического свойства, на исследование которого направлена психодиагностическая методика. Сравнение результатов теста с критерием валидизации является непременным условием процедуры… … Современный образовательный процесс: основные понятия и термины
ИЗМЕРЕНИЕ ОБОСНОВАННОСТИ (ВАЛИДНОСТИ) СОЦИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ — один из этапов измерения надежности социологич. информации. Под обоснованностью информации понимают отсутствие теоре тич. ошибок: полученные данные обоснованы если верны теоретич. посылки, положенные в основу измерительной процедуры, т. е. если… … Российская социологическая энциклопедия
валидность: критерий — применительно методик означает независимые показатели и признаки, по коим можно судить о ее валидности. По этим критериям оцениваются результаты, получаемые при практическом применении методики. Критерии могут быть таковы: 1) поведенческие… … Большая психологическая энциклопедия
Диагнозы (diagnoses) — Д., или более специфически психодиагноз, означает: а) процесс классиф. информ., значимой для эмоциональной сферы и поведения индивидуума; б) обозначение состояния, обычно взятое из общепринятой системы классиф. Процедура психодиагностики… … Психологическая энциклопедия
Невоспроизводимость — Воспроизводимость результатов критерий валидности данных, полученных лабораторным путём. Воспроизводимость признаётся удовлетворительной, если результаты, полученные при исследовании одного и того же образца разными лабораториями, на различных… … Википедия
валидность теста прогностическая — критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у… … Энциклопедический словарь по психологии и педагогике
валидность эксперимента внутренняя — критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной… … Энциклопедический словарь по психологии и педагогике
Валидность — качество метода психологического исследования, выражающееся в его соответствии тому, для изучения и оценки чего он изначально был предназначен. * * * (лат. validus крепкий, здоровый) надёжность в плане соответствия истине, действительности,… … Энциклопедический словарь по психологии и педагогике
ТЕСТЫ — (англ. tests испытания, пробы) один из наиболее распространенных и практически эффективных видов методик психологии, диагностики; его выполнение требует актуализации нек рых обобщенных умений, имеющих значение в деятельности человека, учебной,… … Российская социологическая энциклопедия
Психометрика (psychometrics) — Область П. (или психометрии) связана с количественным подходом к анализу тестовых данных. П. включает два раздела: теорет. и прикл. Психометрическая теория обеспечивает исследователей и психологов мат. моделями, используемыми при анализе ответов… … Психологическая энциклопедия
psychology.academic.ru
Особенности определения валидности педагогического теста
В статье рассматривается понятие валидности, ее виды, приводится вычислительный алгоритм проверки качества педагогического теста с помощью коэффициента валидности.
Педагогический тест сегодня стал одним из наиболее распространенных инновационных педагогических инструментов контроля качества образовательного процесса. Так или иначе, в своей деятельности педагоги сталкиваются с необходимостью разработать педагогический тест. Созданный тест необходимо проверить на его качество. Одним из показателей качества теста является проверка его на валидность.
Понятие «валидность» произошло от анг. слова «valid», что в переводе означает «годный». Валидность — один из базовых показателей качества созданного теста, характеризует пригодность результатов полученных после тестирования именно для той цели, ради которой и проводилось само тестирование.
Аванесов В.С. в своей статье «Тесты: история и теория» пишет: «Валидность характеризует пригодность теста для измерения определенной величины, но нельзя говорить о валидности не указав его применения» [2]. Приведем пример для понимания смысла валидности. Два лучника стреляют по мишеням. Первый лучник набрал 70 очков, а второй 80 из 100. На первый взгляд кажется, что второй лучник лучше первого. Но при уточнении результатов оказалось, что второй лучник поразил чужую мишень. Поэтому, второй стрелок является «не валидным», он не может достигнуть цели, которая перед ним ставилась.
В научной работе Майорова А. «Теория и практика создания тестов для системы образования» говорится «Валидность – должна определять насколько тест может отражать то, что он должен оценивать» [6].
Валидизация теста, это ни что иное, как процесс накопления подтверждений для доказательства его валидности. В теории тестирования существует несколько классификаций валидности. Майоров А. выделяет три вида валидности: конструктная, критериальная и содержательная [6].
Конструктная валидность – определяется в тех случаях, когда представление об измеряемом свойстве существует в форме абстрактного образа. В критериальной или эмпирической валидности оценивается величина связи теста с независимыми критериями. Для оценки степени связи используются средства математической статистики (корреляция двух рядов значений: баллов по тесту и показателей по внешним параметрам). При этом можно выделить два подвида: текущая и прогностическая валидность. Текущая валидность рассматривает корреляцию с критерием существующим в настоящее время (например, тест по предмету сравнивается со школьными оценками). Прогностическая валидность определяется на основе сравнения результатов с критериями которые предположительно появятся в будущем (например, результаты прошлого года переносим на следующий год).
Содержательная валидность характеризует тест по степени его соответствия предметной области, глубина и проработка соответствия. Анна Анастази пишет «Содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить соответствует ли оно репрезентативной выборке измеряемой области» [4].
Согласно Клайну П., тест с высокой содержательной валидностью можно определить следующим образом [5]:
- Указать категорию лиц, для которых предназначен тест.
- Составить список знаний, умений и навыков, подлежащих тестированию.
- Выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности.
- На основе списка составить перечень заданий.
- Выполнить внешнюю экспертизу составленных заданий.
- На данной основе создать тестовые задания образующие тест, при этом тест будет содержательно валидным.
Вычислить числовой коэффициент валидности теста означает эмпирически установить, как выполнение теста испытуемыми соотносится с другими независимо опредленными оценками их знаний. Для определения валидности требуется независимый внешний критерий, то есть оценка эксперта (преподавателя). За коэффициент валидности принимают коэффициент корреляции результатов тестовых измерений и критерия. Если экспертная оценка знаний испытуемых, полученная независимо от процедуры тестирования, представлена числовой последовательностью Y1,Y2, …, Yn, то коэффициент валидности теста может быть рассчитан по формуле, предложенной в своих работой Анастази А., Аванесовым В.С [1, 3, 4, 7]:
,
где n – количество испытуемых, — экспертная оценка i-го учащегося, — средняя арифметическая экспертных оценок, — стандартное отклонение экспертных оценок, — количество правильных ответов у i-го учащегося, — средняя арифметическая количества правильных ответов, — стандартное отклонение количества правильных ответов.
,
Интерпретация результатов:
a) если V принимает значение в диапазоне от 0,6 до 1 – валидность считается высокой,
b) если V принимает значение в диапазоне от 0,3 до 0,6 – валидность считается средней,
c) если V принимает значение меньшее 0,3– валидность считается низкой,
Рассмотрим пример расчета валидности теста.
Тест «Информационные процессы» должна выполнить группа студентов из 7 человек (в нашем примере мы рассмотрим небольшую группу, на практике рекомендуется проводить проверку теста на группе не менее 30 человек). Тест состоит из 10 заданий.
Экспертом, предварительно оцениваются результаты (экспертом может выступить преподаватель информационных технологий, хорошо знающий данную группу студентов, и имеющий возможность предсказать результата выполнения ими данного теста).
Результаты оценивания экспертов приведены в таблице 1.
Таблица 1. Результаты оценивания экспертов.
Номер студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Yi |
5 |
10 |
3 |
4 |
7 |
6 |
9 |
Расчеты можно произвести в электронных таблицах Microsoft Excel используя встроенные функции для вычислений.
Рассчитаем — среднюю арифметическую экспертных оценок:
.
Функция СРЗНАЧ в Microsoft Office Excel вычисляет среднее арифметическое значение чисел выбранного диапазона. В частности, если диапазон B4:B15 содержит числовые значения, то формула =СРЗНАЧ(B4:B15) вернет среднее арифметическое значение этих чисел.
Найдем — стандартное отклонение экспертных оценок:
.
Функция СТАНДОТКЛОН в Microsoft Office Excel вычислят стандартное отклонение используя указанную выборку, на основании «n-1» вычислительного метода. При этом, укажем, что стандартное отклонение — это оценка того, насколько массово разбросаны данные относительно среднего арифметического этих данных.
После проведения теста, были получены результаты, приведенные в таблице 2.
Таблица 2. Результаты тестирования.
Номер студента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
yi |
4 |
9 |
3 |
3 |
8 |
6 |
9 |
Рассчитаем — среднюю арифметическую количества правильных оценок:
.
Найдем — стандартное отклонение количества правильных оценок:
Рассчитаем коэффициент валидности:
На основании расчетов можно сделать вывод о том, что валидность, рассмотренного в примере теста «Информационные процессы», высокая. На основании определенного показателя мы можем сказать. Что тест достигает своих результатов, а значит, разработчик теста справился со своим заданием – разработкой качественного теста по данной тематики. Заметим, что качество теста определяется не только показателем валидности, но и многими другими дополнительными показателями.
Таким образом, рассмотренный способ определения коэффициента валидности, является одним из доступных, для педагога, вариантом расчета и позволяет определить соответствие созданного теста поставленным педагогическим условиям.
novainfo.ru
ВАЛИДНОСТЬ это что такое ВАЛИДНОСТЬ: определение — Психология.НЭС
ВАЛИДНОСТЬ это что такое ВАЛИДНОСТЬ: определение — Психология.НЭС-
Психология.НЭС
- Право.НЭС
- Философия.НЭС
- Социология.НЭС
- Экономика.НЭС
- Педагогика.НЭС
- Политика.НЭС
- История.НЭС
- Словари
- Термины
- Персоны
- Новости
- Каталог
vocabulary.ru