Валидные методики: Валидность методики

Психологические методики, опросники и тесты

MQ-тест (mental coefficient test)	установки, оптимизм, пессимизм
Ваше отношение к конфликтам	психологический климат, опросники, Конфликты
Диагностика самоэффективности. Методика Маддукса и Шеера	самоэффективность, Эффективность работы, Психология личности
Диагностика состояния агрессии (по Басса-Дарки)	Агрессия, Оценка персонала
Диагностика состояния агрессии. Опросник Басса-Дарки	личностные опросники
Диагностика эмпатии по А. Меграбяну и Н. Эпштейну	эмпатия, Оценка персонала
Идет ли стресс тебе на пользу?	Стресс
Индивидуально-типологический опросник. Методика Собчик	самооценка, самоконтроль, самосознание
Исследование условий общения	Общение, Деловые игры, деловое общение
Какой вы руководитель?	Менеджмент
Классификация тестов (Дмитрий Леонтьев)	Психодиагностика
Копинг-тест Лазаруса. Оценка поведения в трудной жизненной ситуации	стили поведения
Краткий тест оценки потенциала команды	Командообразование
Методика «План приятных событий»	Принятие решений
Методика Будасси. Тест на самооценку личности	самооценка
Методика Диагностика реальной структуры ценностных ориентаций личности С.С. Бубнова	ценностные ориентации, Мотивация персонала
Методика диагностики личности «Мотивация к избеганию неудач»	Мотивация персонала, опросники
Методика диагностики личности «Мотивация к успеху» Т. Элерса	Мотивация персонала, опросники, Достижение успеха
Методика диагностики профессионального выгорания	Профессиональное выгорание
Методика диагностики самооценки Ч.Д. Спилбергера, Л. Ханина (оценка ситуационной и личностной тревожности)	тревожность, Психодиагностика, ситуационная тревожность, личностная тревожность
Методика диагностики степени готовности к риску Шуберта	опросники, готовность к риску, Мотивация персонала
Методика исследования эмоционального выгорания (В. Бойко)	эмоциональное выгорание
Методика Мюнстерберга	внимание, Избирательность внимания, Диагностика способностей
Методика определение уровня эмоционального интеллекта	Интеллект, эмоциональный интеллект, EI
Методика определения направленности личности — на достижение успеха/ избегание неудачи (А. А. Реан )	Психология личности, Достижение успеха, избегание неудач, Мотивация персонала
Методика определения ценностных ориентаций М. Рокича	ценности, ценностные ориентации, Мотивация персонала
Методика оценки организационного стресса Маклина, адаптированная Н. Е. Водопьяновой	Стресс
Методика оценки самоорганизации деятельности. Психодиагностика управления временем	Самоорганизация, Тайм-менеджмент
Методика оценки угрозы переутомление от альтруизма	Альтруизм, самооценка, выгорание, Оценка персонала
Методика Хека и Хесса. Экспресс-диагностика вероятности невроза	личностные опросники
Методика: Изучение мотивационного профиля личности (Ш. Ричи и П. Мартин)	Мотивация персонала
Методика: Профессиональное выгорание или синдром хронической усталости	Профессиональное выгорание, Синдром хронической усталости
Многоуровневый личностный опросник «Адаптивность» (МЛО-АМ) А.Г. Маклакова и С.В. Чермянина	личностные опросники
Насколько вы подвержены стрессу на работе?	Стресс, Профессиональное выгорание
Не пора ли отдохнуть?	Профессиональное выгорание
Определение направленности личности	опросники, личность, направленность личности
Определение уровня тревожности (методика Спилбергера-Ханина)	тревожность, Оценка персонала
Опросник 16 РF Р.Кэттелла	опросники, Психодиагностика, теория личности
Опросник Айзенка (EPI, Form B)	темперамент, опросники, EPI
Опросник Айзенка: определение типа темперамента	темперамент, опросники
Опросник для измерения мотивации достижения	Мотивация персонала, мотивация достижения
Опросник для экспертной оценки руководителя	Менеджмент
Опросник изучения коммуникативных и организаторских склонностей (КОС)	Руководителю, Коммуникации, Общение, деловое общение, КОС
Опросник изучения коммуникативных и организаторских склонностей (КОС-2)	Коммуникации, Общение, деловое общение, КОС
Опросник изучения направленности личности	Общение, деловое общение
Опросник исследования уровня субъективного контроля (УСК)	Методы, субъективный контроль
Опросник М. Цукермана. Методика диагностики потребности в поисках ощущений	Мотивация персонала, потребности
Опросник оценки привлекательности работы	Мотивация персонала
Опросник оценки силы воли	сила воли, личностные опросники
Опросник самоконтроля при общении	Общение, опросники, самоконтроль
Опросник самоотношения (В.В.Столина)	опросники, личностные опросники, Психодиагностика, самооценка
Опросник самооценки биполярной эффективности руководства	Лидерство, Менеджмент
Опросник Стефансона	опросники, самооценка
Опросник формально-динамических свойств индивидуальности В.М. Русалова (ОФДСИ)	личностные опросники
Опросник Шпалинского и Шелеста. Диагностика психологического климата в малой группе	Командообразование, малые группы, психологический климат
Опросник экспресс-диагностики стрессогенных факторов в деятельности руководителя	стрессоустойчивость, Менеджмент
Опросник: Кто Вы в конфликте?	Конфликты
Опросник: Оценка коммуникативных навыков	Общение, опросники, деловое общение
Опросник: оценка поведения	поведение, Психология личности, настойчивость
Опросник: оценка тревожности	тревожность, Психология личности
Опросник: самоконтроль (настойчивость)	Психология личности, настойчивость
Опросник: самооценка коммуникативных навыков	Общение, деловое общение
Пятифакторный личностный опросник МакКрае и Коста (Большая пятерка)	личностные опросники
Развита ли у вас интуиция?	интуиция
Самоактуализационный тест (CAT)	Оценка персонала, самоактуализация
Самооценка стиля руководства	самооценка, Стили руководства
Самооценка уверенности руководителя	уверенность, Руководителю
Самооценка эмоционального интеллекта	эмоциональный интеллект
Самопознание — практическое задание.	тест на самопознание
Сколько вы будете вместе	Семейная психология
Социально-психологический климат: диагностика (СПСК Немова, Методика А. С. Михайлюк, Л. Ю. Шарыто)	психологический климат, Оценка персонала
Стандартизированный многофакторный метод исследования личности MMPI	личностные опросники
Тест FPI на исследование личности	личностные опросники
Тест «Выход из трудных жизненных ситуаций»	стили поведения
Тест «Готовы ли вы к жизненным сюрпризам»	проективные тесты
Тест «Дом, дерево, человек»	проективные тесты
Тест «Как вы действуете в условиях конфликта?»	Конфликт
Тест «Какой Вы руководитель?»	Менеджмент
Тест «Конструктивный рисунок человека из геометрических фигур»	проективные тесты
Тест «Перепутанные линии»	внимание, Диагностика способностей
Тест «Цель–Средство–Результат»	стили поведения, Достижение Результата
Тест «Человек под дождем»	проективные тесты
Тест «Что я вижу?»	эмпатия
Тест Ассингера. Диагностика агрессивности личности	Конфликт
Тест Белбина. Диагностика функционально-ролевых позиций	Командообразование
Тест Берна. Определение ролевых позиций в межличностных отношениях	личностные опросники, Командообразование
Тест Блейка – Мутона. Анализ поведения руководителя	стили поведения, Менеджмент
Тест Вудкока. Оценка эффективности команды	Командообразование
Тест диагностики климата в коллективе	Командообразование, психологический климат
Тест для диагностики мотивационных ориентаций в межличностных коммуникациях	Общение, Мотивация персонала
Тест для диагностики психолого-педагогической характеристики команды	Командообразование
Тест для диагностики самочувствия, активности и настроения (САН)	Самочувствие, самооценка
Тест для диагностики уровня развития малой команды	Командообразование
Тест для определения индекса групповой сплоченности Сишора	групповая динамика, Командообразование
Тест для определения психологического возраста	психологический возраст, личностные опросники
Тест для оценки интроверсии и экстраверсии	экстраверсия, интроверсия, личностные опросники, Коммуникации
Тест для оценки потребности в одобрении. Методика Д. Крауна и Д. Марлоу	потребности, Мотивация персонала
Тест интегральной самооценки уровня развития группы как коллектива Л.Г. Почебута	Командообразование, Коллектив
Тест интеллекта Векслера	Интеллект
Тест Лири. Диагностика межличностных отношений (ДМО)	личностные опросники, Командообразование
Тест на выявление психологической совместимости	личностные опросники
Тест на логическое мышление	мышление, логическое мышление
Тест на определение уровня Эмоционального Интеллекта (Холл)	эмоциональный интеллект, Оценка персонала
Тест на педантичность	стили поведения
Тест на стрессоустойчивость Холмса и Раге	стрессоустойчивость
Тест на толерантность	личностные опросники
Тест определения стиля управления руководителя с помощью самооценки	самооценка, Стили руководства, Менеджмент
Тест определения типа поведения DISC	стили поведения
Тест оценки внимания ЮСЭФО	внимание, Диагностика способностей
Тест оценки выраженности шести основных мотивов к работе	Мотивация персонала
Тест оценки демонстративности	личностные опросники
Тест оценки доминирующих стратегий конфликтного поведения	стили поведения, Конфликт
Тест оценки мотивации Герчикова	Мотивация персонала
Тест оценки мотивации организационного поведения	Мотивация персонала
Тест оценки настроения и состояния «Инь и Ян»	проективные тесты
Тест оценки объективности	личностные опросники
Тест оценки ориентации внимания	Мотивация персонала, внимание
Тест оценки ориентационных стилей общения	Стили общения, Общение
Тест оценки поведения «Не дай человеку упасть»	проективные тесты
Тест оценки поведения в коллективе	Командообразование
Тест оценки потребности в достижении цели. Методика Орлова	достижение целей
Тест оценки свойств нервной системы по семи шкалам	личностные опросники
Тест по типологии Майерс – Бриггс. Типологический индикатор MBTI	личностные опросники
Тест Потемкиной. Диагностика социально-психологических установок личности в мотивационно-потребностной сфере	Мотивация персонала
Тест Ряховского. Методика оценки уровня общительности	Общение, Коммуникации
Тест самодиагностики стиля управления	самооценка, стили управления, Стили руководства, Менеджмент
Тест Сопова и Карпушиной. Оценка жизненных ценностей	Мотивация персонала, ценности
Тест Стреляу. Изучение темперамента	темперамент
Тест Тейлора. Оценка шкалы проявления тревоги	личностная тревожность, тревожность
Тест Томаса: Поведение в конфликте	Конфликт
Тест Хони и Мамфорда. Определение стиля обучения	стили обучения, Обучение персонала
Тест юмористических фраз	Тест юмористических фраз
Тест юмористических фраз: описание и интерпретация	Тест юмористических фраз
Тест Ярошевского. Исследование ролей в творческой группе	Командообразование
Тест-опросник Вассермана и Гуменюка. Методика диагностики типа поведенческой активности	стили поведения
Тест-опросник оценки типа мотивации	Мотивация персонала
Тест-опросник Столина и Пантелеева. Оценка отношения к себе	самооценка
Тест-опросник Шмишека и Леонгарда. Методика акцентуации характера и темперамента личности	личностные опросники, Акцентуации характера
Упражнения на концентрацию внимания	внимание
Фрагмент таблицы стрессоров (методика определения стрессоустойчивости и социальной адаптации Холмса и Раге)	Увольнение, Стресс
Ценностный опросник Шварца	ценности
Эмоциональный тест Фордайса	счастье

Тесты способностей. Часть 3. Надежность и валидность

Надежность и валидность — ключевые характеристики психометрического теста

Надежность показывает, что результаты проводимого исследования близки к истине.
Валидность – признак того, что результаты действительно относятся к тому явлению, которое изучается исследователем.

1. НАДЕЖНОСТЬ

НАДЕЖНОСТЬ КАК УСТОЙЧИВОСТЬ

Относительное постоянство, устойчивость, согласованность результатов теста. Независимость методики от действия случайных факторов

Устойчивость определяется с помощью повторного тестирования (ретеста)
1.1. Метод повторного тестирования (ретеста)
Ретестовая надежность определяется путем повторного обследования одних и тех же лиц при помощи одной и той же методики. Основан на подсчете корреляции индивидуальных баллов испытуемых, полученных в результате двукратного выполнения ими одного и того же теста. Чем выше коэффициент корреляции, тем выше надежность, и мы получаем примерно то же самое распределение. Обычно повторное тестирование проводится через 1-2 недели. Наименьшим удовлетворительным значением для ретестовой надежности является 0.76

Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Ещё один недостаток повторного тестирования — это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

1.2. Метод параллельных форм
Проверяется с помощью взаимозаменяемых форм теста (т.е. одни и те же обследуемые сначала обследуются с помощью одного теста, затем (через определенный интервал) с помощью другого теста). Метод эффективен, когда изначально разрабатываются параллельные варианты теста с целью ротации. Имеются трудности в доказательстве того, что обе формы — параллельные наборы заданий — являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

НАДЕЖНОСТЬ КАК СОГЛАСОВАННОСТЬ

Внутренняя согласованность (англ. — internal consistency) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Для проверки внутренней согласованности применяются различные методы:

1.3. Метод расщепления или метод автономных частей
Характеристика надежности осуществляется путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных заданий теста. Для этого тест расщепляется/ разделяется на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным. Другие названия — одномоментная надежность, надежность-согласованность.

1.4. Метод эквивалентных бланков
Состоит в применении двух сопоставимых друг с другом форм теста для большой выборки. Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен.

1.5. Метод альфа Кронбаха
В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, то каждый отдельный вопрос направлен на исследование одного и того же общего основания.
Если все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха будет равен 1. При случайном разбросе результатов ответов на вопросы, коэффициент альфа Кронбаха будет равен 0, и тест ненадежен.

2. ВАЛИДНОСТЬ ТЕСТА

Валидность теста (от англ. valid – актуальный, подходящий, действительный) – понятие, указывающее, что именно тест измеряет и насколько хорошо он это делает. Это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность.

Не существует какого-то единого универсального подхода к определению валидности. В зависимости от того, какую сторону валидности хочет рассмотреть исследователь, используются и разные способы доказательства. Проверка валидности методики называется валидизацией.

2.1. Концептуальная валидность
Понимается как обоснование с позиции соответствия авторским представлениям об особенностях диагностируемых свойств, как мера соответствия заданий теста авторской концепции этих свойств.

2.2. Содержательная (логическая) валидность
Под содержанием понимается фактический материал, входящий в пункты тестов. Валидность по содержанию оценивает соответствие содержания теста (заданий, вопросов) той реальной деятельности, в которой проявляется измеряемое в методике свойство.

Например, чтобы тест математических способностей имел достаточный уровень содержательной валидности, его пункты не должны иметь таких формулировок, при которых для испытуемого решающими оказываются вербальные способности, необходимые для того, чтобы понять, о чём спрашивается в этом пункте.

Содержание должно быть уравновешено таким образом, чтобы все тестируемые аспекты были представлены. Тест не должен быть перегружен, допустим, пунктами на умножение в ущерб пунктам на сложение.
Установление содержательной валидности есть в значительной степени субъективная операция, основанная на мнениях «экспертов» относительно уместности используемых материалов.

2.3. Конструктная валидность (концептуальная, понятийная, внутренняя валидность)

Под конструктом понимают психологический феномен, который невозможно наблюдать непосредственно, но можно вывести из поведения человека, например, экстраверсия, общий интеллект, открытость, умения и т.д.

Конструктная валидность определяет наличие взаимосвязи между новым и ранее существующим тестом-эталоном, изучающим тот же конструкт, валидность которого была ранее определена. Она указывает на то, что разрабатываемый тест измеряет примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика

При анализе конструктной валидности методики формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. Конструктная валидность характеризуется не только связями проверяемого теста с близкородственными показателями эталонного теста, но и с теми, где, исходя из гипотезы, значимых связей наблюдаться не должно.

2.4. Операциональная валидность
Определяет степень соответствия используемой экспериментальной методики (экспериментальных утверждений) теоретическим положениям, которые положены в основу организации и проведения данного эксперимента

2.5. Очевидная (доверительная) валидность
Очевидная валидность показывает в какой степени содержание теста и его заданий (пунктов) выглядит в глазах тестируемого подходящим для данной ситуации. Именно она в первую очередь определяет отношение испытуемых к обследованию. Тест должен восприниматься испытуемым как серьезный инструмент познания его личности.

Наличие очевидной валидности способствует воспринимаемой целесообразности психологического теста и создает у тестируемого впечатления, что тест учитывает его индивидуальность и опыт работы. Позволяет добиться сотрудничества и хорошего раппорта между тестирующим и тестируемыми.
Недостаток очевидной валидности (независимо от технической валидности, или точности, теста) может вызывать у тестируемых чувства раздражения, неудовлетворенности и обманутости, создавать негативное общественное мнение.
Хотя очевидная валидность, на первый взгляд, кажется подобной содержательной валидности, смысл этих показателей различен.

2.6. Критериальная (прагматическая, эмпирическая) валидность
Такая валидность показывает ее практическую полезность. Для этого используется независимый внешний относительно самого теста критерий – показатель проявления изучаемого свойства в повседневной жизни.

Критериальная (прагматическая, эмпирическая) валидность позволяет выяснить насколько высокие или низкие результаты теста соответствуют высокой или низкой оценке того поведенческого проявления — критерия, которое он должен предсказать

Например, практическая задача теста – выявить тех, кто будет эффективен в будущей работе. Критерий «эффективность» определен как % выполнения плана продаж. В таком случае, валидный тест позволяет с определенной вероятностью отделить «выполняющих план» от «не выполняющих план».

Важно можно ли с помощью теста разделить испытуемых на эти две группы. Обладает ли тест дискриминативностью. Важно, что тест или отдельное его задание успешно (с высокими баллами) проходят «эффективные», а неуспешно (с низкими баллами) «неэффективные». В случае, когда группы отличаются друг от друга только по одной переменной, причина дифференциации бывает понятна. Но это не важно. Важно, чтобы тест умел хорошо разделять группы по целевому критерию.

Для вычисления коэффициента валидности сопоставляются результаты, полученные при применении диагностической методики, с данными, полученными по внешнему критерию, тех же лиц. Используются разные виды линейной корреляции (по Спирмену, по Пирсону).

Виды критериальной валидности:

«Прогностическая» (предсказательная) валидность показывает возможность экстраполирования результатов на будущее. Определяется также по достаточно надежному внешнему критерию, но информация по нему собирается некоторое время спустя после испытания. Внешним критерием обычно бывает выраженная в каких-нибудь оценках способность человека к тому виду деятельности, для которой он отбирался по результатам диагностических испытаний.

«Ретроспективная» валидность определяется на основе критерия, отражающего события или состояние качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики.

Валидность это в психологии, виды валидности, понятие

Валидность – это один из базовых критериев в психодиагностике тестов, методик, определяющий их качество, близкое к понятию достоверности. Применяется, когда нужно узнать насколько хорошо методика измеряет именно то, на что она ориентирована, соответственно то, насколько лучше отображается исследуемое качество, тем большая валидность данной методики.

Вопрос о валидности возникает сперва в процессе разработки материала, потом после применения теста или методики, если необходимо узнать, соответствует ли степень выраженности определяемой характеристики личности и методом измерения этого свойства.

Понятие валидности выражается корреляцией результатов, которые получились в результате применения теста или методики с другими характеристиками, которые также исследуются, и ее можно также аргументировать комплексно, с помощью разных приемов и критериев. Используются разные виды валидности: концептуальная, конструктивная, критериальная, содержательная валидности, со свойственными методами установления их степени достоверности. Иногда критерий достоверности является обязательным требованием к проверке психодиагностических методов, если они вызывают сомнения.

Чтобы психологическое исследование имело реальную ценность, оно должно быть не только валидным, а еще и надежным одновременно. Надежность позволяет экспериментатору быть уверенным в том, что исследуемое значение очень близко к истинному показателю. А валидный критерий важен тем, что он указывает, что изучается именно то, что экспериментатор предполагает. Важно обратить внимание на тот факт, что данный критерий может предположить надежность, но надежность предположить валидность не может. Надежные значения могут быть не валидными, но валидные обязаны быть надежными, в этом вся суть успешного исследования, тестирования.

Валидность это в психологии

В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.

Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем. Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать. Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.

Проверка на валидность осуществляется тремя способами.

Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике. Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых. В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.

Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.

В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства. Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.

Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.

Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям. Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения. И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.

Валидность теста это

Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.

Валидность и надежность тестов – это два показателя, которые определяют их качество.

Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.

Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.

Существует несколько подходов к определению валидности теста.

При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.

Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.

Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.

Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.

Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования. Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых. Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.

Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.

В измерении надежности и валидность имеет место также этический контекст. Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей. Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения. Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.

Виды валидности

Валидный критерий бывает нескольких видов, в зависимости на что именно он направлен.

Внутренняя валидность определяет насколько определенное экспериментально воздействие стало причиной изменений в данном эксперименте.

Внутренняя валидность определяется отношениями между независимыми и зависимыми переменными, и проходит через особенные процедуры, в результате которых определяется достоверность выводов в данном исследовании. О внутреннем критерии говорится, когда достоверно известно о зависимости причинно-следственного типа между независимыми и зависимыми переменными.

Валидность исследования определяется влиянием неконтролируемых ситуативных факторов на изучаемое явление, если оно высокое, то данный критерий будет низким. Высокая внутренняя валидность исследования является признаком качественного исследования.

Внешняя валидность обобщает вывод популяции, ситуации и других независимых переменных. От того, насколько высокая и хорошая внешняя валидность зависит возможность переноса результатов, полученных в исследовании на реальную жизнь.

Очень часто внешняя и внутренняя валидизации противоречат друг другу, потому что если увеличивается одна валидность, то это значение может повлиять на показатели другой. Самым лучшим вариантом считается выбор экспериментальных планов, которые обеспечивали бы два вида данного критерия. Особенно это важно в случае исследований, в которых важным есть распространение результатов в определенных практических ситуациях.

Содержательная валидность применима к тем тестам, в которых полностью моделируется определенная деятельность, в первую очередь, аспекте связанным с предметом. Выходит, что в самом содержании методики отражаются основные стороны психологического конструкта. Если эта характеристика имеет сложную структуру, то в самой методике должны присутствовать все входящие в него элементы. Определяется такой валидный критерий с помощью систематического контроля за содержанием, должен показывать полноту охвата всей выборки за измеряемыми параметрами. Исходя из этого должна быть проведена эмпирическая проверка методики в соответствии с ее гипотезами. Каждое задание или вопрос в назначенной области, должен иметь равные шансы на включение его к заданиям теста.

Эмпирическая валидность определяется через статистическую корреляцию, то есть считается корреляция баллов по тесту и показателей внешнего параметра, избранного как критерий валидности.

Конструктная валидность относится к теоретическому конструкту, как отдельному и включается к поиску факторов, которые объясняют поведение человека при выполнении теста или методики.

Прогностический тип валидности определяется за счет наличия очень надежного внешнего критерия, хотя информация о нем собирается через определенное время после окончания испытания. Таким внешним критерием может быть способность личности к определенному виду деятельности, для которой он был отобран за результатами психодиагностических измерений. Точность прогнозирования в этом валидном критерии находится в противоположной зависимости от времени, которое давалось для прогнозирования. И чем больше времени проходит после исследования, тем еще больше факторов будут учитываться для оценивания прогностической значимости теста. Хотя учесть абсолютно все имеющиеся факторы практически невозможно.

Ретроспективная валидность определяется за критерием, который отражает события или сстояние свойства в прошлом времени. Она может использоваться для получений знаний о предсказательных аспектах методики. Очень часто в таких тестах сопоставляют оценки развития способности в их прошлом значении и на данный момент, вычесляется насколько эффективнее стали результаты.

Экологическая валидность показывает, что некий организм в силу наследственных, генетически обусловленных или приобретенных особенностей является подготовленным к демонстрированию разнообразных форм поведения во всевозможных контекстах или в разных средах обитания. Действия организма могут быть успешными в одном времени и месте, но не настолько успешными или совсем не иметь успеха в другое время, и другом месте.

Экологическая валидность подтверждается, если результаты исследования имеют место подтверждения или должного применения их в полевых исследованиях. Проблемой лабораторных исследований есть адекватная переносимость полученных результатов на условия реальной жизни, на повседневную деятельность индивида, которая длится естественным путем. Но это тоже не является конечным подтверждением результатов, как экологически валидных, потому что предполагает генерализацию также на другие условия и обстоятельства. Часто исследования обвиняются в невысоком, экологическом валидном критерии, но вся причина бывает заключается в невозможности повторить исследование в реальной жизни.

Автор: Практический психолог Ведмеш Н.А.

Спикер Медико-психологического центра «ПсихоМед»

Мы в телеграм! Подписывайтесь и узнавайте о новых публикациях первыми!
Методики для профотбора и профориентации

Диагностика структуры сигнальных систем (Э.Ф. Зеер, А.М. Павлова, Н.О. Садовникова)
. На основе относительного преобладания у человека первой или второй сигнальной системы определяются специфические типы высшей нервной деятельности: художественный (преобладание первой сигнальной системы), мыслительный (преобладание второй сигнальной системы) и средний (относительно одинаковая роль обоих систем). По результатам диагностики выдаются рекомендации о том, какой вид трудовой деятельности более всего подходит испытуемому.
«Дифференциально-диагностичекий опросник» (ДДО)
. Методика предназначена для отбора на различные типы профессий в соответствии с классификацией типов профессий Е.А. Климова (человек-природа, человек-техника, человек-человек, человек-знак, человек-художественный образ). Результаты опросника ДДО показывают к какой профессиональной сфере человек испытывает склонность и проявляет интерес.
«Карта интересов», опросник разработан А. Е. Голомштоком
. Тест используется в целях профориентации при приеме на работу. Может применяться для обследования как подростков, так и взрослых. Исходя из структуры ответов определяется степень выраженности интереса к определенному виду профессиональной деятельности (биология, география, геология, медицина, легкая и пищевая промышленность, физика, химия, техника, электро- и радиотехника, металлообработка, деревообработка, строительство, транспорт, авиация, морское дело, военные специальности, история, литература, журналистика, общественная деятельность, педагогика, юриспруденция, сфера обслуживания, математика, экономика, иностранные языки, изобразительное искусство, сценическое искусство, музыка, физкультура и спорт).
«Карта интересов», модификация О.Г. Филимоновой
. Опросник А.Е. Голомштока представлен достаточно широко в разных источниках. В его основе лежит перечень направлений, по которым составлены вопросы к учащимся. Этот опросник уже долгое время публикуется без изменений и устарел как с точки зрения перечня направлений деятельности, так и с точки зрения формулировки вопросов. При его проведении в аудитории возникают смешки и недоумение, что и побудило автора к некоторому его усовершенствованию. В новом перечне направлений деятельности появились такие популярные сейчас виды деятельности, как информационные технологии, социология, философия, бизнес.
«Матрица выбора профессии»
. Данная методика разработана Московским областным центром профориентации молодежи. С помощью 2-х вопросов и таблицы можно выявить профессию наиболее близкую интересам и склонностям опрашиваемого.
Методика Л.А. Йовайши
предназначена для определения склонностей личности к различным сферам профессиональной деятельности (искусства, технических интересов, работы с людьми, умственного труда, физического труда и сфера материальных интересов).
Опросник для определения профессиональной готовности Л. Н. Кабардовой
. По результатам испытуемого делается вывод о том, к какой сфере профессиональной деятельности он склонен (человек-знаковая система, -техника, -природа, -художественный образ, -человек).
«Ориентация» анкета И.Л. Соломина
. Анкета пригодна для самооценки профессиональных интересов и способностей молодых и взрослых людей, очень проста в применении и обработке. Определяется преимущественная склонность и способность к одному из пяти типов профессий (человек-человек, -техника, -знаковая система, -художественный образ, -природа) и соответствие двум классам: исполнительские и творческие.
Оценка профессиональной направленности личности учителя
. Методика разработана для определения степени включенности учителя в профессию, определения механизмов, через которые профессиональная деятельность воздействует на личность, выявления типических педагогических деформаций личности.
«Профассоциации»
. Профориентационный тест, основанный на ассоциативном методе. Испытуемый дает ассоциации на профессии. Оценивается профессиональная направленность. Может применяться как в индивидуальной, так и групповой профориентационной работе.
«Профессиональные намерения»
. Все вопросы методики группируются по пяти направлениям, а ответы свидетельствуют об уровне сформированности и осознанности каждого из них (жизненные планы, увлечения и проф.намерения, знания о профессии, оценка своей пригодности к профессии, эффективность профориентационной работы).
«Профиль»
(методика карты интересов А. Голомштока в модификации Г. Резапкиной). Данная методика исследует профессиональные интересы. Помогает определить профиль обучения.
«Цель — Средство — Результат» методика А.А.Карманова (ЦСР)
. Методика рассчитана на исследование особенностей структуры деятельности.
Экспресс-диагностика социальных ценностей личности
. Методика способствует выявлению личных, профессиональных и социально-психологических ориентаций и предпочтений и может быть полезна как при выборе характера работы, так и при оценке работника в процессе найма и аттестации кадров.
«Якоря карьеры» методика диагностики ценностных ориентаций в карьере (Э.Шейн, перевод и адаптация В.А.Чикер, В.Э.Винокурова)
. Данный тест предназначен для определения выраженности карьерной ориентации. Можно использовать для профессиональной ориентации подростков и взрослых.

Открытый реестр психодиагностических методик, вызывающихдоверие профессионального сообщества с описанием минимальнонеобходимых условий и требований их использования(заимствования) и реализации в школе
В настоящее время в связи с распространением и укреплением позиций доказательного подхода в психологии и образовании все большую роль приобретает построение практической деятельности специалистов в этих областях на основе данных научных исследований. Пользование валидным и надежным диагностическим инструментарием является необходимой составляющей доказательного подхода и актуально для специалистов-исследователей и практиков в любой сфере психологии и образования. В национальном проекте «Наука» на 2018 — 2024 гг. <11> поставлена задача увеличить количество публикаций российских ученых в ведущих мировых научных журналах, входящих в первый и второй квартиль по индексам научного цитирования, что применительно к психологии также предполагает наличие стандартизированных психодиагностических методик как инструментов сбора эмпирических данных научных исследований, в том числе касающихся образования и социальной сферы.
Вместе с тем в психологии ощущается явный дефицит психодиагностического инструментария, удовлетворяющего международным требованиям. Исследователи и практики зачастую пользуются методиками, которые вообще не проходили процедуры стандартизации или же проходили их достаточно давно и используются скорее «по традиции», чем на основе принципов доказательности. В ряде случаев используемые методики поступают из источников, надежность которых не подтверждена. В дальнейшем это обстоятельство приводит к снижению качества профессиональной деятельности педагогов-психологов образовательных организаций.
Целью создания открытого реестра психодиагностических методик (см. приложение 3) является отбор и предъявление сотрудникам психологических служб общеобразовательных организаций психодиагностических методик, вызывающих доверие научного сообщества. При этом значительное число российских методик или русскоязычных версий зарубежных методик, включенных в реестр, прошло процедуры стандартизации и/или валидизации, данные результаты опубликованы в ведущих научных журналах за последние 5 лет. В то же время важной задачей является осуществление должной процедуры верификации всех психодиагностических методик, пользующихся доверием у профессионального сообщества психологов образования, на основании экспертного мнения которых с учетом письма Министерства образования и науки Российской Федерации от 10 февраля 2015 г. N ВК-268/07 «О совершенствовании деятельности центров психолого-педагогической, медицинской и социальной помощи» подготовлен реестр в данных методических рекомендациях.
Данное обстоятельство ставит задачу организации работы по сбору эмпирических данных и проведению соответствующих процедур стандартизации и/или валидизации профессионального инструментария. Вместе с тем, осознание определенной «уязвимости» даже хорошо известного и широко используемого психодиагностического инструментария призвано содействовать организации систематической работы по его верификации в среде профессионального сообщества.
Открыть полный текст документа

Валидность — Блог Викиум

Илья Павлов

Автор Викиум

Валидность — важнейший аспект экспериментальной психологии. Это свидетельство того, что, применяя определённую методику, специалист измерил именно то, что планировал.

Валидной считается методика, результаты которой соответствуют задачам, поставленным перед исследованием. Например, методика, разработанная для того, чтобы определить темперамент человека, должна измерять именно его, а не иные психические свойства.
Принципиальную важность валидности невозможно переоценить. Ведь именно от неё зависит достоверность проводимых тестов. Совершенный эксперимент невозможен, если методика не обладает идеальной валидностью.

Как проверить валидность?

Существует три способа, позволяющих определить, насколько методика валидна:

Содержательная сторона

Проверка выявляет, насколько методика соответствует действительности, в которой реализуется изучаемое свойство. Через призму содержательности рассматривают и лицевую (очевидную) валидность. Лицевая валидность характеризует, насколько тест соответствует ожиданиям тех, кто его проходил.

Конструктная валидность

Если методика валидна, она будет проверять научно обоснованные конструкты. Здесь же можно пойти по двум направлениям. Конвергентная валидность требует сопоставления нескольких методик, проверяющих идентичные показатели. Если между результатами будет наблюдаться корреляция, методику можно считать валидной.

При дискриминантном подходе проверяют, диагностирует ли методика только заданные характеристики и не затрагивает ли те, с которыми нет зависимости у исходных параметров.

Критериальная проверка

Здесь используются статистические методы. Чтобы протестировать валидность, проверяют, соответствуют ли результаты испытания заранее заданным критериям.

Рассматривая критериальную валидность, также говорят о прогностической составляющей. Такие методики применяют, когда хотят предсказать поведение. Если прогноз, сделанный с помощью методики, со временем оправдывается, экспериментальный комплекс получает статус прогностически валидного.

Надёжность и валидность

Критерии надёжности рассматриваются с формальной точки зрения, тогда как содержательная сторона не учитывается.

Валидность, наоборот, обращает внимание на содержательные результаты теста. Оценивается их соответствие существующим феноменам психологии.

Надёжная методика не тождественна валидной. Например, тест, оценивающий инициативность, может продемонстрировать высокие показатели надёжности и ретестовости элементов. Однако фактически результаты будут свидетельствовать о значительной силе воли, но с точки зрения содержания инициативности не подтвердят.

Таким образом, надёжность теста является высокой, а валидность — низкой.

Внутренняя валидность и пример её нарушения

Внутренняя валидность — одна из разновидностей данного феномена. Чтобы понять её принцип, стоит рассмотреть пример, который отразит её нарушение.

Допустим, лаборатория хочет протестировать лекарство, способствующее росту. Для этого экспериментаторы отбирают несколько подростков тринадцати лет, измеряют параметры роста и дают детям лекарство.

Спустя два года снова производятся замеры, которые отражают увеличение показателей. Однако на основании изменившихся данных нельзя сделать вывод о том, что причиной перемен оказалось именно лекарство.

Нарушение внутренней валидности заключается в неучтенных факторах, которые влияют на результат исследования. В данном случае речь идёт о естественных процессах взросления. Корректный эксперимент должен был предусмотреть и их.

Методика определения определения поведения людей в различных ситуациях тоже может быть валидной или нет. Курс Викиум «Профайлинг» научит «читать людей» по невербальным признакам, выявлять скрытые намерения собеседника и прогнозировать действия оппонента.
Читайте нас в Telegram — wikium
Факультет психологии
КУРСОВАЯ РАБОТА. НАЧАЛО
Уважаемые исследователи, выполняющие курсовые работы!

Курсовая работа – это исследование по определённой теме в рамках одной из отраслей психологии.

Вы погружаетесь в тему, изучаете её глубже, чем в учебнике.

? С чего начать?

Шаг 1. Понять, что такое курсовая работа.

Рекомендации помогут вам. Мы с коллегами их разработали специально для вас.

Как их найти: заходите на сайт факультета психологии, выбираете раздел «Студентам», там «Рекомендации по написанию курсовой работы». Нажимаете на ссылку.

Вот вам прямая ссылка

https://psychology.tversu.ru/pages/1039

Шаг 2. Посмотреть образцы

Добро пожаловать на кафедры. Обратитесь к методистам, посмотрите опыт ваших более старших коллег – студентов, которые уже выполнили курсовые. Подержите сей труд в руках, бумажный, переплетённый.

Шаг 3. Определиться с темой

Выбирайте, что актуально для отрасли (например, возрастной психологии) и что интересно лично Вам. По интересной теме курсовая пишется куда приятней.

Можно изыскать самим, можно обратиться за предложениями к научному руководителю.

Пример темы

«Конфликтное поведение в подростковом возрасте»

Курсовая работа по возрастной психологии, следовательно, нужно раскрыть особенности подросткового возраста.

Рассмотреть понятия «конфликт», «конфликтное поведение», изучить специфику проявления конфликтного поведения у подростков».

Вперёд!..

Всем успехов!

ЧЕМ НАПОЛНИТЬ КУРСОВУЮ РАБОТУ. СТРУКТУРА
Внимание начинающим исследователям!

Курсовая работа по возрастной психологии и психологии развития.

Изучаются психические процессы, свойства личности, состояния в разные возрастные периоды.

ВАЖНО показать специфику психики в определённом возрасте.

Можно изучать: детство, подростковый возраст, юношеский возраст, молодость, зрелость, пожилой возраст, старость.

КАК ПИСАТЬ ТЕОРЕТИЧЕСКУЮ ГЛАВУ

Краткая схема примерно такая:

Описать явление: понятие, структура, классификации и т.д.

Описать возрастной период.

Особенности явления в этот возрастной период.

Более подробно, что может быть:

1. Определение понятия, теоретические подходы различных исследователей.

2. Структура явления.

3. Сопоставление (или связи) с другими подобными или более общими явлениями.

4. Виды явления, классификации.

5. Причины, породившие явление. Факторы, обуславливающее явление.

6. Различия у разных групп (разных по полу, возрасту, этнической принадлежности и т.д.)

7. Обзор эмпирических исследований последних лет (отечественных и зарубежных).

8. Методы исследования явления.

9. Практическое применение. Методы воздействия.

ПРИМЕР

Тема: «Особенности проявления жизнестойкости в юношеском и взрослом возрасте».

Тогда структура теоретической главы может быть такой:

1. Определение жизнестойкости в психологии, теоретические подходы.

2. Структурные компоненты жизнестойкости: вовлечённость, контроль, принятие риска.

3. Соотношение понятий «жизнестойкость», «стрессоустойчивость» и «копинг-поведение».

4. Специфика юношеского возраста.

5. Специфика взрослости как возрастного периода.

6. Обзор результатов эмпирических исследований жизнестойкости в разные возрастные периоды.

7. Сравнительный анализ проявления жизнестойкости в юношеском и взрослом возрасте.

! Научная литература берётся из достоверных источников.

Литература должна быть написана специалистами в своей предметной области.

У источника должен быть автор, даже если это статья с сайта.

Вы используете: статьи, материалы конференций, монографии, диссертации.

Мало и при необходимости используете учебники.

Не используете: сайты типа studfiles, Википедия и т.д.

Вперёд!..

Всем успехов!

ЗАЧЕМ СТУДЕНТУ ПСИХОЛОГУ ИССЛЕДОВАТЕЛЬСКИЕ УМЕНИЯ
Зачем писать курсовые работы и ВКР – выпускные квалификационные?

1. Сначала нужен анализ проблемы, потом выбор средств и воздействие.

2. Возможность после выпуска устроиться на работу в исследовательский центр.

3. «Математику уже затем учить надо, что она ум в порядок приводит» М.В. Ломоносов.

ПУНКТ 1.

1. Сначала нужен анализ проблемы, потом выбор средств и только потом – воздействие.

Чтобы работать с проблемой, её нужно сначала изучить, прежде чем начинать оказывать психологическую помощь личности или группе, нужно провести диагностику. Сразу бросаются давать рекомендации только маги, экстрасенсы и некомпетентные специалисты. Ну и обыватели с фразами «ты себя накручиваешь», «тебе просто надо быть позитивным» и т.д.

Как мы можем понять, что у определённой социальной группы есть психологические проблемы? Или в чём людям стоит развиваться, что корректировать, какие формировать умения и т.д. Как определить уровень, например, коммуникативности или преобладающие стратегии копинг-поведения?

Провести диагностику, применяя надёжные и валидные методики: тесты, анкеты, интервью, анализ документов.

Рассмотрим на конкретном примере.

Пример.

Допустим, вы устроились психологом в организацию, в службу персонала. Руководитель предприятия ставит перед вами задачу – снизить уровень стресса у сотрудников.

Что делать?

А) Подойти к каждому сотруднику и сказать ему: «Ты себя накручиваешь, просто будь позитивным».

Б) «Погуглить», какие есть техники по работе со стрессом, первые штук 10 распечатать и бежать к работникам, реализовывать на всех.

В) Провести диагностику стресса, изучить другие факторы, обуславливающие стресс (применяя тестирование, интервьюирование). Сформировать группу, с которой будете работать. Выделить терапевтические мишени. Подобрать психологические техники воздействия. Разработать программу тренинга или программу психологического сопровождения.

Пожалуй, вариант действий очевиден.

Таким образом, сначала диагностика и анализ ситуации, только потом – воздействие.

ПУНКТ 2. Можно после выпуска устроиться на работу в исследовательский центр. Можно решать трудовые задачи, где нужны исследовательские умения.

«Ты молод, амбициозен, креативен, общителен? А делать что-нибудь умеешь?» (из анекдота)

Если соискатель затрудняется ответить, это плохо. Я уже вижу, как работодатели скептически поднимают вверх бровь, вздыхают и переглядываются.

Про курсовые.

Минимум требований – изучить проблему на теоретическом уровне.

Для этого студенту автору нужно ориентироваться в предметной области своей работы. Например, курсовая по общей психологии «Мотивация субъекта деятельности». Понятие «деятельность» изучает только психология? Нет. Но поскольку работа не по менеджменту, не по социологии, не по педагогике, не по философии… нужно изучить определения и подходы именно в психологии. Идём от общего к частному, определились, что курсовая по психологии, по общей психологии, значит, изучаем деятельность и мотивацию в целом, описываем различные виды деятельности: игровую, учебную, трудовую.

Рассмотрим разные фундаментальные отрасли.

Общая психология – психические процессы, состояния, свойства в целом.

Возрастная психология – процессы, состояния, свойства на разных возрастных этапах. Пример темы: «Особенности мотивации учебной деятельности школьников подросткового и юношеского возраста».

Социальная психология – психические явления, связанные с включённостью в группы, с социальным взаимодействием. Пример темы: «Особенности мотивации трудовой деятельности русских и китайцев как различных этнических общностей».

Организационная психология – психические явления, связанные с включённость в организацию. Пример темы: «Особенности трудовой мотивации сотрудников промышленных предприятий в контексте разных организационных культур».

Если студент принёс на защиту курсовую не соответствующую заявленной предметной области, а того хуже – направлению подготовки, я уже вижу, как члены комиссии хмурят лица и переглядываются.

Психологи могут работать в команде с другими специалистами. Например, на маркетинговых исследованиях или политических опросах.

ПУНКТ 3. «Математику уже затем учить надо, что она ум в порядок приводит» М.В. Ломоносов.

И математику, и логику, и методологию исследований и экспериментальную психологию. Всё пригодится!

Дело в том, что исследователю нужно уметь перевести идеи в эмпирические показатели. Реальность, которую мы наблюдаем, явления, на которые жалуются клиенты описать психологическим языком, используя научные термины. Мало того, нужно подобрать инструмент для измерения этих явлений. Надёжные и валидные методики.

Рассмотрим на примере.

Пример

Предположим, что мы изучаем такую проблему – как помочь людям привыкнуть к новой работе. Или даже не к новому месту работы, а вообще к работе – к новой для человека деятельности.

Опять же нужно описать проблему психологическим языком.

Обычная житейская формулировка: «Что влияет на привыкание человека к новой работе».

Но такую фразу никто на свой титульный лист курсовой или дипломной работы не вынесет. Да и не нужно. (Ни в коем случае так не делайте!)

Привыкание ≈ адаптация (≈ это знак из математики «приближённо равно»), «что влияет» ≈ факторы, человек ≈ личность, «к новой работе» ≈ организация, трудовая деятельность, освоение профессиональной роли.

Формулировка психологическими терминами: «Факторы адаптации личности к профессиональной роли в организации».

Начать нужно с понимания того, что значит в психологии «адаптация»: в общей, в социальной, в организационной. Как её можно измерить? Можно. Существуют тестовые методики.

Далее, изучаем, что её обуславливает. Возможно, такие характеристики личности как гибкость, ответственность, жизнестойкость, склонность к риску. Подбираем соответствующий инструментарий для их измерения… Измерили.

Теперь нам нужно доказать, что они действительно связаны с адаптацией сотрудника. Просто разглядывая таблицы с сырыми данными это сделать невозможно. Здесь снова нам приходит на помощь математика. (Снова, потому что тестовые методики были разработаны их авторами с использованием математической статистики).

Например. Применяем корреляционным анализ, ищем взаимосвязь между шкалой «адаптация» и субшкалами жизнестойкости: «вовлечённость», «контроль», «склонность к риску». Что такое «r»? Буковка? Не только, это коэффициент корреляции! Допустим, обнаружена взаимосвязь между адаптацией и склонностью к риску r = 0,501. Этот показатель говорит о средней по силе корреляции между адаптацией сотрудника и его склонностью к риску, чем выше один показатель, тем выше другой. Предположим, связи с другими субшкалами так же есть. Гипотезы подтвердились.

Как нам может пригодиться эта информация? Если показатели взаимосвязаны, то увеличивая один можно увеличить и другой. Логично? На основе результатов исследования можно разработать программу тренинга жизнестойкости, где когнитивными методами будет проведена работа с развитием компонентов жизнестойкости вовлечённость, контролем, принятием риска. Когнитивными, потому что каждый компонент – это убеждения человека, и в целом жизнестойкость это система убеждений о себе, о мире, об отношениях с миром (как гласит книга).

Набираем экспериментальную группу из товарищей с низкими и средними показателями адаптации, ибо именно им нужна помощь. Набираем контрольную группу из таких же товарищей. Проводим серию встреч в рамках тренинга жизнестойкости с экспериментальной группой в объёме, скажем 24 часа. Проводим замеры адаптации и жизнестойкости после тренинга, осуществляем анализ достоверности различий (скажем, по критерию Вилкоксона)… Есть! Различия достоверны! А это говорит о чём? Ваш тренинг работает. Доказано математическими методами. Вы великолепны!

Итак, минимальные умения необходимые исследователю:

Определять предметную область работы.

Формулировать цель, разбивать цель на задачи.

Анализировать и структурировать информацию.

Если вы обладаете этими умениями, это уже хорошо.

Информация из многолетнего опыта множества людей.

Про алгоритм
ПОЙДИ ТУДА, НЕ ЗНАЮ КУДА, ПРИНЕСИ ТО, ЗНАЮ ЧТО

Предположим, вы устроились на работу, и начальник ставит перед вами задачу в стиле «Пойди туда, не знаю куда, принеси то, не знаю что». Что принести он, скорее всего, знает, но как это делается – это уже ваши проблемы. Собрать информацию, разработать документацию, привести делегацию, разобрать инсталляцию…

Если же вариант: пойди туда, знаю, куда, принеси то, знаю, что + знаю как. Возьми алгоритм, здесь всё написано. Прекрасно! Perfectamente! (испан.) Да просто muy bien. Можно разве что сказать: «Спасибо, директор!» и для убедительности слегка поклониться.

В работе психолога тоже есть работа по алгоритму. А как же. Например:

1. Работа с проективной рисуночной методикой. Есть инструкция респонденту, есть вопросы для пострисуночного опроса, есть ключ для интерпретации.

2. Тренинг. Есть план, описание упражнений, инструкции участникам.

Но и здесь что-то может пойти не так, могут возникнуть внештатные ситуации. Например, участник тренинга может после какого-то упражнения заплакать и убежать. И что делать? Или два члена группы вдруг начали драться. Что же делать? Как же быть?

В деятельности психолога также есть формы работы, где нет чёткого алгоритма, есть общая схема. Например, консультирование – индивидуальная работа с клиентом по решению психологической проблемы. Есть этапы работы: установление контакта, сбор информации по проблеме, формулирование запроса и т.д. Но люди все разные, их проблемы тоже, консультанту приходится быстро соображать, действовать по ситуации, клиента ведь на паузу не поставишь.

Мораль: если вам в рабочей ситуации вручили задачу + алгоритм выполнения – это хорошо. Если только задачу без готового алгоритма, и при этом вы справились, то вы восхитительны!

#алгоритм #рабочаязадача #пойдитуда

P.S. Текст авторский. Идеи из жизни. Картинки из сети Интернет

Надежность и валидность в исследованиях

Надежность и валидность — это концепции, используемые для оценки качества исследования. Они показывают, насколько хорошо метод, техника или тест что-то измеряет. Надежность — это постоянство меры, а достоверность — ее точность.

Важно учитывать надежность и обоснованность при разработке дизайна исследования, планировании методов и оформлении результатов, особенно в количественных исследованиях.

Надежность и действительность

Надежность Срок действия

Что он вам говорит? Степень, в которой могут быть воспроизведены результаты при повторении исследования в тех же условиях. Степень, в которой результаты действительно измеряют то, что они должны измерять.

Как это оценивается? Путем проверки согласованности результатов во времени, разными наблюдателями и по частям самого теста. Путем проверки того, насколько хорошо результаты соответствуют установленным теориям и другим показателям той же концепции.

Как они связаны? Надежное измерение не всегда верно: результаты могут быть воспроизводимыми, но не обязательно правильными. Действительное измерение обычно надежно: если тест дает точные результаты, они должны быть воспроизводимыми.

Понимание надежности и действительности

Надежность и достоверность тесно связаны, но означают разные вещи.Измерение может быть надежным, но не действительным. Однако, если результат измерения верен, он обычно также надежен.

Что такое надежность?

Надежность означает, насколько последовательно метод что-то измеряет. Если один и тот же результат может быть стабильно достигнут с помощью одних и тех же методов при одних и тех же обстоятельствах, измерение считается надежным.

Вы измеряете температуру жидкой пробы несколько раз в одинаковых условиях. Термометр каждый раз показывает одну и ту же температуру, поэтому результаты надежны.

Врач использует анкету по симптомам, чтобы поставить диагноз пациенту с длительным заболеванием. Несколько разных врачей используют одну и ту же анкету с одним и тем же пациентом, но ставят разные диагнозы. Это указывает на низкую надежность анкеты как показателя состояния.

Что такое срок действия?

Действительность означает, насколько точно метод измеряет то, что он предназначен для измерения. Если исследование имеет высокую достоверность, это означает, что оно дает результаты, соответствующие реальным свойствам, характеристикам и вариациям в физическом или социальном мире.

Высокая надежность — один из индикаторов правильности измерения. Если метод ненадежен, вероятно, он недействителен.

Если термометр каждый раз показывает разные температуры, даже если вы тщательно контролировали условия, чтобы температура образца оставалась неизменной, возможно, термометр неисправен, и, следовательно, его измерения недействительны.

Если вопросник по симптомам дает надежный диагноз, если ответы на него даны в разное время и у разных врачей, это означает, что он имеет высокую достоверность для измерения состояния здоровья.

Однако одной надежности недостаточно для обеспечения действительности. Даже если тест надежен, он может неточно отражать реальную ситуацию.

Термометр, который вы использовали для проверки образца, дает надежные результаты. Однако термометр не откалиброван должным образом, поэтому результат на 2 градуса ниже истинного значения. Следовательно, измерение недействительно.

Группа участников проходит тест, предназначенный для измерения рабочей памяти. Результаты надежны, но оценки участников сильно коррелируют с их уровнем понимания прочитанного.Это указывает на то, что метод может иметь низкую валидность: тест может измерять понимание прочитанного участниками вместо их рабочей памяти.

Достоверность оценить сложнее, чем надежность, но она даже важнее. Чтобы получить полезные результаты, методы, которые вы используете для сбора данных, должны быть действительными: исследование должно измерять то, что, по его утверждению, измеряется. Это гарантирует, что ваше обсуждение данных и сделанные вами выводы также будут правильными.

Как оцениваются надежность и достоверность?

Надежность можно оценить, сравнивая разные версии одного и того же измерения.Валидность оценить сложнее, но ее можно оценить, сравнив результаты с другими соответствующими данными или теорией. Методы оценки надежности и достоверности обычно делятся на разные типы.

Виды надежности

Различные типы надежности можно оценить с помощью различных статистических методов.

Виды надежности

Тип надежности Что он оценивает? Пример

Повторное испытание Согласованность меры во времени : получаете ли вы те же результаты, когда повторяете измерение? Группа участников заполняет анкету, предназначенную для измерения личностных качеств.Если они повторяют анкету с интервалом в несколько дней, недель или месяцев и дают одинаковые ответы, это указывает на высокую надежность повторного тестирования.

Интеррейтер Согласованность показателя между оценщиками или наблюдателями : получаете ли вы одинаковые результаты, когда разные люди проводят одно и то же измерение? На основании контрольного списка критериев оценки пять экзаменаторов представляют существенно разные результаты по одному и тому же студенческому проекту. Это указывает на то, что контрольный список для оценки имеет низкую межэкспертную надежность (например, потому, что критерии слишком субъективны).

Внутренняя согласованность Стабильность самого измерения : получаете ли вы одинаковые результаты в разных частях теста, которые предназначены для измерения одного и того же? Вы разрабатываете анкету для измерения самооценки. Если вы случайным образом разделите результаты на две половины, между двумя наборами результатов должна быть сильная корреляция. Если два результата сильно различаются, это указывает на низкую внутреннюю согласованность.

Виды действия

Достоверность измерения можно оценить на основе трех основных типов свидетельств.Каждый тип можно оценить с помощью экспертных оценок или статистических методов.

Виды действия

Срок действия Что он оценивает? Пример

Конструкция Приверженность меры существующей теории и знаниям измеряемой концепции. Анкета самооценки может быть оценена путем измерения других черт, которые, как известно, или предположительно связаны с концепцией самооценки (например, социальные навыки и оптимизм).Сильная корреляция между оценками самооценки и связанных с ними черт может указывать на высокую валидность конструкта.

Содержание Степень, в которой измерение охватывает все аспекты измеряемой концепции. Тест, целью которого является определение уровня испанского языка учащимися, содержит компоненты чтения, письма и говорения, но не аудирование. Эксперты согласны с тем, что понимание на слух является важным аспектом языковых навыков, поэтому тесту недостает валидности содержания для измерения общего уровня владения испанским языком.

Критерий Степень, в которой результат меры соответствует другим действительным показателям той же концепции. Опрос проводится для измерения политических взглядов избирателей в регионе. Если результаты точно предсказывают более поздний исход выборов в этом регионе, это указывает на то, что опрос имеет высокую достоверность критериев.

Чтобы оценить достоверность причинно-следственной связи, вам также необходимо учитывать внутреннюю достоверность (план эксперимента) и внешнюю достоверность (обобщаемость результатов).

Какая у вас оценка за плагиат?

Сравните вашу статью с более чем 60 миллиардами веб-страниц и 30 миллионами публикаций.

Лучшая программа для проверки плагиата 2020 года

Отчет о плагиате и процентное содержание

Самая большая база данных о плагиате

Scribbr Проверка на плагиат

Как обеспечить обоснованность и надежность вашего исследования

Надежность и достоверность ваших результатов зависит от создания четкого плана исследования, выбора подходящих методов и образцов, а также тщательного и последовательного проведения исследования.

Гарантия действительности

Если вы используете баллы или рейтинги для измерения вариаций чего-либо (например, психологических черт, уровней способностей или физических свойств), важно, чтобы ваши результаты как можно точнее отражали реальные вариации. Достоверность следует учитывать на самых ранних этапах вашего исследования, когда вы решаете, как вы будете собирать свои данные.

Выберите подходящие методы измерения

Убедитесь, что ваш метод и техника измерения имеют высокое качество и позволяют точно измерять то, что вы хотите знать.Они должны быть тщательно изучены и основаны на существующих знаниях.

Например, для сбора данных о чертах личности вы можете использовать стандартизированный вопросник, который считается надежным и действительным. Если вы разрабатываете свой собственный вопросник, он должен основываться на установленной теории или результатах предыдущих исследований, а вопросы должны быть тщательно и точно сформулированы.

Для получения достоверных обобщаемых результатов четко определите исследуемую популяцию (например,люди определенного возраста, географического положения или профессии). Убедитесь, что у вас достаточно участников и что они репрезентативны для населения.

Обеспечение надежности

Надежность следует учитывать на протяжении всего процесса сбора данных. Когда вы используете инструмент или методику для сбора данных, важно, чтобы результаты были точными, стабильными и воспроизводимыми.

Применяйте свои методы последовательно

Тщательно спланируйте свой метод, чтобы убедиться, что вы выполняете одни и те же шаги одинаково для каждого измерения.Это особенно важно, если задействовано несколько исследователей.

Например, если вы проводите интервью или наблюдения, четко определите, как будут учитываться конкретные действия или ответы, и убедитесь, что вопросы каждый раз формулируются одинаково.

Стандартизируйте условия вашего исследования

При сборе данных старайтесь, чтобы обстоятельства были как можно более согласованными, чтобы уменьшить влияние внешних факторов, которые могут привести к изменению результатов.

Например, в экспериментальной установке убедитесь, что всем участникам предоставлена одинаковая информация и они протестированы в одинаковых условиях.

Где написать о надежности и обоснованности в диссертации

Уместно обсуждать надежность и обоснованность в различных разделах вашей диссертации или диссертации. Демонстрация того, что вы приняли их во внимание при планировании своего исследования и интерпретации результатов, делает вашу работу более достоверной и заслуживающей доверия.

Надежность и обоснованность в дипломной работе

Раздел Обсудить

Обзор литературы Что сделали другие исследователи для разработки и улучшения надежных и действенных методов?

Методология Как вы планировали свое исследование, чтобы гарантировать надежность и обоснованность используемых мер? Это включает в себя выбранный набор и размер образца, подготовку образца, внешние условия и методы измерения.

Результаты Если вы рассчитываете надежность и достоверность, укажите эти значения вместе с основными результатами.

Обсуждение Это момент, чтобы поговорить о том, насколько надежными и достоверными были ваши результаты. Были ли они последовательны и отражали истинные ценности? Если нет, то почему?

Заключение Если надежность и достоверность были большой проблемой для ваших выводов, было бы полезно упомянуть об этом здесь.

4 типа достоверности

В количественном исследовании вы должны учитывать надежность и достоверность ваших методов и измерений.

Validity показывает, насколько точно метод что-то измеряет. Если метод измеряет то, что, по его утверждению, измеряется, и результаты близко соответствуют реальным значениям, то его можно считать действительным. Выделяют четыре основных типа срока действия:

Обратите внимание, что в этой статье рассматриваются типы проверки достоверности, которые определяют точность фактических компонентов меры.Если вы проводите экспериментальное исследование, вам также необходимо учитывать внутреннюю и внешнюю валидность, которая связана с планом эксперимента и обобщаемостью результатов.

Срок действия конструкции

Construct validity оценивает, действительно ли инструмент измерения представляет то, что мы хотим измерить. Это важно для определения общей валидности метода.

Что такое конструкция?

Конструкт относится к понятию или характеристике, которую нельзя непосредственно наблюдать, но можно измерить, наблюдая за другими связанными с ней индикаторами.

Конструкции могут быть характеристиками людей, такими как интеллект, ожирение, удовлетворенность работой или депрессия; они также могут быть более широкими концепциями, применяемыми к организациям или социальным группам, например гендерное равенство, корпоративная социальная ответственность или свобода слова.

Пример

Не существует объективной, наблюдаемой сущности, называемой «депрессией», которую мы могли бы измерить напрямую. Но, основываясь на существующих психологических исследованиях и теории, мы можем измерить депрессию на основе набора симптомов и показателей, таких как низкая уверенность в себе и низкий уровень энергии.

Что такое конструктивная валидность?

Достоверность конструкции — это гарантия того, что метод измерения соответствует конструкции, которую вы хотите измерить. Если вы разрабатываете анкету для диагностики депрессии, вам необходимо знать: действительно ли анкета измеряет конструкт депрессии? Или это на самом деле измерение настроения, самооценки респондента или какой-то другой конструкт?

Для достижения достоверности построения вы должны убедиться, что ваши индикаторы и измерения тщательно разработаны на основе соответствующих существующих знаний.Анкета должна включать только релевантные вопросы, которые измеряют известные индикаторы депрессии.

Остальные типы валидности, описанные ниже, могут рассматриваться как формы свидетельства конструктивной валидности.

Срок действия

Достоверность содержимого определяет, является ли тест репрезентативным для всех аспектов конструкции.

Для получения достоверных результатов содержание теста, опроса или метода измерения должно охватывать все относящиеся к делу части предмета, который он нацелен на измерение.Если некоторые аспекты отсутствуют в измерении (или если включены нерелевантные аспекты), достоверность оказывается под угрозой.

Пример

Учитель математики разрабатывает в конце семестра тест по алгебре для своего класса. Тест должен охватывать все формы алгебры, изучаемые в классе. Если исключить некоторые виды алгебры, то результаты могут не быть точным показателем понимания учащимися предмета. Точно так же, если она включает вопросы, не связанные с алгеброй, результаты больше не являются действительной мерой знаний алгебры.

Получение отзывов о языке, структуре и макете

Профессиональные редакторы корректируют и редактируют вашу статью, уделяя особое внимание:

Академический стиль

Расплывчатые предложения

Грамматика

Единообразие стиля

См. Пример

Срок действия

Face validity учитывает, насколько подходящим содержание теста кажется на первый взгляд.Это похоже на валидность контента, но фактическая валидность — это более неформальная и субъективная оценка.

Пример

Вы создаете опрос, чтобы измерить регулярность пищевых привычек людей. Вы просматриваете пункты опроса, в которых задаются вопросы о каждом приеме пищи в течение дня и перекусах, которые вы съели в перерывах на каждый день недели. На первый взгляд, опрос кажется хорошим представлением того, что вы хотите протестировать, поэтому вы считаете, что он имеет высокую достоверность.

Поскольку фактическая достоверность является субъективной мерой, ее часто считают самой слабой формой достоверности.Однако это может быть полезно на начальных этапах разработки метода.

Срок действия критерия

Criterion validity оценивает, насколько близко результаты вашего теста соответствуют результатам другого теста.

Что такое критерий?

Критерий — это внешнее измерение того же самого. Обычно это установленный или широко используемый тест, который уже считается действительным.

Что такое критерий действительности?

Чтобы оценить достоверность критерия, вы вычисляете корреляцию между результатами вашего измерения и результатами измерения критерия.Если существует высокая корреляция, это свидетельствует о том, что ваш тест измеряет то, что он намеревается измерять.

Пример

Профессор университета создает новый тест для измерения уровня владения английским языком абитуриентов. Чтобы оценить, насколько хорошо этот тест действительно измеряет письменные способности учащихся, она находит существующий тест, который считается действительным измерением навыков письма на английском языке, и сравнивает результаты, когда одна и та же группа учащихся сдает оба теста. Если результаты очень похожи, новый тест имеет высокий критерий достоверности.

Надежность и достоверность измерения — Методы исследования в психологии — 2-е канадское издание

Определите надежность, включая различные типы и способы их оценки.

Определите срок действия, включая различные типы и способы их оценки.

Опишите виды доказательств, которые могут иметь отношение к оценке надежности и действительности той или иной меры.

Опять же, измерение включает в себя присвоение баллов отдельным лицам, чтобы они отражали некоторые характеристики людей.Но как исследователи узнают, что оценки на самом деле представляют характеристику, особенно если это такие конструкты, как интеллект, самооценка, депрессия или объем рабочей памяти? Ответ заключается в том, что они проводят исследование, используя эту меру, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции. Это очень важный момент. Психологи не просто предполагают, что их меры работают. Вместо этого они собирают данные для , чтобы продемонстрировать , что они работают.Если их исследование не демонстрирует, что мера работает, они прекращают ее использовать.

В качестве неформального примера представьте, что вы сидите на диете в течение месяца. Ваша одежда кажется более свободной, и несколько друзей спросили, похудели ли вы. Если в этот момент ваши весы для ванной показывают, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжили бы пользоваться весами. Но если бы это указывало на то, что вы набрали 10 фунтов, вы бы справедливо пришли к выводу, что он сломан, и либо почините его, либо избавьтесь от него.Оценивая метод измерения, психологи принимают во внимание два основных аспекта: надежность и валидность.

Надежность — это постоянство меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (надежность между экспертами).

Тестирование-повторное тестирование надежности
Когда исследователи измеряют конструкт, который, по их мнению, является непротиворечивым во времени, полученные ими оценки также должны быть согласованными во времени.Надежность повторного тестирования — это степень, в которой это действительно так. Например, обычно считается, что интеллект постоянен во времени. Человек, который сегодня очень умный, на следующей неделе станет очень умным. Это означает, что любой хороший показатель интеллекта должен дать этому человеку примерно такие же оценки на следующей неделе, что и сегодня. Ясно, что мера, которая дает очень непоследовательные оценки с течением времени, не может быть очень хорошей мерой конструкции, которая должна быть согласованной.

Оценка надежности повторного тестирования требует одновременного использования этого показателя на группе людей, повторного его использования на той же группе людей позднее, а затем анализа корреляции между тестами и повторными тестами между двумя наборами оценок. Обычно это делается путем построения графика данных в виде диаграммы рассеяния и вычисления r Пирсона. На рис. 5.2 показана корреляция между двумя наборами оценок нескольких студентов университетов по шкале самооценки Розенберга, введенной два раза с интервалом в неделю.Коэффициент Пирсона для этих данных равен +,95. Обычно считается, что корреляция между тестами и повторными тестами +80 или выше указывает на хорошую надежность.
Рисунок 5.2 Корреляция между тестами и повторными тестами между двумя наборами оценок нескольких студентов по шкале самооценки Розенберга, полученными два раза в неделю с разницей
. время, которое относится к интеллекту, самооценке и измерениям личности Большой пятерки.Но другие конструкции не считаются стабильными с течением времени. Например, сама природа настроения такова, что оно меняется. Таким образом, показатель настроения, который дает низкую корреляцию между тестами и повторными тестами в течение месяца, не будет поводом для беспокойства.

Внутренняя согласованность
Второй вид надежности — это внутренняя согласованность, то есть согласованность ответов людей по всем пунктам при измерении нескольких пунктов. В целом предполагается, что все элементы таких показателей отражают одну и ту же основную конструкцию, поэтому оценки людей по этим вопросам должны коррелировать друг с другом.По шкале самооценки Розенберга люди, которые согласны с тем, что они достойные люди, должны соглашаться с тем, что у них есть ряд хороших качеств. Если ответы людей на разные вопросы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же основную конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самооценки. Например, люди могут сделать серию ставок в имитируемой игре в рулетку, чтобы измерить свой уровень стремления к риску.Этот показатель будет внутренне согласованным в той степени, в которой ставки отдельных участников будут постоянно высокими или низкими в ходе испытаний.

Как и надежность повторного тестирования, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов — посмотреть на корреляцию разделенных половин. Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четным и нечетным номерами. Затем для каждого набора элементов вычисляется оценка и исследуется взаимосвязь между двумя наборами оценок.Например, на рис. 5.3 показана корреляция между двумя частицами между оценками нескольких студентов университетов по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга. Коэффициент r Пирсона для этих данных равен +,88. Корреляция разделенных половин, равная +80 или больше, обычно считается хорошей внутренней согласованностью.
Рис. 5.3. Корреляция между разделами и половинками между оценками нескольких студентов колледжей по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга
. Возможно, наиболее распространенной мерой внутренней согласованности, используемой исследователями в области психологии, является статистика называется α Кронбаха (греческая буква альфа).Концептуально α — это среднее значение всех возможных корреляций разделенных половин для набора элементов. Например, существует 252 способа разделить набор из 10 элементов на два набора по пять. Α Кронбаха будет средним из 252 корреляций разделенных половин. Обратите внимание, что на самом деле α вычисляется не так, но это правильный способ интерпретации значения этой статистики. Опять же, обычно используется значение +80 или больше, чтобы указать на хорошую внутреннюю согласованность.

Надежность Interrater
Многие поведенческие меры требуют значительного суждения со стороны наблюдателя или оценщика.Межэкспертная надежность — это степень, в которой разные наблюдатели едины в своих суждениях. Например, если вы хотите измерить социальные навыки студентов университета, вы можете сделать видеозаписи их взаимодействия с другим студентом, с которым они встречаются впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той степени, в которой каждый участник действительно обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом.Надежность между экспертами также могла быть измерена в исследовании куклы Бобо Бандуры. В этом случае оценки наблюдателей того, сколько актов агрессии совершил конкретный ребенок во время игры с куклой Бобо, должны были иметь очень положительную корреляцию. Надежность между экспертами часто оценивается с помощью α Кронбаха, когда суждения являются количественными, или аналогичной статистики, называемой κ Коэна (греческая буква каппа), когда они категоричны.

Достоверность — это степень, в которой баллы меры представляют переменную, для которой они предназначены.Но как исследователи делают такое суждение? Мы уже учли один фактор, который они учитывают, — надежность. Если показатель имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки соответствуют тому, что им положено. Однако здесь должно быть что-то еще, потому что мера может быть чрезвычайно надежной, но совершенно бесполезной. В качестве абсурдного примера представьте человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам.Хотя эта мера имела бы чрезвычайно хорошую надежность повторного тестирования, она не имела бы абсолютно никакой ценности. Тот факт, что указательный палец одного человека на сантиметр длиннее, чем у другого, ничего не говорит о том, у кого из них более высокая самооценка.

Обсуждения валидности обычно делят его на несколько различных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды свидетельств, помимо надежности, которые следует принимать во внимание при оценке достоверности меры.Здесь мы рассматриваем три основных типа: валидность лица, валидность содержания и валидность критерия.

Лицевая достоверность
Лицевая достоверность — это степень, в которой метод измерения проявляется «на лице» для измерения интересующей конструкции. Большинство людей ожидают, что в анкету для самооценки будут включены вопросы о том, считают ли они себя достойным человеком и считают ли они себя хорошими. Таким образом, анкета, включающая такие вопросы, будет иметь хорошую внешнюю валидность.С другой стороны, метод измерения самооценки на расстоянии пальца, похоже, не имеет ничего общего с самооценкой и, следовательно, имеет низкую достоверность. Хотя фактическая валидность может быть оценена количественно — например, с помощью большой выборки людей, оценивающих меру с точки зрения того, действительно ли она измеряет то, для чего она предназначена, — обычно она оценивается неформально.

Фактическая достоверность — это в лучшем случае очень слабое свидетельство того, что метод измерения измеряет то, что должен.Одна из причин заключается в том, что это основано на интуиции людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепринятые меры в психологии работают достаточно хорошо, несмотря на недостаточную достоверность. Миннесотский многофазный опросник личности-2 (MMPI-2) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, причем многие из утверждений не имеют очевидного отношения к конструкции, которую они измеряют .Например, пункты «Мне нравятся детективы или детективы» и «Вид крови не пугает меня и не вызывает тошноту», оба измеряют подавление агрессии. В данном случае интерес представляют не буквальные ответы участников на эти вопросы, а, скорее, соответствие модели ответов участников на серию вопросов ответам людей, которые склонны подавлять свою агрессию.

Срок действия
Достоверность содержания — это степень, в которой мера «покрывает» интересующий конструкт.Например, если исследователь концептуально определяет тестовую тревогу как связанную как с активацией симпатической нервной системы (ведущей к нервным переживаниям), так и с негативными мыслями, то его мера тестовой тревожности должна включать вопросы как о нервных переживаниях, так и о негативных мыслях. Или подумайте, что отношения обычно определяются как связанные с мыслями, чувствами и действиями по отношению к чему-либо. Согласно этому концептуальному определению, человек положительно относится к упражнениям в той мере, в какой он или она думает о тренировках положительно, чувствует себя хорошо во время тренировок и фактически занимается спортом.Таким образом, чтобы иметь хорошую достоверность содержания, показатель отношения людей к упражнениям должен отражать все три этих аспекта. Как и фактическая достоверность, достоверность содержания обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.

Срок действия критерия
Достоверность критерия — это степень, в которой оценки людей по критерию коррелируют с другими переменными (известными как критерии), с которыми можно было бы ожидать их корреляции.Например, оценки людей по новому критерию тревожности при тестировании должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что оценки людей на самом деле отрицательно коррелировали с их успеваемостью на экзамене, то это было бы доказательством того, что эти оценки действительно отражают тревогу людей перед тестированием. Но если бы выяснилось, что люди одинаково хорошо сдавали экзамен, независимо от их тестовой тревожности, это поставило бы под сомнение достоверность этой меры.

Критерием может быть любая переменная, которая, как есть основания полагать, должна коррелировать с измеряемым конструктом, и обычно их много. Например, можно было бы ожидать, что результаты теста на тревожность будут отрицательно коррелировать с результатами экзамена и оценками по курсу и положительно коррелировать с общим беспокойством и с артериальным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру принятия физического риска. Баллы людей по этому показателю должны соотноситься с их участием в «экстремальных» видах деятельности, таких как сноуборд и скалолазание, количеством полученных штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы.Когда критерий измеряется одновременно с построением, достоверность критерия упоминается как одновременная достоверность ; однако, когда критерий измеряется в какой-то момент в будущем (после того, как конструкция была измерена), он упоминается как предсказательная достоверность (поскольку оценки по этому показателю «предсказали» будущий результат).

Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые меры тестовой тревожности или принятия физического риска будут положительно коррелированы с существующими показателями тех же конструктов.Это известно как конвергентная достоверность .

Оценка конвергентной достоверности требует сбора данных с помощью меры. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самоотчета «Потребность в познании», чтобы измерить, насколько люди ценят и вовлечены в мышление (Cacioppo & Petty, 1982). В серии исследований они показали, что оценки людей положительно коррелировали с их оценками по стандартизированному тесту академических достижений, и что их оценки отрицательно коррелировали с их оценками по показателю догматизма (который представляет собой тенденцию к послушанию).За годы, прошедшие с момента создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и МакКаслин, 2009 г.).

Дискриминантная валидность
Дискриминантная валидность, с другой стороны, — это степень, в которой оценки по показателю , а не коррелируют с мерами переменных, которые концептуально различны.Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, которое бывает хорошим или плохим в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новый показатель самооценки был сильно коррелирован с показателем настроения, можно было бы утверждать, что новый показатель на самом деле не измеряет самооценку; вместо этого он измеряет настроение.

При создании шкалы потребности в познании Качиоппо и Петти также предоставили доказательства дискриминантной валидности, показав, что оценки людей не коррелировали с некоторыми другими переменными.Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части, или целостным образом в терминах «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их склонностью реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличную конструкцию.

Психологические исследователи не просто предполагают, что их меры работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что работают, они прекращают их использовать.

Есть два разных критерия, по которым исследователи оценивают свои измерения: надежность и валидность. Надежность — это постоянство во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между исследователями (надежность между экспертами). Достоверность — это степень, в которой оценки фактически представляют переменную, для которой они предназначены.

Действительность — это решение, основанное на различных типах доказательств. Соответствующие свидетельства включают надежность меры, то, покрывает ли она интересующий конструкт и коррелируют ли полученные оценки с другими переменными, с которыми они, как ожидается, коррелируют, а не коррелируют ли с переменными, которые концептуально различны.

Надежность и валидность меры устанавливаются не одним исследованием, а результатами нескольких исследований.Оценка надежности и достоверности — непрерывный процесс.

Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделенных половин (элементы с четным и нечетным номерами). Вы также можете вычислить r Пирсона, если знаете как.

Обсуждение: Вспомните последний экзамен в колледже, который вы сдавали, и думайте об этом как о психологической мере. Как вы думаете, для измерения какой конструкции она предназначалась? Прокомментируйте его лицо и достоверность содержания.Какие данные вы могли бы собрать, чтобы оценить их надежность и валидность критериев?

Что такое валидность в психологии

Методы исследования

Валидность

Что такое валидность?

Д-р Саул МакЛеод, опубликовано в 2013 г.

Что означает валидность в исследованиях?

Концепция достоверности была сформулирована Келли (1927, стр. 14), который заявил, что тест действителен, если он измеряет то, что, по его утверждению, измеряется.

Например, тест на интеллект должен измерять интеллект, а не что-то еще (например, память).

Различают внутреннюю и внешнюю действительность. Эти типы валидности имеют отношение к оценке валидности исследовательского исследования / процедуры.

Что такое внутренняя и внешняя валидность в исследованиях?

Внутренняя валидность относится к тому, вызваны ли эффекты, наблюдаемые в исследовании, манипулированием независимой переменной, а не каким-либо другим фактором.

Другими словами, существует причинно-следственная связь между независимой и зависимой переменной.

Внутренняя достоверность может быть улучшена за счет контроля посторонних переменных, использования стандартизированных инструкций, противовеса и исключения характеристик спроса и эффектов исследователя.

Внешняя валидность — это степень, в которой результаты исследования могут быть обобщены для других условий (экологическая валидность), других людей (популяционная валидность) и с течением времени (историческая валидность).

Внешнюю валидность можно улучшить, поставив эксперименты в более естественную обстановку и используя случайную выборку для отбора участников.

Оценка валидности теста

Оценка валидности теста

Существуют две основные категории валидности, используемые для оценки валидности теста (например, анкета, интервью, тест IQ и т. Д.): Содержание и критерий.

Что такое фактическая валидность в исследованиях?

Признание достоверности — это просто то, появляется ли тест (по номинальной стоимости) для измерения того, на что он претендует.Это наименее изощренная мера достоверности.

Тесты, цель которых ясна даже для наивных респондентов, считаются имеющими высокую достоверность. Соответственно, тесты, цель которых неясна, имеют низкую валидность (Nevo, 1985).

Прямое измерение валидности лица получают, когда людей просят оценить валидность теста, как им кажется. Этот оценщик может использовать шкалу Лайкерта для оценки достоверности лица. Например:

тест очень подходит для данной цели

тест очень подходит для этой цели;

тест адекватен

тест неадекватен

тест неактуален и, следовательно, не подходит

Важно выбрать подходящих людей для оценки теста (например.грамм. анкета, интервью, тест на IQ и т. д.). Например, люди, которые действительно проходят тест, будут иметь все возможности для оценки его достоверности.

Также люди, которые работают с тестом, могут высказать свое мнение (например, работодатели, администраторы университетов, работодатели). Наконец, исследователь может использовать представителей широкой общественности, интересующихся тестом (например, родителей испытуемых, политиков, учителей и т. Д.).

Фактическая валидность теста может считаться надежной конструкцией только в том случае, если между оценщиками существует разумный уровень согласия.

Следует отметить, что следует избегать использования термина «достоверность лица», когда оценка проводится «экспертом», поскольку достоверность содержимого является более подходящей.

Наличие фактической валидности не означает, что тест действительно измеряет то, что исследователь намеревается измерить, а только по мнению рейтеров, которые, по-видимому, делают это. Следовательно, это грубая и основная мера достоверности.

Такой тестовый элемент, как « Я недавно думал о самоубийстве », имеет очевидную внешнюю валидность как элемент, измеряющий суицидальные мысли, и может быть полезен при измерении симптомов депрессии.

Однако результаты тестов с явной валидностью заключаются в том, что они более уязвимы для предвзятости социальной желательности. Люди могут манипулировать своей реакцией, чтобы отрицать или скрывать проблемы, или преувеличивать свое поведение, чтобы представить себя в позитивном свете.

Возможно, что элемент тестирования не будет иметь лицевую достоверность, но все же будет иметь общую достоверность и измерить то, что, по его утверждению, измеряется. Это хорошо, потому что снижает характеристики спроса и затрудняет манипулирование респондентами своими ответами.

Например, элемент теста « Я верю во Второе пришествие Христа » будет недействителен как мера депрессии (поскольку цель элемента неясна).

Этот элемент появился в первой версии Миннесотского многофазного опросника личности (MMPI) и загружен в шкалу депрессии.

Поскольку большинство первоначальной нормативной выборки MMPI были хорошими христианами, только христианин в депрессии мог подумать, что Христос не вернется. Таким образом, для данного конкретного религиозного образца пункт имеет общую действительность, но не является действительным.

Что такое конструктная валидность в исследованиях?

Конструктивная валидность была изобретена Корнболлом и Милом (1955). Этот тип валидности относится к степени, в которой тест охватывает конкретную теоретическую конструкцию или признак, и перекрывается с некоторыми другими аспектами валидности

Конструктивная валидность не касается простого фактического вопроса о том, измеряет ли тест атрибут .

Напротив, речь идет о сложном вопросе о том, согласуются ли интерпретации результатов тестов с номологической сетью, включающей теоретические и наблюдательные термины (Cronbach & Meehl, 1955).

Для проверки достоверности конструкции необходимо продемонстрировать, что измеряемое явление действительно существует. Так, например, конструктивная валидность теста на интеллект зависит от модели или теории интеллекта.

Конструктивная валидность влечет за собой демонстрацию силы такой конструкции для объяснения сети результатов исследований и прогнозирования дальнейших взаимоотношений.

Чем больше доказательств валидности тестовой конструкции сможет продемонстрировать исследователь, тем лучше.Однако не существует единого метода определения валидности конструкции теста.

Вместо этого различные методы и подходы объединяются, чтобы представить общую конструктивную валидность теста. Например, можно использовать факторный анализ и корреляционные методы.

Что такое одновременная валидность в исследованиях?

Это степень, в которой тест соответствует внешнему критерию, который известен одновременно (т. Е. Происходит одновременно).

Если новый тест подтвержден сравнением с существующим в настоящее время критерием, у нас есть одновременная валидность.

Очень часто новый IQ или личностный тест можно сравнить с более старым, но похожим тестом, который, как известно, уже имеет хорошую валидность.

Что такое прогностическая достоверность в исследованиях?

Это степень, в которой тест точно предсказывает критерий, который будет применяться в будущем.

Например, на основе нового теста интеллекта можно сделать прогноз, что люди с высокими показателями в возрасте 12 лет с большей вероятностью получат университетскую степень через несколько лет.Если предсказание оправдывается, значит, тест имеет прогностическую достоверность.

Ссылки на стиль APA
Кронбах, Л. Дж., И Мил, П. Э. (1955) Конструируйте валидность в психологических тестах. Психологический бюллетень , 52, 281-302.

Hathaway, S. R., & McKinley, J. C. (1943). Руководство по многофазной инвентаризации личности в Миннесоте . Нью-Йорк: Психологическая корпорация.

Келли Т. Л. (1927). Интерпретация образовательных измерений.Нью-Йорк, : Макмиллан.

Нево, Б. (1985). Повторная проверка достоверности лица. Журнал образовательных измерений , 22 (4), 287-293.

Как ссылаться на эту статью:

Как ссылаться на эту статью:
McLeod, S. A. (2013). Что такое действительность? . Просто психология. https://www.simplypsychology.org/validity.html

сообщить об этом объявлении
4 типа валидности в дизайне исследования (+3 еще для рассмотрения)

Выводы, которые вы делаете из своего исследования (будь то анализ опроса, фокус группы, экспериментальный план или другие методы исследования) полезны только в том случае, если они действительны.

Насколько «верны» эти результаты? Насколько хорошо они представляют то, что вы на самом деле пытаетесь изучить? Валидность используется, чтобы определить, измеряет ли исследование то, что оно намеревалось измерить, и приблизить правдивость результатов.

К сожалению, исследователи иногда создают свои собственные определения того, что считается достоверным.

В количественных исследованиях проверка достоверности и надежности является данностью.

Однако некоторые качественные исследователи зашли так далеко, что предположили, что валидность неприменима к их исследованиям, даже если они признают необходимость некоторых квалификационных проверок или мер в своей работе.

Это неверно. Валидность всегда важна, даже если ее сложнее определить при качественном исследовании.

Игнорировать действительность — значит поставить под сомнение надежность вашей работы и поставить под сомнение уверенность других в ее результатах. Даже когда в исследованиях используются качественные показатели, их необходимо рассматривать с использованием показателей надежности и валидности, чтобы поддерживать достоверность результатов.

Что такое обоснованность в исследовании?

Достоверность — это то, как исследователи говорят о степени соответствия результатов действительности.Методы исследования, количественные или качественные, представляют собой методы изучения реального явления — достоверность означает, какую часть этого явления они измеряют по сравнению с тем, сколько «шума» или несвязанной информации зафиксировано в результатах.

Валидность и надежность определяют разницу между «хорошими» и «плохими» исследовательскими отчетами. Качественное исследование зависит от приверженности тестированию и повышению достоверности, а также надежности результатов ваших исследований.

Любое ценное исследование связано с тем, является ли то, что измеряется, тем, что должно быть измерено, и рассматривает способы, которыми на наблюдения влияют обстоятельства, в которых они проводятся.

Основа того, как мы делаем наши выводы, играет важную роль в рассмотрении более широких вопросов существа любого данного исследования.

По этой причине мы собираемся рассмотреть различные типы валидности, которые были сформулированы как часть законной исследовательской методологии.

Вот 7 ключевых типов валидности в исследованиях:

Срок действия

Срок действия

Срок действия конструкции

Внутренняя действительность

Внешнее действие

Достоверность статистического заключения

Срок действия по критерию

1.Срок действия

Фактическая валидность — это то, насколько достоверными кажутся ваши результаты в зависимости от того, как они выглядят. Это наименее научный метод достоверности, поскольку он не определяется количественно с помощью статистических методов.

Лицевая действительность не является действительностью в техническом смысле этого слова. Его интересует, кажется ли, что мы измеряем то, что заявляем.

Здесь мы смотрим, насколько достоверная мера кажется на первый взгляд, и на основании этого делаем субъективные суждения.

Например,

Представьте, что вы проводите опрос, который кажется респонденту действительным, а вопросы выбираются, потому что администратору они кажутся действительными.

Администратор спрашивает группу случайных людей, неподготовленных наблюдателей, кажутся ли им эти вопросы верными

В исследованиях никогда не бывает достаточно полагаться только на суждения о лицах — и необходимы более поддающиеся количественной оценке методы проверки достоверности, чтобы сделать приемлемые выводы. Есть много инструментов измерения, которые следует учитывать, поэтому фактическая достоверность полезна в тех случаях, когда вам нужно отличать один подход от другого.

Признание достоверности лица никогда не следует доверять само по себе.

2. Срок действия

Достоверность содержания — это то, охватывает ли мера, используемая в исследовании, все содержание базовой конструкции (то, что вы пытаетесь измерить).

Это тоже субъективная мера, но в отличие от фактической достоверности мы спрашиваем, охватывает ли содержание меры всю область содержания. Если исследователь хотел бы измерить интроверсию, ему сначала нужно было бы решить, что составляет релевантную область контента для этой черты.

Достоверность содержания считается субъективной формой измерения, поскольку она по-прежнему полагается на восприятие людей для измерения конструкций, которые в противном случае было бы трудно измерить.

Когда достоверность контента отличается (и становится полезной), так это за счет привлечения экспертов в данной области или лиц, принадлежащих к целевой группе. Это исследование можно сделать более объективным с помощью строгих статистических тестов.

Например, у вас может быть исследование валидности контента, которое информирует исследователей о том, как элементы, используемые в опросе, представляют их предметную область, насколько они ясны и в какой степени они поддерживают теоретическую структуру факторов, оцененную с помощью факторного анализа.

3. Срок действия конструкции

Конструкция представляет собой набор моделей поведения, которые связаны значимым образом для создания образа или идеи, придуманной для исследовательских целей. Валидность конструкции — это степень, в которой ваше исследование измеряет конструкт (по сравнению с вещами вне конструкции).

Депрессия — это конструкция, которая представляет собой черту личности, которая проявляется в таком поведении, как чрезмерный сон, потеря аппетита, трудности с концентрацией внимания и т. Д.

Существование конструкции подтверждается наблюдением за набором связанных индикаторов. Любой знак может быть связан с несколькими конструкциями. Человек с трудностями в сосредоточении может иметь A.D.D. но не депрессия.

Конструктивная валидность — это степень, в которой могут быть сделаны выводы из операционализаций (соединения концепций с наблюдениями) в вашем исследовании к конструкциям, на которых эти операционализации основаны. Чтобы установить достоверность конструкции, вы должны сначала предоставить доказательства того, что ваши данные поддерживают теоретическую структуру.

Вы также должны показать, что управляете операционализацией конструкции, другими словами, показать, что ваша теория имеет некоторое соответствие с реальностью.

Конвергентная достоверность — степень, в которой операция похожа на другие операции, на которые она теоретически должна быть похожа.

Дискриминационная валидность -– если шкала адекватно дифференцирует себя или не различает группы, которые должны различаться или не отличаться на основании теоретических соображений или предыдущих исследований.

Номологическая сеть — представление конструктов, представляющих интерес в исследовании, их наблюдаемых проявлений и взаимосвязей между ними. Согласно Кронбаху и Милу, номологическая сеть должна быть разработана для меры, чтобы она имела конструктивную валидность

Multitrait-Multimethod Matrix — шесть основных соображений при проверке достоверности конструкции в соответствии с Кэмпбеллом и Фиске. Это включает в себя оценки конвергентной достоверности и дискриминативной достоверности.Остальные — это единица метода черты, несколько методов / черт, действительно другая методология и характеристики черт.

4. Внутренняя действительность

Внутренняя достоверность относится к степени, в которой независимая переменная может быть точно указана для получения наблюдаемого эффекта.

Если эффект зависимой переменной обусловлен только независимой (ыми) переменной (ами), то внутренняя достоверность достигается. Это степень, в которой можно манипулировать результатом.

Другими словами, внутренняя валидность — это то, как вы можете сказать, что ваше исследование «работает» в исследовательской среде.Влияет ли изменяемая вами переменная на изучаемую вами в рамках данного исследования?

Никогда не пропустите запись в блоге

Подпишитесь на блог ActiveCampaign, чтобы получать последние новости о продуктах.

5. Внешнее действие

Внешняя валидность — это степень, в которой результаты исследования могут быть обобщены за пределами выборки. То есть вы можете применить свои выводы к другим людям и окружающим условиям.

Думайте об этом как о степени обобщения результата.Насколько хорошо результаты исследования применимы к остальному миру?

Лаборатория (или другое место исследования) — это контролируемая среда с меньшим количеством переменных. Внешняя валидность относится к тому, насколько хорошо результаты сохраняются, даже при наличии всех этих других переменных.

6. Достоверность статистического заключения

Достоверность статистического заключения — это определение наличия взаимосвязи или совместной вариации между причинно-следственными переменными.

Этот тип действительности требует:

Обеспечение надлежащих процедур отбора проб

Соответствующие статистические тесты

Надежные методы измерения

Это степень достоверности вывода.

7. Срок действия по критерию

Критериальная валидность (также называемая инструментальной валидностью) — это мера качества ваших методов измерения. Точность меры демонстрируется путем сравнения ее с уже заведомо действительной мерой.

Другими словами — если ваша мера имеет высокую корреляцию с другими мерами, которые, как известно, действительны из-за предыдущих исследований.

Для того, чтобы это сработало, вы должны знать, что критерий был хорошо измерен.И имейте в виду, что соответствующие критерии существуют не всегда.

То, что вы делаете, — это проверка эффективности вашего ввода в эксплуатацию по критериям.

Критерии, которые вы используете в качестве стандарта суждения, учитывают различные подходы, которые вы бы использовали:

Predictive Validity — способность операционализации предсказать то, что она теоретически способна предсказать. Степень, в которой мера предсказывает ожидаемые результаты.

Concurrent Validity — способность операционализации различать группы, которые она теоретически должна уметь.Здесь тест хорошо коррелирует с показателем, который был ранее проверен.

Когда мы смотрим на достоверность данных опроса, мы спрашиваем, представляют ли данные то, что, по нашему мнению, они должны представлять.

Мы зависим от мышления и отношения респондента, чтобы предоставить нам достоверные данные.

Другими словами, мы зависим от них, чтобы они ответили на все вопросы честно и добросовестно. Мы также зависим от того, смогут ли они ответить на вопросы, которые мы задаем.Когда задаются вопросы, которые респондент не может понять или понять, тогда данные не говорят нам, что, по нашему мнению, они делают.

Срок действия — Методология исследования

Валидность исследования в опросах относится к степени, в которой опрос определяет правильные элементы, которые необходимо измерить. Проще говоря, валидность означает, насколько хорошо инструмент измеряет то, что он предназначен для измерения.

Одной надежности недостаточно, меры должны быть надежными и действительными.Например, если весы для измерения веса неверны на 4 кг (из них вычитается 4 кг фактического веса), их можно указать как надежные, поскольку весы показывают один и тот же вес каждый раз, когда мы измеряем конкретный предмет. Однако весы недействительны, потому что они не отображают фактический вес предмета.

Исследования по валидности можно разделить на две группы: внутренние и внешние. Можно указать, что «внутренняя валидность относится к тому, насколько результаты исследования соответствуют действительности, в то время как внешняя валидность относится к степени, в которой результаты исследования могут быть воспроизведены в других средах» (Pelissier, 2008, p.12).

Причем срок действия также можно разделить на пять типов:

1. Действительность лица — это самый основной тип достоверности, связанный с высочайшим уровнем субъективности, поскольку он не основан на каком-либо научном подходе. Другими словами, в этом случае исследователь может признать тест действительным, потому что он может казаться таким же достоверным, без глубокого научного обоснования.

Пример: дизайн анкеты для исследования, в котором анализируются вопросы производительности сотрудников, может быть оценен как действительный, поскольку может показаться, что каждый отдельный вопрос касается конкретных и значимых аспектов производительности сотрудников.

2. Construct Validity относится к оценке пригодности измерительного инструмента для измерения изучаемого явления. Применение конструктной валидности может быть эффективно облегчено с привлечением группы «экспертов», хорошо знакомых с мерой и явлением.

Пример: с применением конструкта валидности уровни лидерской компетентности в любой данной организации можно эффективно оценить, разработав анкету, на которую должны отвечать сотрудники операционного уровня, и задав вопросы об уровнях их мотивации выполнять свои обязанности в повседневной жизни.

3. Валидность, связанная с критериями включает сравнение результатов тестов с результатами. Этот конкретный тип валидности коррелирует результаты оценки с другим критерием оценки.

Пример: характер восприятия клиентом имиджа бренда конкретной компании можно оценить путем организации фокус-группы. Эту же проблему можно оценить, разработав анкету, на которую будут отвечать текущие и потенциальные клиенты бренда. Чем выше уровень корреляции между результатами фокус-группы и анкетированием, тем выше уровень критериальной валидности.

4. Формирующая валидность относится к оценке эффективности меры с точки зрения предоставления информации, которая может быть использована для улучшения конкретных аспектов явления.

Пример: при разработке инициатив по повышению уровней эффективности организационной культуры, если мера способна выявить конкретные слабые стороны организационной культуры, такие как коммуникационные барьеры между сотрудником и менеджером, то уровень формирующей валидности меры можно оценить как адекватный.

5. Действительность выборки (аналогично достоверности содержания) гарантирует, что область охвата меры в рамках области исследования обширна. Никакая мера не может охватить все элементы и элементы явления, поэтому важные элементы и элементы выбираются с использованием определенного метода выборки в зависимости от целей и задач исследования.

Пример: при оценке стиля лидерства, применяемого в конкретной организации, недостаточно оценки стиля принятия решений и других вопросов, связанных со стилем лидерства, таких как организационная культура, личность лидеров, характер отрасли и т. Д.также необходимо учитывать.

Моя электронная книга, Полное руководство по написанию диссертации в области бизнес-исследований: пошаговая помощь предлагает практическую помощь в завершении диссертации с минимальным стрессом или без него. Электронная книга охватывает все этапы написания диссертации, начиная от выбора и заканчивая областью исследования и сдачей завершенной версии работы в установленные сроки. Иоанн Дудовский

Что такое научно обоснованный метод?

Серия веб-семинаров EAS по соответствию GMP в лабораториях диетических добавок

Представлено Тарой Лин Коуч, Ph.Д.

По многочисленным просьбам — старший директор по диетическим добавкам и табачным изделиям, Тара Лин Коуч, доктор философии. обсудит соблюдение надлежащей производственной практики (GMP) в лаборатории пищевых добавок. В этой серии, первоначально выпущенной в 2015 году, будут обсуждаться различные аспекты соответствия нормативным требованиям 21 CFR 111, Текущая надлежащая производственная практика в области производства, упаковки, маркировки или хранения пищевых добавок , что касается лабораторных операций.

Эта серия статей — прекрасная возможность узнать, как поддерживать лабораторное оборудование с эффективными лабораторными контролируемыми процессами, а также оценить то же самое в вашей контрактной лаборатории. Участники этого вебинара получат общее представление о доступных аналитических методах и методах тестирования; и когда они подходят для установления соответствия спецификациям диетических ингредиентов и пищевых добавок в отношении идентичности, чистоты, силы, состава и потенциальных загрязнителей.

Повтор каждого часового вебинара

21 CFR 111 GMP Обзор лаборатории [Просмотр]

Надлежащее использование аналитических приборов [Просмотр]

Что такое научно обоснованный метод? [см. Ниже]

Разработка соответствующей спецификации — здесь нет «по входам»

Как выбрать и квалифицировать контрактную лабораторию [Просмотр]

О докладчике

Тара Лин Коуч, доктор философии, старший директор отдела диетических добавок и табачных изделий

Старший директор отдела диетических добавок и табачных изделий EAS, Dr.Тара Лин Коуч — доктор философии. Химик-аналитик / химик-органик с исключительными аналитическими способностями и более 25 лет разнообразного лабораторного и нормативного опыта в академической, полевой, контрактной и производственной среде. Она является востребованным экспертом по вопросам, связанным с контролем качества на предприятиях по производству фармацевтических препаратов и пищевых добавок, включая разработку спецификаций и создание хорошо организованных и современных лабораторий.

	Надежность	Срок действия
Что он вам говорит?	Степень, в которой могут быть воспроизведены результаты при повторении исследования в тех же условиях.	Степень, в которой результаты действительно измеряют то, что они должны измерять.
Как это оценивается?	Путем проверки согласованности результатов во времени, разными наблюдателями и по частям самого теста.	Путем проверки того, насколько хорошо результаты соответствуют установленным теориям и другим показателям той же концепции.
Как они связаны?	Надежное измерение не всегда верно: результаты могут быть воспроизводимыми, но не обязательно правильными.	Действительное измерение обычно надежно: если тест дает точные результаты, они должны быть воспроизводимыми.

Тип надежности	Что он оценивает?	Пример
Повторное испытание	Согласованность меры во времени : получаете ли вы те же результаты, когда повторяете измерение?	Группа участников заполняет анкету, предназначенную для измерения личностных качеств.Если они повторяют анкету с интервалом в несколько дней, недель или месяцев и дают одинаковые ответы, это указывает на высокую надежность повторного тестирования.
Интеррейтер	Согласованность показателя между оценщиками или наблюдателями : получаете ли вы одинаковые результаты, когда разные люди проводят одно и то же измерение?	На основании контрольного списка критериев оценки пять экзаменаторов представляют существенно разные результаты по одному и тому же студенческому проекту. Это указывает на то, что контрольный список для оценки имеет низкую межэкспертную надежность (например, потому, что критерии слишком субъективны).
Внутренняя согласованность	Стабильность самого измерения : получаете ли вы одинаковые результаты в разных частях теста, которые предназначены для измерения одного и того же?	Вы разрабатываете анкету для измерения самооценки. Если вы случайным образом разделите результаты на две половины, между двумя наборами результатов должна быть сильная корреляция. Если два результата сильно различаются, это указывает на низкую внутреннюю согласованность.

Срок действия	Что он оценивает?	Пример
Конструкция	Приверженность меры существующей теории и знаниям измеряемой концепции.	Анкета самооценки может быть оценена путем измерения других черт, которые, как известно, или предположительно связаны с концепцией самооценки (например, социальные навыки и оптимизм).Сильная корреляция между оценками самооценки и связанных с ними черт может указывать на высокую валидность конструкта.
Содержание	Степень, в которой измерение охватывает все аспекты измеряемой концепции.	Тест, целью которого является определение уровня испанского языка учащимися, содержит компоненты чтения, письма и говорения, но не аудирование. Эксперты согласны с тем, что понимание на слух является важным аспектом языковых навыков, поэтому тесту недостает валидности содержания для измерения общего уровня владения испанским языком.
Критерий	Степень, в которой результат меры соответствует другим действительным показателям той же концепции.	Опрос проводится для измерения политических взглядов избирателей в регионе. Если результаты точно предсказывают более поздний исход выборов в этом регионе, это указывает на то, что опрос имеет высокую достоверность критериев.

Раздел	Обсудить
Обзор литературы	Что сделали другие исследователи для разработки и улучшения надежных и действенных методов?
Методология	Как вы планировали свое исследование, чтобы гарантировать надежность и обоснованность используемых мер? Это включает в себя выбранный набор и размер образца, подготовку образца, внешние условия и методы измерения.
Результаты	Если вы рассчитываете надежность и достоверность, укажите эти значения вместе с основными результатами.
Обсуждение	Это момент, чтобы поговорить о том, насколько надежными и достоверными были ваши результаты. Были ли они последовательны и отражали истинные ценности? Если нет, то почему?
Заключение	Если надежность и достоверность были большой проблемой для ваших выводов, было бы полезно упомянуть об этом здесь.

Психологические методики, опросники и тесты

Тесты способностей. Часть 3. Надежность и валидность

1. НАДЕЖНОСТЬ

2. ВАЛИДНОСТЬ ТЕСТА

Валидность это в психологии, виды валидности, понятие

Валидность это в психологии

Валидность теста это

Валидность методики это

Виды валидности

Методики для профотбора и профориентации

Валидность — Блог Викиум

Как проверить валидность?

Надёжность и валидность

Внутренняя валидность и пример её нарушения

Факультет психологии

Надежность и валидность в исследованиях

Понимание надежности и действительности

Что такое надежность?

Что такое срок действия?

Как оцениваются надежность и достоверность?

Виды надежности

Виды действия

Какая у вас оценка за плагиат?

Как обеспечить обоснованность и надежность вашего исследования

Гарантия действительности

Обеспечение надежности

Где написать о надежности и обоснованности в диссертации

4 типа достоверности

Срок действия конструкции

Что такое конструкция?

Пример

Что такое конструктивная валидность?

Срок действия

Пример

Получение отзывов о языке, структуре и макете

Срок действия

Пример

Срок действия критерия

Что такое критерий?

Что такое критерий действительности?

Пример

Надежность и достоверность измерения — Методы исследования в психологии — 2-е канадское издание

Что такое валидность в психологии

Что такое валидность?

Что означает валидность в исследованиях?

Что такое внутренняя и внешняя валидность в исследованиях?

Оценка валидности теста

Оценка валидности теста

Что такое фактическая валидность в исследованиях?

Что такое конструктная валидность в исследованиях?

Что такое одновременная валидность в исследованиях?

Что такое прогностическая достоверность в исследованиях?

4 типа валидности в дизайне исследования (+3 еще для рассмотрения)

Что такое обоснованность в исследовании?

1.Срок действия

2. Срок действия

3. Срок действия конструкции

4. Внутренняя действительность

5. Внешнее действие

6. Достоверность статистического заключения

7. Срок действия по критерию

Срок действия — Методология исследования

Что такое научно обоснованный метод?

Серия веб-семинаров EAS по соответствию GMP в лабораториях диетических добавок

Представлено Тарой Лин Коуч, Ph.Д.

Повтор каждого часового вебинара

О докладчике

Тара Лин Коуч, доктор философии, старший директор отдела диетических добавок и табачных изделий

Добавить комментарий Отменить ответ