Какое название носит способ проверки достоверности теста: НАБОР И ОТБОР ПЕРСОНАЛА — 1 — Тесты — Основы управления персоналом — Каталог файлов

Рабочая программа дисциплины

Негосударственное образовательное учреждение

«Алтайский экономико-юридический институт»

______________ В.И. Степанов

«___» ________ 2016 г.

Экономические основы управления персоналом

Рабочая программа рассмотрена и утверждена на заседании кафедры управленческих дисциплин от «__»____ 2016 г.


Оглавление 2

1.Цели, задачи дисциплины 3

2.Место дисциплины в структуре ООП, требования к «входным» знаниям, умениям и навыкам студента 5

3.Объем дисциплины и виды учебной работы для студентов очной и заочной форм обучения
6

4.Учебно-тематический план дисциплины 7

5.Содержание дисциплины. 9

6.Планы практических занятий. 25

7.Самостоятельная работа студентов. 38

8.Образовательные технологии, используемые в преподавании дисциплины. 40

9.Критерии оценки результатов обучения. 41

10.Материалы для текущей, промежуточной и итоговой аттестации. 42

11.Материально-техническое обеспечение дисциплины. 43

12.Информационное обеспечение дисциплины. 44

12.1.Основная литература. 44

12.2.Дополнительная литература. 45

12.3.Интернет-ресурсы. 45

Приложение 1. 46

Тесты. 46

Приложение 2. 116

Зачет. 116

Цель изучения курса – исследование целенаправленного воздействия администрации на персонал для оптимального осуществления миссии предприятия (организации) и удовлетворения потребностей работников. При этом персонал рассматривается как совокупность работников, объединенных целями хозяйственной деятельности, технологией, средствами производства.

К важнейшим задачам курса относятся: овладение основами методологии кадрового менеджмента; исследование персонала как объекта управления; изучение вопросов формирования кадровой политики и стратегии управления персоналом; анализ деятельности современной службы управления персоналом; овладение кадровыми технологиями, оценка экономической эффективности управления.

В результате освоения дисциплины должны быть сформированы следующие профессиональные (ПК) компетенции:

Управление финансовыми рисками предприятия

Что бы получить содержание теста отправьте запрос на e-mail 0

№3305 Управление человеческими ресурсами – 487 вопр. ОРИГиз525 — 350 руб

1. _____ человеческих ресурсов представляет собой систему контроля за соблюдением установленного порядка учета личного состава и надежностью функционирования всей системы работы с персоналом, регламентированной трудовым законодательством РФ и локальными нормативными актами предприятия. Внутренний _____ человеческих ресурсов — один из способов контроля за эффективностью управления персоналом в структурных подразделениях компании

2. _____ инструктаж проходят все работники не реже одного раза в шесть месяцев по программам, разработанным для проведения первичного инструктажа на рабочем месте

3. _____ является традиционным методом обучения и в качестве основной цели преследует оперативное вовлечение нового работника в профессиональную сферу деятельности на конкретном рабочем месте в конкретном коллективе

4. Executive search («охота за головами») — это

5. X и Y-теории управления разработал и предложил

6. Z-концепция Уильяма Оучи и Альфреда Джегера — это «трёхмерный» анализ, основанный на сопоставлении

7. а) определение источников и путей покрытия потребности в персонале

8. Автор «административной доктрины»

9. Автором «пирамиды» иерархии потребностей является

10. Автором ERG-тории мотивации является

11. Автором концепции «бюрократической организации» является

12. Автором теории институтов и институциональных изменений является

13. Адаптация — это

14. Американский психолог и психиатр Эрик Берн (1902 — 1970) получил всемирную известность благодаря исследованиям и типологии

15. Анализ образовательных свидетельств позволяет сделать некоторые заключения о кандидате. К таковым относятся (при необходимости указать несколько)

16. Анализ работы (должности) может быть использован для

17. Аттестация — это форма оценки человека, которую

18. Аттестация персонала — это

19. Аттестация работников представляет собой процедуру определения соответствия квалификации, результативности деятельности, уровня знаний и навыков сотрудников, их деловых, личностных и иных значимых качеств требованиям занимаемой должности

20. б) увольнения по собственному желанию и инициативе администрации

21. Базовыми стилями управления (по Курту Левину) считаются

22. Безработные — это

23. В каждом подразделении организации должны быть документы: а) положение о подразделении, б) должностные инструкции. В какой последовательности должны разрабатываться эти документы?

24. В Казахстане назначение и выплата пенсий в большинстве случаев производится

25. В какой период профессиональной деятельности формируется мотивация труда?

26. В каком документе определяется продолжительность испытательного срока для принимаемого на работу сотрудника

27. В каком случае происходит формирование мотива труда?

28. В каком случае цена рабочей силы, определяемая заработной платой, будет равна ее стоимости?

29. В области совершенствования управления персоналом наибольшее распространение получил метод

30. В организационную структуру продвинутой службы управления персоналом в крупной организации входят перечисленные подразделения/отделы, за исключением

31. В организацию, где нет собственной HR-службы, требуется директор по маркетингу. Какой из методов его поиска представляется Вам наиболее эффективным?

32. В основу _____ управления заложена концепция интрапренерства, получившая название от двух слов: «антрепренерство» — предпринимательство и «интре» — внутренний. Суть данной концепции заключается в развитии предпринимательской активности внутри организации, которую можно представить как сообщество предпринимателей, новаторов и творцов

33. В основу деления методов управления на три группы (экономические, организационно-распорядительные, или административные, и социально-психологические) положен критерий

34. В процессе отбора кандидатов кадровые органы практикуют тесты на выявление _____ характеристик

35. В процессе отбора кандидатов кадровые органы практикуют тесты на определение уровня развития _____

36. В результате социометрического опроса 8 сотрудников торгового подразделения фирмы «Омега» было выявлено 7 взаимных положительных выборов. Вычислите индекс групповой сплоченности

37. В результате социометрического опроса персонала ООО «Альфа» (6 чел.) сотрудник N получил 3 положительных и 2 отрицательных выбора. Вычислите значение его социометрического статуса и укажите правильный ответ

38. В результате социометрического опроса персонала отдела маркетинга ООО «Омега-Л» (11 чел.) сотрудник N сделал 2 положительных и 4 отрицательных выбора. Рассчитайте индекс его эмоциональной экспансивности и укажите ответ

39. В ряде случаев, особенно в периоды экономического спада, организации нуждаются в специфической кадровой программе. Эта программа применяется в тех случаях, когда увольнение не является следствием невыполнения работником своих обязанностей, а связано с процессом реорганизации, сокращения штата или ликвидации предприятия и выполняется, как правило, кадровым агентством по организации процесса увольнения сотрудников наиболее щадящим способом. Как называется такая программа?

40. В соответствие с принципом иерархии решения начальника службы управления персоналом в аппарате генеральной дирекции обязательны для исполнения начальниками цехов

41. В соответствие с Трудовым кодексом, заработная плата — это

42. В соответствие с Трудовым кодексом, квалификационный разряд — это

43. В соответствие с Трудовым кодексом, минимальная заработная плата (минимальный размер оплаты труда) — это

44. В соответствие с Трудовым кодексом, оплата труда — это

45. В соответствие с Трудовым кодексом, тарификация работы — это

46. В соответствие с Трудовым кодексом, тарифная сетка — это

47. В соответствие с Трудовым кодексом, тарифная система — это

48. В соответствие с Трудовым кодексом, тарифная ставка (оклад) — это

49. В соответствие с Трудовым кодексом, тарифный разряд — это

50. В соответствии с теорией «X» Дугласа МакГрегора человек

51. В теории результативности руководства, разработанной американским психологом Ф.Е. Фидлером, применяются четыре переменные: 1- упор на задачу или персонал; 2- структура поставленной задачи; 3- взаимоотношения между руководителем и подчиненными; 4-_____ руководителя. Укажите четвертую переменную

52. В том случае, когда результаты работника нельзя точно учесть, а также когда выработка продукции в количественном измерении не является решающим показателем, применяется

53. В управленческой решетке Р. Блейка и Дж. Моутон сектор «1.1» обозначает

54. В управленческой решетке Р. Блейка и Дж. Моутон сектор «5.5» обозначает

55. В управленческой решетке Р. Блейка и Дж. Моутон сектор «9.9» обозначает

56. В ходе _____ кадров происходит поочередное пребывание сотрудников в различных должностях для освоения смежных специальностей, приобщения к новым функциональным задачам, иногда для смены профессиональной ориентации

57. В чем заключается основная идея классической теории мотивации?

58. В чем заключается основной недостаток аттестации?

59. В чем заключается роль минимальной оплаты труда?

60. В чем заключается социально-психологический аспект адаптации?

61. В чем заключается цель анализа работы?

62. В чем заключается цель создания философии предприятия?

63. В чем заключается цель стимулирования персонала?

64. В чем заслуга классической школы управления?

65. В чем суть классической теории мотивации?

66. В чем суть предпринимательско-рыночного подхода в работе с персоналом?

67. Вероятность увольнения по собственному желанию выше

68. Виктор Врум является одним из последователей теории

69. Возрастание роли стратегического подхода к управлению человеческим ресурсом в настоящее время связано

70. Выберите из перечисленных ниже элементов те из них, которые не являются подсистемами системы управления персоналом

71. Выберите способы сокращения работающих в организации, не прибегая к процедуре увольнения: (более одного правильного ответа)

72. Выберите способы увеличения предложения работников в организации (привести численность в соответствие с ее реальными потребностями), не прибегая к дополнительному найму со стороны

73. Выберите способы эффективной интеграции нового сотрудника в организацию

74. Выберите элементы, не являющиеся элементами подсистемами системы управления персоналом (более одного правильного ответа)

75. Выберите, что необходимо применить для расчета эффективности мероприятий по совершенствованию системы управления персоналом

76. Выделите категории населения, которые относятся к занятому населению

77. Выделите категории населения, которые относятся к экономически активному населению

78. Выделите ключевой элемент адаптации

79. Выделите один из способов управления конфликтами

80. Выделите одну из функций накопительных пенсионных фондов

81. Выделите элемент системы контроля на предприятии

82. Выплачивает ли предприятие выходные пособия в случае его ликвидации?

83. Выполнение определенной служебной роли на ступени, не имеющей жесткого, формального закрепления в организационной структуре, например выполнение роли руководителя временной целевой группы, есть проявление внутриорганизационной карьеры

84. Генри Форд знаменит тем, что

85. Главной задачей службы управления персоналом является достижение соответствия рабочей силы в организации рабочим местам

86. Двухфакторная теория мотивации была разработана

87. Делегирование полномочий является составной частью

88. Денежные средства на выплату пенсий поступают в виде страховых платежей, начисляемых в зависимости от размера

89. Для оплаты труда специалистов и служащих чаще всего применяются

90. Для проведения собеседования при приеме на работу сотруднику без специальной подготовки в этой области, можно порекомендовать

91. Для расчета эффективности мероприятий по совершенствованию системы управления персоналом необходимо использовать (можно указать несколько вариантов)

92. Для того чтобы найти подходящего кандидата на руководящую должность, целесообразно

93. Для увеличения эффективности труда необходимо

94. Для ускорения процесса адаптации нового сотрудника необходимо

95. Доверительные обращения руководителя к сотруднику есть проявления внутриорганизационной карьеры

96. Если в ходе собеседования выясняется, что кандидат явно не соответствует требованиям должности, то когда лучше сообщить ему «вы нам не подходите»?

97. Если результаты деятельности работника неудовлетворительны, то как руководителю предпочтительнее сообщить об этом

98. За что лучше всего, с точки зрения компании, платить сотруднику премию

99. Завышение размеров вознаграждения сотрудника обычно приводит к

100.Заключение трудовых договоров позволяет удовлетворить потребность

101.Замысел заложенный в модель соответствия управления человеческими ресурсами состоит в том, что существует цикл человеческих ресурсов, состоящий из четырех основных процессов или функций, характерных для любой организации Это: — отбор — соответствие имеющихся в наличии человеческих ресурсов рабочим местам; — аттестация — управление показателями деятельности; — вознаграждение — «система вознаграждений является тем инструментом управления, который применяется для стимулирования организационных показателей работы зачастую в недостаточной степени и неверно»; — она обязана поощрять как краткосрочные, так и долгосрочные достижения, имея в виду, что «предприятие должно работать сегодня, чтобы преуспеть в будущем»; — _____ — стремление к наличию высококвалифицированных работников. Назвать ключевое слово, которое определяет суть четвертого и завершающего процесса модели соответствия

102.Зарождение научного и учебного направления «Управление человеческими ресурсами» обосновано

103.Из каких средств выплачивается материальная помощь на предприятии?

104.Из каких структурных компонентов складывается вознаграждение работника?

105.Из перечисленных авторов — 1.Ф.У.Тейлор, 2.А.Файоль, 3.М.П.Фоллет, 4.Ф.Гилбрет, 5.С.Черчмен, 6.Г.Гант — представителями школы научного управления являются

106.Из перечисленных принципов: 1.Научность, 2.Дисциплина, 3.Экономичность, 4.Иерархия, 5.Ответственность, 6.Инициатива — принципами администрирования являются

107.Из чего складывается конфликт?

108.Избегание является оптимальным способом управления конфликтом

109.Использование гибких режимов работы в организации позволяет (более одного правильного ответа)

110.Использование гибких режимов работы в организации позволяет

111.Использование методов научного анализа, отбора и обучения персонала, отделение плановой и организационной работы от производственной является вкладом в развитие управленческой мысли

112.Исследования показывают, что налаженная система профессионально-квалификационного продвижения персонала в организации

113.Исследования показывают, что правдивая предварительная характеристика работы

114.Источниками формирования резерва кадров являются

115.Источники формирования резерва кадров?

116.К добровольным социальным льготам относятся

117.К достоинствам внешних источников привлечения персонала относят

118.К какой группе административных методов управления можно отнести процедуру нормирования труда?

119.К какой группе требований, предъявляемых руководителю, можно отнести аналитические способности?

120.К какой из трех гипотез теории конструирования организации Минцберга можно отнести следующий тезис: «Эффективное структурирование требует внутренней последовательности между параметрами конструирования организации»?

121.К какому действию должен прибегнуть менеджер по персоналу при появлении вакансии в ситуации временного увеличения объема работ?

122.К наименее достоверным тестам отбора кандидатов относятся

123.К наименее достоверным тестам отбора кандидатов относятся

124.К недостаткам внешних источников привлечения персонала относят (при необходимости выделить несколько)

125.К недостаткам проектной организационной структуры в плане координации взаимодействия среди сотрудников можно отнести

126.К обеспечивающим подсистемам системы управления персоналом относятся следующие подсистемы

127.К организационным методам воздействия на персонал относится

128.К основным относятся группы методов управления персоналом в организации (более одного правильного ответа)

129.К основным ошибкам интервью относятся следующие (при необходимости отметить несколько)

130.К особенностям дивизионального типа оргструктуры управления относятся

131.К показателям, оценивающим положение предприятия на рынке труда, не относится

132.К помощи рекрутинговых агентств целесообразнее обращаться в случае, когда

133.К представителям какой группы теории мотивации относятся Абрахам Маслоу, Дэвид МакКлеланд, Фредерик Герцберг?

134.К преимуществам внутренних источников найма относят (более одного правильного ответа)

135.К преимуществам внутренних источников привлечения персонала относят

136.К процессуальным теориям мотивации относится

137.К экономически неактивному населению относятся

138.К эффекту совместной деятельности персонала не относят

139.К явной функции аттестации относится

140.Как Вы считаете, к какой категории относится большая часть людей, приходящих в кадровые органы в поисках работы?

141.Как вы считаете, насколько полезны для специалистов по набору и отбору персонала сведения, характеризующие вакантное место (профессиональные требования к кандидату), на которое набираются предполагаемые кандидаты?

142.Как добиться увеличения предложения работников в организации (привести численность в соответствие с ее реальными потребностями), не прибегая к дополнительному найму со стороны

143.Как добиться уменьшения предложения работников в организации (привести численность в соответствие с ее реальными потребностями), не прибегая к увольнениям

144.Как называется формализованный документ, в котором представлена краткая трудовая биография кандидата?

145.Как называют совокупность средств и методов должностного продвижения персонала, применяемых в организации?

146.Как называются методы управления конфликтами, которые заключаются в разъяснении требований к работе, использовании координационных и интеграционных механизмов, установлении общеорганизационных комплексных целей и использовании системы вознаграждений?

147.Как называются методы управления конфликтами, которые заключаются в умении правильно организовать свое собственное поведение, высказать свою точку зрения, не вызывая защитной реакции со стороны другого человека?

148.Как обеспечить эффективную интеграцию нового сотрудника в организацию

149.Как определяется «относительная (сопоставимая) ценность работы»?

150.Как условно называют теорию мотивации Виктора Врума?

151.Какая группа наиболее часто подвергается дискриминации при приеме на работу?

152.Какая группа потребностей является первичной, базовой в иерархии А.Маслоу?

153.Какая заработная плата определяется не по конкретному результату, а по времени, которое работник отработает в организации?

154.Какая из перечисленных концепций управления утверждает, что эффективность работы руководителя определяется не его личными качествами, а манерой поведения по отношению к подчиненным, «стилем руководства»?

155.Какая из перечисленных систем оплаты труда не относится к сдельной форме оплаты?

156.Какая из предложенных современных концепций мотивации была разработана профессором Калифорнийского университета В.Оучи?

157.Какая из теорий мотивации включает в себя следующие переменные: усилие, восприятие, результаты, вознаграждение, степень удовлетворения?

158.Какая карьера характеризуется тем, что конкретный работник в процессе своей профессиональной деятельности проходит различные стадии карьеры, которые он может пройти последовательно как в одной, так и в различных организациях, но в рамках профессии и одной области деятельности, в которой он специализируется?

159.Какая концепция управления является превалирующей в Казахстане?

160.Какая организационная структура основывается на заданиях, которые должны быть выполнены (например, финансовая деятельность, бухгалтерский учет, маркетинг, персонал) ?

161.Какая характеристика теста является ключевой при его включении в процесс отбора?

162.Какая часть населения не относится к группам, наиболее часто подвергающимся дискриминации в сфере занятости

163.Какие виды адаптации выделяют ученые?

164.Какие возможны программы поддержки развития сотрудника, если он стремится установить и закрепить основу для будущего продвижения (при необходимости указать несколько)

165.Какие выделяют способы распорядительного воздействия на персонал?

166.Какие два вида служебно-профессионального продвижения (карьеры) различают с точки зрения практики управления организацией?

167.Какие два направления адаптации выделяют в управлении персоналом?

168.Какие два независимых параметра составляют основу классификации формы поведения личности в конфликтной ситуации по К.Томасу и А.Килменну?

169.Какие две основные формы заработной платы существуют?

170.Какие из приведенных потребностей свойственны всем людям?

171.Какие качества и навыки нужны сотрудникам кадровой службы для успешного выполнения своих функций

172.Какие методы наиболее эффективные для обучения персонала поведенческим навыкам (ведение переговоров, проведение заседаний, работа в группе)

173.Какие методы наиболее эффективные для обучения техническим приемам (ремонт несложной бытовой техники, электродвигателей)

174.Какие основные параметры отличают различные подходы к проведению анализа работы?

175.Какие основные формы стимулов выделяют?

176.Какие три вида посредничества различают при решении конфликта?

177.Какие три уровня конфликтов выделил С.Хэнди

178.Какие функции присущи заработной плате?

179.Каким образом проявляется в поведении человека доминирование мотива достижения успеха (выберите несколько ответов) ?

180.Какова предпочтительность каналов поиска опытного сотрудника редкой специальности?

181.Каковы могут быть последствия конфликта в организации?

182.Каковы причины высвобождения работников в организации

183.Какое название носит один из стилей оценочного интервью, в ходе которого менеджер рассказывает подчиненному о том, как он работает, а затем выслушивает точку зрения служащего об оценке работы и о его последующих действиях?

184.Какое название носит способ проверки достоверности теста, при котором сопоставляются ответы на похожие вопросы, несколько раз встречающиеся в тексте?

185.Какое название носят методы по устранению организационных конфликтов?

186.Какое понятие не используется при анализе работы?

187.Какой из видов разделения труда в управлении является, на Ваш взгляд, основой для выделения других

188.Какой из методов отбора кандидатов в мировой практике считается наиболее надежным?

189.Какой из ниже перечисленных видов адаптации относят к вторичной адаптации?

190.Какой из ниже перечисленных вопросов является центральным в западном варианте аттестации (performance appraisal) ?

191.Какой из ниже перечисленных пунктов можно отнести к преимуществам внутреннего набора кандидатов?

192.Какой из ниже перечисленных пунктов не относится к основным факторам мотивации труда?

193.Какой из ниже перечисленных пунктов нельзя отнести к качествам успешного менеджера?

194.Какой из ниже перечисленных пунктов нельзя отнести к факторам, лежащим в основе критериев оценки персонала?

195.Какой из ниже перечисленных пунктов ограничивает процесс оценки персонала?

196.Какой из ниже перечисленных этапов анализа работы является третьим?

197.Какой из перечисленных ниже аспектов управления персоналом в наименьшей степени зависит от национальной культуры?

198.Какой из перечисленных пунктов является необходимым условием организации коллектива и существенным фактором организационно-административной адаптации?

199.Какой из перечисленных пунктов является особенно важным для эффективной работы руководителя?

200.Какой из принципов относится к классической школе управления?

201.Какой из современных подходов к управлению рассматривает все процессы в виде целостных систем, обладающих новыми качествами?

202.Какой из элементов не входит в модель «7С»? 1 — структура; 2 — стратегия; 3 — сумма навыков персонала; 4 — состав персонала; 5 — стиль управления; 6 — системы; 7 — символы; 8 — совместно разделяемые ценности?

203.Какой из элементов не может служить источником формирования резерва кадров?

204.Какой из элементов не относится к модели структуры организации, сформулированной Генри Минцбергом?

205.Какой комплекс кадровых мероприятий уменьшает приток новых идей в организацию

206.Какой метод позволяет наиболее точно определить характер и содержание потребности в обучении персонала

207.Какой метод сбора информации не применяется при анализе работы?

208.Какой подход при работе с персоналом стал преобладать в последнее время, когда труд и его условия рассматриваются в качестве продуктов маркетинга?

209.Какой пункт из перечисленных ниже можно отнести к преимуществам матричной структуры организации?

210.Какой тип карьеры наиболее характерен для японских организаций?

211.Какой ученый разработал теорию выбора карьеры в зависимости от принадлежности индивидуума к одному из 6 типов личности?

212.Какой элемент координационного механизма управления конфликтной ситуацией является основным?

213.Какой элемент не относится к 4-факторной модели культуры Гирта Хофстеде

214.Карьера — это

215.Классификация стилей руководства, предложенная Томом Бойделлом, является

216.Когда надо проводить аттестацию персонала

217.Когда начинается процесс управления деловой карьерой?

218.Коллективно одобряемый и закрепляемый за определенным членом группы образец поведения обозначается термином

219.Комбинированный стиль управления персоналом — это индивидуальный синтез авторитаризма, демократизма и либерализма, понимаемый следующим образом

220.Кому принадлежит идея о том, что при соблюдении правил научного менеджмента конфликты в организации не должны возникать?

221.Конечной целью традиционной аттестации (формальный классический государственный вариант) является

222.Контроль в организации, с точки зрения менеджмента, это

223.Конфликт в организации должен рассматриваться

224.Коэффициент, определяемый как отношение количества принятых на работу по должности к общему числу претендентов на эту должность, есть

225.Краткая трудовая биография кандидата

226.Кто автор модели построения эффективной организации, получившей название «Модель 7 — С»?

227.Кто автор теории конструирования организации?

228.Кто из знаменитых промышленников разработал рациональную целевую модель, определяющую метод управления и анализа работы?

229.Кто из ученых анализировал и сопоставлял две мотивационные теории «X» и «Y»?

230.Кто из ученых при классификации мотивов выделил в отдельную группу гигиенические мотивы?

231.Кто из ученых разработал теорию выбора карьеры?

232.Кто из ученых рассматривал конфликты как неизбежное явление в общественной жизни, вытекающее из свойств человеческой природы и присущего личности инстинкта агрессивности?

233.Кто не является представителем школы человеческих отношений?

234.Кто сформулировал новые обязанности администрации?

235.Лидер — это человек, который представляет

236.Личностные особенности сотрудника, необходимые для успешного выполнения деятельности, сформулированы в

237.Личный пример, убеждение, упражнение, поощрение, наказание — это методы

238.Люди, приходящие в отдел кадров в поиске работы, есть

239.Маркетинг персонала — это

240.Маслоу расположил потребности в следующей последовательности

241.Материальные издержки обычно

242.Метод оценки персонала, предполагающий письменный отчет или устное выступление с анализом выполнения плана работы и личных обязательств, называется

243.Метод оценки персонала, предполагающий проведение беседа с работником в режиме «вопрос-ответ» называется

244.Метод оценки персонала, предполагающий создание критической ситуации и наблюдение за поведением человека в процессе ее разрешения, называется

245.Метод экспертных оценок наиболее адекватен для

246.Метод, позволяющий выявить наивысшие рейтинги различных сотрудников по тому или иному показателю оценки, через последовательное сравнение сотрудников друг с другом называется методом

247.Метод, позволяющий объективно оценить соответствие кандидатов требованиям работы, является метод

248.Методы первичного отбора называют

249.Методы первичного отбора?

250.Механизм управления профессиональной ориентацией и адаптацией осуществляется через

251.Минимальная заработная плата

252.Минимальная часовая тарифная ставка первого разряда рассчитывается путем

253.Модель _____ управления базируется на предпосылке: если работник принимает участие в делах фирмы, вовлечен в управление и получает от этого удовлетворение, то он работает более заинтересованно и производительно

254.Может ли один человек работать сразу по нескольким договорам?

255.Мостик А. Файоля — это

256.На какие два основных вида ученые разделяют деловую карьеру в зависимости от места ее развития?

257.На какие две группы подразделяются современные теории мотивации?

258.На каком этапе отбора персонала применяются деловые игры?

259.На каком этапе урегулирования жалобы менеджер проверяет факты, собранные сотрудником?

260.На основе чего решается задача определения потребности в работниках и источников ее удовлетворения?

261.На предприятиях какой страны применяется политика пожизненного найма?

262.На собеседовании с кандидатом на вакантную должность целесообразно предоставить ему возможность задать свои вопросы

263.На схеме изображена организационная структура

264.На чем основаны административные методы управленческого воздействия на персонал?

265.Наиболее достоверным методом оценки способностей кандидата выполнять работу, на которую он будет нанят, является

266.Наиболее пригодным документом для достаточно быстрого обзора профессионального и личностного развития и становления кандидата является

267.Наиболее распространен в практике организаций подход к управленческому развитию

268.Наиболее распространенный в практике организаций подход к управленческому развитию

269.Наиболее распространенными в настоящее время методами первичного отбора персонала являются (при необходимости отметить несколько методов)

270.Наиболее эффективным методом оценки способностей кандидата выполнять работу, является

271.Наибольшую ценность с точки зрения мотивирования имеет работа

272.Научная школа, в рамках которой Анри Файоль, Мари Паркер Фоллет, Честер Барнард разрабатывали управленческие идеи, называется

273.Начальным этапом процесса найма персонала является

274.Новый сотрудник приходит в отдел, где все работники давно знают друг друга и привыкли работать в команде. Они не стремятся общаться с новичком, предпочитая сначала к нему присмотреться. С Вашей точки зрения, как должен поступить руководитель в подобной ситуации?

275.Общий принцип управления, предполагающий критическое отношение к прошлому опыту и нестандартные действия, называется Общий принцип управления, предполагающий критическое отношение к прошлому опыту и нестандартные действия, называется

276.Общий принцип управления, предполагающий не фрагментарное, а всестороннее (многомерное) и объективное исследование процессов и явлений, называется Общий принцип управления, предполагающий не фрагментарное, а всестороннее (многомерное) и объективное исследование процессов и явлений, называется

277.Общий принцип управления, предполагающий учет и использование прошлого опыта, называется

278.Общий принцип, указывающий на необходимость экспериментального (опытного, практического) подтверждения концептуальных идей и планов, называется ип, указывающий на необходимость экспериментального (опытного, практического) подтверждения концептуальных идей и планов, на

279.Общий принцип, указывающий на противоречивый, двойственный характер развития человека, организации и общества в целом, называется

280.Обязанности, которые прежде выполнялись одним сотрудником, планируется распределить между двумя работниками. При этом один из них — новичок в организации. На ваш взгляд, следует

281.Один из базовых стилей управления содержит угрозу снижения или потери управляемости организацией при «избыточном делегировании» полномочий

282.Один из базовых стилей управления таит в себе угрозу подавления инициативы подчинённых, субъективизм и «манию величия» руководителя

283.Один из базовых стилей управления требует дополнительных затрат времени и таит угрозу «избыточной коллегиальности» при принятии управленческих решений

284.Один из вариантов децентрализованной структуры коммуникаций обеспечивает свободное межличностное общение в малой группе

285.Один из кандидатов на вакантную должность получил хорошее образование, мотивирован на работу в вашей компании и умеет легко находить общий язык с людьми. Но у него отсутствует опыт работы в аналогичной должности. На Ваш взгляд, следует

286.Один из принципов «школы научного управления»?

287.Определите одну из стадий адаптации

288.Определите проблему, которая может возникнуть при проведении собеседований как инструмента отбора кадров

289.Опыт работы в аналогичной должности

290.Организации с экстенсивным использованием формальных правил и процедур, централизованным принятием решений, узко определенной ответственностью в работе и жесткой иерархии власти являются

291.Организационная культура — это отношения

292.Организационная культура — это

293.Организационная структура — это

294.Организационная структура, построенная на основе прямого распределения должностных обязанностей от высшего звена к низшему, называется

295.Организационно — административная адаптация позволяет работнику

296.Организационные изменения чаще всего терпят неудачу вследствие

297.Организационные структуры, ориентированные на продукт, потребителя или регионы, называются

298.Основателем школы научного управления считается

350.Основная цель первичного отбора состоит в

300.Основной недостаток системы научного управления Ф.Тейлора?

301.Основной современной идеей развития системы управления является создание

302.Основными методами воспитания персонала являются

303.Основными методами обучения (по И.Я. Лернеру) являются

304.Основными формами оплаты труда являются

305.Основными функциями подсистемы развития персонала являются

306.Основой для выработки и принятия решения по стимулированию труда персонала является

307.Основоположником концепции «научного управления» считается

308.Основоположником школы «человеческих отношений» считается

309.Открытые вопросы на собеседовании предполагают

310.Отличительной особенностью срочного трудового договора от бессрочного является то, что в срочном трудовом договоре

311.Отношения занятости возникают по инициативе

312.Официальное положение субъекта в группе, определяющее меру его потенциального влияние на других членов группы, обозначается термином

313.Охотники за головами — это

314.Оценка эффективности деятельности подразделений управления персоналом — это системный процесс, направленный на (выберите все правильные ответы)

315.Первоочередное предоставление льгот и бонусов руководящим сотрудникам

316.Перечислите возможные программы поддержки развития сотрудника, если он стремится установить и закрепить основу для будущего продвижения (более одного правильного ответа)

317.Перечислите закономерные основания для высвобождения работников в организации (более одного правильного ответа)

318.Перечислите качества и навыки, необходимые сотрудникам кадровой службы для успешного выполнения своих функций (более одного правильного ответа)

319.Перечислите наиболее эффективные методы для обучения техническим приемам (ремонт несложной бытовой техники, электродвигателей, прием коммунальных платежей, расчет процентов по вкладам)

320.Перечислите основные элементы, входящие в организационную структуру продвинутой службы управления персоналом крупной организации

321.Перечислите элементы относящиеся к обеспечивающим подсистемам системы управления персоналом

322.Период адаптации к новым обязанностям

323.Планирование карьеры осуществляется прежде всего с целью

324.Планируемое развитие менеджеров за пределами работы предусматривает

325.Планы по человеческим ресурсам определяют

326.По Герцбергу основным фактором, влияющим на удовлетворенность трудом, является

327.По каким аспектам Левис предложил разделить критерии отбора работников из кандидатов?

328.По какому признаку можно классифицировать организационные конфликты?

329.По мнению П.Я. Чаадаева, «существенным элементом нашего (российского) политического величия и истинной причиной нашего умственного бессилия» является фактор

330.По принципам оплаты труд можно разделить на

Тест по психодиагностике, 70 вопросов с ответами

1. При проведении исследований часто встаёт вопрос о том, насколько характерный материал вы используете. Как называется мера соответствия по некоей характеристике испытуемого той популяции, к которой он принадлежит:
а) валидность;
б) вариабельность;
в) репрезентативность;
г) надёжность.

2. Как называется стадия исследования, на которой формулируются идеи о причинах и следствиях избранных для исследования явлений:
а) стадия наблюдения;
б) корреляционная стадия;
в) контрольная стадия;
г) стадия формирования гипотезы.

3. Какое из утверждений описывает понятие валидности:
а) способность теста определять меру дефекта;
б) характеристика единства способов использования теста;
в) показатель того, что тест измеряет то, для измерения чего предназначен;
г) мера вероятности получения ошибочных результатов.

4. Репрезентативность теста указывает на:
а) возможность применения к данной выборке норм, указанных в тесте;
б) степень однородности диагностируемой выборки;
в) насколько результат по данному тесту одного испытуемого отличается от результата другого испытуемого.

5. Какое утверждение определяет понятие стандартизации тестов:
а) приведение теста в соответствие со стандартами;
б) использование единообразных процедур проведения и обсчета результатов;
в) согласование популяционных нормативов с культурными и социальными стандартами.

6. Какое из утверждений точнее всего описывает, что такое коэффициент интеллекта:
а) характеристика имеющихся познавательных способностей;
б) характеристика врожденных способностей;
в) мера приобретенных интеллектуальных навыков;
г) характеристика зоны ближайшего развития.

7. Оценка психологического состояния при помощи системы тестов называется:
а) психодиагностика;
б) диагноз;
в) измерение;
г) психологический эксперимент.

8. Работы, каких двух исследователей стояли у истоков метода тестирования:
а) Э. Крепелина и А. Бине;
б) П. Жане и Ф. Гальтона;
в) Ф. Гальтона и Дж. Кеттелла;
г) Ф. Гальтона и А. Бине.
9. Кто предложил исследование памяти методом пиктограммы:
а) С.Л. Рубинштейн;
б) А.Р. Лурия;
в) Т. Рибо;
г) В.Б. Зейгарник.

10. Используемая в детской диагностике методика обучающего обучения А.Я. Ивановой направлена на изучение:
а) интеллектуального уровня;
б) зоны ближайшего развития;
в) мотивации учебной деятельности;
г) эмоциональных блоков интеллектуальной работы.

11. Целевые установки пробы Бурдона и матриц Равена соотносятся как:
а) предпосылки интеллекта — интеллект;
б) интеллект — мышление;
в) ригидность — гибкость.

12. Что одно из перечисленного является существенным элементом предложенного А.Ф. Лазурским «естественного эксперимента» в отличие от лабораторного:
а) условия эксперимента не связаны с искусственными условиями и требованиями;
б) эксперимент проводится без использования технических средств;
в) экспериментатор включен в выполнение задания вместе с испытуемым;
г) наблюдение в естественных условиях с точностью и научностью эксперимента, когда испытуемый не осведомлен о проводящемся исследовании;
д) применяется специальная аппаратура и четко спланированные задания.

13. Тест фрустрации Розенцвейга относится к одной из названных групп:
а) личностные опросники;
б) тесты достижений;
в) психометрические тесты;
г) проективные методы;
д) свободное интервью.

14. Оценка коэффициента интеллекта опирается на сопоставление:
а) паспортного возраста и уровня образования;
б) умственного и эмоционального возраста;
в) интеллектуального и паспортного возраста;
г) максимальных и минимальных показателей;
д) уровень актуального развития и потенциальных возможностей.

15. Включенное наблюдение – это:
а) наблюдение, использующее «батареи» психологических тестов;
б) длительное наблюдение;
в) наблюдение в условиях лаборатории;
г) наблюдение, при котором психолог является непосредственным участником событий;
д) наблюдение включает в себя несколько этапов.

16. Метод познания, который ограничивается регистрацией выявленных фактов при исследовании возрастных особенностей, называется:
а) формирующим экспериментом;
б) наблюдением;
в) констатирующим экспериментом;
г) квазиэкспериментом;
д) моделированием.

17. Метод активного воздействия исследователя на изменения психики ребенка – это:
а) включенное наблюдение;
б) пилотажный эксперимент;
в) контрольный эксперимент;
г) формирующий эксперимент;
д) констатирующий эксперимент.

18. Синонимом формирующего эксперимента является:
а) квазиэксперимент;
б) проективный эксперимент;
в) контрольный эксперимент;
г) генетико-моделирующий;
д) лабораторный эксперимент.

19. Данные о реальном поведении человека, полученные в ходе внешнего поведения, называются:
а) L- данными;
б) Q- данными;
в) T-данными;
г) Z- данными.

20. Б.Г.Ананьев относит лонгитюдный метод исследования:
а) к организационным методам;
б) к эмпирическим методам;
в) к способам обработки данных;
г) к интерпретационным методам.

21. Тип результатов, регистрируемых с помощью опросников и других методов самооценок, называется:
а) L- данными;
б) Q- данными;
в) T-данными;
г) Z- данными.

22. Целенаправленное, планомерно осуществляемое восприятие объектов, в познании которых заинтересована личность, является:
а) экспериментом;
б) контент-анализом;
в) наблюдением;
г) методом анализа продуктов деятельности.

23. Длительное и систематическое наблюдение, изучение одних и тех же людей, позволяющее анализировать психологическое развитие на различных этапах жизненного пути и на основе этого делать определённые выводы, принято называть исследованием:
а) пилотажным;
б) лонгитюдным;
в) сравнительным;
г) комплексным.

24. Понятие «самонаблюдение» является синонимом термина:
а) интроверсия;
б) интроекция;
в) интроспекция;
г) интроскопия.

25. Краткое, стандартизированное психологическое испытание, в результате которого делается попытка оценить тот или иной психологический процесс или личность в целом, — это:
а) наблюдение;
б) эксперимент;
в) тестирование;
г) самонаблюдение.

26 Получение субъектом данных о собственных психических процессах и состояниях в момент их протекания или вслед за ним – это:
а) наблюдение;
б) эксперимент;
в) тестирование;
г) самонаблюдение.

27. Активное вмешательство исследователя в деятельность испытуемого с целью создания условий для установления психологического факта называется:
а) контекст-анализом;
б) анализом продуктов деятельности;
в) беседой;
г) экспериментом.

28. Способ исследования структуры и характера межличностных отношений людей на основе измерения межличностного выбора называется:
а) контент-анализом;
б) методом сравнения;
в) методом социальных единиц;
г) социометрией.

29. Возможность исследователя вызвать какой-то психический процесс или свойство является главным достоинством:
а) наблюдения;
б) эксперимента;
в) контент-анализа;
г) анализа продуктов деятельности.

30. Оценка согласованности показателей, получаемых при повторном тестировании тех же испытуемых и тем же самым тестом или эквивалентной его формой, характеризует тест с точки зрения его:
а) валидности;
б) достоверности;
в) надёжности.

31. Первые интеллектуальные тесты для детей были разработаны:
а) Бине-Симоном;
б) И.П. Павловым;
в) Эббингаузом.

32. К формализованным методикам относятся:
а) тесты;
б) опросники;
в) проективные методики;
г) психофизиологические методики;
д) все ответы верны;
е) все ответы неверны.

33. К малоформализованным методикам НЕ относят:
а) наблюдение;
б) беседу;
в) анализ продуктов деятельности;
г) опросники;
д) тесты.

34.Стандартизация — это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

35.Надежность- это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

36.Валидность — это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

37. Прием, используемый для повторного обследования испытуемых с помощью одной и той же методики для проверки стабильности диагностируемого признака, называется:
а) константностью;
б) контент-анализ;
в) тест-ретест.

38. Таблицы Шульте предназначены для исследования объема внимания, а таблицы Шульте-Горбова для исследования:
а) устойчивости внимания;
б) концентрации внимания;
в) переключаемости внимания;
г) динамической асимметрии внимания.

39. В каком пункте указаны методики, лучше всего позволяющие выявить разноплановость мышления:
а) классификация и сложение фигур;
б) сложение фигур и исключение предметов;
в) пиктограмма и сложение фигур;
г) классификация и исключение предметов;
д) пиктограмма и классификация.

40. Методика Дембо-Рубинштейн представляет собой:
а) тест уровня самооценки;
б) экспериментально-психологическую методику изучения свойств личности по самооценке;
в) экспериментально-психологическую методику изучения самооценки.

41. Какое из приведенных утверждений НЕ отражает основных правил оценки профиля MMPI:
а) профиль должен оцениваться как единое целое;
б) при оценке профиля наиболее существенно значение Т-нормы по каждой шкале, сравнение с которой отражает степень выраженности психопатологии;
в) профиль характеризует особенности личности и актуальное психическое состояние;
г) при оценке профиля наиболее существенно отношение уровня каждой шкалы к среднему уровню профиля в целом и, особенно, по отношению к соседним шкалам.

42. Тест «чернильных пятен» создан Г. Роршахом:
а) в 1912 г.;
б) в 1921 г.;
в) в 1935 г.;
г) в 1951 г.

43. Минимальный возраст, начиная с которого может использоваться цветовой тест отношений А.М. Эткинда:
а) 3-4 года;
б) 5-6 лет;
в) 7-8 лет;
г) 9-10 лет.

44. «Кубики Кооса», «куб Линка» являются методиками для исследования:
а) процесса решения конструктивных задач;
б) абстрактно-логического мышления;
в) дискурсивного мышления;
г) оперативной памяти.

45. Во взрослом и детском вариантах теста Векслера наиболее культурально-зависимы результаты по тесту:
а) недостающие детали;
б) арифметика;
в) лабиринт;
г) осведомленность.

46. Какой из перечисленных факторов может приводить к снижению показателей по вербальному тесту Векслера:
а) высокий уровень тревоги;
б) высокая потребность в самореализации;
в) высокий уровень внимания;
г) высокая самооценка.

47. Какой из перечисленных тестов НЕ является проективным:
а) ТАТ;
б) тест Роршаха;
в) тест тревожности Спилберга-Ханина;
г) тест незаконченных фраз.

48. Какой из перечисленных тестов НЕ предназначен для оценки интеллектуальных способностей:
а) ТАТ;
б) тест Векслера;
в) тест общих способностей;
г) тест Стенфорд-Бине.

49. Опросник Спилберга-Ханина позволяет:
а) оценить уровень депрессии;
б) выявить склонность к полярным колебаниям аффекта;
в) сопоставить истинную и ситуационную самооценку;
г) сопоставить ситуационную и конституциональную тревожность.

50. Какой из тестов позволяет сопоставить вербальные и невербальные способности:
а) тест Роршаха;
б) тест Векслера;
в) тест Бендер;
г) тест Кеттелла.

51. 16-факторный личностный опросник разработал …..
а) Кеттел
б) Рорших
в) Векслер
г) Бендер

52. Какой из тестов содержит 3 шкалы валидности и 10 клинических шкал:
а) тест Векслера для взрослых;
б) тест Айзенка;
в) MMPI;
г) Тест Кеттелла.

53. Тесты способностей показывают:
а) уровень предшествующей подготовки;
б) степень вклада наследственности в способности;
в) возможности успеха в той или иной области;
г) общий уровень умственных способностей.

54. Какой из цветов в тесте Люшера НЕ относится к основным:
а) синий;
б) желтый;
в) фиолетовый;
г) сине-зеленый.

55. Надежность теста показывает:
а) какую стабильность результатов измерения обеспечивает сам тест;
б) насколько стабильны те свойства и качества, которые измеряются с помощью теста;
в) насколько стабильна процедура подсчета суммарного балла по тесту.

56. Каково исходное назначение опросника Т. Лири:
а) изучение групповой динамики;
б) изучение взаимоотношений в семье;
в) изучение ролевых идентификаций личности;
г) изучение социальной конфликтности.

57. Какое из утверждений верно описывает назначение теста Розенцвейга:
а) выявление агрессивных реакций на стресс;
б) определение уровня стрессоустойчивости;
в) определение типов реагирования на фрустрацию;
г) диагностика клинических типов агрессивности.

58. Методологической основой психодиагностики является:
а) хорошо разработанная психологическая теория;
б) психометрика;
в) практическая область применения психодиагностических методов.

59. Фактор социальной желательности оказывает наибольшее влияние в:
а) ситуации клиента;
б) ситуации экспертизы;
в) патопсихологической диагностики.

60. Содержательная валидность теста – это:
а) степень представленности (репрезентации) исследуемого психологического конструкта в результатах теста;
б) отражение в содержании теста ключевых сторон изучаемого психологического феномена;
в) показатель внутренней однородности (согласованности) теста.

61. Если выборка репрезентативна срезу популяции, то:
а) результаты выборочного распределения можно описать распределением близким к нормальному;
б) результаты выборочного распределения можно описать любым математическим распределением;
в) по результатам выборочного распределения вообще нельзя судить о репрезентативности выборки.

62. Нелинейное преобразование стандартных показателей необходимо для того, чтобы:
а) удобства интерпретации полученных результатов;
б) добиться сопоставимости результатов, принадлежащих к распределениям полученным по различным тестам;
в) добиться сопоставимости результатов, принадлежащих к распределениям различной формы.

63. Социально-психологический норматив – это:
а) статистическая норма, эмпирически полученная на какой-либо выборке;
б) система требований общества к индивиду;
в) индивидуальная норма, рассчитанная для данного конкретного индивида.

64. Идея стандартизации методик и тестов принадлежит:
а) Дж. Кеттелу;
б) В.Вундту;
в) А. Бине.

65. Проективные тесты и методики отличаются от объективных тестов и стандартизированных самоотчетов тем, что:
а) не могут давать объективных и надежных результатов;
б) результаты по тесту не поддаются никакой формализации;
в) интерпретация результатов по тесту зависит от компетентности и уровня квалификации психодиагноста.

66. Экспертная эмпирическая валидизация относится к:
а) теоретическому типу валидизации;
б) практическому типу валидизации;
в) теоретическому и практическому типам валидизации.

67. Конструктная валидность теста – это:
а) степень представленности (репрезентации) исследуемого психологического конструкта в результатах теста;
б) показатель внутренней однородности (согласованности) теста;
в) отражение в содержании теста ключевых сторон изучаемого психического свойства.

68. Между валидностью и надежностью существует следующее соотношение:
а) валидность ≤ надежность;
б) валидность ≥ надежность;
в) валидность = надежность;

69. Достоверность теста – это:
а) его защищенность от фальсификации результатов психодиагностом;
б) его защищенность от влияния на результаты различных внешних воздействий;
в) его защищенность от фальсификации результатов испытуемым;

70. Валидность теста доказывает:
а) независимость результатов теста от мнения психодиагноста;
б) можно ли применять данный тест на практике;
в) измеряет ли тест тот психический феномен, для измерения которого он предназначен.

какие параметры аккумуляторных батарей нужно проверять и как это сделать?

При использовании аккумуляторных батарей на любых объектах, особенно в системах бесперебойного питания, за их состоянием нужно следить и регулярно проводить проверки. В этом материале мы рассмотрим основные параметры АКБ, а также рассмотрим, какими приборами и как можно провести их контроль и проверку!

Основная задача при проверке состояния любой аккумуляторной батареи – выяснить, обладает ли она достаточной емкостью, может ли обеспечить заявленные производителем характеристики в течение необходимого времени. Однако непосредственно средствами измерения определяются только несколько основных параметров – напряжение, сила тока. В обслуживаемых аккумуляторах можно также замерить плотность электролита. Измерения можно проводить неоднократно, фиксируя изменение значений с течением времени. Все остальные параметры и характеристики не измеряются напрямую, а выводятся по разработанной изготовителем методике, причем она зависит и от типа АКБ, и от рекомендаций производителя, и от вида подключенной нагрузки. При этом необходимо учитывать, что многие зависимости, характеризующие работу АКБ, носят нелинейный характер. Могут сказываться и другие факторы, например, влияние температуры.

При выполнении краткосрочных измерений при использовании даже самых совершенных методик тестирование носит не точный количественный, а качественный характер. Единственный достоверный способ измерения емкости АКБ – его полная разрядка в течение многих часов с тщательной фиксацией параметров в ходе всего процесса. Но использовать столь продолжительную процедуру на практике можно далеко не всегда, особенно если батарей много. Тем не менее, и краткосрочных оценочных измерений достаточно для того, чтобы отличить работоспособный аккумулятор от изношенного, утратившего емкость, и вовремя произвести замену АКБ.

Способы проверки АКБ

1. Подключение нагрузки

К АКБ на некоторое время подключается рабочая или второстепенная нагрузка той или иной величины. Вольтметром или мультиметром измеряется падение напряжения. Если процедура выполняется несколько раз, между измерениями выжидается определенное время, чтобы батарея восстановилась. Полученные данные сопоставляются с параметрами, заявленными производителем АКБ для данного типа батареи и данной величины нагрузки.

2. Измерения при помощи нагрузочной вилки

Строение простейшей нагрузочной вилки показано на схеме:

Устройство оснащено вольтметром, параллельно которому установлен большой по мощности нагрузочный резистор, и имеет два щупа. В старых моделях вольтметры аналоговые; новые модели, как правило, оснащены ЖК-дисплеем и цифровым вольтметром. Существуют нагрузочные вилки с усложненной схемой, использующие несколько нагрузочных спиралей (сменных сопротивлений), рассчитанные на разные диапазоны измерения напряжений, предназначенные для тестирования кислотных либо щелочных аккумуляторов. Есть даже вилки, которыми тестируют отдельные банки аккумуляторов. В состав продвинутых устройств помимо вольтметра может входить амперметр.

Получаемые при измерениях данные также необходимо сопоставлять с параметрами, заявленными производителями для данного типа батарей и данного сопротивления.

3. Измерения при помощи специальных устройств, тестеров анализаторов АКБ

Приборы Кулон

Принципиальным развитием идеи нагрузочной вилки можно считать семейство цифровых приборов-тестеров Кулон (Кулон-12/6f, Кулон-12m, Кулон-12n и другие) для проверки состояния свинцовых кислотных аккумуляторов, а также другие подобные устройства. Они позволяют проводить быстрые замеры напряжения, приближенно определять емкость АКБ без контрольного разряда и сохранять в памяти несколько сотен, а иногда и тысяч измерений.

Приборы Кулон питаются от аккумулятора, на котором проводятся измерения. Входящие в комплект провода с разъемами «крокодил» имеют части, изолированные друг от друга, что обеспечивает четырехзажимное подключение к аккумулятору и устраняет влияние на показания прибора сопротивления в точках подключения зажимов. По заявлению разработчика, прибор анализирует отклик аккумулятора на тестовый сигнал специальной формы, при этом измеряемый параметр примерно пропорционален площади активной поверхности пластин аккумулятора и, таким образом, характеризует его емкость. Фактически, точность показаний зависит от достоверности методики, разработанной производителем.

Емкость аккумулятора – электрический заряд, отдаваемый полностью заряженным аккумулятором – измеряется в ампер-часах и представляет собой произведение тока разряда на время. Для точного определения емкости необходимо произвести разряд батареи (процесс длительный, многочасовой), постоянно фиксируя величину заряда, отдаваемого батареей. При этом относительная емкость АКБ в зависимости от времени изменяется нелинейно. Например, для аккумуляторной батареи типа LCL-12V33AP относительная емкость меняется со временем следующим образом:

Время разряда, часы Относительная емкость, %
0,1 37
1,3 48
0,7 53
1,9 76
4,2 84
9,2 92
20 100

Прибор Кулон при помощи быстрого измерения ориентировочно определяет емкость полностью заряженного аккумулятора. Он не предназначен для оценки степени заряженности АКБ, все измерения необходимо проводить на полностью заряженной батарее. Устройство кратковременно подает тестовый сигнал, регистрирует отклик от батареи и через несколько секунд выдает ориентировочную емкость АКБ в ампер-часах. Одновременно на экран выводится измеренное напряжение. Полученные значения можно сохранять в памяти прибора.

Производитель подчеркивает, что устройство не является прецизионным измерителем, но позволяет оценочно определять емкость свинцовой кислотной батареи, особенно если пользователь самостоятельно откалибровал прибор при помощи аккумулятора такого же типа, что и тестируемый, но с известной емкостью. Процедура калибровки подробно изложена в инструкции к прибору.

Тестеры PITE

Следующая разновидность устройств для тестирования АКБ – тестеры PITE: модель  Kongter BT-3915  для измерения внутреннего сопротивления батарей.

Управление осуществляется при помощи цветного сенсорного экрана, но основные управляющие кнопки вынесены на клавиатуру в нижней части корпуса. Прибором можно тестировать батареи емкостью от 5 до 6000 А·ч, с элементами аккумулятора 1.2 В, 2 В, 6 В и 12 В. Диапазон измерения напряжения – от 0.000 В до 16 В, сопротивления – от 0.00 до 100 мОм. Прибор позволяет задать тип проверяемых батарей, выполнить измерение напряжения и сопротивления (модель 3915) или напряжения и проводимости (модель 3918), и на их основании судить о том, соответствует емкость батареи заявленной производителем или нет. При этом параметр Capacity (емкость батареи) выводится в процентах.

Интерфейс прибора позволяет проводить как одиночные измерения, так и последовательные (до 254 измерений в каждой последовательности, совокупное количество результатов более 3000), что удобно при проверке большого количества однотипных АКБ (в последнем случае результаты сохраняются автоматически, помимо данных в них фиксируется также порядковый номер измерения). В зависимости от настроек прибор может использовать для выдачи результата (статуса Good, Pass, Warning или Failed) собственные критерии либо значения, заданные пользователем. Результаты тестирования через порт USB могут быть перенесены на компьютер для просмотра и последующей подготовки отчетов.

Анализаторы Fluke

Более глубокое развитие той же идеи – приборы Fluke Battery Analyzer серии 500 (BT 510, BT 520, BT 521), которые позволяют измерять и сохранять в памяти напряжение, внутреннее сопротивление стационарной батареи, температуру минусовой клеммы, напряжение при разрядке. При наличии дополнительных аксессуаров можно измерять и сохранять в памяти и другие параметры. Тесты можно проводить как в режиме отдельных измерений, так и в последовательном режиме; используя настраиваемые профили. Есть возможность задать пороговые значения для различных параметров. Встроенный порт USB позволяет передавать собранные записи (до 999 записей каждого типа) на компьютер для подготовки отчетов с помощью программного обеспечения Analyze Software, входящего в комплект поставки.

Щупы прибора имеют специальную конструкцию: внутренний подпружиненный контакт предназначен для измерения тока, внешний – для измерения напряжения. Если на щуп надавить, внутренний наконечник смещается внутрь таким образом, что оба контакта каждого щупа касаются поверхности одновременно. В результате одни и те же щупы позволяют организовать как 2-проводное, так и 4-проводное подключение к полюсам батареи (последнее необходимо для измерения Кельвина).

  • Прибор позволяет измерять следующие параметры:

  • Внутреннее сопротивление батареи (измерение занимает менее 3 с).

  • Напряжение батареи (производится одновременно с измерением внутреннего сопротивления)

  • Температура минусовой клеммы (рядом с черным наконечником на щупе BTL21 Interactive Test Probe предусмотрен ИК-датчик)

  • Напряжение при разрядке (определяется несколько раз в ходе разрядки или во время теста на нагрузку)

Также возможно измерение пульсирующего напряжения, измерение переменного и постоянного тока (при наличии токовых клещей и адаптера), выполнение функций мультиметра. С анализаторами Fluke можно использовать интерактивный тестовый щуп BTL21 Interactive Test Probe со встроенным датчиком температуры. С приборами совместимо большое разнообразие дополнительных аксессуаров (токовые клещи, удлинители разного размера, съемный фонарик и т. п.).


 


 

Хотя прибор обладает богатым функционалом, ключевым этапом в определении состояния АКБ остается сопоставление измеренных показателей с расчетными или заданными изготовителем для данного конкретного типа батарей. Устройства Fluke Battery Analyzer серии 500 удобны для массовой инспекции состояния батарей. Последовательный режим и система профилей позволяют выполнять необходимые измерения одно за другим, результаты запоминаются прибором и хранятся в упорядоченной форме, последовательно пронумерованные и разбитые на группы. Но прибор не имеет функции прямого или косвенного измерения емкости АКБ в ампер-часах – хотя бы потому, что для батарей разного типа на сегодняшний день вряд ли возможно разработать единую точную методику такого определения.

Все перечисленные выше устройства, хоть и отличаются друг от друга по размеру, относятся к классу портативных. В отдельную группу можно выделить стационарные комплексы для проверки АКБ, которые могут проводить быстрые испытания с определением внутреннего сопротивления, контролировать все параметры, включая активную и реактивную составляющие сопротивления, управлять процессом разряда/заряда и т. п. Подобные комплексы адресованы скорее исследовательским лабораториям, промышленным производителям АКБ и разработчикам нового оборудования, чем конечным пользователям.

4. Полная разрядка/зарядка

На сегодняшний день полная разрядка и зарядка – это единственный прямой и максимально достоверный способ определения емкости АКБ. Специализированные устройства контроля разряда/заряда батареи (УКРЗ) позволяют выполнить глубокую разрядку и последующую полную зарядку батареи с постоянным контролем емкости. Однако эта процедура занимает очень много времени: 15-17-20-24 часа, иногда и более суток, в зависимости от емкости и текущего состояния батареи. Хотя метод дает наиболее точные результаты, из-за временных затрат его применение ограничено.

5. Измерение плотности электролита

В обслуживаемых аккумуляторах для определения их состояния можно измерять плотность электролита, поскольку между этим параметром и емкостью АКБ существует непосредственная зависимость. Плотность электролита может меняться в силу разных причин, которые вдобавок взаимосвязаны (частый глубокий разряд батареи, сульфатация, неоптимальная плотность электролита, испарение и утечка раствора и т. д.). Аккумулятор начинает быстрее разряжаться, отдает меньше заряд. При этом необходимо понимать, что плотность электролита даже в исправном аккумуляторе, находящемся в идеальном состоянии – не константа, она меняется с температурой и степенью зарядки аккумулятора. Более того, для разных регионов рекомендованная плотность электролита отличается в зависимости от типовых климатических условий.

Результаты измерения плотности ареометром можно сопоставить со следующей диаграммой для кислотных аккумуляторов.

В зависимости от того, больше или меньше плотность электролита, чем требуемая (а для батареи вредно отклонение и в ту, и в другую сторону), можно частично или полностью заменить электролит, залить дистиллированную воду или раствор необходимой концентрации, обязательно обеспечив перемешивание. Как и при использовании всех ранее описанных способов проверки состояния АКБ ключевым является сопоставление измеренных значений с рекомендациями производителя батареи и следование всем предусмотренным процедурам обслуживания.

Выводы

Каждый способ определения текущего состояния аккумуляторной батареи имеет свои преимущества и недостатки. Каким из них пользоваться – зависит от ваших задач и возможностей. Сориентироваться вам поможет эта сводная таблица.

Способ определения состояния АКБ Преимущества Недостатки
Подкл ючение нагрузки Достаточно реалистичные результаты без использования специализированного оборудования Времязатратность при многократных измерениях Измеренные параметры документируются вручную
Нагрузочная вилка, специализированные анализаторы и тестеры

Портативность устройств

Простота использования

Быстрое проведение измерений, особенно многократных

Некоторые модели способны проводить измерения без выведения АКБ из режима эксплуатации

Специализированные модели позволяют сохранять результаты и переносить их на компьютер для подготовки отчетов

Часть параметров АКБ определяется по косвенным методикам Оценочная точность измерений
Полный разряд/заряд Единственный достоверный способ оценки емкости АКБ Очень продолжительная процедура – многие часы, иногда сутки
Измерение плотности электролита ρ Непосредственное определение состояния батареи по концентрации электролита Способ применяется только для обслуживаемых батарей

 

Материал подготовлен
техническими специалистами компании “СвязКомплект”.

Управление персоналом. Тест 10 — ДЕКАН ТЕСТ

1. Анализ работы (должности) может быть использован для:
маркетингового анализа, определения доли рынка
выбора методов отбора для конкретной должности, выработки компенсационных решений
выбора ценовой политики, формы рекламы товаров и услуг
получения информации о наличии необходимой рабочей силы на рынке труда, качественного анализа человеческих ресурсов
анализа финансового состояния фирмы

2. Какие основные параметры отличают различные подходы к проведению анализа работы?
тип собираемой информации, способ сбора информации, форма представления собранной информации
тип анализируемой работы, способ ее выполнения, выбор показателей, степень важности работы для фирмы и конечного продукта (услуги)
возможность количественного измерения работы, выбор показателей, степень важности работы для фирмы и конечного продукта (услуги)
количество типичных рабочих мест на предприятии, уровень автоматизации или механизации работ, место в технологической цепочке
условия труха, экологические и эргономические характеристики

3. Какой из ниже перечисленных этапов анализа работы является третьим?
выбор работника или процесса
подготовка описания работы
анализ работы, наблюдение за намеченными объектами и фиксирование результатов
критическое рассмотрение полученных результатов

подготовка требований к кандидатам

4. Кто из знаменитых промышленников разработал рациональную целевую модель, определяющую метод управления и анализа работы?
Г.Форд
Ф.Тейлор
С.Йошимури
Б.Гейтс
А. Маслоу

5. Чаще всего на практике изложение содержания работы на конкретном рабочем месте в определенное время представлено в виде:
должностной инструкции
трудового договора
листа интервьюера
анкеты работника

6. Аттестация персонала — это:
анализ затрат, связанных с наймом персонала
целенаправленный процесс исследования трудовой мотивации персонала
целенаправленный процесс установления соответствия качественных характеристик персонала требованиям должности или рабочего места
установление функциональной роли работника

7. К какой группе требований, предъявляемых руководителю, можно отнести аналитические способности?
профессиональная компетентность
организаторские способности
личные качества
коммуникативные способности
медицинские показания

8. Какое название носит один из стилей оценочного интервью, в ходе которого менеджер рассказывает подчиненному о том, как он работает, а затем выслушивает точку зрения служащего об оценке работы и о его последующих действиях?
рассказать и выслушать
решение проблемы
«дерево решений»
Бостонская матрица

9. Какой из ниже перечисленных пунктов нельзя отнести к качествам успешного менеджера?
уверенность в себе
опыт в бизнесе
отношение к деньгам как к мере успеха
готовность к компромиссу
настойчивость в решении задач

10. Какой из ниже перечисленных пунктов ограничивает процесс оценки персонала?
единообразие методов оценки
однозначность зависимости между оценкой и деятельностью
различие представлений об эффективности оценки
необходимость наличия большого числа членов аттестационной комиссии
желание большого количества работников пройти процедуру оценки

11. Конечной целью традиционной аттестации (формальный классический государственный вариант) является:
письменное официальное решение, изменяющее или сохраняющее социальное положение аттестуемого в соответствии с его готовностью к исполнению данной социальной роли
выработка мер по улучшению качества работы сотрудника в его рабочем окружении
неофициальные рекомендации по улучшению качества работы сотрудника в его рабочем окружении, развитию его способностей и навыков в связи с требованиями компании
сокращение как можно большего количества работников
составление должностной инструкции для каждой штатной должности

12. Метод оценки персонала, предполагающий проведение беседа с работником в режиме «вопрос-ответ» называется:
анкетный опрос
критический инцидент
интервью
ранжирование
шкалирование

13. Метод, позволяющий выявить наивысшие рейтинги различных сотрудников по тому или иному показателю оценки, через последовательное сравнение сотрудников друг с другом называется методом …
попарного сравнения
принудительного распределения
альтернативных характеристик
упорядочения рангов
управления по целям

14. Чем отличается оценка деятельности в форме западного варианта аттестации (performance appraisal) от традиционной аттестации персонала (формальный классический государственный вариант)?
оценка деятельности накладывает ответственность за результаты деятельности на работника и менеджеров в отличие от аттестации
оценка деятельности всегда закрепляется официальным документом, решением о заработной плате, продвижении, в отличие от аттестации
ничем не отличается
аттестацию проводят коллеги работника, а оценку специальная комиссия
оценка, в отличие от аттестации, проводится по желанию работника

15. Явной функцией аттестации является:
придание большего веса принятым ранее кадровым решениям
углубление знакомства с подчиненными, их возможностями и способностями
эмоциональная разрядка недовольства деятельностью подчиненных
придание коллективу дополнительного стимула для улучшения работы
установление факта пригодности того или иного человека к определенной социальной роли

Экспресс тест для диагностики инфаркта миокарда Тропонин I

Своевременная диагностика заболевания увеличивает шансы на быстрое и полное выздоровление. Очень важно иметь под рукой устройство для исследования, если вопрос касается жизни и смерти. Экспресс тест для диагностики инфаркта миокарда поможет предположить его развитие уже через 2-3 часа после того, как появились первые симптомы.

Принцип работы экспресс теста Тропонин I

Для того, чтобы сердечная мышца работала без перебойно, в ней есть специальный регуляторный комплекс, который состоит из белков тропонина Т и I. Они специфические, потому их называют еще сердечными.

Когда развивается инфаркт, а значит начинается некроз мышечной ткани, белки в большом количестве выделяются в кровь. В норме тропонинов в крови человека практически нет. Потому целесообразно проводить тропониновый тест при инфаркте, если есть причины подозревать развитие заболевания. Основные симптомы нарушения работы сердца такие:

  • Резкая боль за грудиной.
  • Общая слабость.
  • Головокружение и потеря сознания.

Экспресс диагностика инфаркта миокарда выполняется при помощи тестов, которые продаются в аптеках. Они работают по тому же принципу, что и тесты на беременность. Отличительным является используемый биологический материал. Для определения нарушений в работе сердца используют кровь.

На тестовую полоску наносят небольшое количество биологического материала.

Выдерживают временную паузу для того, чтобы вещества могли прореагировать.

Оценивают результат. Если появилась одна полоска, значит заболевания нет. Если две – нужно срочно обратиться за медицинской помощью. В случае, когда на тестовой полоске нет никаких отметин, результат считается недостоверным. Это может свидетельствовать об истечении срока годности или фабричном браке. Исследование нужно повторить.

Достоверность результато
в

Важно понимать, что в первые минуты после возникновения симптомов количество тропинов в крови небольшое. Они еще не успели попасть в кровоток, поскольку процесс некроза проходит медленно. Если результат теста оказался отрицательным, но симптомы яркие, то следует повторить исследование через 3-4 часа.

В случае подтверждения подозрений нужно срочно обратиться к доктору. Но когда результат теста оказался снова отрицательным, а признаки не уходят, это совсем другое заболевание, и нужны клинические исследования.

Поздняя диагностика

Очень часто доктора сталкиваются с тем, что люди не обращают внимание на слабые симптомы и переносят болезнь «на ногах». Когда признаки появляются повторно, тогда больной бежит за помощью в медицинское учреждение. Стандартная эхокардиограмма покажет, что есть отклонения в работе сердца, но точно не сможет определить причину.

В этом случае поможет тропониновый тест на инфаркт. В первые 4-6 часов количество белков резко увеличивается, пик концентрации обычно наступает через 14-20 часов. Попадая в кровяное русло, они остаются там на 10-15 дней. Потому определить перенесенное заболевание можно и через неделю.

Набор реагентов для иммунохроматографического выявления кардиомаркеров в цельной крови.

Состав набора:

  • Тест-плашка в герметической упаковке 1 шт
  • Буфер в пробирке 1 шт
  • Скарификатор 1 шт
  • Спиртовая салфетка 2 шт.
  • Пипетка 1 шт
  • Инструкция 1 шт

 Хранить в сухом месте при температуре от 2 до 28 градусов

Как действуют тесты на беременность, виды тестов

Как действуют тесты на беременность, виды тестов

23 июля 2014 г.

Для любой женщины известие о беременности является очень волнующим моментом, для всех по-разному. Но в любом случае хочется убедиться в наличии или, напротив, в отсутствии беременности, как можно скорее.

Современные медицинские технологии позволяют определять беременность уже с первой недели задержки менструального цикла, еще до визита к врачу. Сделать это дают возможность тесты на беременность. Такие тесты могут быть качественными, т.е. просто определять наличие в моче гормона под названием «хорионический гонадотропин человека», называемого также «гормоном беременности», или его отсутствие. А могут быть и количественными – определять количество ХГЧ в моче или крови. 

Самым популярным инструментом являются тест – полоски для быстрого определения беременности по анализу мочи. Принцип их действия одинаков – это определение наличия гормона в моче методом жидкостной хроматографии. Самый простой и популярный, благодаря своей доступной стоимости тест – обычная бумажная тест-полоска, с нанесенными на нее реактивами.

 

Для проведения теста необходимо собрать порцию мочи в сухую чистую емкость и опустить туда тест до отмеченной линии. После того, как полоска впитает мочу до контрольной линии, тест следует вынуть и оценивать полученный результат в интервале 2 — 5 минут. При отсутствии беременности проявится только одна контрольная полоска, при ее наличии – две полоски.

 

Для точности теста важны чистота посуды, соблюдение техники выполнения теста (не передержать тест в моче или, наоборот, не вынуть раньше времени). Нельзя касаться руками зоны реакции. Именно поэтому не рекомендуется проводить тест в условиях, которые не могут это обеспечить. Результат с высокой вероятностью будет некорректным. Более удобным является кассетный тест на беременность. В этом варианте тест-полоска помещена внутрь пластикового контейнера, и оставлено окошко для нанесения мочи при помощи прилагающейся пипетки. Мочу также следует собрать в чистую емкость. Самой удобной моделью тестов для определения беременности являются струйные тесты, которые не требуют предварительного сбора мочи. Пластиковый корпус достаточно просто подставить тестовой зоной под струю мочи. Естественно, по мере возрастания эргономичности теста, его стоимость увеличивается. Все эти типы полосок для теста доступны практически в каждой аптеке. 

Чувствительность таких тестов для определения беременности достаточно высока и составляет 10 -25 микромоль /мл. Наиболее чувствительны тесты с границей определения 10 микромоль/мл. Это дает возможность определить, есть ли беременность, с точностью около 99%. Для повышения точности следует делать тест в утренние часы, т.к. в это время уровень хориогонадотропина в организме максимально высок. Если вторая полоска бледная, то результат следует считать положительным, можно продублировать тест, когда концентрация гормона повысится (через неделю, например). 

Не так давно в аптеках появилась новинка – тест, позволяющий определить не только присутствие, но и приблизительный срок беременности. Этот электронный тест способен определить не только наличие ХГЧ в моче, но и провести его количественный анализ. А количество гормона в норме напрямую зависит от срока беременности. Несоответствие возможно только в случае угрозы самопроизвольного прерывания беременности или определенных опухолевых заболеваниях органов репродуктивной системы женщины. Некоторые опухоли способны дать и ложноположительный результат при отсутствии беременности. Также результат теста может исказить прием определенных лекарственных препаратов. Стоимость электронного теста достаточно высока, но, тем не менее, он начинает завоевывать популярность у современных женщин.

Беременность можно определить, в том числе, и по анализу крови. Для этого при проявлении каких-либо признаков беременности вам следует посетить лабораторию. Лабораторные методы также основаны на определении хорионического гонадотропина, но на этот раз в крови. Лабораторный тест может быть как качественным, так и количественным. Тест следует проводить обязательно натощак, как и все прочие анализы крови. 

Предлагаемые онлайн тесты для быстрого определения беременности, основанные на анкетировании, не несут никакой достоверности. Так как носят исключительно субъективный характер, и даже опытный врач не ставит диагноз на основании только опроса, без лабораторного подтверждения.

Как только вы получили результат теста, и он оказался положительным, обязательно следует посетить врача для подтверждения факта беременности и постановки на учет. Не забывайте, что контролировать нормальное течение беременности и предотвратить возможные проблемы может только квалифицированный специалист. Вовремя встав на учет в женской консультации, вы позаботитесь о своем собственном здоровье и о здоровье вашего будущего ребенка.

 

 

Как измерить валидность и надежность теста

Недействительные или ненадежные методы оценки могут снизить шансы на достижение заранее определенных академических или учебных целей. Плохо написанные оценки могут даже нанести ущерб общему успеху программы. Важно, чтобы разработчики экзаменов использовали все доступные ресурсы, в частности анализ данных и психометрию, для обеспечения достоверности результатов своей оценки.

Что делает оценку надежной?

Чтобы экзамен или оценка считались надежными, они должны давать стабильные результаты.Отклонения от шаблонов данных и аномальные результаты или ответы могут быть признаком того, что определенные элементы экзамена вводят в заблуждение или ненадежны. Согласно Graide Network, вот три типа надежности, которые могут помочь определить, действительны ли результаты оценки:

  • Надежность тестирования-повторного тестирования измеряет «воспроизводимость результатов».
    • Пример. Учащийся, который дважды сдает один и тот же тест, но в разное время, должен каждый раз получать одинаковые результаты.
  • Надежность альтернативной формы измеряет, «насколько результаты тестов сравниваются по двум аналогичным оценкам, полученным за короткий промежуток времени».
    • Пример. Учащийся, который сдает две разные версии одного и того же теста, должен каждый раз давать одинаковые результаты.
  • Надежность внутренней согласованности измеряет, «как фактическое содержание оценки работает вместе для оценки понимания концепции».
    • Пример. Учащийся, которому задают несколько вопросов, оценивающих одно и то же, должен дать одинаковый ответ на каждый вопрос.

Использование этих трех типов показателей надежности может помочь учителям и администраторам гарантировать, что их оценки будут максимально последовательными и точными.

Как повысить достоверность теста?

Под достоверностью оценки понимается то, насколько точно или эффективно она измеряет то, для чего она предназначена, отмечает Управление академической оценки Университета Северной Айовы. Если разработчики тестов или преподаватели не учтут все аспекты создания экзаменов, помимо содержания, их экзамены могут быть поставлены под угрозу.Например, тест по политологии с заданиями, составленными с использованием сложных формулировок или фраз, может непреднамеренно перейти на оценку понимания прочитанного. Точно так же экзамен по истории искусства, который укладывается в шаблон вопросов об рассматриваемом историческом периоде без ссылки на искусство или художественные движения, может не точно измерять цели курса. Подобные непреднамеренные ошибки могут иметь разрушительное влияние на достоверность экзамена. В тематическом исследовании из The Journal of Competency-Based Education предлагается следовать этим передовым принципам разработки, чтобы помочь сохранить действительность экзамена:

  1. Установите цель теста.

Это первый и, возможно, самый важный шаг в разработке экзамена. При составлении экзамена важно учитывать предполагаемое использование оценочных баллов. Экзамен должен измерять уровень владения языком или предсказывать успех? «Если вначале уделить время определению четкой цели, это поможет обеспечить более эффективное выполнение целей и приоритетов».

  1. Выполните анализ задания / теста (JTA).

Этот важный шаг при создании экзамена проводится для того, чтобы точно определить, какими профессиональными характеристиками должен обладать человек перед тем, как приступить к работе.«JTA способствует валидности оценки, гарантируя, что критические аспекты области становятся областями содержания, которые измеряет оценка».

  1. Создайте пул товаров.

После того, как цель экзамена, а также конкретные знания и навыки, которые он должен оценивать, определены, пора приступить к созданию экзаменационных заданий или вопросов. «Обычно группа экспертов в предметной области (SME) собирается для написания набора тестовых заданий.Панель предназначена для написания заданий в соответствии с областями содержания и когнитивными уровнями, указанными в тестовом плане ».

  1. Просмотрите задания экзамена.

После того, как экзаменационные вопросы созданы, они проверяются группой экспертов, чтобы убедиться в отсутствии конструктивных недостатков. Экзаменационные задания проверяются на грамматические ошибки, технические недостатки, точность и правильность набора текста. «Кроме того, элементы проверяются на чувствительность и язык, чтобы соответствовать различным студентам.”

  1. Провести анализ позиции.

Этот важный этап подготовки к экзамену включает использование данных и статистических методов, таких как психометрия, для проверки действительности оценки. «Если задание слишком простое, слишком сложное, не позволяет показать разницу между опытными и неквалифицированными испытуемыми или даже выставлено неверно, анализ задания покажет это».

Улучшение экзаменов в целом с помощью данных и психометрии

Один из наиболее эффективных способов улучшить качество оценки — это использование психометрии.ExamSoft дает определение психометрии: «Психометрия буквально означает ментальное измерение или анализ, это важные статистические показатели, которые предоставляют составителям экзаменов и администраторам стандартный набор данных для проверки надежности, согласованности и качества экзамена». Вот психометрические параметры, одобренные оценочным сообществом для оценки качества экзамена:

  • Индекс сложности задания (p-значение): Определяет общую сложность экзаменационного задания.
  • Индекс сложности для высших классов (27% для высших): Определяет, насколько сложными были экзаменационные задания для участников, набравших наибольшее количество баллов.
  • Индекс более низкой сложности (27% ниже): Определяет, насколько сложными были экзаменационные задания для участников с наименьшими баллами.
  • Индекс дискриминации: Обеспечивает сравнительный анализ верхних и нижних 27% испытуемых.
  • Баллов Коэффициент корреляции двух серий: Измеряет корреляцию между ответом экзаменуемого по конкретному заданию и его результатами на экзамене в целом.
  • Формула Кудера-Ричардсона 20 (KR-20): Оценивает общий экзамен на основе согласованности, успеваемости и сложности всех экзаменационных заданий.

Важно отметить, что точки психометрических данных не предназначены для самостоятельного использования в качестве индикаторов валидности экзамена. Эти статистические данные следует использовать вместе для определения контекста и в сочетании с целями программы для целостного понимания экзамена и его вопросов. При правильном использовании точки психометрических данных могут помочь администраторам и разработчикам тестов улучшить свои оценки следующими способами:

  • Выявить вопросы, которые могут быть слишком сложными.
  • Определите вопросы, которые могут оказаться недостаточно сложными.
  • Избегайте случаев выбора более одного правильного ответа.
  • Исключите экзаменационные задания, которые измеряют неверные результаты обучения.
  • Повсеместно повысьте надежность (предварительное тестирование, альтернативная форма и внутренняя согласованность).

Использование наиболее надежных оценок дает преимущества каждому

Обеспечение правильности и надежности экзаменов является важнейшей задачей разработчиков тестов. Психометрические данные могут иметь большое значение между некорректным экзаменом, требующим проверки, и оценкой, которая дает точную картину того, усвоили ли студенты содержание курса и готовы ли они выполнять свою карьеру.


Источники:

The Graide Network: Важность валидности и надежности в классных оценках

Университет Северной Айовы: Изучение надежности в академической оценке

Журнал об образовании, основанном на компетенциях: Повышение достоверности объективной оценки в высшем учебном заведении Образование: шаги по созданию лучшей в своем классе программы оценки на основе компетенций

ExamSoft: качество экзаменов с помощью психометрического анализа

Опубликовано: 28 апреля 2021 г.

Изменено: 29 апреля 2021 г.

Надежность и действительность Измерение

Цели обучения

  1. Определите надежность, включая различные типы и способы их оценки.
  2. Определите срок действия, включая различные типы и способы их оценки.
  3. Опишите виды доказательств, которые могут иметь отношение к оценке надежности и действительности той или иной меры.

Опять же, измерение включает в себя присвоение баллов отдельным лицам, чтобы они отражали некоторые характеристики людей. Но как исследователи узнают, что оценки на самом деле представляют характеристику, особенно если это такие конструкты, как интеллект, самооценка, депрессия или объем рабочей памяти? Ответ заключается в том, что они проводят исследование, используя эту меру, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции.Это очень важный момент. Психологи не просто предполагают , что их меры работают. Вместо этого они собирают данные для , чтобы продемонстрировать , что они работают. Если их исследование не демонстрирует, что мера работает, они прекращают ее использовать.

В качестве неформального примера представьте, что вы сидите на диете в течение месяца. Ваша одежда кажется более свободной, и несколько друзей спросили, похудели ли вы. Если на этом этапе ваши весы для ванной показывают, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжили бы пользоваться весами.Но если бы это указывало на то, что вы набрали 10 фунтов, вы бы справедливо пришли к выводу, что он сломан, и либо почините его, либо избавьтесь от него. Оценивая метод измерения, психологи принимают во внимание два основных аспекта: надежность и валидность.

Надежность

Надежность относится к последовательности меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (надежность между экспертами).

Проверка-повторная проверка надежности

Когда исследователи измеряют конструкт, который, по их мнению, является непротиворечивым во времени, полученные ими оценки также должны быть согласованными во времени. Надежность повторных испытаний — это степень, в которой это действительно так. Например, обычно считается, что интеллект постоянен во времени. Человек, который сегодня очень умный, на следующей неделе станет очень умным. Это означает, что любой хороший показатель интеллекта должен дать этому человеку примерно такие же оценки на следующей неделе, что и сегодня.Ясно, что мера, которая дает очень непоследовательные оценки с течением времени, не может быть очень хорошей мерой конструкции, которая должна быть согласованной.

Оценка надежности повторного тестирования требует использования этого показателя одновременно на группе людей, его повторного использования на той же группе людей в более позднее время, а затем анализа корреляции повторного тестирования между двумя наборами критериев. оценки. Обычно это делается путем построения графика данных в виде диаграммы рассеяния и вычисления r Пирсона.На рис. 5.2 показана корреляция между двумя наборами оценок нескольких студентов университетов по шкале самооценки Розенберга, введенной два раза с интервалом в неделю. Коэффициент Пирсона для этих данных равен +,95. Обычно считается, что корреляция между тестами и повторными тестами +80 или выше указывает на хорошую надежность.

Рис. 5.2 Корреляция между тестами и повторными тестами между двумя наборами оценок нескольких студентов колледжа по шкале самооценки Розенберга, полученных два раза в неделю с интервалом

Опять же, высокая корреляция между тестами и ретестами имеет смысл, когда предполагается, что измеряемый конструкт остается неизменным во времени, что имеет место в случае интеллекта, самооценки и измерений личности Большой пятерки.Но другие конструкции не считаются стабильными с течением времени. Например, сама природа настроения такова, что оно меняется. Таким образом, показатель настроения, который дает низкую корреляцию между тестами и повторными тестами в течение месяца, не будет поводом для беспокойства.

Внутренняя согласованность

Второй вид надежности — это внутренняя согласованность , которая представляет собой согласованность ответов людей по элементам при измерении нескольких элементов. В целом предполагается, что все элементы таких показателей отражают одну и ту же основную конструкцию, поэтому оценки людей по этим вопросам должны коррелировать друг с другом.По шкале самооценки Розенберга люди, которые согласны с тем, что они достойные люди, должны соглашаться с тем, что у них есть ряд хороших качеств. Если ответы людей на разные вопросы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же основную конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самооценки. Например, люди могут сделать серию ставок в имитируемой игре в рулетку, чтобы измерить свой уровень стремления к риску.Этот показатель будет внутренне согласованным в той степени, в которой ставки отдельных участников будут постоянно высокими или низкими в ходе испытаний.

Как и надежность повторного тестирования, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов состоит в том, чтобы взглянуть на корреляцию с разделением половин . Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четным и нечетным номерами. Затем для каждого набора элементов вычисляется оценка и исследуется взаимосвязь между двумя наборами оценок.Например, на рис. 5.3 показана корреляция между двумя частицами между оценками нескольких студентов университетов по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга. Значение r Пирсона для этих данных составляет +,88. Корреляция разделенных половин, равная +80 или больше, обычно считается хорошей внутренней согласованностью.

Рис. 5.3. Корреляция деления половин между результатами нескольких студентов колледжа по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга

Пожалуй, наиболее распространенным показателем внутренней согласованности, используемым исследователями в области психологии, является статистика под названием α Кронбаха (греческая буква альфа).Концептуально α — это среднее значение всех возможных корреляций разделенных половин для набора элементов. Например, существует 252 способа разделить набор из 10 элементов на два набора по пять. Α Кронбаха будет средним из 252 корреляций разделенных половин. Обратите внимание, что на самом деле α вычисляется не так, но это правильный способ интерпретации значения этой статистики. Опять же, обычно используется значение +80 или больше, чтобы указать на хорошую внутреннюю согласованность.

Надежность Interrater

Многие поведенческие меры требуют значительного суждения со стороны наблюдателя или оценщика. Надежность между экспертами — это степень, в которой разные наблюдатели едины в своих суждениях. Например, если вы заинтересованы в измерении социальных навыков студентов университета, вы можете сделать видеозаписи их взаимодействия с другим студентом, с которым они встречаются впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той степени, в которой каждый участник действительно обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом.Надежность между экспертами также могла быть измерена в исследовании куклы Бобо Бандуры. В этом случае оценки наблюдателей того, сколько актов агрессии совершил конкретный ребенок во время игры с куклой Бобо, должны были иметь очень положительную корреляцию. Надежность между экспертами часто оценивается с помощью α Кронбаха, когда суждения являются количественными, или аналогичной статистики, называемой κ Коэна (греческая буква каппа), когда они категоричны.

Срок действия

Действительность — это степень, в которой баллы из меры представляют переменную, для которой они предназначены.Но как исследователи делают такое суждение? Мы уже учли один фактор, который они учитывают, — надежность. Если показатель имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки соответствуют тому, что им положено. Однако здесь должно быть что-то еще, потому что мера может быть чрезвычайно надежной, но совершенно бесполезной. В качестве абсурдного примера представьте человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам людей.Хотя эта мера имела бы чрезвычайно хорошую надежность повторного тестирования, она не имела бы абсолютно никакой ценности. Тот факт, что указательный палец одного человека на сантиметр длиннее, чем у другого, ничего не говорит о том, у кого из них выше самооценка.

Обсуждения валидности обычно делят его на несколько различных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды свидетельств, помимо надежности, которые следует принимать во внимание при оценке достоверности меры.Здесь мы рассматриваем три основных типа: валидность лица, валидность содержания и валидность критерия.

Лицевая действительность

Лицевая достоверность — это степень, в которой метод измерения проявляется «на лице» для измерения интересующей конструкции. Большинство людей ожидают, что в анкету для самооценки будут включены вопросы о том, считают ли они себя достойным человеком и обладают ли они хорошими качествами. Таким образом, анкета, включающая такие вопросы, будет иметь хорошую внешнюю валидность.С другой стороны, метод измерения самооценки на расстоянии пальца, похоже, не имеет ничего общего с самооценкой и, следовательно, имеет низкую достоверность. Хотя фактическая валидность может быть оценена количественно — например, с помощью большой выборки людей, оценивающих меру с точки зрения того, действительно ли она измеряет то, для чего она предназначена, — обычно она оценивается неформально.

Фактическая достоверность — это в лучшем случае очень слабое свидетельство того, что метод измерения измеряет то, что должен.Одна из причин заключается в том, что это основано на интуиции людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепринятые меры в психологии работают достаточно хорошо, несмотря на недостаточную достоверность. Миннесотский многофазный опросник личности-2 (MMPI-2) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, причем многие из утверждений не имеют очевидного отношения к конструкции, которую они измеряют. .Например, пункты «Мне нравятся детективы или детективы» и «Вид крови не пугает меня и не вызывает тошноту», оба измеряют подавление агрессии. В данном случае интерес представляют не буквальные ответы участников на эти вопросы, а, скорее, соответствие модели ответов участников на серию вопросов ответам людей, которые склонны подавлять свою агрессию.

Срок действия содержимого

Достоверность содержимого — это степень, в которой мера «покрывает» интересующий конструкт.Например, если исследователь концептуально определяет тестовую тревогу как связанную как с активацией симпатической нервной системы (ведущей к нервным переживаниям), так и с негативными мыслями, то его мера тестовой тревожности должна включать вопросы как о нервных переживаниях, так и о негативных мыслях. Или подумайте, что отношения обычно определяются как связанные с мыслями, чувствами и действиями по отношению к чему-либо. Согласно этому концептуальному определению, человек положительно относится к упражнениям в той мере, в какой он или она думает о тренировках положительно, чувствует себя хорошо во время тренировок и фактически занимается спортом.Таким образом, чтобы иметь хорошую достоверность содержания, показатель отношения людей к упражнениям должен отражать все три этих аспекта. Как и фактическая достоверность, достоверность содержания обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.

Срок действия критерия

Достоверность критерия — это степень, в которой оценки людей по показателю коррелируют с другими переменными (известными как критерии ), с которыми можно было бы ожидать их корреляции.Например, оценки людей по новому критерию тревожности при тестировании должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что оценки людей на самом деле отрицательно коррелировали с их успеваемостью на экзамене, то это было бы доказательством того, что эти оценки действительно отражают тревогу людей перед тестированием. Но если бы выяснилось, что люди одинаково хорошо сдавали экзамен, независимо от их тестовой тревожности, это поставило бы под сомнение достоверность этой меры.

Критерием может быть любая переменная, которая, как есть основания полагать, должна коррелировать с измеряемым конструктом, и обычно их много. Например, можно было бы ожидать, что результаты теста на тревожность будут отрицательно коррелировать с успеваемостью на экзамене и оценками по курсу и положительно коррелироваться с общим беспокойством и артериальным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру принятия физического риска. Баллы людей по этому показателю должны соотноситься с их участием в «экстремальных» видах деятельности, таких как сноубординг и скалолазание, количеством полученных штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы.Когда критерий измеряется одновременно с построением, достоверность критерия упоминается как одновременная достоверность ; однако, когда критерий измеряется в какой-то момент в будущем (после того, как конструкция была измерена), он упоминается как прогностическая достоверность (поскольку оценки по этому показателю «предсказали» будущий результат).

Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые меры тестовой тревожности или принятия физического риска будут положительно коррелированы с существующими показателями тех же конструктов.Это известно как конвергентная достоверность .

Оценка конвергентной достоверности требует сбора данных с помощью меры. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самоотчета «Потребность в познании», чтобы измерить, насколько люди ценят и вовлечены в мышление (Cacioppo & Petty, 1982). В серии исследований они показали, что оценки людей положительно коррелировали с их оценками по стандартизированному тесту академических достижений, и что их оценки отрицательно коррелировали с их оценками по показателю догматизма (который представляет собой тенденцию к послушанию).За годы, прошедшие с момента создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и МакКаслин, 2009 г.).

Дискриминантная валидность

Дискриминантная валидность , с другой стороны, — это степень, в которой оценки по показателю , а не коррелируют с мерами переменных, которые концептуально различны.Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, которое бывает хорошим или плохим в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новый показатель самооценки был сильно коррелирован с показателем настроения, можно было бы утверждать, что новый показатель на самом деле не измеряет самооценку; вместо этого он измеряет настроение.

При создании шкалы потребности в познании Качиоппо и Петти также предоставили доказательства дискриминантной валидности, показав, что оценки людей не коррелировали с некоторыми другими переменными.Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части, или целостным образом в терминах «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их склонностью реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличную конструкцию.

Основные выводы

  • Психологические исследователи не просто предполагают, что их меры работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что работают, они прекращают их использовать.
  • Есть два различных критерия, по которым исследователи оценивают свои измерения: надежность и валидность. Надежность — это постоянство во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между исследователями (надежность между экспертами).Достоверность — это степень, в которой оценки фактически представляют переменную, для которой они предназначены.
  • Действительность — это решение, основанное на различных типах доказательств. Соответствующие свидетельства включают надежность меры, то, покрывает ли она интересующий конструкт и коррелируют ли полученные оценки с другими переменными, с которыми они, как ожидается, коррелируют, а не коррелируют ли с переменными, которые концептуально различны.
  • Надежность и валидность меры устанавливаются не каким-либо одним исследованием, а результатами нескольких исследований.Оценка надежности и достоверности — непрерывный процесс.

Упражнения

  1. Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделенных половин (элементы с четным и нечетным номерами). Вы также можете вычислить r Пирсона, если знаете как.
  2. Обсуждение. Вспомните последний экзамен в колледже, который вы сдавали, и воспринимайте его как психологическую меру. Как вы думаете, для измерения какой конструкции она предназначалась? Прокомментируйте его лицо и достоверность содержания.Какие данные вы могли бы собрать, чтобы оценить их надежность и валидность критериев?

Глава 7 Надежность и валидность весов

В предыдущей главе были рассмотрены некоторые трудности с измерением конструктов в социальных исследованиях. Например, как мы узнаем, измеряем ли мы «сострадание», а не «сочувствие», если оба конструкта в некоторой степени похожи по значению? Или сострадание — это то же самое, что сочувствие? Его усложняет то, что иногда эти конструкции являются воображаемыми концепциями (т.е., они не существуют в действительности), и многомерны (в этом случае у нас есть дополнительная проблема определения их составляющих измерений). Следовательно, недостаточно просто измерять построения социальных наук с использованием любой шкалы, которую мы предпочитаем. Мы также должны протестировать эти шкалы, чтобы убедиться, что: (1) эти шкалы действительно измеряют ненаблюдаемую конструкцию, которую мы хотели измерить (т. Е. Шкалы «действительны»), и (2) они последовательно и точно измеряли предполагаемую конструкцию (т. Е. , весы «надежные»).Надежность и достоверность, вместе называемые «психометрическими свойствами» шкал измерения, являются критериями, по которым в научных исследованиях оценивается адекватность и точность наших процедур измерения.

Мера может быть надежной, но недействительной, если она измеряет что-то очень последовательно, но постоянно измеряет неверную конструкцию. Точно так же мера может быть действительной, но ненадежной, если она измеряет правильную конструкцию, но не делает это последовательным образом.Используя аналогию со стреляющей мишенью, как показано на рис. 7.1, многопозиционная мера конструкции, которая является одновременно надежной и действительной, состоит из выстрелов, сгруппированных в узком диапазоне около центра мишени. Достоверная, но ненадежная мера будет состоять из выстрелов, сосредоточенных в центре цели, но не сгруппированных в узком диапазоне, а скорее разбросанных по цели. Наконец, надежная, но недействительная мера будет состоять из выстрелов, сгруппированных в узком диапазоне, но не от цели.Следовательно, надежность и валидность необходимы для обеспечения адекватного измерения интересующих конструкций.

Рисунок 7.1. Сравнение надежности и достоверности

Надежность

Надежность — это степень, в которой мера конструкции является последовательной или надежной. Другими словами, если мы используем эту шкалу для многократного измерения одной и той же конструкции, получим ли мы практически одинаковый результат каждый раз, если исходное явление не меняется? Пример ненадежного измерения — люди угадывают ваш вес.Вполне вероятно, что люди будут догадываться по-разному, разные меры будут несовместимы, и, следовательно, метод измерения «наугад» ненадежен. Более надежным измерением может быть использование весов, на которых вы, вероятно, будете получать одно и то же значение каждый раз, когда встанете на весы, если только ваш вес действительно не изменился между измерениями.

Обратите внимание, что надежность подразумевает последовательность, но не точность. В предыдущем примере весов, если весы откалиброваны неправильно (скажем, чтобы сбросить десять фунтов от вашего истинного веса, просто чтобы вы почувствовали себя лучше!), Они не будут измерять ваш истинный вес и, следовательно, не будут действительная мера.Тем не менее, неправильно откалиброванные весы будут каждый раз давать вам один и тот же вес (что на десять фунтов меньше вашего истинного веса), и, следовательно, весы надежны.

Каковы источники ненадежных наблюдений в измерениях социальных наук? Одним из основных источников является субъективность наблюдателя (или исследователя). Если моральный дух сотрудников в фирме измеряется путем наблюдения за тем, улыбаются ли сотрудники друг другу, шутят ли они и т. некогда шутить или болтать) или светлый день (когда они более веселые или болтливые).Два наблюдателя также могут сделать вывод о разном уровне морального духа в один и тот же день, в зависимости от того, что они считают шуткой, а что нет. «Наблюдение» — это качественный метод измерения. Иногда надежность может быть повышена путем использования количественных показателей, например, путем подсчета количества жалоб, поданных за один месяц, как показателя морального духа (обратного). Конечно, обиды могут быть, а могут и не быть действительной мерой морального духа, но они менее подвержены человеческой субъективности и, следовательно, более надежны.Второй источник ненадежных наблюдений — это неточные или двусмысленные вопросы. Например, если вы спросите людей, какова их зарплата, разные респонденты могут интерпретировать этот вопрос по-разному, как месячную зарплату, годовую зарплату или почасовую заработную плату, и, следовательно, полученные в результате наблюдения, вероятно, будут сильно расходящимися и ненадежными. Третий источник ненадежности — это вопросы о проблемах, которые респонденты не очень хорошо знают или не волнуют, например, спросить выпускника американского колледжа, удовлетворен ли он / она отношениями Канады со Словенией, или попросить главного исполнительного директора оценить эффективность технологической стратегии его компании — то, что он, вероятно, делегировал руководителю отдела технологий.

Так как же создать надежные меры? Если ваше измерение включает сбор информации у других, как это имеет место в большинстве исследований в области социальных наук, то вы можете начать с замены методов сбора данных, которые больше зависят от субъективности исследователя (например, наблюдений), на методы, которые в меньшей степени зависят от субъективности (например, как анкета), задавая только те вопросы, ответы на которые респонденты могут знать, или проблемы, которые их волнуют, избегая двусмысленных пунктов в ваших измерениях (например,g., четко указав, ищете ли вы годовую зарплату) и упростив формулировку показателей, чтобы они не были неправильно истолкованы некоторыми респондентами (например, избегая сложных слов, значения которых они могут не знать). Эти стратегии могут повысить надежность наших измерений, даже если они не обязательно сделают измерения полностью надежными. Измерительные приборы все же должны быть проверены на надежность. Есть много способов оценки надежности, которые обсуждаются далее.

Межэкспертная надежность. Надежность между экспертами, также называемая надежностью между экспертами, является мерой согласованности между двумя или более независимыми экспертами (наблюдателями) одной и той же конструкции. Обычно это оценивается в пилотном исследовании и может быть выполнено двумя способами, в зависимости от уровня измерения конструкции. Если мера является категориальной, определяется набор всех категорий, оценщики отмечают, в какую категорию попадает каждое наблюдение, а процент согласия между оценщиками является оценкой надежности между оценщиками.Например, если два эксперта оценивают 100 наблюдений в одну из трех возможных категорий, и их рейтинги соответствуют 75% наблюдений, то надежность между экспертами составляет 0,75. Если мера имеет интервальную или пропорциональную шкалу (например, активность в классе измеряется каждые 5 минут двумя оценщиками по шкале ответов от 1 до 7), то простая корреляция между показателями двух оценщиков также может служить оценкой меж- надежность оценщика.

Тест-ретест надежности.Надежность повторного тестирования — это мера согласованности между двумя измерениями (тестами) одной и той же конструкции, примененными к одному и тому же образцу в два разных момента времени. Если между двумя тестами наблюдения существенно не изменились, то измерение является надежным. Корреляция в наблюдениях между двумя тестами является оценкой надежности повторного тестирования. Обратите внимание, что временной интервал между двумя тестами имеет решающее значение. Как правило, чем больше временной промежуток, тем больше вероятность того, что два наблюдения могут измениться в течение этого времени (из-за случайной ошибки), и тем ниже будет надежность повторного тестирования.

Надежность при разделении половин. Надежность с разделением половин — это мера согласованности между двумя половинами меры построения. Например, если у вас есть мера из десяти элементов данной конструкции, случайным образом разделите эти десять элементов на два набора по пять (допускаются неравные половины, если общее количество элементов нечетное) и примените весь инструмент к выборке из респонденты. Затем вычислите общий балл для каждой половины для каждого респондента, и корреляция между общими баллами в каждой половине является мерой надежности разделенной половины.Чем длиннее инструмент, тем больше вероятность того, что две половины меры будут похожи (поскольку случайные ошибки сводятся к минимуму по мере добавления дополнительных элементов), и, следовательно, этот метод имеет тенденцию систематически переоценивать надежность более длинных инструментов.

Надежность внутренней согласованности. Надежность внутренней согласованности — это мера согласованности между различными элементами одной и той же конструкции. Если респондентам вводится мера построения, состоящая из нескольких пунктов, степень, в которой респонденты оценивают эти пункты одинаковым образом, является отражением внутренней согласованности.Эта надежность может быть оценена с точки зрения средней корреляции между элементами, средней корреляции между элементами или, как правило,

.

Альфа Кронбаха. Например, если у вас есть шкала с шестью элементами, у вас будет пятнадцать различных пар элементов и пятнадцать корреляций между этими шестью элементами. Средняя корреляция между элементами — это среднее значение этих пятнадцати корреляций. Чтобы рассчитать среднюю корреляцию между элементами и общим количеством элементов, вам необходимо сначала создать «общий» элемент, добавив значения всех шести элементов, вычислить корреляции между этим общим элементом и каждым из шести отдельных элементов и, наконец, усреднить шесть элементов. корреляции.Ни одна из двух вышеперечисленных мер не учитывает количество элементов в мере (в этом примере шесть элементов). Альфа Кронбаха, показатель надежности, разработанный

Ли Кронбах в 1951 году, фактор размера шкалы при оценке надежности, рассчитанный по следующей формуле:

, где K — количество пунктов в измерении, — дисперсия (квадрат стандартного отклонения) наблюдаемых общих оценок и — наблюдаемая дисперсия для пункта i. Стандартизированная альфа Кронбаха может быть вычислена по более простой формуле:

, где K — количество элементов, — средняя корреляция между элементами, т.е.е., среднее значение коэффициентов K (K -1) / 2 в верхней треугольной (или нижней треугольной) корреляционной матрице.

Срок действия

Валидность, часто называемая валидностью конструкции, относится к степени, в которой мера адекватно представляет лежащую в основе конструкцию, которую она должна измерять. Например, действительно ли мера сострадания измеряет сострадание, а не другое понятие, такое как сочувствие? Валидность может быть оценена с использованием теоретических или эмпирических подходов, а в идеале должна измеряться с использованием обоих подходов.Теоретическая оценка валидности фокусируется на том, насколько хорошо идея теоретической конструкции транслируется или представлена ​​в оперативном измерении. Этот тип валидности называется трансляционной валидностью (или репрезентативной валидностью) и состоит из двух подтипов: валидность лица и валидность содержания. Трансляционная валидность обычно оценивается с помощью группы экспертов-судей, которые оценивают каждый элемент (индикатор) по тому, насколько хорошо они соответствуют концептуальному определению этой конструкции, и качественной методики, называемой Q-сортировкой.

Эмпирическая оценка достоверности исследует, насколько хорошо данная мера соотносится с одним или несколькими внешними критериями на основе эмпирических наблюдений. Этот тип валидности называется валидностью, связанной с критерием, и включает четыре подтипа: конвергентная, дискриминантная, одновременная и прогностическая валидность. В то время как валидность перевода проверяет, является ли мера хорошим отражением лежащей в основе конструкции, валидность, связанная с критериями, исследует, ведет ли данная мера должным образом с учетом теории этой конструкции.Эта оценка основана на количественном анализе наблюдаемых данных с использованием статистических методов, таких как корреляционный анализ, факторный анализ и т. Д. Различие между теоретической и эмпирической оценкой достоверности показано на рисунке 7.2. Однако оба подхода необходимы для адекватного обеспечения достоверности показателей в социальных исследованиях.

Обратите внимание, что различные типы валидности, обсуждаемые здесь, относятся к валидности процедур измерения, которая отличается от валидности процедур проверки гипотез, таких как внутренняя валидность (причинность), внешняя валидность (обобщаемость) или валидность статистических выводов.Последние типы валидности обсуждаются в следующей главе.

Фактическая годность. Внешняя валидность относится к тому, кажется ли индикатор разумной мерой лежащей в его основе конструкции «на первый взгляд». Например, частота посещения религиозных служб, кажется, имеет смысл как показатель религиозности человека без особых объяснений. Следовательно, этот показатель имеет фактическую ценность. Однако, если бы мы предположили, сколько книг было извлечено из офисной библиотеки в качестве меры морального духа сотрудников, тогда такая мера, вероятно, не имела бы фактической достоверности, потому что она, похоже, не имеет большого смысла.Интересно, что некоторые из популярных мер, используемых в исследованиях организаций, не имеют фактической достоверности. Например, абсорбционная способность организации (сколько новых знаний она может усвоить для улучшения организационных процессов) часто измеряется как интенсивность исследований и разработок (т. Е. Расходы на НИОКР, деленные на валовую выручку)! Если ваше исследование включает в себя очень абстрактные конструкции или конструкции, которые сложно концептуально отделить друг от друга (например, сострадание и сочувствие), возможно, стоит подумать об использовании группы экспертов для оценки фактической достоверности ваших показателей построения.

Рисунок 7.2. Два подхода к оценке валидности

Срок действия. Достоверность содержимого — это оценка того, насколько хорошо набор элементов шкалы совпадает с соответствующей областью содержимого конструкции, которую он пытается измерить. Например, если вы хотите измерить конструкт «удовлетворенность ресторанным обслуживанием» и определяете предметную область ресторанного обслуживания как включающую качество еды, вежливость обслуживающего персонала, продолжительность ожидания и общую атмосферу ресторана ( я.е., является ли он шумным, задымленным и т. длительность ожидания и атмосфера в ресторане. Конечно, этот подход требует подробного описания всей области содержания конструкции, что может быть затруднительно для сложных конструкций, таких как самооценка или интеллект. Следовательно, не всегда возможно адекватно оценить достоверность содержания.Как и в случае с номинальной достоверностью, для проверки достоверности содержания конструкций может быть привлечена группа экспертов.

Конвергентная валидность относится к степени, с которой мера соотносится (или сходится) с конструкцией, которую она должна измерять, а дискриминантная валидность относится к степени, в которой мера не измеряет (или не отличает) другие конструкции, которые она не предполагается измерять. Обычно конвергентная валидность и дискриминантная валидность оцениваются совместно для набора связанных конструкций.Например, если вы ожидаете, что знания организации связаны с ее производительностью, как вы можете гарантировать, что ваша мера организационных знаний действительно измеряет организационные знания (для конвергентной достоверности), а не организационные показатели (для дискриминантной достоверности)? Конвергентная достоверность может быть установлена ​​путем сравнения наблюдаемых значений одного индикатора одного конструкта со значениями других индикаторов того же конструкта и демонстрации сходства (или высокой корреляции) между значениями этих индикаторов.Дискриминантная валидность устанавливается путем демонстрации того, что индикаторы одной конструкции отличаются от других конструктов (т.е. имеют низкую корреляцию с ними). В приведенном выше примере, если у нас есть трехэлементная мера организационных знаний и еще три пункта для организационной эффективности, на основе наблюдаемых выборочных данных, мы можем вычислить двумерные корреляции между каждой парой знаний и элементов производительности. Если эта корреляционная матрица показывает высокие корреляции внутри элементов организационных знаний и конструкций организационной эффективности, но низкие корреляции между элементами этих конструкций, то мы одновременно продемонстрировали конвергентную и дискриминантную валидность (см. Таблицу 7.1).

Таблица 7.1. Двумерный корреляционный анализ конвергентной и дискриминантной достоверности

Альтернативным и более распространенным статистическим методом, используемым для демонстрации конвергентной и дискриминантной достоверности, является исследовательский факторный анализ. Это метод сокращения данных, который объединяет заданный набор элементов в меньший набор факторов на основе двумерной корреляционной структуры, описанной выше, с использованием статистического метода, называемого анализом главных компонентов. Эти факторы должны идеально соответствовать лежащим в основе теоретическим построениям, которые мы пытаемся измерить.Общая норма для извлечения факторов состоит в том, что каждый извлеченный фактор должен иметь собственное значение больше 1,0. Затем извлеченные факторы могут быть повернуты с использованием методов ортогонального или наклонного вращения, в зависимости от того, будут ли лежащие в основе конструкции относительно некоррелированными или коррелированными, для генерации весовых коэффициентов, которые можно использовать для агрегирования отдельных элементов каждой конструкции в составную меру. Для адекватной конвергентной достоверности ожидается, что элементы, принадлежащие к общей конструкции, должны иметь факторные нагрузки, равные 0.60 или выше по одному фактору (так называемые нагрузки одного фактора), в то время как для дискриминантной валидности эти элементы должны иметь факторные нагрузки 0,30 или меньше по всем другим факторам (кросс-факторные нагрузки), как показано в примере повернутой матрицы факторов в таблице 7.2. Более сложным методом оценки конвергентной и дискриминантной валидности является подход с множеством признаков и несколькими методами (MTMM). Этот метод требует измерения каждого конструкта (признака) с использованием двух или более различных методов (например, опрос и личное наблюдение или, возможно, опрос двух разных групп респондентов, таких как учителя и родители, для оценки академического качества).Это обременительный и относительно менее популярный подход, поэтому здесь не обсуждается.

Критерийная валидность также может быть оценена на основе того, хорошо ли соотносится данная мера с текущим или будущим критерием, которые, соответственно, называются одновременной и прогностической валидностью. Прогностическая достоверность — это степень, в которой мера успешно предсказывает будущий результат, который теоретически ожидается. Например, могут ли стандартизированные результаты тестов (например, результаты тестов на академические способности) правильно предсказать академический успех в колледже (например,g., измеряемый средним баллом колледжа)? Оценка такой достоверности требует создания «номологической сети», показывающей, как конструкции теоретически связаны друг с другом.

Параллельная валидность проверяет, насколько хорошо одна мера соотносится с другим конкретным критерием, который, как предполагается, имеет место одновременно. Например, хорошо ли соотносятся оценки учащихся на уроке математики с их оценками на уроке линейной алгебры? Эти оценки должны быть связаны одновременно, потому что они оба являются тестами по математике.В отличие от конвергентной и дискриминантной валидности, параллельная и прогностическая валидность часто игнорируется в эмпирических исследованиях социальных наук.

Таблица 7.2. Исследовательский факторный анализ конвергентной и дискриминантной достоверности

Теория измерений

Теперь, когда мы знаем различные виды надежности и валидности, давайте попробуем синтезировать наше понимание надежности и валидности математическим способом, используя классическую теорию тестирования, также называемую теорией истинных оценок.Это психометрическая теория, которая исследует, как работает измерение, что оно измеряет, а что не измеряет. Эта теория постулирует, что каждое наблюдение имеет истинную оценку T, которую можно точно наблюдать, если бы не было ошибок в измерениях. Однако наличие ошибок измерения E приводит к отклонению наблюдаемой оценки X от истинной оценки следующим образом:

Х

= Т +

E

Наблюдаемый балл Истинный результат Ошибка

Для набора наблюдаемых оценок дисперсия наблюдаемых и истинных оценок может быть связана с помощью аналогичного уравнения:

var (X) = var (T) + var (E)

Целью психометрического анализа является оценка и, если возможно, минимизация дисперсии ошибки var (E), чтобы наблюдаемая оценка X была хорошей мерой истинной оценки T.

Ошибки измерения могут быть двух типов: случайная ошибка и систематическая ошибка. Случайная ошибка — это ошибка, которую можно отнести к набору неизвестных и неконтролируемых внешних факторов, которые случайным образом влияют на одни наблюдения, но не влияют на другие. Например, во время измерения некоторые респонденты могут быть в более хорошем настроении, чем другие, что может повлиять на их реакцию на элементы измерения. Например, респонденты с более хорошим настроением могут более положительно реагировать на такие конструкции, как самооценка, удовлетворение и счастье, чем те, кто находится в плохом настроении.Однако невозможно предугадать, какой субъект находится в каком настроении, или контролировать влияние настроения в исследовательских исследованиях. Аналогичным образом, на организационном уровне, если мы измеряем результаты деятельности фирм, нормативные или экологические изменения могут повлиять на результаты деятельности одних фирм в наблюдаемой выборке, но не других. Следовательно, случайная ошибка считается «шумом» при измерении и обычно игнорируется.

Систематическая ошибка — это ошибка, вносимая факторами, которые систематически влияют на все наблюдения конструкции по всей выборке систематическим образом.В нашем предыдущем примере эффективности фирмы, поскольку недавний финансовый кризис повлиял на эффективность финансовых фирм в непропорционально большей степени, чем любой другой тип фирм, таких как производственные или сервисные фирмы, если наша выборка состояла только из финансовых фирм, мы можем ожидать систематического сокращения производительность всех фирм в нашей выборке из-за финансового кризиса. В отличие от случайной ошибки, которая может быть положительной отрицательной или нулевой при наблюдении в выборке, систематические ошибки имеют тенденцию быть постоянно положительными или отрицательными для всей выборки.Следовательно, систематическая ошибка иногда рассматривается как «систематическая ошибка» при измерении и должна быть исправлена.

Поскольку наблюдаемая оценка может включать как случайные, так и систематические ошибки, наше истинное уравнение оценки может быть изменено как:

X = T + E r + E s

, где E r и E s представляют собой случайные и систематические ошибки соответственно. Статистическое влияние этих ошибок заключается в том, что случайная ошибка добавляет изменчивость (например, стандартное отклонение) к распределению наблюдаемой меры, но не влияет на ее центральную тенденцию (например, стандартное отклонение).g., среднее), в то время как систематическая ошибка влияет на центральную тенденцию, но не на изменчивость, как показано на рисунке 7.3.

Рисунок 7.3. Влияние случайных и систематических ошибок

Что означает случайная и систематическая погрешность для процедур измерения? Увеличивая вариабельность наблюдений, случайная ошибка снижает надежность измерения. Напротив, за счет смещения центральной меры тенденции систематическая ошибка снижает достоверность измерения. Проблемы валидности представляют собой гораздо более серьезные проблемы при измерении, чем проблемы надежности, потому что неверный показатель, вероятно, измеряет конструкцию, отличную от того, что мы планировали, и, следовательно, проблемы валидности вызывают серьезные сомнения в выводах, полученных в результате статистического анализа.

Обратите внимание, что надежность — это отношение или доля, которая отражает, насколько близка истинная оценка к наблюдаемой. Следовательно, надежность можно выразить как:

var (T) / var (X) = var (T) / [var (T) + var (E)]

Если var (T) = var (X), то истинная оценка имеет ту же изменчивость, что и наблюдаемая оценка, а надежность составляет 1,0.

Комплексный подход к валидации измерений

Полная и адекватная оценка достоверности должна включать как теоретический, так и эмпирический подходы.Как показано на рисунке 7.4, это сложный многоэтапный процесс, который должен учитывать различные типы надежности и валидности шкалы.

Рисунок 7.4. Комплексный подход к валидации измерений

Комплексный подход начинается с теоретической области. Первый шаг — концептуализация интересующих конструкций. Это включает определение каждой конструкции и идентификацию составляющих их доменов и / или размеров. Затем мы выбираем (или создаем) элементы или индикаторы для каждой конструкции на основе нашей концептуальной концепции этой конструкции, как описано в процедуре масштабирования в главе 5.Обзор литературы также может быть полезен при выборе индикатора. Каждый пункт переформулирован единообразно с использованием простого и понятного текста. После этого шага группа экспертов-судей (ученые, имеющие опыт в методах исследования и / или репрезентативная группа целевых респондентов) может быть привлечена для изучения каждого показателя и проведения анализа Q-сортировки. В этом анализе каждому судье дается список всех конструкций с их концептуальными определениями и стопка учетных карточек, в которых перечислены все индикаторы для каждой из мер построения (по одному индикатору на учетную карточку).Затем судей просят независимо прочитать каждую учетную карточку, изучить ясность, удобочитаемость и семантическое значение этого элемента и отсортировать его с помощью конструкции там, где она кажется наиболее разумной, на основе предоставленных определений конструкции. Надежность между экспертами оценивается для проверки того, насколько судьи согласны с их классификациями. Неоднозначные вопросы, которые часто пропускались многими судьями, могут быть пересмотрены, переформулированы или исключены. Для дальнейшего анализа отбираются лучшие элементы (скажем, 10-15) для каждой конструкции.Каждый из выбранных пунктов повторно исследуется судьями на предмет достоверности и достоверности содержания. Если на этом этапе не достигается адекватный набор элементов, может потребоваться создание новых элементов на основе концептуального определения предполагаемой конструкции. Два или три раунда Q-сортировки могут потребоваться, чтобы прийти к разумному соглашению между судьями по набору пунктов, которые лучше всего представляют интересующие конструкции.

Затем процедура проверки переходит в эмпирическую область. Создан инструмент исследования, включающий все уточненные элементы конструкции, и его вводят в пилотную тестовую группу репрезентативных респондентов из целевой группы.Собранные данные сводятся в таблицу и подвергаются корреляционному анализу или исследовательскому факторному анализу с использованием программного обеспечения, такого как SAS или SPSS, для оценки конвергентной и дискриминантной достоверности. Пункты, которые не соответствуют ожидаемым нормам факторной нагрузки (однофакторные нагрузки выше 0,60 и кросс-факторные нагрузки меньше 0,30), должны быть исключены на этом этапе. Остальные шкалы оцениваются на надежность с использованием такой меры внутренней согласованности, как альфа Кронбаха. На этом этапе также можно проверить размерность шкалы, в зависимости от того, были ли заданные конструкции концептуализированы как одномерные или многомерные.Затем оцените прогностическую способность каждой конструкции в рамках теоретически определенной номологической сети конструкций с помощью регрессионного анализа или моделирования структурным уравнением. Если построенные меры удовлетворяют большинству или всем требованиям надежности и достоверности, описанным в этой главе, мы можем быть уверены, что наши операционализированные меры достаточно адекватны и точны.

Обсуждаемый здесь комплексный подход к валидации измерений весьма требует времени и усилий исследователя.Тем не менее, этот сложный многоступенчатый процесс необходим для обеспечения того, чтобы шкалы измерений, используемые в наших исследованиях, соответствовали ожидаемым нормам научных исследований. Поскольку выводы, сделанные с использованием ошибочных или скомпрометированных шкал, бессмысленны, проверка и измерение шкалы остаются одним из наиболее важных и сложных этапов эмпирического исследования.

Как измерить надежность ваших методов и показателей — MeasuringU

Надежность — это мера согласованности метрики или метода.

Каждая метрика или метод, который мы используем, включая такие вещи, как методы выявления проблем удобства использования в интерфейсе и экспертное заключение, должны быть оценены на надежность.

Фактически, прежде чем вы сможете установить действительность, вам необходимо установить надежность.

Вот четыре наиболее распространенных способа измерения надежности любого эмпирического метода или показателя:

  • Межэкспертная надежность
  • испытание-повторное испытание надежности
  • надежность параллельных форм
  • внутренняя согласованность надежность

Поскольку надежность проистекает из истории измерений в образовании (подумайте о стандартизированных тестах), многие термины, которые мы используем для оценки надежности, взяты из лексикона тестирования.Но не позволяйте плохим воспоминаниям о тестировании игнорировать их отношение к оценке качества обслуживания клиентов. Эти четыре метода являются наиболее распространенными способами измерения надежности любого эмпирического метода или показателя.

Надежность между оценщиками

Степень, в которой оценщики или наблюдатели одинаково реагируют на данное явление, является одним из показателей надежности. Где есть суждения, там и разногласия.

Даже высококвалифицированные эксперты расходятся во мнениях при наблюдении одного и того же явления.Каппа и коэффициент корреляции — два общих показателя надежности между экспертами. Некоторые примеры включают:

Например, мы обнаружили, что средняя межэкспертная надежность [pdf] экспертов по юзабилити, оценивающих серьезность проблем юзабилити, составила r = 0,52. Вы также можете измерить надежность внутри оценщика, при этом вы коррелируете несколько оценок от одного наблюдателя. В том же исследовании мы обнаружили, что средняя внутриэкспертная надежность при оценке серьезности проблемы составляла r = 0,58 (что обычно является низкой надежностью).

Тестирование-повторное тестирование надежности

Дают ли клиенты такой же набор ответов, когда ничего не изменилось в их опыте или отношении? Вы же не хотите, чтобы ваша система измерения колебалась, когда все остальное статично.

Попросите группу участников ответить на набор вопросов (или выполнить набор задач). Позже (как минимум через несколько дней) попросите их снова ответить на те же вопросы. Когда вы коррелируете два набора показателей, ищите очень высокие корреляции ( r > 0.7) для установления ретестовой надежности.

Как видите, здесь требуются определенные усилия и планирование: вам нужно, чтобы участники согласились ответить на одни и те же вопросы дважды. Немногие анкеты измеряют надежность повторного тестирования (в основном из-за логистики), но с распространением онлайн-исследований мы должны поощрять больше таких мер.

Надежность параллельных форм

Получение одинаковых или очень похожих результатов при небольших вариациях вопроса или метода оценки также подтверждает надежность.Один из способов добиться этого — иметь, скажем, 20 элементов, которые измеряют одну конструкцию (удовлетворенность, лояльность, удобство использования), и назначить 10 элементов одной группе, а остальные 10 — другой группе, а затем сопоставить результаты. Вы ищете высокую корреляцию и отсутствие систематической разницы в оценках между группами.

Надежность внутренней согласованности

Это, безусловно, наиболее часто используемый показатель надежности в прикладных настройках. Он популярен, потому что его проще всего вычислить с помощью программного обеспечения — для оценки надежности внутренней согласованности требуется только один образец данных.Этот показатель надежности чаще всего описывается с помощью альфы Кронбаха (иногда называемой коэффициентом альфа).

Он измеряет, насколько последовательно участники отвечают на один набор вопросов. Вы можете думать об этом как о некотором среднем значении корреляций между элементами. Альфа Кронбаха варьируется от 0,0 до 1,0 (отрицательная альфа означает, что вам, вероятно, нужно поменять местами некоторые элементы). С конца 1960-х минимально приемлемый показатель надежности был 0,70; на практике, однако, для анкет с высокими ставками стремитесь к большему, чем 0.90. Например, для SUS альфа Кронбаха составляет 0,92.

Чем больше у вас заданий, тем надежнее внутренне инструмент, поэтому для повышения надежности внутренней согласованности вы должны добавлять пункты в свой вопросник. Однако, поскольку часто возникает острая потребность в небольшом количестве предметов, обычно страдает внутренняя надежность. Когда у вас всего несколько элементов и, следовательно, внутренняя надежность обычно ниже, выбор большего размера помогает компенсировать потерю надежности.

Вкратце

Вот несколько моментов, о которых следует помнить при измерении надежности:

  • Надежность — это постоянство меры или метода во времени.
  • Надежность необходима, но недостаточна для признания метода или метрики действительными.
  • Нет единого критерия надежности, вместо этого есть четыре общих показателя согласованности ответов.
  • Вы захотите использовать как можно больше показателей надежности (хотя в большинстве случаев одного достаточно, чтобы понять надежность вашей системы измерения).
  • Даже если вы не можете собрать данные о надежности, имейте в виду, каким образом низкая надежность может повлиять на достоверность ваших измерений и, в конечном итоге, на правдивость ваших решений.

4.2 Надежность и достоверность измерения — методы исследования в психологии

Цели обучения

  1. Определите надежность, включая различные типы и способы их оценки.
  2. Определите срок действия, включая различные типы и способы их оценки.
  3. Опишите виды доказательств, которые могут иметь отношение к оценке надежности и действительности той или иной меры.

Опять же, измерение включает в себя присвоение баллов отдельным лицам, чтобы они отражали некоторые характеристики людей.Но как исследователи узнают, что оценки на самом деле представляют характеристику, особенно если это такие конструкты, как интеллект, самооценка, депрессия или объем рабочей памяти? Ответ заключается в том, что они проводят исследование, используя эту меру, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции. Это очень важный момент. Психологи не просто предполагают , что их меры работают. Вместо этого они собирают данные для , чтобы продемонстрировать , что они работают.Если их исследование не демонстрирует, что мера работает, они прекращают ее использовать.

В качестве неформального примера представьте, что вы сидите на диете в течение месяца. Ваша одежда кажется более свободной, и несколько друзей спросили, похудели ли вы. Если на этом этапе ваши весы для ванной показывают, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжили бы пользоваться весами. Но если бы это указывало на то, что вы набрали 10 фунтов, вы бы справедливо пришли к выводу, что он сломан, и либо почините его, либо избавьтесь от него.Оценивая метод измерения, психологи принимают во внимание два основных аспекта: надежность и валидность.

Надежность

Надежность относится к последовательности меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (надежность между экспертами).

Тестирование-повторное тестирование

Когда исследователи измеряют конструкт, который, по их мнению, является непротиворечивым во времени, полученные ими оценки также должны быть согласованными во времени. Надежность повторных испытаний — это степень, в которой это действительно так. Например, обычно считается, что интеллект постоянен во времени. Человек, который сегодня очень умный, на следующей неделе станет очень умным. Это означает, что любой хороший показатель интеллекта должен дать этому человеку примерно такие же оценки на следующей неделе, что и сегодня. Ясно, что мера, которая дает очень непоследовательные оценки с течением времени, не может быть очень хорошей мерой конструкции, которая должна быть согласованной.

Оценка надежности повторного тестирования требует использования этого показателя одновременно на группе людей, его повторного использования на той же группе людей в более позднее время, а затем анализа корреляции повторного тестирования между двумя наборами критериев. оценки. Обычно это делается путем построения графика данных в виде диаграммы рассеяния и вычисления коэффициента корреляции. На рис. 4.2 показана корреляция между двумя наборами оценок нескольких студентов университетов по шкале самооценки Розенберга, введенной два раза с интервалом в неделю.Коэффициент корреляции для этих данных составляет +,95. Обычно считается, что корреляция между тестами и повторными тестами +80 или выше указывает на хорошую надежность.

Рис. 4.2 Корреляция между тестами и повторными тестами между двумя наборами оценок нескольких студентов колледжа по шкале самооценки Розенберга, полученных два раза в неделю с интервалом

Опять же, высокая корреляция между тестами и ретестами имеет смысл, когда предполагается, что измеряемый конструкт остается неизменным во времени, что имеет место в случае интеллекта, самооценки и измерений личности Большой пятерки.Но другие конструкции не считаются стабильными с течением времени. Например, сама природа настроения такова, что оно меняется. Таким образом, показатель настроения, который дает низкую корреляцию между тестами и повторными тестами в течение месяца, не будет поводом для беспокойства.

Внутренняя согласованность

Другой вид надежности — это внутренняя согласованность , которая представляет собой согласованность ответов людей по всем пунктам при измерении нескольких пунктов. В целом предполагается, что все элементы таких показателей отражают одну и ту же основную конструкцию, поэтому оценки людей по этим вопросам должны коррелировать друг с другом.По шкале самооценки Розенберга люди, которые согласны с тем, что они достойные люди, должны соглашаться с тем, что у них есть ряд хороших качеств. Если ответы людей на разные вопросы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же основную конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самооценки. Например, люди могут сделать серию ставок в имитируемой игре в рулетку, чтобы измерить свой уровень стремления к риску.Этот показатель будет внутренне согласованным в той степени, в которой ставки отдельных участников будут постоянно высокими или низкими в ходе испытаний.

Как и надежность повторного тестирования, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов состоит в том, чтобы взглянуть на корреляцию с разделением половин . Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четным и нечетным номерами. Затем для каждого набора элементов вычисляется оценка и исследуется взаимосвязь между двумя наборами оценок.Например, на рис. 4.3 показана корреляция между двумя частицами между оценками нескольких студентов университетов по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга. Коэффициент корреляции для этих данных равен +,88. Корреляция разделенных половин, равная +80 или больше, обычно считается хорошей внутренней согласованностью.

Рисунок 4.3 Распределенная корреляция между результатами нескольких студентов колледжа по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга

Пожалуй, наиболее распространенным показателем внутренней согласованности, используемым исследователями в области психологии, является статистика под названием α Кронбаха (греческая буква альфа).Концептуально α — это среднее значение всех возможных корреляций разделенных половин для набора элементов. Например, существует 252 способа разделить набор из 10 элементов на два набора по пять. Α Кронбаха будет средним из 252 корреляций разделенных половин. Обратите внимание, что на самом деле α вычисляется не так, но это правильный способ интерпретации значения этой статистики. Опять же, обычно используется значение +80 или больше, чтобы указать на хорошую внутреннюю согласованность.

Надежность Interrater

Многие поведенческие меры требуют значительного суждения со стороны наблюдателя или оценщика. Надежность между экспертами — это степень, в которой разные наблюдатели едины в своих суждениях. Например, если вы заинтересованы в измерении социальных навыков студентов университета, вы можете сделать видеозаписи их взаимодействия с другим студентом, с которым они встречаются впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той степени, в которой каждый участник действительно обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом.Надежность между экспертами также могла быть измерена в исследовании куклы Бобо Бандуры. В этом случае оценки наблюдателей того, сколько актов агрессии совершил конкретный ребенок во время игры с куклой Бобо, должны были иметь очень положительную корреляцию. Надежность между экспертами часто оценивается с помощью α Кронбаха, когда суждения являются количественными, или аналогичной статистики, называемой κ Коэна (греческая буква каппа), когда они категоричны.

Срок действия

Действительность — это степень, в которой баллы из меры представляют переменную, для которой они предназначены.Но как исследователи делают такое суждение? Мы уже учли один фактор, который они учитывают, — надежность. Если показатель имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки соответствуют тому, что им положено. Однако здесь должно быть что-то еще, потому что мера может быть чрезвычайно надежной, но совершенно бесполезной. В качестве абсурдного примера представьте человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам людей.Хотя эта мера имела бы чрезвычайно хорошую надежность повторного тестирования, она не имела бы абсолютно никакой ценности. Тот факт, что указательный палец одного человека на сантиметр длиннее, чем у другого, ничего не говорит о том, у кого из них более высокая самооценка.

Обсуждения валидности обычно делят его на несколько различных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды свидетельств, помимо надежности, которые следует принимать во внимание при оценке достоверности меры.Здесь мы рассматриваем три основных типа: валидность лица, валидность содержания и валидность критерия.

Лицевая достоверность

Лицевая достоверность — это степень, в которой метод измерения проявляется «на лице» для измерения интересующей конструкции. Большинство людей ожидают, что в анкету для самооценки будут включены вопросы о том, считают ли они себя достойным человеком и обладают ли они хорошими качествами. Таким образом, анкета, включающая такие вопросы, будет иметь хорошую внешнюю валидность.С другой стороны, метод измерения самооценки на расстоянии пальца, похоже, не имеет ничего общего с самооценкой и, следовательно, имеет низкую достоверность. Хотя фактическая валидность может быть оценена количественно — например, с помощью большой выборки людей, оценивающих меру с точки зрения того, действительно ли она измеряет то, для чего она предназначена, — обычно она оценивается неформально.

Фактическая достоверность — это в лучшем случае очень слабое свидетельство того, что метод измерения измеряет то, что должен.Одна из причин заключается в том, что это основано на интуиции людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепринятые меры в психологии работают достаточно хорошо, несмотря на недостаточную достоверность. Миннесотский многофазный опросник личности-2 (MMPI-2) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, причем многие из утверждений не имеют очевидного отношения к конструкции, которую они измеряют. .Например, пункты «Мне нравятся детективы или детективы» и «Вид крови не пугает меня и не вызывает тошноту», оба измеряют подавление агрессии. В данном случае интерес представляют не буквальные ответы участников на эти вопросы, а, скорее, соответствие модели ответов участников на серию вопросов ответам людей, которые склонны подавлять свою агрессию.

Срок действия содержимого

Достоверность содержимого — это степень, в которой мера «покрывает» интересующий конструкт.Например, если исследователь концептуально определяет тестовую тревогу как связанную как с активацией симпатической нервной системы (ведущей к нервным переживаниям), так и с негативными мыслями, то его мера тестовой тревожности должна включать вопросы как о нервных переживаниях, так и о негативных мыслях. Или подумайте, что отношения обычно определяются как связанные с мыслями, чувствами и действиями по отношению к чему-либо. Согласно этому концептуальному определению, человек положительно относится к упражнениям в той мере, в какой он или она думает о тренировках положительно, чувствует себя хорошо во время тренировок и фактически занимается спортом.Таким образом, чтобы иметь хорошую достоверность содержания, показатель отношения людей к упражнениям должен отражать все три этих аспекта. Как и фактическая достоверность, достоверность содержания обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.

Срок действия критерия

Достоверность критерия — это степень, в которой оценки людей по показателю коррелируют с другими переменными (известными как критерии ), с которыми можно было бы ожидать их корреляции.Например, оценки людей по новому критерию тревожности при тестировании должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что оценки людей на самом деле отрицательно коррелировали с их успеваемостью на экзамене, то это было бы доказательством того, что эти оценки действительно отражают тревогу людей перед тестированием. Но если бы выяснилось, что люди одинаково хорошо сдавали экзамен, независимо от их тестовой тревожности, это поставило бы под сомнение достоверность этой меры.

Критерием может быть любая переменная, которая, как есть основания полагать, должна коррелировать с измеряемым конструктом, и обычно их много. Например, можно было бы ожидать, что результаты теста на тревожность будут отрицательно коррелировать с успеваемостью на экзамене и оценками по курсу и положительно коррелироваться с общим беспокойством и артериальным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру принятия физического риска. Баллы людей по этому показателю должны соотноситься с их участием в «экстремальных» видах деятельности, таких как сноубординг и скалолазание, количеством полученных штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы.Когда критерий измеряется одновременно с построением, достоверность критерия упоминается как одновременная достоверность ; однако, когда критерий измеряется в какой-то момент в будущем (после того, как конструкция была измерена), он упоминается как прогностическая достоверность (поскольку оценки по этому показателю «предсказали» будущий результат).

Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые меры тестовой тревожности или принятия физического риска будут положительно коррелированы с существующими установленными показателями тех же конструктов.Это известно как конвергентная достоверность .

Оценка конвергентной достоверности требует сбора данных с помощью меры. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самоотчета «Потребность в познании», чтобы измерить, насколько люди ценят и вовлечены в мышление (Cacioppo & Petty, 1982). В серии исследований они показали, что оценки людей положительно коррелировали с их оценками по стандартизированному тесту академических достижений, и что их оценки отрицательно коррелировали с их оценками по показателю догматизма (который представляет собой тенденцию к послушанию).За годы, прошедшие с момента создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и МакКаслин, 2009 г.).

Дискриминантная валидность

Дискриминантная валидность , с другой стороны, — это степень, в которой оценки по показателю , а не коррелируют с мерами переменных, которые концептуально различны.Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, которое бывает хорошим или плохим в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новый показатель самооценки был сильно коррелирован с показателем настроения, можно было бы утверждать, что новый показатель на самом деле не измеряет самооценку; вместо этого он измеряет настроение.

При создании шкалы потребности в познании Качиоппо и Петти также предоставили доказательства дискриминантной валидности, показав, что оценки людей не коррелировали с некоторыми другими переменными.Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части, или целостным образом в терминах «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их склонностью реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличную конструкцию.

Основные выводы

  • Психологические исследователи не просто предполагают, что их меры работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что работают, они прекращают их использовать.
  • Есть два различных критерия, по которым исследователи оценивают свои измерения: надежность и валидность. Надежность — это постоянство во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между исследователями (надежность между экспертами).Достоверность — это степень, в которой оценки фактически представляют переменную, для которой они предназначены.
  • Действительность — это решение, основанное на различных типах доказательств. Соответствующие свидетельства включают надежность меры, то, покрывает ли она интересующий конструкт и коррелируют ли полученные оценки с другими переменными, с которыми они, как ожидается, коррелируют, а не коррелируют ли с переменными, которые концептуально различны.
  • Надежность и валидность меры устанавливаются не каким-либо одним исследованием, а результатами нескольких исследований.Оценка надежности и достоверности — непрерывный процесс.

Упражнения

  1. Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделенных половин (элементы с четным и нечетным номерами). Вычислите также коэффициент корреляции и , если знаете как.
  2. Обсуждение. Вспомните последний экзамен в колледже, который вы сдавали, и воспринимайте его как психологическую меру.Как вы думаете, для измерения какой конструкции она предназначалась? Прокомментируйте его лицо и достоверность содержания. Какие данные вы могли бы собрать, чтобы оценить их надежность и валидность критериев?

Надежность и достоверность — статистические решения

Надежность и достоверность — важные аспекты выбора инструмента для обследования. Под надежностью понимается степень, в которой прибор дает одинаковые результаты в нескольких испытаниях. Под действительностью понимается степень, в которой инструмент измеряет то, для чего был разработан.В исследованиях есть три способа приблизиться к валидности, и они включают валидность содержания, валидность построения и валидность, связанную с критериями.

Достоверность содержимого измеряет степень, в которой элементы, составляющие шкалу, точно представляют или измеряют информацию, которая оценивается. Представляют ли задаваемые вопросы возможные вопросы, которые можно задать?

Получите одобрение диссертации

Мы ежедневно работаем с аспирантами и знаем, что нужно сделать, чтобы ваше исследование было одобрено.

  • Отзыв адресной комиссии
  • Дорожная карта до завершения
  • Разберитесь с вашими потребностями и сроками

Construct validity измеряет, что означают вычисленные баллы, и можно ли их обобщить. Construct validity использует статистический анализ, такой как корреляции, для проверки релевантности вопросов. Вопросы из существующего аналогичного инструмента, который был признан надежным, можно сопоставить с вопросами из исследуемого инструмента, чтобы определить, присутствует ли конструктивная валидность.Если оценки сильно коррелированы, это называется конвергентной достоверностью. Если существует сходящаяся достоверность, поддерживается допустимость конструкции.

Валидность, связанная с критериями, связана с тем, насколько хорошо баллы инструмента предсказывают известный результат, который они, как ожидается, предсказывают. Статистический анализ, такой как корреляции, используется для определения наличия достоверности, связанной с критериями. Баллы по рассматриваемому инструменту должны коррелировать с заданием, которое, как известно, они предсказывают. Если соотношение>.60 существует, валидность, связанная с критерием, также существует.

Надежность можно оценить с помощью метода повторного тестирования, метода альтернативной формы, метода внутренней согласованности, метода разделения половинок и межэкспертной надежности.

Повторное тестирование — это метод, при котором один и тот же прибор обрабатывается одним и тем же образцом в два разных момента времени, возможно, с интервалом в один год. Если оценки за оба периода времени сильно коррелированы,> 0,60, их можно считать надежными. Альтернативный метод формы требует двух разных инструментов, состоящих из аналогичного содержания.В одном и том же образце должны быть взяты оба инструмента, и оценки по обоим инструментам должны быть коррелированы. Если корреляции высоки, инструмент считается надежным. Для внутренней согласованности используется один инструмент, управляемый только один раз. Коэффициент альфа (или альфа Кронбаха) используется для оценки внутренней согласованности элемента. Если значение альфа составляет 0,70 или выше, прибор считается надежным. Метод разделения половинок также требует однократного проведения одного теста. Количество пунктов в шкале делится на половины, и для оценки надежности каждой половины теста берется корреляция.Чтобы оценить надежность всего обзора, необходимо применить поправку Спирмена-Брауна. Межэкспертная надежность включает сравнение наблюдений двух или более лиц и оценку согласованности наблюдений. В этом случае можно рассчитать значения каппа.

Почему для психологических тестов важна валидность

Когда люди говорят о психологических тестах, они часто спрашивают, действителен ли тест или нет. Что именно это значит? Валидность — это мера того, насколько хорошо тест измеряет то, что, по его словам, измеряется.

Психологическая оценка — важная часть как экспериментального исследования, так и клинического лечения. Одна из самых больших проблем при создании психологического теста заключается в том, действительно ли он измеряет то, что, по нашему мнению, он измеряет.

Например, тест может быть разработан для измерения стабильной личностной черты, но вместо этого для измерения преходящих эмоций, вызванных ситуативными или окружающими условиями. Действительный тест гарантирует, что результаты являются точным отражением измеряемого параметра.

Валидность — это степень, в которой тест измеряет то, что, по его утверждению, измеряется. Жизненно важно, чтобы тест был действительным, чтобы результаты можно было точно применить и интерпретировать.

Типы действия

Валидность определяется не одной статистикой, а совокупностью исследований, демонстрирующих взаимосвязь между тестом и поведением, которое он предназначен для измерения. Есть три типа действительности.

Срок действия содержимого

Когда тест имеет достоверность содержания, элементы теста представляют весь диапазон возможных элементов, которые тест должен охватывать.Отдельные вопросы теста могут быть составлены из большого количества заданий, охватывающих широкий круг тем.

В некоторых случаях, когда тест измеряет черту, которую трудно определить, эксперт-судья может оценить релевантность каждого элемента. Поскольку каждый судья основывает свою оценку на своем мнении, два независимых судьи оценивают тест отдельно. Пункты, оцененные обоими судьями как имеющие большое значение, будут включены в финальный тест.

Срок действия по критерию

Считается, что тест имеет относящуюся к критерию валидность, когда тест продемонстрировал свою эффективность в прогнозировании критерия или показателей конструкции, например, когда работодатель нанимает новых сотрудников на основе обычных процедур найма, таких как собеседования, образование и опыт.

Этот метод демонстрирует, что люди, которые хорошо сдали тест, будут хорошо работать на работе, а люди с низким баллом по тесту будут плохо справляться с работой. Есть два разных типа критериев достоверности:

  • Одновременная валидность : Это происходит, когда критерии критериев получены одновременно с оценками тестов, что указывает на способность оценок по тестам оценивать текущее состояние человека. Например, в тесте, который измеряет уровни депрессии, можно сказать, что тест имеет одновременную валидность, если он измеряет текущие уровни депрессии, испытываемые тестируемым.
  • Прогностическая валидность : это когда критерии критериев получают сразу после теста. Примерами тестов с предсказательной валидностью являются тесты карьеры или способностей, которые помогают определить, кто с большой вероятностью преуспеет или проиграет по определенным предметам. или занятий.

Срок действия конструкции

Тест имеет конструктивную валидность, если он демонстрирует связь между результатами теста и предсказанием теоретической характеристики.Тесты интеллекта являются одним из примеров инструментов измерения, которые должны иметь конструктивную валидность.Действительный тест интеллекта должен быть в состоянии точно измерить конструкцию интеллекта, а не другие характеристики, такие как память или уровень образования.

По сути, валидность контента смотрит на то, охватывает ли тест весь спектр поведения, составляющего измеряемую конструкцию. Процедура здесь состоит в том, чтобы определить необходимые задачи для выполнения такой работы, как набор текста, дизайн или физические способности.

Чтобы продемонстрировать валидность содержания процедуры отбора, поведение, продемонстрированное при выборе, должно быть репрезентативной выборкой поведения на работе.

Валидность лица в психологическом тестировании

Другой метод, который используется редко, потому что он не очень сложен, — это проверка по лицу. Он основан только на внешнем виде меры и на том, что он должен измерять, но не на том, что на самом деле измеряет тест.

Фактическая валидность — одна из основных мер валидности. По сути, исследователи просто принимают достоверность теста за чистую монету, проверяя, выглядит ли тест как для измерения целевой переменной.Например, по показателю счастья можно было бы сказать, что тест имеет внешнюю достоверность, если бы он действительно измерял уровень счастья.

Очевидно, внешняя достоверность означает только то, что тест выглядит как так, как будто он работает. Это не означает, что тест доказал свою эффективность. Однако, если мера кажется действительной на данный момент, исследователи могут продолжить исследование, чтобы определить, действителен ли тест и его следует использовать в будущем.

По сути, фактическая достоверность — это то, измеряет ли тест то, что он должен измерять.Это предполагает сдачу теста за чистую монету.

Опрос, в котором спрашивают людей, за какого политического кандидата они планируют проголосовать, будет считаться имеющим высокую достоверность. Цель теста предельно ясна даже людям, незнакомым с психометрией.

Можно сказать, что сложный тест, используемый как часть психологического эксперимента, который рассматривает множество ценностей, характеристик и моделей поведения, имеет низкую достоверность.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *