https://wodolei.ru/catalog/installation/dlya-napolnyh-unitazov/
Оказалось, что за 30 лет корреляция снизилась с 0,71 до 0,52. Про-
верка двумерного распределения данных легко выявила причину этого
снижения. Дело в том, что в связи с повысившимися требованиями при
приеме в колледж группа студентов во втором случае была более одно-
родной, чем в первом, по отношению как к предиктору, так и к крите-
риальному выполнению. Отсюда и падение корреляции, несмотря на то
что точность прогноза успеваемости в колледже осталась в общем пре-
жней. Иными словами, наблюдавшийся эффект вовсе не свидетельствует
о временном снижении валидности предикторов, а к такому выводу
моно бы прийти, упустив из вида различия в однородности групп.
-Для правильной интерпретации коэффициента валидности следует
принимать во внимание форму зависимости между тестом и критерием.
Определение пирсоновского коэффициента корреляции предполагает, что
эта зависимость линейна и остается одной и той же по всему диапазону
значений предиктора. Однако в ряде ситуаций это условие не выполняет-
ся (J. Fisher, 1959; D. Kahneman, 1962). Пусть для выполнения некоторой
работы требуется лишь минимальный уровень понимания читаемого, до-
статочный для прочтения инструкций, названий и т.д. Но как только
этот минимальный уровень превзойден, то от дальнейшего развития
данного умения успешность выполнения работы уже не зависит, т.е. ме-
жду тестом и выполнением работы существуют нелинейные отношения.
Проверка двумерного распределения или диаграммы рассеяния, по-
строенной по показателям теста на понимание читаемого и крите-
риальных мер, выявила бы, что уровень выполнения работы растет, пока
,-,"" ,,>nrrf -ггала тт тттт-QT "rrVPAAnir ТПНН ПОСЛб ЧеГО
152 lllIIIIUIItIhl ПСИХОЛОГИЧЕСКОГО ТГСТИРОИАПИЯ
он остается примерно тем же. Следовательно, точки на диаграмме ско-
рее группируются вокруг кривой, а не прямой линии.
В других случаях эта линия может быть и прямой, но точки, изобра-
жающие индивидуальные данные, могут отстоять от нее в верхнем конце
шкалы дальше, чем в нижнем. Предположим, что выполнение теста спо-
собности к обучению-необходимое, но не достаточное условие для ус-
воения некоторого учебного предмета. Это значит, что ученики, показав-
шие в тесте низкие результаты, справятся с ним плохо, тогда как среди
учеников с высокими результатами одни освоят предмет, а другие, из-за
недостаточной мотивации, еле его одолеют. В этом случае будет наблю-
даться большая вариативность критериального выполнения у учащихся
с более высокими тестовыми результатами, чем с более низкими. Опи-
санная особенность двумерного распределения называется гетероскеда-
стичиостыо. Определение корреляции по Пирсону предполагает наличие
гомоскедастичности, т.е. одинаковую дисперсию критерия по всей обла-
сти двумерного распределения. В приведенном примере двумерное рас-
пределение имеет форму веера, расширяющегося слева направо и снизу
вверх. Одною взгляда на двумерное распределение обычно бывает до-
статочно для установления характера соотношения между тестом и кри-
терием. Прогностические таблицы и карты прогноза также достаточно
хорошо выявляют относительную эффективность теста на разных уров-
нях.
Величина коэффициента валидности. Какова должна быть ве-
личина коэффициента валидности? На этот вопрос нет единого ответа.
так как при интерпретации коэффициента валидности нужно учитывать
ряд побочных обстоятельств. Конечно, корреляция должна быть стати-
стически значимой на некотором достаточном уровне (0,01 или 0,05-см.
гл. 5). Иными словами, прежде чем делать выводы о валидности теста,
нужно иметь уверенность в том, что данный коэффициент валидности не
появился в результате случайных выборочных отклонений от нулевого
значения.
Установив значимость корреляции между тестовыми показателями
и критерием, необходимо еще оценить величину корреляции с точки зре-
ния использования теста. Если мы хотим оценить величину индивидуаль-
ного критериального показателя (скажем, успеваемость первокурсника),
то для интерпретации коэффициента валидности уместно обратиться
к стандартной ошибке оценки, аналогично рассматривавшейся в связи
с надежностью теста ошибке измерения. Напомним, что ошибка измере-
ния указывает на допустимые пределы возможной ошибки в индиви-
дуальных показателях вследствие ограниченной надежности теста. Точно
так же ошибка оценки указывает на допустимые пределы возможной
ошибки в прогнозируемой величине индивидуального критериального
показателя как результата ограниченной валидности теста.
Ошибка оценки находится по следующей формуле:
-~
-ст1 - r,
где r -квадрат коэффициента валидности и -стандартное отклонение
критериальных показателей-.3аметим, что при полной валидности ошиб-
ка оценки была бы равна нулю. Вместе с тем если валидность теста рав-
на нулю, то ошибка оценки совпадает со стандартным отклонением кри-
териального распределения. В этих условиях прогноз равносилен
153 ВАЛИДНОСТЬ. ИЗМЕгеНИ И ИПТИРПППАЦИЯ
деление критериальных показателей. Ошибка оценки и IUUCIIMOCIH от
меняющейся валидности теста располагается между этими предельными
значениями. ______
Из формулы для (7, видно, что величина [/1 - " указывает на вели-
чину ошибки относительно ошибки простого угидыччпия, т.е. при нуле-
вой валидности. Иными словами, если ]/)- гу = 1,00, то ошибка оцен-
ки столь же велика, как и при угадывании. Пользы от теста, сле-
довательно не будет никакой. Если коэффициент валидное in равец 0,80,
то 1/1- гу= 0,60, т.е. ошибка составляет 60"" от той, которая бы-
ла бы при угадывании. Это означает, что тест позволяет делать про-
гнозы о критериальном выполнении индивида с ошибкой на 40"" мень-
шей, чем в случае угадывания.
Может показаться, что даже при такой необычно высокой валидно-
сти, как 0,80, ошибка в предсказываемых показателях все еще значи цель-
на. Если основным назначением психологического теста счтать прелска-
зание точного положения показателя ипдипида в распредслепип крше-
риальных показателей, то вывод будет совершенно обескуражипакнцпм.
С точки зрения ошибки оценки большинство тестов представляются не
особенно эффективными. Однако чаще всего при тестировании нет необ-
ходимости прогнозировать критериальное BbinoJ>nciiiic в индиви-
дуальных случаях, но требуется лишь определить, кто из испытуемых
превзойдет некоторый минимальный стандарт выполнения, или норма-
тивный показатель критерия. Каковы шансы у Мери Грин закончить ме-
дицинское училище, у Тома Хиг гипса усвоить курс дифференциальною
исчисления, а у Беверли Бруса преуспеть в качестве ас1ропавта? Кто из
поступающих, скорее всего, будет хорошим служащим, продавцом, меха-
ником? Такая информация полезна не только при отборе кадров, но
и при индивидуальном выборе профессии. Например, школьнику полез-
но знать, что у него хорошие шансы благополучно окончить юридиче-
ский факультет, даже если мы не можем с \ перечною 11.14 ч.п.ш.. будет
ли его средний балл 74 или 81.
Тест может заметно повысить эффективность прогноза, если для не-
го будет установлена любая, даже низкая, значимая корреляция с крите-
рием. В ряде случаев валидность 0,20 или 0,30 уже оправдывает включе-
ние теста в программу отбора. Для основных целей тестирования
суждение о тесте с точки зрения ошибки оценки чрезмерно строго. Су-
дить следует, принимая во внимание иные способы оценки геста, те, ко-
торые бы учитывали типы решений, осуществляемых на основе его ре-
зультатов. О некоторых из этих методов пойдет речь в следующем
разделе.
ВАЛИДНОСТЬ ТЕСТА И ТЕОРИЯ РЕШЕНИЙ
Основной подход. Предположим, 100 человек, поступающих на рабо-
ту, выполнили тест способностей и по прошествии какого-то времени
были оценены их успехи в выполнении своих обязанное} ей. На рис. 17
изображено двумерное распределение результатов тестирования и пока-
зателей выполнения работы. Корреляция между обеими переменными
несколько ниже 0,70. Необходимый минимум выполнения обязанностей,
154
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
числу людей, не справившихся с работой, а 60 случаев над чертой-спра-
вившихся с ней. Если все 100 поступавших принимаются на работу, то
60Їо справятся с ней. При принятии меньшего числа без учета результа-
тов теста, т. е. наугад, относительное количество удач было бы, вероятно,
близким к 60Їо. Предположим, однако, тестовые показатели используют-
ся для отбора из 100 претендентов 45 наиболее перспективных сотрудни-
ков (индекс отбора-0,45). В таком случае следует выбрать 45 человек,
чьи показатели попали справа от вертикальной толстой линии. Среди
них будет 7 случаев неудач в работе, или ошибочного приема, и 38 слу-
чаев успеха. Процент успеха теперь равен уже не 60, а 84 (т.е. 38/45 ==
= 0,84). Это увеличение обусловлено применением теста в качестве ин-
струмента отбора. Кстати, можно игнорировать ошибки показателей
прогностического критерия, не влияющие на принимаемое решение. Из-
бирательную эффективность теста снижают только те из них, которые
находятся ниже горизонтальной толстой черты и, следовательно, поме-
щают индивида в ошибочную категорию.
Для полной оценки эффективности теста как инструмента отбора
рассмотрим также ошибки другого типа, представленные на рис. 17.
Рис. 17. Рост количества успехов вследствие использования отборочного тесто
и S QJ 0 10 S. ш а о И 1 to s л 1 1правильное принятие.S t С-х (и С U 1 л <о ? S 1" о. >1Ї <и о. х ш
;(38)
(шибочное неп зиняти/
(22)
///
т////
///м-//1111/
itfMiiii///ч
////тii/ill/
Прзвильное/////Mf-iw iiiiii/
непри (3нитие 3)тiiчillОшибочное пр (7)инятие
/iii
s X т 5 1/
той. Таким о, которые ост нормативные по-
ного успеха вао тесте Даала соответсеи,
бораприменяется при клиническоеa Тестировании
ошибоозо Р практике "Ри, если
ложительным в меди "азываются ит называется
Этот Рогии Результаты JC если п означает,
--
видов "?"Їоз относительно вьи учитывать
нота), а ределенных исключить н о не-
иснытуемых. Вно вьо характер Р серьезные
должен быть дос одимо, J может н граждан-
ожных афицированныи Ря на отбор Jo боль-
достаточно здесь Ует важнее нансла неудач.
щерб или У условиях быв большего ием
"Р-
установленвТо о можно
критериальнораспределение Р, методу ег, 1966;
Kuo-Cheng Hs ep потери, свя
156 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
работой вновь принятых сотрудников с 60 до 84 может служить основа-
нием для оценки преимуществ от использования теста.
Теория статистических решений была разработана А. Уолдом
(A. Wald, 1950) применительно к решениям, принимаемым при контроле
качества промышленных изделий. Модификация этого подхода примени-
тельно к составлению и интерпретации психологических тестов была
осуществлена Л. Кронбахом и Г. Глесером (L. J. Cronbach, G. С. Glesser,
1965). Теория решений в принципе представляет собой попытку придать
процессу принятия решения математическую форму, с тем чтобы исполь-
зовать имеющуюся информацию для выработки в конкретных обстоя-
тельствах наиболее эффективных решений. Математические процедуры,
применяемые в теории решений, весьма сложны, и лишь немногие из них
имеют форму, приемлемую для непосредственного использования
в практических задачах тестирования. Некоторые из основных понятий
теории решений, однако, помогают лучше объяснить ряд касающихся те-
стов вопросов. Часть идей, составивших основу теории решений, была
введена в тестирование еще до того, как был разработан формальный
аппарат этой теории.
Предсказание результатов. Своего рода предвестником теории
решений в психологическом тестировании явились таблицы Тейлора-
Расселла (Н.С. Taylor, J.T. Russell, 1939), позволившие определить вы-
игрыш в точности отбора от использования теста. Для работы с табли-
цами нужно знать коэффициент валидности теста, индекс отбора
и базовый уровень, т.е. oi носи тельные количесгно coip\ шиков, спра-
вляющихся со своими обязанностями и набранных случайно (без исполь-
зования теста). Изменение любого из этих параметров может повлиять
на прогностическую эффективность теста.
В качестве примера приведем одну из таблиц Тейлора-Расселла, от-
вечающую базовому уровню 0,60 (табл. 14). В верхней ее части приве-
дены различные значения индекса отбора, в крайнем левом столбце-
коэффициенты валидности, а в с троках-относительное число успехов
среди принятых на работу по результатам теста. Разность между такой
величиной и 0,60 указывает на выигрыш от применения теста.
Очевидно, если индекс отбора равен 1,0, т.е. когда приему подлежат
все претенденты, ни один тест, как бы валиден он ни был, не улучшит ка-
чества отбора. Из табл. 14 видно, что при индексе отбора, равном 0,95,
даже тест с коэффициентом валидности, равным 1,0, повышает долю ус-
пехов только на 0,03 (с 0,60 до 0,63). Напротив, если из поступающих
нужно отобрать только 5Ї/", то тест обеспечивает рост правильно приня-
тых с 0,60 до 0,82. Этот рост представляет инкрементную валидность те-
ста (L. Sechrest, 1963), или рост прогностической валидности теста,
и указывает на роль теста в улучшении отбора лиц, которые в дальней-
шем будут удовлетворять минимальным требованиям критериального
выполнения. Применяя таблицы Тейлора-Расселла, необходимо, конеч-
но, знать валидность теста для группы именно того типа, по которой
определялся базовый уровень. Иными словами, польза от применения
теста оценивается не вероятностью успеха отобранных с его помощью
претендентов (если, конечно, до этого поступавшие на работу не при-
нимались наугад, что маловероятно), а тем, насколько улучшает проце-
дуру отбора, основывающуюся на сведениях о предыдущей деятельно-
157
ВАЛИДНОСТЬ ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
Инкрементная валидность теста зависит не только от индекса отбо-
ра, но и от базового уровня, в чем можно убедиться, сравнивая разные
таблицы Тейлора-Расселла. Рассмотрим случай, когда валидность теста
равна 0,40, а индекс отбора-0,70. Какова в этих условиях инкрементная
валидность при базовом уровне 0,50?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
верка двумерного распределения данных легко выявила причину этого
снижения. Дело в том, что в связи с повысившимися требованиями при
приеме в колледж группа студентов во втором случае была более одно-
родной, чем в первом, по отношению как к предиктору, так и к крите-
риальному выполнению. Отсюда и падение корреляции, несмотря на то
что точность прогноза успеваемости в колледже осталась в общем пре-
жней. Иными словами, наблюдавшийся эффект вовсе не свидетельствует
о временном снижении валидности предикторов, а к такому выводу
моно бы прийти, упустив из вида различия в однородности групп.
-Для правильной интерпретации коэффициента валидности следует
принимать во внимание форму зависимости между тестом и критерием.
Определение пирсоновского коэффициента корреляции предполагает, что
эта зависимость линейна и остается одной и той же по всему диапазону
значений предиктора. Однако в ряде ситуаций это условие не выполняет-
ся (J. Fisher, 1959; D. Kahneman, 1962). Пусть для выполнения некоторой
работы требуется лишь минимальный уровень понимания читаемого, до-
статочный для прочтения инструкций, названий и т.д. Но как только
этот минимальный уровень превзойден, то от дальнейшего развития
данного умения успешность выполнения работы уже не зависит, т.е. ме-
жду тестом и выполнением работы существуют нелинейные отношения.
Проверка двумерного распределения или диаграммы рассеяния, по-
строенной по показателям теста на понимание читаемого и крите-
риальных мер, выявила бы, что уровень выполнения работы растет, пока
,-,"" ,,>nrrf -ггала тт тттт-QT "rrVPAAnir ТПНН ПОСЛб ЧеГО
152 lllIIIIUIItIhl ПСИХОЛОГИЧЕСКОГО ТГСТИРОИАПИЯ
он остается примерно тем же. Следовательно, точки на диаграмме ско-
рее группируются вокруг кривой, а не прямой линии.
В других случаях эта линия может быть и прямой, но точки, изобра-
жающие индивидуальные данные, могут отстоять от нее в верхнем конце
шкалы дальше, чем в нижнем. Предположим, что выполнение теста спо-
собности к обучению-необходимое, но не достаточное условие для ус-
воения некоторого учебного предмета. Это значит, что ученики, показав-
шие в тесте низкие результаты, справятся с ним плохо, тогда как среди
учеников с высокими результатами одни освоят предмет, а другие, из-за
недостаточной мотивации, еле его одолеют. В этом случае будет наблю-
даться большая вариативность критериального выполнения у учащихся
с более высокими тестовыми результатами, чем с более низкими. Опи-
санная особенность двумерного распределения называется гетероскеда-
стичиостыо. Определение корреляции по Пирсону предполагает наличие
гомоскедастичности, т.е. одинаковую дисперсию критерия по всей обла-
сти двумерного распределения. В приведенном примере двумерное рас-
пределение имеет форму веера, расширяющегося слева направо и снизу
вверх. Одною взгляда на двумерное распределение обычно бывает до-
статочно для установления характера соотношения между тестом и кри-
терием. Прогностические таблицы и карты прогноза также достаточно
хорошо выявляют относительную эффективность теста на разных уров-
нях.
Величина коэффициента валидности. Какова должна быть ве-
личина коэффициента валидности? На этот вопрос нет единого ответа.
так как при интерпретации коэффициента валидности нужно учитывать
ряд побочных обстоятельств. Конечно, корреляция должна быть стати-
стически значимой на некотором достаточном уровне (0,01 или 0,05-см.
гл. 5). Иными словами, прежде чем делать выводы о валидности теста,
нужно иметь уверенность в том, что данный коэффициент валидности не
появился в результате случайных выборочных отклонений от нулевого
значения.
Установив значимость корреляции между тестовыми показателями
и критерием, необходимо еще оценить величину корреляции с точки зре-
ния использования теста. Если мы хотим оценить величину индивидуаль-
ного критериального показателя (скажем, успеваемость первокурсника),
то для интерпретации коэффициента валидности уместно обратиться
к стандартной ошибке оценки, аналогично рассматривавшейся в связи
с надежностью теста ошибке измерения. Напомним, что ошибка измере-
ния указывает на допустимые пределы возможной ошибки в индиви-
дуальных показателях вследствие ограниченной надежности теста. Точно
так же ошибка оценки указывает на допустимые пределы возможной
ошибки в прогнозируемой величине индивидуального критериального
показателя как результата ограниченной валидности теста.
Ошибка оценки находится по следующей формуле:
-~
-ст1 - r,
где r -квадрат коэффициента валидности и -стандартное отклонение
критериальных показателей-.3аметим, что при полной валидности ошиб-
ка оценки была бы равна нулю. Вместе с тем если валидность теста рав-
на нулю, то ошибка оценки совпадает со стандартным отклонением кри-
териального распределения. В этих условиях прогноз равносилен
153 ВАЛИДНОСТЬ. ИЗМЕгеНИ И ИПТИРПППАЦИЯ
деление критериальных показателей. Ошибка оценки и IUUCIIMOCIH от
меняющейся валидности теста располагается между этими предельными
значениями. ______
Из формулы для (7, видно, что величина [/1 - " указывает на вели-
чину ошибки относительно ошибки простого угидыччпия, т.е. при нуле-
вой валидности. Иными словами, если ]/)- гу = 1,00, то ошибка оцен-
ки столь же велика, как и при угадывании. Пользы от теста, сле-
довательно не будет никакой. Если коэффициент валидное in равец 0,80,
то 1/1- гу= 0,60, т.е. ошибка составляет 60"" от той, которая бы-
ла бы при угадывании. Это означает, что тест позволяет делать про-
гнозы о критериальном выполнении индивида с ошибкой на 40"" мень-
шей, чем в случае угадывания.
Может показаться, что даже при такой необычно высокой валидно-
сти, как 0,80, ошибка в предсказываемых показателях все еще значи цель-
на. Если основным назначением психологического теста счтать прелска-
зание точного положения показателя ипдипида в распредслепип крше-
риальных показателей, то вывод будет совершенно обескуражипакнцпм.
С точки зрения ошибки оценки большинство тестов представляются не
особенно эффективными. Однако чаще всего при тестировании нет необ-
ходимости прогнозировать критериальное BbinoJ>nciiiic в индиви-
дуальных случаях, но требуется лишь определить, кто из испытуемых
превзойдет некоторый минимальный стандарт выполнения, или норма-
тивный показатель критерия. Каковы шансы у Мери Грин закончить ме-
дицинское училище, у Тома Хиг гипса усвоить курс дифференциальною
исчисления, а у Беверли Бруса преуспеть в качестве ас1ропавта? Кто из
поступающих, скорее всего, будет хорошим служащим, продавцом, меха-
ником? Такая информация полезна не только при отборе кадров, но
и при индивидуальном выборе профессии. Например, школьнику полез-
но знать, что у него хорошие шансы благополучно окончить юридиче-
ский факультет, даже если мы не можем с \ перечною 11.14 ч.п.ш.. будет
ли его средний балл 74 или 81.
Тест может заметно повысить эффективность прогноза, если для не-
го будет установлена любая, даже низкая, значимая корреляция с крите-
рием. В ряде случаев валидность 0,20 или 0,30 уже оправдывает включе-
ние теста в программу отбора. Для основных целей тестирования
суждение о тесте с точки зрения ошибки оценки чрезмерно строго. Су-
дить следует, принимая во внимание иные способы оценки геста, те, ко-
торые бы учитывали типы решений, осуществляемых на основе его ре-
зультатов. О некоторых из этих методов пойдет речь в следующем
разделе.
ВАЛИДНОСТЬ ТЕСТА И ТЕОРИЯ РЕШЕНИЙ
Основной подход. Предположим, 100 человек, поступающих на рабо-
ту, выполнили тест способностей и по прошествии какого-то времени
были оценены их успехи в выполнении своих обязанное} ей. На рис. 17
изображено двумерное распределение результатов тестирования и пока-
зателей выполнения работы. Корреляция между обеими переменными
несколько ниже 0,70. Необходимый минимум выполнения обязанностей,
154
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
числу людей, не справившихся с работой, а 60 случаев над чертой-спра-
вившихся с ней. Если все 100 поступавших принимаются на работу, то
60Їо справятся с ней. При принятии меньшего числа без учета результа-
тов теста, т. е. наугад, относительное количество удач было бы, вероятно,
близким к 60Їо. Предположим, однако, тестовые показатели используют-
ся для отбора из 100 претендентов 45 наиболее перспективных сотрудни-
ков (индекс отбора-0,45). В таком случае следует выбрать 45 человек,
чьи показатели попали справа от вертикальной толстой линии. Среди
них будет 7 случаев неудач в работе, или ошибочного приема, и 38 слу-
чаев успеха. Процент успеха теперь равен уже не 60, а 84 (т.е. 38/45 ==
= 0,84). Это увеличение обусловлено применением теста в качестве ин-
струмента отбора. Кстати, можно игнорировать ошибки показателей
прогностического критерия, не влияющие на принимаемое решение. Из-
бирательную эффективность теста снижают только те из них, которые
находятся ниже горизонтальной толстой черты и, следовательно, поме-
щают индивида в ошибочную категорию.
Для полной оценки эффективности теста как инструмента отбора
рассмотрим также ошибки другого типа, представленные на рис. 17.
Рис. 17. Рост количества успехов вследствие использования отборочного тесто
и S QJ 0 10 S. ш а о И 1 to s л 1 1правильное принятие.S t С-х (и С U 1 л <о ? S 1" о. >1Ї <и о. х ш
;(38)
(шибочное неп зиняти/
(22)
///
т////
///м-//1111/
itfMiiii///ч
////тii/ill/
Прзвильное/////Mf-iw iiiiii/
непри (3нитие 3)тiiчillОшибочное пр (7)инятие
/iii
s X т 5 1/
той. Таким о, которые ост нормативные по-
ного успеха вао тесте Даала соответсеи,
бораприменяется при клиническоеa Тестировании
ошибоозо Р практике "Ри, если
ложительным в меди "азываются ит называется
Этот Рогии Результаты JC если п означает,
--
видов "?"Їоз относительно вьи учитывать
нота), а ределенных исключить н о не-
иснытуемых. Вно вьо характер Р серьезные
должен быть дос одимо, J может н граждан-
ожных афицированныи Ря на отбор Jo боль-
достаточно здесь Ует важнее нансла неудач.
щерб или У условиях быв большего ием
"Р-
установленвТо о можно
критериальнораспределение Р, методу ег, 1966;
Kuo-Cheng Hs ep потери, свя
156 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
работой вновь принятых сотрудников с 60 до 84 может служить основа-
нием для оценки преимуществ от использования теста.
Теория статистических решений была разработана А. Уолдом
(A. Wald, 1950) применительно к решениям, принимаемым при контроле
качества промышленных изделий. Модификация этого подхода примени-
тельно к составлению и интерпретации психологических тестов была
осуществлена Л. Кронбахом и Г. Глесером (L. J. Cronbach, G. С. Glesser,
1965). Теория решений в принципе представляет собой попытку придать
процессу принятия решения математическую форму, с тем чтобы исполь-
зовать имеющуюся информацию для выработки в конкретных обстоя-
тельствах наиболее эффективных решений. Математические процедуры,
применяемые в теории решений, весьма сложны, и лишь немногие из них
имеют форму, приемлемую для непосредственного использования
в практических задачах тестирования. Некоторые из основных понятий
теории решений, однако, помогают лучше объяснить ряд касающихся те-
стов вопросов. Часть идей, составивших основу теории решений, была
введена в тестирование еще до того, как был разработан формальный
аппарат этой теории.
Предсказание результатов. Своего рода предвестником теории
решений в психологическом тестировании явились таблицы Тейлора-
Расселла (Н.С. Taylor, J.T. Russell, 1939), позволившие определить вы-
игрыш в точности отбора от использования теста. Для работы с табли-
цами нужно знать коэффициент валидности теста, индекс отбора
и базовый уровень, т.е. oi носи тельные количесгно coip\ шиков, спра-
вляющихся со своими обязанностями и набранных случайно (без исполь-
зования теста). Изменение любого из этих параметров может повлиять
на прогностическую эффективность теста.
В качестве примера приведем одну из таблиц Тейлора-Расселла, от-
вечающую базовому уровню 0,60 (табл. 14). В верхней ее части приве-
дены различные значения индекса отбора, в крайнем левом столбце-
коэффициенты валидности, а в с троках-относительное число успехов
среди принятых на работу по результатам теста. Разность между такой
величиной и 0,60 указывает на выигрыш от применения теста.
Очевидно, если индекс отбора равен 1,0, т.е. когда приему подлежат
все претенденты, ни один тест, как бы валиден он ни был, не улучшит ка-
чества отбора. Из табл. 14 видно, что при индексе отбора, равном 0,95,
даже тест с коэффициентом валидности, равным 1,0, повышает долю ус-
пехов только на 0,03 (с 0,60 до 0,63). Напротив, если из поступающих
нужно отобрать только 5Ї/", то тест обеспечивает рост правильно приня-
тых с 0,60 до 0,82. Этот рост представляет инкрементную валидность те-
ста (L. Sechrest, 1963), или рост прогностической валидности теста,
и указывает на роль теста в улучшении отбора лиц, которые в дальней-
шем будут удовлетворять минимальным требованиям критериального
выполнения. Применяя таблицы Тейлора-Расселла, необходимо, конеч-
но, знать валидность теста для группы именно того типа, по которой
определялся базовый уровень. Иными словами, польза от применения
теста оценивается не вероятностью успеха отобранных с его помощью
претендентов (если, конечно, до этого поступавшие на работу не при-
нимались наугад, что маловероятно), а тем, насколько улучшает проце-
дуру отбора, основывающуюся на сведениях о предыдущей деятельно-
157
ВАЛИДНОСТЬ ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
Инкрементная валидность теста зависит не только от индекса отбо-
ра, но и от базового уровня, в чем можно убедиться, сравнивая разные
таблицы Тейлора-Расселла. Рассмотрим случай, когда валидность теста
равна 0,40, а индекс отбора-0,70. Какова в этих условиях инкрементная
валидность при базовом уровне 0,50?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69