Принято считать, что классические тесты интеллекта позволяют измерять только уровень конвергентного мышления – нетворческого, «осторожного». Другой компонент интеллекта – дивергентное (творческое) мышление – подобному тестированию не поддается. Получаемые коэффициенты (IQ) не дают представления об этой стороне интеллекта, что привело к попыткам разработки специальных методов – тестов креативности (см. ниже).
Тесты
способностей– это методы, направленные на оценку возможностей человека в овладении знаниями, умениями и навыками как общего, так и частного характера. В первом случае речь идет об оценке общих способностей (сенсорных, моторных, мнемических и т. д.), во втором – об оценке способностей специальных, обычно связанных с профессиональной деятельностью (математических, музыкальных, художественных, скорости чтения и т. д.).
В зависимости от задач исследования тесты способностей часто объединяются в те или иные батареи; иногда они включаются в батареи с тестами интеллекта, например для более полной оценки способностей человека при проведении профотбора и профориентации. Батарея тестов общих способностей GATB, разработанная американской Службой занятости в 1956 г., содержит 12 субтестов на вербальные и математические способности, пространственное восприятие, моторику пальцев, моторику рук и т. д. В настоящий момент батарея GATB за счет разработки ряда ее модификаций для отдельных групп профессий относится к числу наиболее широко применяемых в зарубежной профессиональной диагностике, в частности в США.
Отдельный вид способностей представляют собой творческие способности. Совокупность творческих способностей называют
креативностью.В теоретическом плане не проведена четкая грань между креативностью как качеством интеллекта, как творческой способностью и как свойством личности. Поэтому в группу тестов креативности входят весьма разнообразные методики. Наиболее известны тесты Дж. Гилфорда и Е. Торренса, разработанные на рубеже 1950—1960-х гг. Тест Е. Торренса состоит из трех субтестов, позволяющих оценить уровни развития вербального, образного и звукового творческого мышления, получить представление о качественном своеобразии этих структур креативности у разных людей. Задания требуют от испытуемого продуцировать идеи в вербальной форме, в форме некоторого рисунка, изображения. В зависимости от количества и оригинальности идей судят об уровне развития креативности испытуемого.
Тесты
достиженийпредназначены для оценки уровня овладения знаниями, умениями и навыками в какой-либо конкретной деятельности и используются преимущественно в сферах обучения и профотбора. По типу задания различают тесты
действия, письменные и устныетесты.
Тесты
действиявыявляют степень умения выполнять действия с определенными инструментами, орудиями, материалами, механизмами и т. п., например при тестировании машинистки, сборщика деталей, водителя автомобиля и т. д.
Письменныетесты представляют собой систему вопросов и возможных ответов на специальном бланке. Иногда вопросы иллюстрируются рисунками, сопровождающими вопрос. Задача испытуемого – либо выбрать правильный словесный ответ, либо отметить на графике отображение описанной в вопросе ситуации, либо найти в рисунке деталь, дающую правильное решение соответствующего вопроса.
Устныетесты – это системы устных вопросов, предусматривающие обход трудностей, возникающих из-за отсутствия у испытуемого опыта в формулировании ответов. Тесты достижений используются в первую очередь в сферах обучения и профотбора. В последнее время они приобрели огромную популярность в виде разнообразных игр на радио и телевидении.
Проективные тесты.В рамках проективного диагностического подхода получение информации основано на анализе особенностей действий испытуемого с внешне нейтральным, как бы безличным материалом, становящимся в силу его слабой структурированности и неопределенности объектом проекции. Соответственно, методики, основанные на использовании принципа проекции, называются
проективными(прожективными). Понятие проекции для обозначения этих методик впервые было использовано французским психологом Л.К. Франком в 1939 г. и, несмотря на неоднократные попытки изменить их название, закрепилось, став общепринятым.
Необходимость смены названия была продиктована постепенным отходом в интерпретации методик этой группы от идей психоанализа. На сегодняшний день термин «проекция» в психологии имеет два значения; 1) в психоаналитическом понимании – один из защитных механизмов, посредством которого внутренние импульсы и чувства, неприемлемые для «Я», приписываются внешнему объекту и только тогда проникают в сознание (в этом смысле термин был впервые введен в науку 3. Фрейдом в 1894 г.); 2) в непсихоаналитическом понимании – проявления личности вовне. Каждое проявление активности (эмоциональное, речевое, двигательное) несет на себе отпечаток личности в целом. Чем менее стереотипны стимулы, побуждающие к активности, тем ярче проявление личности.
Первое описание проекции как естественной тенденции людей действовать под влиянием своих потребностей, интересов и всей психической организации (причем защитные механизмы могут проявляться, а могут и не проявляться) принадлежит американскому психологу Г.А. Мюррею. Создание теоретической концепции проекции в применимом для исследования личности виде обусловило бурное развитие проективных методик, которые в настоящий момент занимают видное положение в зарубежной психодиагностической практике.
Тестирование с помощью проективных методов имеет следующие наиболее общие особенности. В методиках используется неоднозначный, слабоструктурированный стимульный материал, допускающий большое число вариантов восприятия и интерпретации. При этом предполагается, что чем слабее он структурирован, тем выше степень проекции: «Субъект, поглощенный попытками интерпретировать вроде бы ничего субъективно не значащий материал, не замечает, как раскрывает свои волнения, страхи, желания и тревоги. Таким образом значительно снижается сопротивление при раскрытии личных, иногда очень болезненных проблем».
Для преодоления сопротивления испытуемого инструкция дается ему без раскрытия истинной цели, а сама процедура тестирования нередко проходит в игровой форме. Испытуемый, как правило, не ограничивается в выборе ответов, и ответы не оцениваются как «правильные» или «ошибочные». Благодаря этим особенностям проективные методики нередко используются на начальных этапах психологической работы с клиентом или в начале комплексного психологического тестирования личности, поскольку позволяют установить контакт и вызвать интерес к обследованию. Немаловажным достоинством многих проективных методик является то, что ответы испытуемых не обязательно должны даваться в вербальной форме (как в случае с опросниками), что позволяет использовать их в работе и со взрослыми, и с детьми.
Классификация проективных методов принадлежит Л.К. Франку. Он предложил различать проективные методы в зависимости от характера реакций испытуемого. В современной, дополненной классификации проективных методов различают конститутивные, конструктивные, интерпретативные, катартические, экспрессивные, импрессивные, аддитивные методики.
Конститутивныеметодики характеризуются ситуацией, в которой от испытуемого требуется создать некую структуру из слабоструктурированного, аморфного материала, оформить стимулы, придать им смысл. Примером методик этой группы является тест Г. Роршаха, стимульный материал которого состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными «кляксами». Испытуемому предлагается ответить на вопрос, на что, по его мнению, похоже каждое пятно. В зависимости от ответов обследуемого судят о его переживаниях, особенностях взаимодействия с окружением, реалистичности восприятия действительности, тенденциях к беспокойству и тревожности и др. Тест Г. Роршаха в высокой степени удовлетворяет ориентацию проективной психологии на использование нестереотипных стимулов. Стимульный материал данного теста не навязывает испытуемому ответов, в связи с чем он является наиболее часто используемой в зарубежной психодиагностике проективной методикой. Попыткой дальнейшего развития принципа слабоструктурированности стимульного материала является методика «Картины облаков» В. Штерна и др., где используется напоминающий облака стимульный материал, не имеющий в отличие от «пятен Роршаха» симметрии и четкого контура. Испытуемому предлагается самостоятельно отметить контуры и рассказать о том, что изображено на картинках.
Конструктивныеметодики подразумевают конструирование, создание из оформленных деталей осмысленного целого. Например, стимульный материал методик «Деревня» и «Тест мира» состоит из небольших по величине предметов, количество которых в разных вариантах доходит до 300. Среди них школа, больница, мэрия, церковь, торговые лавки, деревья, автомобили, фигурки людей и животных и т. п. Испытуемому предлагается по своему усмотрению построить из этих предметов деревню, в которой он хотел бы жить, либо некоторое пространство своего существования (по терминологии авторов – «малый мир»). Определяется подход испытуемого к конструированию макета, реалистичность его построения, близость к характерным для разных контингентов построениям и т. д.
Интерпретативныеметодики подразумевают истолкование испытуемым какого-либо события, ситуации. Примерами являются тест тематической апперцепции (ТАТ), тесты словесных ассоциаций. Стимульный материал ТАТ представляет собой набор из 30 черно-белых изображений, на которых представлены относительно неопределенные сцены, допускающие неоднозначную интерпретацию. Испытуемому предлагается составить рассказ по каждому изображению: что там происходит, что переживают действующие лица, что этому предшествовало, чем ситуация закончится. На основе рассказа испытуемого создается представление о его переживаниях, осознаваемых и неосознаваемых потребностях, конфликтах и способах их разрешения. В тестах словесных ассоциаций стимульный материал состоит из списка не связанных между собой слов, на каждое из которых испытуемый должен как можно быстрее дать первое пришедшее на ум слово-ассоциацию. Характер и время реакции ответов дают возможность выделить наиболее «эмоционально заряженные» для данного испытуемого слова-стимулы, судить о наличии тех или иных проблемных тем.
Катартическиеметодики представляют собой осуществление игровой деятельности в специально организованных условиях. К ним относят, в частности, психодраму Я. (Дж.) Морено, рассматриваемую как проективную методику исследования личности. В ходе мини-представления, в котором испытуемый (протагонист) играет роль самого себя или воображаемого лица в значимых для себя ситуациях, проявляются его личностные особенности, а путем аффективного отреагирования в драматических ситуациях, созвучных переживаниям испытуемого, достигается терапевтический эффект (катарсис – очищение и инсайт – озарение). Методика не имеет стандартной процедуры проведения, данных о валидности и надежности, вследствие чего применяется в качестве не столько психодиагностической, сколько психотерапевтической методики в групповой психотерапии.
В
экспрессивныхметодиках получение информации основано на анализе рисунков испытуемого. Рисунки могут быть на свободную или заданную тему. Известны рисуночные методики «Несуществующее животное» М.З. Друкаревич, «Дом – дерево – человек» Дж. Бука, «Рисунок семьи» В. Халса, «Нарисуй человека» К. Маховер, «Мой жизненный путь» И.Л. Соломина, «Детская рука, которая беспокоит» Р. Давидо, «Лица и эмоции» А. Джахез и Н. Манши, многомерный рисуночный тест Р. Блоха, тест рисования пальцами Р. Шоу и др. По утверждению Д. Харриса, автора одной из модификаций теста «Рисунок человека» Ф. Гудинаф, «рисунки могут многое сказать об аффекте, темпераменте, отношении и личности человека, который их нарисовал».
Проведение рисуночных тестов не требует больших затрат времени, обычно допускает групповую форму. Основными подвергаемыми анализу элементами рисунка являются его размер, положение на листе (вверху, внизу, в центре, в углу), поворот рисунка влево или вправо, нажим (слабый, стандартный, сильный), характеристика линий (ровные, дрожащие, прерывистые, двойные), наклон фигуры, плотность и площадь штриховки, количество и характер деталей. Как правило, рисуночные методики подразумевают дополнение рисунка рассказом испытуемого об изображенном, составление истории по рисунку, опрос испытуемого по прилагаемому перечню вопросов. Анализируются и поведение испытуемого во время выполнения задания, его высказывания, вегетативные проявления, длительность работы над рисунком. Для увеличения достоверности интерпретации желательно проводить рисуночные методики в комплексе с другими тестами, дополнять их результатами беседы и наблюдения.
Импрессивныеметодики подразумевают предпочтение одних стимулов (как наиболее желательных) другим. Испытуемый оказывается в ситуации, когда необходимо либо выбрать наиболее предпочтительные стимулы, либо проранжировать стимулы по степени предпочтения. Например, в тесте Л. Сонди испытуемому предъявляются 48 портретов психически больных людей, разбитых на шесть серий, с инструкцией выбрать в каждой серии по два наиболее и наименее понравившихся портрета. В зависимости от предпочтений испытуемого судят о наиболее значимых для него «диагностических областях».
Отдельную подгруппу импрессивных тестов составляют тесты цветового выбора (цветовой тест отношений А.М. Эткинда, тест цветовых метафор И.Л. Соломина, тест цветных пирамид М. Пфистера и Р. Хайсса, «Попарные сравнения» Ю.И. Филимоненко и др.). Все эти тесты базируются на тесте швейцарского психолога М. Люшера, опубликованном в 1948 г. В основе теста Люшера лежит предположение о том, что выбор цвета отражает настроение, функциональное состояние и наиболее устойчивые черты личности. Каждый цвет спектра является пусковым сигналом, вызывающим у человека разнообразные, не осознаваемые в полной мере ассоциации. Например, с красным цветом человек сталкивается преимущественно в ситуациях опасности и напряженной борьбы (это цвет крови, огня), что приводит к ассоциированию этого цвета с соответствующим для таких ситуаций состоянием нервно-психического напряжения, мобилизованности, активного действия. Соответственно, предпочитать в ситуации тестирования красный цвет будет человек активный и хорошо отдохнувший, для которого ассоциативная специфика восприятия цвета будет соответствовать его энергетическим возможностям и мотивационным установкам, отвергать – человек утомленный и заторможенный, для которого возбуждение в данный момент неуместно, идет вразрез с наличным энергопотенциалом и установками.
Аддитивныеметодики подразумевают произвольное завершение испытуемым стимульного материала, например завершение предложения (методики А. Пейна, Д. Сакса и С. Леви, А. Тендлера, Дж. Роттера, Б. Форера, А. Роде и др.) или завершение истории (методики Л. Дюсса, М. Тома и др.). В зависимости от характера завершений судят о потребностях и мотивах испытуемого, его отношении к семье, сексу, вышестоящим по работе и т. д.
Классификация К. Франка неоднократно критиковалась за описательность, смешение критериев, нечеткое разделение групп методов. Непонятно, например, куда отнести тесты типа «Завершение рисунка» – к экспрессивным, конститутивным или аддитивным методам. При выделении группы катартических методов произошло смещение акцента с процесса на результат (катарсис). Вряд ли достаточно обоснован выбор характера реакций испытуемого в качестве критерия построения претендующей на полноту охвата классификации проективных методов, тем более что выделенные Франком категории оказались заданы не столько характером реакций испытуемого, сколько характером самого стимульного материала и целью исследования.
В связи с этим возникает необходимость в разведении проективных тестов по нескольким критериям. В.В. Никандров и В.В. Новочадов предлагают следующую классификационную систему проективных методик:
1) по задействованной модальности (методики с визуальной, тактильной, аудио– и иной стимуляцией);
2) по характеру стимульного материала (вербальные, невербальные);
3) по типу реакции испытуемого (ассоциативные, интерпретативные, манипулятивные, свободного выбора);
4) по наличию или отсутствию готовых вариантов ответа (проективные, полупроективные).
Большинство психодиагностических методик подразумевает задействование зрительной модальности. Это является отражением особой важности роли зрения в приеме информации у современного человека: допускается, что адресация стимульного материала глазам позволяет получать ответы, достаточно полно характеризующие личность. Тем не менее существуют методики, где стимуляция предъявляется испытуемому на слух, например в тесте словесных ассоциаций, где тестируемый должен как можно быстрее дать слово-ассоциацию на произносимое психодиагностом слово-стимул. Известны также попытки создания проективных методик, обращенных к тактильным ощущениям.
По характеру стимульного материала проективные методики могут быть вербальными, где в качестве стимула выступает слово, предложение или текст, и невербальными, с предметной, цветовой, рисуночной и прочей стимуляцией. В тестах словесных ассоциаций в качестве стимулов используются отдельные слова, в методиках типа «Завершение предложений» – незаконченные предложения, в методиках типа «Завершение истории» – неполные тексты.
Принято различать следующие типы ответов испытуемых: ассоциация, интерпретация, манипуляция (по шкале действий с предметами, материалами и др., имеющей полюсами творческую и репродуктивную манипуляцию), свободный выбор (т. е. некое распределение, ранжирование стимульного материала). В соответствии с этим проективные методики предложено делить на ассоциативные, интерпретативные, манипулятивные и методики свободного выбора.
В зависимости от наличия готовых вариантов ответа различают полупроективные методики, где испытуемому предлагается выбрать один из предложенных вариантов ответа на проективную стимуляцию (в некотором смысле – аналог закрытых опросников), и собственно проективные, где такие варианты отсутствуют. Примером полупроективной методики может быть тест Л. Сонди (обычно наиболее известные тесты называются только по фамилии, здесь именно такой случай), где испытуемому предлагается выбрать в каждой серии портретов по два понравившихся и два непонравившихся. Испытуемому может не понравиться ни один портрет, а ненравящихся может быть больше, чем два, однако принудительная инструкция ставит испытуемого в определенные условия, которым он должен следовать, что накладывает определенные ограничения на проявление его личностных свойств. Безусловными плюсами полупроективных методик являются простота количественной обработки результатов, доступность перевода методик в компьютерную форму, меньшая уязвимость относительно субъективизма интерпретатора.
Общепринятым является представление о том, что проективные тесты имеют преимущество над субъективными, поскольку позволяют выявить неосознаваемые компоненты психического. Однако необходимо заметить, что эти неосознаваемые компоненты вовсе не обязательно проявятся в результатах тестирования. По мнению Г.У. Оллпорта, нормальный, адекватно приспособленный субъект при проведении проективных тестов дает ответы, аналогичные сознательному отчету в субъективных тестах, либо благодаря достаточно развитому самоконтролю никак не проявляет свои доминирующие мотивы. Поэтому проективное тестирование приобретает особое значение только тогда, «когда в проективных реакциях обнаруживается эмоционально нагруженный материал, противоречащий сознательным отчетам. И только тогда можно с уверенностью говорить о наличии или отсутствии невротических тенденций».
Компьютерное тестирование.Это относительно молодое направление психодиагностики, связанное с использованием средств электронно-вычислительной техники. Появление компьютерной психодиагностики обусловлено развитием информационных технологий. Попытки автоматизировать предъявление испытуемому стимульного материала и последующую обработку результатов предпринимались начиная с 1930-х гг., но лишь с 1970-х гг. началось подлинное развитие компьютерной психодиагностики, обусловленное появлением персональных компьютеров. С 1980-х гг. компьютерные тесты стали разрабатываться в массовых масштабах: сначала – как компьютерные версии известных бланковых методик, а в 1990-е гг. – как специальные методики, учитывающие возможности современной техники и не употребимые в бланковом виде, поскольку рассчитаны на сложный, изменяющийся в пространстве и времени стимульный материал, специфическое звуковое сопровождение и т. п. Начало XXI в. отмечено тем, что управление тестированием все чаще передается компьютеру. Если в прошлые годы автоматизировались отдельные стадии исследования, например предъявление материала, обработка данных, интерпретация результатов, то на современном этапе все чаще можно встретить программы, которые берут на себя все обследование целиком вплоть до постановки диагноза, что сводит необходимость присутствия психолога к минимуму.
Безусловными достоинствами компьютерных тестов являются: быстрое проведение; высокая скорость и безошибочность обработки; возможность безотлагательного получения результатов; обеспечение стандартных условий тестирования для всех испытуемых; четкий контроль процедуры тестирования (невозможен пропуск вопросов, при необходимости может фиксироваться время каждого ответа, что особенно важно для тестов на интеллект); возможность исключения психолога как дополнительной переменной (что имеет особое значение при проведении экспертизы); наглядность и занимательность процесса (поддержка внимания с помощью цвета, звука, игровых элементов, что наиболее важно для обучающих программ); легкая архивация результатов; возможность объединения тестов в батареи (пакеты программ) с единой итоговой интерпретацией; мобильность экспериментатора (весь инструментарий на одной дискете); возможность проведения массовых исследований (например, через Интернет).
Недостатки компьютерных тестов: сложность, трудоемкость и дороговизна разработки программ; необходимость дорогостоящей компьютерной техники; сложность использования ЭВМ в полевых условиях; необходимость специального обучения испытуемого работе с компьютерными тестами; трудности работы с невербальным материалом, особая сложность перевода в компьютерную форму проективных тестов; отсутствие индивидуального подхода к тестируемому (потеря части психодиагностической информации, получаемой в беседе и наблюдении); латентность этапов обработки и интерпретации данных (качество этих процедур полностью зависит от разработчиков программ). У некоторых испытуемых при взаимодействии с компьютером могут возникать эффекты «психологического барьера» или «сверхдоверия». Поэтому данные о валидности, надежности и репрезентативности бланковых тестов не могут быть автоматически перенесены на их компьютерные аналоги, что ведет к необходимости новой стандартизации тестов.
Недостатки компьютерных тестов вызывают настороженное отношение к ним психологов. Мало используются такие тесты в клинической психологии, где цена ошибки слишком высока. Отечественный психолог Л.С. Выготский выделял три уровня психодиагностики: 1) симптоматический (выявление симптомов); 2) этиологический (выявление причин); 3) типологический (целостная, динамическая картина личности, на основе чего строится прогноз). Компьютерная психодиагностика на сегодняшний день находится на низшем уровне – уровне симптоматического диагноза, практически не давая материала для выявления причин и вынесения прогноза.
Тем не менее, по-видимому, компьютерные тесты имеют большое будущее. Многие из перечисленных недостатков компьютерной психодиагностики наверняка будут устранены благодаря дальнейшему развитию электронной техники и совершенствованию психодиагностических технологий. Залогом такого оптимизма является нарастающий интерес науки и практики к компьютерной диагностике, в арсенале которой уже сейчас имеется свыше 1000 компьютерных тестов.
Среди существующих компьютерных тестов можно выделить следующие их виды:
1) по структуре – аналоги бланковых тестов и собственно компьютерные тесты;
2) по количеству тестируемых – тесты индивидуального и группового тестирования;
3) по степени автоматизации тестирования – автоматизирующие один или несколько этапов обследования и автоматизирующие все обследование;
4) по задаче – диагностические и обучающие;
5) по адресату – профессиональные психологические, полупрофессиональные и непрофессиональные (развлекательные).
Пользователем
профессиональныхкомпьютерных тестов является психолог, поэтому они разрабатываются специализированными лабораториями или центрами компьютерной психодиагностики. Эти тесты имеют ряд специфических особенностей: а) наличие архива (базы данных); б) наличие пароля на вход в тест или базу данных для обеспечения конфиденциальности результатов; в) развернутая интерпретация результатов с использованием профессиональных терминов, коэффициентов, с построением графиков (профилей); г) наличие информации о разработчиках методики, сведений о валидности и надежности, справочных материалов о лежащих в основе методики теоретических положениях.
Полупрофессиональныекомпьютерные тесты ориентированы на специалистов смежных профессий, например на педагогов, менеджеров по персоналу. Такие тесты зачастую снабжены редуцированной интерпретацией без использования специальной лексики, просты в освоении и работе. Тесты подобного уровня могут быть предназначены и для неспециалиста, рядового пользователя персонального компьютера, интересующегося психологией. Наконец, существует также большое число непрофессиональных компьютерных тестов, направленных на популяризацию психологических идей или преследующих развлекательные цели.
Пользуясь профессиональными или полупрофессиональными компьютерными тестами, необходимо соблюдать те же этические принципы, что и при бланковом тестировании. Важно не распространять результаты тестирования и защищать свои файлы паролем, особенно если у компьютера несколько пользователей. И главное – «не сотворить себе кумира», т. е. помнить, что компьютерный тест является только средством, помощником и имеет свои границы применения.
6.4. Стандартизация, надежность и валидность теста
Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.
В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.
Надежность теста.Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под
надежностьютеста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка
ретестовойнадежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее.
Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75.
Валидность теста.Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается.
Валидностьозначает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее.
Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.
Существуют следующие виды валидности теста.
Очевидная валидность.Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять.
Конкретная валидность(конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства.
Прогностическая валидность.Тест должен коррелировать с отдаленными по времени внешними критериями.
Содержательная валидность.Тест должен охватывать всю область изучаемого поведения.
Конструктная валидность.Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.