Тестирование как метод в психологии. Тестовые (измерительные) методы в психодиагностике

  • 29.09.2019

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

  • Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
  • Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
  • Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
  • После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

  1. дизайн и разработка
  2. тестирование
  3. реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

  1. Планирование
  2. Анализ рисков
  3. Разработка
  4. Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

  • Участие в Scrum планировании
  • Поддержка в юнит-тестировании
  • Тестирование пользовательских историй
  • Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
  • Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

  • Оценка усилий, необходимых для каждой пользовательской истории является обязательной
  • Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
  • Риск регрессии возрастает вместе с частыми изменениями в коде
  • Одновременность планирования и выполнения тестов
  • Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Психологическое тестирование - термин зарубежной психологии, обозначающий процедуру установления и измерения индивидуально-психологических отличий.

Психологическое тестирование используется в различных сферах: профориентации, профотборе, психологическом консультировании, планировании коррекционной работы и т.д.

Психологический тест - стандартизированное задание, по результатам выполнения которого судят о психофизиологических и личностных характеристиках, знаниях, умениях и навыках испытуемого.

На создание эффективного психологического теста уходит от 10 лет работы авторских коллективов. Качество теста обеспечивается многоступенчатой процедурой проверки и стандартизации его шкал.

С появлением первых тестов наиболее употребляемым термином, с помощью которого обозначается измерение индивидуально-психологических особенностей, стал термин «психологическое тестирование». Первоначально термин «психологическое тестирование» использовался широко, включая в себя любое измерение в психологической науке. По мере развития тестов, сфера психологического тестирования сузилась до измерения личностных и когнитивных особенностей.

Характеристики психологических тестов:

Стандартность - тестовая методика проходит стандартизацию, по итогам которой получаемые данные должны соответствовать закону нормального распределения или же норме социокультурного характера. В соответствии с нормами формируются диапазоны значений говорящие нам о силе выраженности исследуемого признака.

Надежность - свойство теста давать при повторном измерении близкие результаты. Надежная методика дает сходные результаты независимо от времени года или пола экспериментатора, влияния подобных фоновых факторов, должно сводится к минимуму самой методикой, что и определяет ее надежность.

Валидность - соответствие результатов теста той характеристике, для измерения которой он предназначен. Различают внутреннюю и внешнюю валидность. В случае с внешней это соответствие может быть проверенно положительной корреляцией, с объективными достижениями, результаты по тесту интеллекта, могут сопоставляться с академической успеваемостью. В случае с внутренней все сложнее, здесь речь идет о теоретической связи, о том, насколько выстроенная модель реально моделирует заявленный аспект.

Виды тестов:

Психологический тест - стандартизированное испытание, по результатам выполнения которого судят о психофизиологических и личностных свойствах (чертах, способностях, состояниях) испытуемого. Тесты, по которым судят о знаниях, умениях и навыках испытуемого, занимают промежуточное положение между психологическими, образовательными и проф. тестами.

Вербальный тест - тест, построенный на использовании языка, когда тестируемый, выполняя задание, должен не совершать действия, а описать их словами.

Стандартизованный тест - психологический тест с четко определенными неизменным списком вопросов, инструкцией, методами обработки результатов и подсчета баллов.

Тесты личности - тесты психологического тестирования, направленные на изучение характера, способностей, эмоций, потребностей и других свойств человеческой личности. Личностные тесты подразделяются на: проективные тесты, личностные опросники и тесты деятельности (ситуационные тесты).

Тест достижений - стандартизированный тест, используются также в целях профессионального отбора: конструируемый на учебном материале; предназначенный для оценки уровня овладения учебными знаниями и навыками.

Тест имитации - психологический тест, состоящий в том, что человеку предлагается выполнить задание, хотя ситуация, в которой предстоит выполнить задание, не воссоздается. Тест имитации используется в процессе отбора претендентов на работу.

Тест на профессиональную пригодность - психологический тест, направленный на выявление индивидуальных интересов и предпочтений. Такие тесты помогают определить работу наиболее предпочтительную для конкретного человека.

Тест интеллекта - тесты психологического тестирования, направленные на изучение степени развития интеллекта у человека. Задания тестов интеллекта: адресуются к словесно-логическому мышлению или направлены и на оценку развития наглядно-образного и наглядно-действенного мышления; позволяют характеризовать память, внимание, пространственную ориентировку, вербальное развитие и др.

Тест - это особый вид неэкспериментального исследования, представляющий собой специальное задание или систему заданий. Испытуемый выполняет задание, время выполнения которого обычно учитывают. Тесты применяют при исследовании способностей, уровня умственного развития, навыков, уровня усвоения знаний, а также при изучении индивидуальных особенностей протекания психических процессов.

Тестирование - обычно ограниченное во времени испытание, с помощью которого измеряется уровень развития или степень выраженности некоторых психических свойств личности, групп или общностей.

Классификация тестов:

  • 1) по форме:
    • а) устные и письменные;
    • б) индивидуальные и групповые;
    • в) аппаратурные и бланковые;
    • г) предметные и компьютерные;
    • д) вербальные и невербальные (выполнение заданий опирается на невербальные способности (перцептивные, моторные), а речевые способности испытуемых включаются в них только в плане понимания инструкций. К невербальным тестам относятся большинство аппаратурных тестов, предметных, рисуночных и т. п.);
  • 2) по содержанию:
    • а) изучающие свойства интеллекта;
    • б) способности;
    • в) отдельные характеристики личности и т. д.;
  • 3) по целям тестирования:
    • а) тесты для самопознания не являются строго научными, имеют небольшой объем, их отличает простота тестирования и подсчета результатов, они публикуются в популярных газетах, журналах, книжных изданиях;
    • б) тесты для диагностирования специалистом являются наиболее строгими в плане стандартизации процедуры тестирования и структуры, содержания тестовых заданий (стимульного материала), а также обработки информации и ее интерпретации, для них характерна валидность, они должны иметь нормативы по базовым группам;
    • в) тесты для экспертизы проводятся по инициативе официальных лиц (например, администрации, желающей проверить своих сотрудников на профессиональную пригодность или нанять на работу наиболее достойных, имеющих наилучшие результаты тестовых испытаний), требования аналогичны требованиям, предъявляемым к тестам для специалистов. Особенностью данных тесов является использование вопросов, минимизирующих неискренние ответы;
  • 4) по временным ограничениям:
    • а) тесты, учитывающие скорость выполнения заданий;
    • б) тесты результативности;
  • 5) по методическому принципу, положенному в основу методики:
    • а) объективные тесты;
    • б) методики стандартизированного самоотчета, в том числе:
      • - тесты-опросники состоят из нескольких десятков вопросов (утверждений), относительно которых испытуемые выносят свои суждения (как правило, «да» или «нет», реже трехальтернативный выбор ответов);
      • - открытые опросники, предполагающие последующий кон

тент-анализ;

  • - шкальные техники, построенные по типу семантического дифференциала Ч. Осгуда, методики классификации;
  • - индивидуально-ориентированные техники типа ролевых репертуарных решеток;
  • в) проективные техники, в которых, стимульный материал, предъявляемый испытуемым, характеризуется неопределенностью, предполагающей самые разнообразные трактовки (тест Роршаха, ТАТ, Сонди и др.);
  • г) диалогические (интерактивные) техники (беседы, интервью, диагностические игры).

Требования к тестовым методам исследования:

  • 1) репрезентативность (представительность) - это возможность распространения результатов, полученных при исследовании выборочной совокупности объектов, на всю совокупность этих объектов;
  • 2) однозначность методики - характеризуется тем, в какой степени получаемые с ее помощью данные отражают изменения именно и только того свойства, для оценки которого данная методика применяется Обычно это качество проверяется повторными измерениями;
  • 3) валидность (обоснованность) - это обоснованность выводов, полученных в результате применения данной методики;
  • 4) точность - способность методики чутко реагировать на малейшие изменения оцениваемого свойства, происходящие в ходе социально-психологического диагностического эксперимента;
  • 5) надежность - возможность получения с помощью данной методики устойчивых показателей.

Тестовое исследование отличается сравнительной простотой процедуры, оно кратковременно, проводится без сложных технических приспособлений, требует самого простого оснащения (часто это просто бланк с текстами задач). Результат решения теста допускает количественное выражение и тем самым открывает возможность математической обработки. Отметим и то, что в процессе тестовых исследований не учитывается влияние многочисленных условий, которые так или иначе влияют на результаты, - настроение испытуемого, его самочувствие, отношение к тестированию. Неприемлемыми являются попытки с помощью тестов установить предел, потолок возможностей данного человека, прогнозировать, предсказывать уровень его будущих успехов.

Тесты являются специализированными методами психодиагностического обследования, применяя которые можно получить точную количественную или качественную характеристику изучаемого явления. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных, а также своеобразие их последующей интерпретации. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки.

Варианты теста: тест-опросник, тест-задание, проективные тесты

  • 1. Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых.
  • 2. Тест-задание предполагает оценку психологии и поведения человека на базе того, что он делает. В тестах этого типа испытуемому предлагается серия специальных заданий, по итогам выполнения которых судят о наличии или отсутствии и степени развития у него изучаемого качества.

Тест-опросник и тест-задание применимы к людям разного возраста, принадлежащим к различным культурам, имеющим разный уровень образования, разные профессии и неодинаковый жизненный опыт. Это - их положительная сторона. А недостаток состоит в том, что при использовании тестов испытуемый по желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по его результатам будут оценивать его психологию и поведение. Кроме того, тест-опросник и тест-задание неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не может быть полностью уверен, не осознает или сознательно не хочет признавать их наличие у себя. Такими характеристиками являются, например, многие отрицательные личностные качества и мотивы поведения.

3. Проективные тесты. В основе таких тестов лежит механизм проекции, согласно которому неосознаваемые собственные качества, особенно недостатки, человек склонен приписывать другим людям. Проективные тесты предназначены для изучения психологических и поведенческих особенностей людей, вызывающих негативное отношение. Применяя тесты подобного рода, о психологии испытуемого судят на основании того, как он воспринимает окружающий коллектив и среду в которой он находится.

Этот недостаток относится ко всем методам исследования, основанным на самоконтроле, т.е. связанным с использованием речевых и поведенческих сознательно контролируемых реакций.

Пользуясь проективным тестом, психолог с его помощью вводит испытуемого в воображаемую, сюжетно неопределенную ситуацию, подлежащую произвольной интерпретации. Такой ситуацией может стать, например, поиск определенного смысла в картинке, где изображены неизвестно какие люди, непонятно чем занятые. Нужно ответить на вопросы, кто эти люди, чем они озабочены, а чем думают и что произойдет дальше. На основании содержательной интерпретации ответов судят о собственной психологии отвечающих.

Тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в этом состоит основное практическое ограничение их применимости. Кроме того, такие тесты требуют большой специальной подготовки и высокой профессиональной квалификации со стороны самого психолога.

4. Дополнительные методы. По сравнению с беседой, которая характеризуется растянутостью, медленным накоплением данных при массовых обследованиях, анкетирование более экономично во времени, что и обеспечивает ему широкое распространение на практике.

Метод экспертных оценок предполагает опрос специалистов о тех или иных элементах рабочей ситуации или личности профессионала с целью построения ответственного заключения. Экспертная оценка бывает индивидуальной, когда ее субъектом является один человек, и групповой. Одной из разновидностей групповой оценки является метод обобщения независимых характеристик, который используется при описании профессионально важных качеств конкретного профессионала

Специфическим методом экспертной оценки профессионала, применяемым в психологии труда, является метод критических инцидентов - его сущность состоит в том, что работники, хорошо знающие профессию, приводят реальные примеры поведения специалистов, характеризующие высокую или низкую эффективность профессиональной деятельности.

Метод анамнеза предполагает сбор данных об истории развития конкретной личности как субъекта трудовой деятельности. Он используется обычно в профессиональном консультировании для определения степени устойчивости мотивов, для выявления некоторых способностей и личностных особенностей, не поддающихся непосредственному наблюдению, для построения прогнозов профессиональной карьеры личности. Данный метод применим к малоразработанной в нашей науке проблеме ретроспективного анализа ситуаций выбора профессий, профессиональной переориентации, типологии профессиональной карьеры.

Психологическое тестирование – это метод измерения и оценки психологических характеристик человека с помощью специальных техник. Предметом тестирования могут быть любые психологические характеристики человека: психические процессы, состояния, свойства, отношения и т. п. Основой психологического тестирования является психологический тест – стандартизированная система испытаний, позволяющая обнаружить и измерить качественные и количественные индивидуально-психологические различия.

Изначально тестирование рассматривалось как разновидность эксперимента. Однако к настоящему времени специфика и самостоятельное значение тестирования в психологии позволяют отграничить его от собственно эксперимента.

Теория и практика тестирования обобщены в самостоятельных научных дисциплинах – психологической диагностике и тестологии. Психологическая диагностика – это наука о способах выявления и измерения индивидуально-психологических и индивидуально-психофизиологических особенностей человека. Таким образом, психодиагностика является экспериментально-психологическим разделом дифференциальной психологии. Тестология – это наука о разработке, конструировании тестов.

Процесс тестирования, как правило, включает в себя три этапа:

1) выбор методики, адекватной целям и задачам тестирования;

2) собственно тестирование, т. е. сбор данных в соответствии с инструкцией;

3) сравнение полученных данных с «нормой» или между собой и вынесение оценки.

В связи с наличием двух способов вынесения оценки по тесту различают два типа психологического диагноза. Первый тип заключается в констатации наличия или отсутствия какого-либо признака. В этом случае полученные данные об индивидуальных особенностях психики тестируемого соотносятся с некоторым заданным критерием. Второй тип диагноза позволяет сравнивать нескольких тестируемых между собой и находить место каждого из них на определенной «оси» в зависимости от степени выраженности тех или иных качеств. Для этого проводится ранжирование всех обследуемых по степени представленности исследуемого показателя, вводятся высокий, средний, низкий и т. д. уровни изучаемых особенностей в данной выборке.

Строго говоря, психологический диагноз есть не только результат сравнения эмпирических данных с тестовой шкалой или между собой, но и итог квалифицированной интерпретации с учетом многих привходящих факторов (психического состояния тестируемого, его готовности к восприятию заданий и отчету о своих показателях, ситуации тестирования и пр.).

Психологические тесты особенно ярко демонстрируют связь способа исследования с методологическими воззрениями психолога. Например, в зависимости от предпочитаемой теории личности исследователь выбирает тип личностного опросника.

Использование тестов – неотъемлемая черта современной психодиагностики. Можно выделить несколько областей практического использования результатов психодиагностики: сфера обучения и воспитания, сфера профессионального отбора и профессиональной ориентации, консультативная и психотерапевтическая практика и, наконец, область экспертизы – медицинской, судебной и т. п.

6.2. Возникновение и развитие метода тестирования

Возникновение метода тестирования, как уже указывалось выше, произошло в конце XIX в. на основе развития экспериментальных методов для изучения психических явлений. Возможность количественной оценки психических явлений и сопоставления на этой основе результатов разных испытуемых между собой обусловила бурное развитие метода тестирования. Вместе с этим накапливались знания об индивидуально-психологических особенностях людей.

Дифференциально-психологическое изучение человека формировалось не только как следствие развития экспериментальной психологии. Дифференциальная психология «выросла» из задач, стоявших перед медицинской и педагогической практикой, где велика была потребность в дифференциации душевнобольных и умственно отсталых людей.

Разработка психологических тестов велась во многих странах Европы и в США. Первоначально в качестве тестов использовались обычные лабораторные эксперименты, однако смысл их применения был иным. В этих экспериментах изучались не различия в реакциях испытуемого на разные стимулы, а индивидуальные различия в реакциях испытуемого при соблюдении постоянных условий эксперимента.

В 1905 г. появился первый интеллектуальный тест, соответствующий современному пониманию тестов. По заказу министерства образования Франции французский психолог А. Бине разработал тест интеллекта для выявления умственно неполноценных детей, не способных обучаться в обычных школах. В 1907 г. этот тест был усовершенствован соотечественником А. Бине Т. Симоном и получил название шкалы умственного развития Бине – Симона. Разработанная шкала содержала 30 заданий, расположенных по степени возрастания трудности. Например, для ребенка трех лет требовалось: 1) показать свои глаза, нос, рот; 2) повторить предложение длиной до шести слов; 3) повторить по памяти два числа; 4) назвать нарисованные предметы; 5) назвать свою фамилию. Если ребенок решал все задания, ему предлагались задания более старшей возрастной ступени. Задания считались соответствующими определенной возрастной ступени, если их правильно выполняло большинство (80–90 %) детей данного возраста.

Шкала Бине – Симона в последующих редакциях (1908 и 1911 гг.) была переведена на английский и немецкий языки. В этих редакциях был расширен возрастной диапазон – до 13 лет, увеличено число задач и введено понятие умственного возраста. Умственный возраст определялся по успешности выполнения тестовых заданий следующим образом: сначала ребенку предлагались задания, соответствующие его хронологическому возрасту. Если он справлялся со всеми заданиями, ему предлагали задания следующей старшей возрастной группы. Если же он не выполнял задания своей возрастной группы, ему предлагались задания предшествующей младшей возрастной группы. Базовым умственным возрастом считался тот, все задания которого были выполнены ребенком. Если ребенок выполнял, кроме них, некоторые задания из последующего старшего возраста, то к его базовому умственному возрасту добавлялось несколько «умственных месяцев».

В 1912 г. немецким психологом В. Штерном было введено понятие коэффициента интеллекта (IQ), определяемого как отношение умственного возраста к хронологическому возрасту, выраженное в процентах.

Усовершенствование шкалы А. Бине было продолжено в Стэнфордском университете (США) под руководством американского психолога Л.М. Термена. В 1916 г. был предложен новый, стандартизированный вариант этой шкалы, которую стали называть шкалой Стэнфорд – Бине. Она имела два существенных отличия от предыдущих редакций. Во-первых, в ней использовался коэффициент интеллекта, а во-вторых, вводилось понятие статистической нормы. Для каждого возраста наиболее типичный, средний показатель выполнения теста равнялся 100, а статистическая мера разброса – стандартное отклонение – 16. Таким образом, все индивидуальные результаты в пределах от 84 до 116 считались нормальными. Если тестовый показатель был выше 116, ребенок считался одаренным, если ниже 84 – умственно отсталым. Шкала Стэнфорд – Бине имела впоследствии еще несколько редакций (1937, 1960, 1972, 1986 гг.). Вновь создаваемые интеллектуальные тесты до сих пор проверяются на валидность путем сопоставления с результатами этой шкалы.

В начале XX в. развитие тестирования определялось также запросами промышленности и армии. Создавались тесты для отбора в различных отраслях производства и сферы обслуживания (тесты Мюнстерберга для профотбора телефонисток, тесты Фридриха для отбора слесарей, тесты Гута для наборщиков и др.), а также для распределения новобранцев по родам войск (тесты «Армия Альфа» и «Армия Бета»). Это привело к появлению группового тестирования. Впоследствии армейские тесты были использованы в гражданских целях.

В первой половине XX в. появился целый ряд методик, направленных на дифференциальную диагностику различных типов патологии. Немецкий психиатр Э. Крепелин продолжил работу Ф. Гальтона над методикой свободных ассоциаций. Впоследствии ассоциативный эксперимент преобразовался в «метод незаконченных предложений», широко используемый до настоящего времени. В 1921 г. швейцарским психиатром Г. Роршахом был создан «тест чернильных пятен», являющийся одной из самых популярных проективных методик.

В 1935 г. американскими психологами Х. Морган и Г. Мюрреем был разработан тест тематической апперцепции (ТАТ), который в настоящее время имеет множество модификаций. Параллельно развивались теоретические основы конструирования тестов, совершенствовались методы математико-статистической обработки. Появились корреляционный и факторный анализ (Ч. Спирмен, Т.Л. Кили, Л.Л. Терстон и др.). Это позволяло разрабатывать принципы стандартизации тестов, что давало возможность создавать согласованные тестовые батареи. В итоге были предложены методики, построенные по факторному принципу (опросник Р. Кеттелла 16PF и др.), и новые тесты интеллекта (1936 г. – тест Дж. Равена, 1949 г. – тест Д. Векслера, 1953 г. – тест Амтхауэра). В это же время совершенствовались тесты профотбора (батарея GATB для армии США в 1957 г.) и клинические тесты (опросник MMPI в 1940-е гг.).

В 1950–1960 гг. произошли важные изменения в идеологии тестирования. Если раньше тесты были направлены на отсев, отбор, типизацию людей по различным категориям, то в 1950-1960-е гг. психодиагностика обратилась к нуждам и проблемам отдельной личности. Появилось огромное количество личностных опросников, цель которых – углубленное познание личности, выявление ее особенностей (опросники Г. Айзенка и др.).

Значительное количество тестов специальных способностей и достижений было создано по запросу со стороны промышленности и образования. В середине XX столетия появились критериально-ориентированные тесты.

В настоящее время в арсенале психологов насчитывается более десяти тысяч тестовых методик.

6.3. Классификация психологических тестов

Одна из наиболее удачных классификаций предложена американским психологом С. Розенцвейгом в 1950 г. Он разделил методы психодиагностики на три группы: субъективные, объективные и проективные.

Субъективные методы, к которым Розенцвейг отнес опросники и автобиографии, требуют от субъекта наблюдения за собой как за объектом. Объективные методы требуют исследования через наблюдение за внешним поведением. Проективные методы основываются на анализе реакций испытуемого на кажущийся личностно-нейтральным материал.

Американский психолог Г.У. Оллпорт предложил различать в психодиагностике прямые и непрямые методы. В прямых методах выводы о свойствах и отношениях испытуемого делаются исходя из его сознательного отчета, они соответствуют субъективным и объективным методам Розенцвейга. В непрямых методах выводы делаются на основании идентификаций испытуемого, они соответствуют проективным методам в классификации Розенцвейга.

В отечественной психологии принято подразделять все психодиагностические методики на два типа: методики высокого уровня формализации (формализованные) и малоформализованные методики (М.К. Акимова).

Для формализованных методик характерна жесткая регламентация процедуры обследования (точное соблюдение инструкций, строго определенные способы предъявления стимульного материала и т. д.); в них предусмотрены нормы или другие критерии оценки результатов. Эти методики позволяют собирать диагностическую информацию в относительно короткие сроки, количественно и качественно сравнивать результаты большого числа испытуемых.

Малоформализованные методики дают ценные сведения об испытуемом в тех случаях, когда изучаемые явления плохо поддаются объективизации (личностные смыслы, субъективные переживания) или чрезвычайно изменчивы (состояния, настроения). Малоформализованные методы требуют высокого профессионализма психолога, значительных затрат времени. Однако полностью противопоставлять эти типы методик не следует, так как в целом они дополняют друг друга.

Всю группу формализованных методик иногда называют тестами. Однако в данной классификации они включают в себя четыре класса методик: тесты, опросники, проективные техники и психофизиологические методики. К малоформализованным методикам относятся: наблюдение, беседа, анализ продуктов деятельности.

В контексте рассматриваемой темы обратимся к классификации С. Розенцвейга, представленной и детально рассмотренной в работе В.В. Никандрова и В.В. Новочадова.

Субъективные психодиагностические методики. При использовании субъективного диагностического подхода получение информации основано на самооценке исследуемым своего поведения и личностных особенностей. Соответственно, методики, основанные на использовании принципа самооценки, называют субъективными.

Субъективные методики в психодиагностике в основном представлены опросниками. В Словаре-справочнике по психодиагностике утверждается, что к опросникам относятся психодиагностические методики, задания которых представлены в виде вопросов. Однако такое представление заданий является лишь внешним признаком, объединяющим опросники, но вовсе не достаточным для отнесения методик к этой группе, поскольку в виде вопросов формулируются задания и интеллектуальных, и проективных тестов.

По процедуре использования опросники сближаются с анкетированием. И в том и в другом случае общение между исследователем и исследуемым опосредовано анкетой или опросником. Исследуемый сам читает предлагаемые ему вопросы и сам фиксирует свои ответы. Подобная опосредованность дает возможность проведения массового психодиагностического исследования с помощью опросников. Вместе с тем существует и ряд различий, не позволяющих рассматривать анкеты и опросники как синонимы. Определяющим является различие в направленности: в отличие от анкет, выполняющих функцию сбора информации любой направленности, опросники нацелены на выявление личностных особенностей, в силу чего в них на первый план выходит признак не технологический (получение ответов на вопросы), а целевой (измерение личностных качеств). Отсюда следуют различия в специфике исследовательских процедур анкетирования и тестирования с помощью опросника. Анкетирование обычно анонимно, тестирование с помощью опросника – персонифицировано. Анкетирование, как правило, формально, ответы респондента не приводят ни к каким непосредственным последствиям, тестирование – личностно. Анкетирование более свободно по процедуре сбора информации вплоть до рассылки анкет по почте, тестирование обычно подразумевает непосредственный контакт с тестируемым.

Таким образом, опросник – это тест для выявления индивидуально-психологических различий на основе самоописания их проявлений испытуемыми. А вопросник в строгом смысле слова – это совокупность последовательно задаваемых вопросов, закладываемая в анкету или опросник при их конструировании. Опросник, таким образом, включает инструкцию испытуемому, перечень вопросов (т. е. вопросник), ключи для обработки получаемых данных, сведения по интерпретации результатов.

По принципу построения различают опросники-анкеты и собственно опросники. К опросникам-анкетам относятся методики, несущие в себе элементы анкеты. Для них характерно включение вопросов не только закрытого, но и открытого типа. Обработка закрытых вопросов производится по соответствующим ключам и шкалам, результаты дополняются и уточняются информацией, получаемой с помощью открытых вопросов. Обычно в опросники-анкеты включаются вопросы на выявление социально-демографических показателей: сведений о поле, возрасте, образовании и т. п. Опросник-анкета может целиком состоять из открытых вопросов, причем иногда количество ответов на вопросы не ограничено. Кроме того, к опросникам-анкетам принято относить методики, предмет диагностики которых слабо связан с личностными характеристиками, даже в том случае, если такие методики имеют формальные признаки опросника (например, Мичиганский скрининг-тест алкоголизма).

По сфере преимущественного применения различают узкопрофильные опросники и опросники широкого применения (широкого профиля). Узкопрофильные опросники, в свою очередь, делятся по сфере преимущественного применения на клинические, профориентационные, сферы обучения, сферы менеджмента и работы с персоналом и др. Некоторые опросники созданы специально для вузовской и школьной психодиагностики (опросник диагностики уровня школьной тревожности Филлипса), психодиагностики в сфере менеджмента (опросники самооценки деловых и личностных качеств менеджеров различных уровней, выявления степени лояльности к фирме и т. п.). Иногда узкопрофильные опросники со временем становятся опросниками широкого профиля. Например, известный Миннесотский многопрофильный личностный опросник (MMPI) создавался как сугубо клинический, для выявления психических заболеваний. Затем благодаря созданию значительного количества дополнительных неклинических шкал он стал универсальным, одним из наиболее употребительных личностных опросников.

В зависимости от того, к какой категории относится исследуемое с помощью опросника явление, выделяют опросники состояний и опросники свойств (личностные опросники). Существуют также комплексные опросники.

Психические состояния ситуационно обусловлены и измеряются минутами, часами, сутками, очень редко – неделями или месяцами. Поэтому инструкции к опросникам состояний указывают на необходимость отвечать на вопросы (или оценивать утверждения) в соответствии с актуальными (а не типичными) переживаниями, отношениями, настроениями. Довольно часто опросники состояний используются для оценки эффективности коррекционных воздействий, когда диагностируются состояния до и после сеанса воздействия или до и после серии сеансов (например, опросник САН, позволяющий оценить состояние по трем параметрам: самочувствие, активность, настроение).

Психические свойства представляют собой более устойчивые явления, чем состояния. На их выявление направлены многочисленные личностные опросники. Комплексные опросники сочетают в себе признаки опросника состояний и опросника свойств. В подобном случае диагностическая информация является более полной, поскольку состояние диагностируется на определенном фоне личностных свойств, облегчающих или затрудняющих возникновение состояния. Например, опросник Спилбергера – Ханина содержит шкалу реактивной тревожности (с помощью которой диагностируется тревожность как состояние) и шкалу личностной тревожности (для диагностики тревожности как личностного свойства).

В зависимости от степени охвата свойств личностные опросники делятся на реализующие принцип черт и типологические.

Опросники, реализующие принцип черт, подразделяются на одномерные и многомерные. Одномерные личностные опросники направлены на выявление наличия либо степени выраженности одного свойства. Выраженность свойства подразумевается в каком-то диапазоне от минимально до максимально возможного уровня. Поэтому такие опросники часто называют шкалами (например, шкала тревожности Ж. Тейлор). Достаточно часто опросники-шкалы используются в целях скрининга, т. е. отсеивания испытуемых по определенному диагностируемому признаку.

Многомерные личностные опросники направлены на измерение более чем одного свойства. Перечень выявляемых свойств, как правило, зависит от специфики области применения опросника и концептуальных воззрений авторов. Так, опросник Э. Шострома, созданный в рамках гуманистической психологии, направлен на выявление таких свойств, как принятие себя, спонтанность, самоуважение, самоактуализация, способность к близким контактам и т. п. Иногда многомерные опросники служат основой для создания одномерных опросников. Например, шкала тревожности Ж. Тейлор была создана на основе одной из шкал опросника MMPI. При этом на создаваемые одномерные опросники не могут автоматически переноситься показатели надежности и валидности исходных многомерных опросников. В данном случае требуется дополнительная оценка этих характеристик производных методик.

Количество шкал в многомерных опросниках имеет определенные пределы. Так, тестирование опросником 16PF Р. Кеттелла, оценивающим свойства личности по 16 параметрам и содержащим 187 вопросов, занимает от 30 до 50 мин. Опросник MMPI содержит 10 основных шкал и три контрольные шкалы. Испытуемый должен ответить на 566 вопросов. Время работы над опросником составляет 1,5–2 ч и, пожалуй, имеет предельную продолжительность. Как показывает практика, дальнейшее увеличение количества вопросов непродуктивно, поскольку ведет к росту почти в геометрической прогрессии необходимого для ответов времени, развитию усталости и монотонии и к падению мотивации испытуемых.

Типологические опросники создаются на основе выделения личностных типов – целостных образований, не сводимых к набору отдельных свойств. Описание типа дается через характеристику усредненного или, наоборот, ярко выраженного представителя типа. Указанная характеристика может содержать значительное количество личностных свойств, которое при этом не обязательно жестко лимитировано. И тогда целью тестирования будет выявление не отдельных свойств, а близости обследуемого человека к тому или иному личностному типу, что можно сделать с помощью опросника с достаточно небольшим числом вопросов.

Ярким примером типологических опросников являются методики Г. Айзенка. Широко используется его опросник EPI, созданный в 1963 г. и направленный на выявление интроверсии-экстраверсии и нейротизма (аффективной стабильности-нестабильности). Эти две личностные характеристики представлены в виде ортогональных осей и круга, в секторах которого выделяются четыре типа личности: экстравертированный нестабильный, экстравертированный стабильный, интровертированный стабильный, интровертированный нестабильный. Для описания типов Айзенком использовано порядка 50 коррелирующих между собой разноуровневых черт: свойства нервной системы, свойства темперамента, черты характера. Впоследствии Айзенк предложил сопоставить эти типы с типами темперамента по Гиппократу и И.П. Павлову, что было реализовано при адаптации опросника в 1985 г. А.Г. Шмелевым. При создании методики экспресс-диагностики характерологических особенностей подростков Т.В. Матолиным исходные типы личности по Айзенку были разбиты на 32 более дробных типа с описанием путей психолого-педагогического воздействия, что позволяет использовать опросник в работе педагога, школьного психолога, работника службы занятости.

По оцениваемой подструктуре личности выделяют: опросники темперамента, опросники характера, опросники способностей, опросники направленности личности; смешанные опросники. Опросники каждой из групп могут быть как типологическими, так и нетипологическими. Например, опросник темперамента может быть направлен на диагностику как отдельных свойств темперамента (активности, реактивности, сензитивности, эмоциональной возбудимости и т. д.), так и на диагностику типа темперамента в целом по одной из существующих типологий.

Из опросников диагностики темперамента большую популярность получили методики В.М. Русалова, Я. Стреляу и ряд других. Опросники составлены с таким расчетом, чтобы о свойствах темперамента конкретного испытуемого можно было бы судить по его описанию своих эмоциональных и поведенческих реакций в различных жизненных ситуациях. Диагностика темперамента с помощью таких опросников не требует специального оборудования, занимает сравнительно немного времени и может быть массовой по процедуре. Основной недостаток этих тестов заключается в том, что относимые к темпераменту поведенческие проявления несут на себе отпечаток не только темперамента, но и характера. Характер сглаживает реальные проявления некоторых свойств темперамента, благодаря чему они выступают в замаскированном виде (феномен «маскировки темперамента»). Поэтому опросники темперамента дают информацию не столько о темпераменте, сколько о типичных формах реагирования испытуемого в тех или иных ситуациях.

Опросники для диагностики характера также могут быть как опросниками отдельных черт, так и опросниками типа характера в целом. Примерами типологического подхода к характеру являются опросник X. Шмишека, направленный на выявление типа акцентуации характера по типологии К. Леонгарда, и опросник ПДО (патохарактерологический диагностический опросник), выявляющий тип акцентуации характера по типологии российского психиатра А.Е. Личко. В работах немецкого психиатра К. Леонгарда можно встретить термины «акцентуация характера» и «акцентуация личности». А.Е. Личко полагает, что правильнее было бы говорить об акцентуациях только характера, потому что в действительности речь идет именно об особенностях и типах характера, а не личности.

Диагностика способностей с помощью субъективных опросников проводится редко. Считается, что дать достоверную оценку своим способностям большинство людей не в состоянии. Поэтому при оценке способностей предпочтение отдается объективным тестам, где уровень развития способностей определяется на основе результативности выполнения испытуемыми заданий тестов. Однако ряд способностей, самооценка развития которых не вызывает включения механизмов психологической защиты, можно успешно измерять и с помощью субъективных тестов, например коммуникативные способности.

Диагностика направленности личности может представлять собой определение типа направленности в целом или исследование ее компонентов, т. е. потребностей, мотивов, интересов, установок, идеалов, ценностей, мировоззрения. Из них достаточно крупные группы методик составляют опросники интересов, опросники мотивов и опросники ценностей.

Наконец, если выявляемые опросником свойства принадлежат не к одной, а к нескольким подструктурам личности, говорят о смешанном опроснике. Это могут быть адаптированные зарубежные опросники, где нет традиции проводить границы между темпераментом и характером, характером и личностью в целом. Существуют и отечественные опросники, созданные с целью комплексной диагностики, например опросник «Черты характера и темперамента» (ЧХТ).

Объективные тесты. В рамках объективного подхода диагноз выносится на основании информации об особенностях выполнения деятельности и ее результативности. Эти показатели в минимальной степени зависят от представлений испытуемого о себе (в отличие от субъективных тестов) и от мнения лица, проводящего тестирование и интерпретацию (в отличие от проективных тестов).

В зависимости от предмета тестирования существует следующая классификация объективных тестов:

Тесты личности;

Тесты интеллекта (вербальные, невербальные, комплексные);

Тесты способностей (общих и специальных;)

Тесты креативности;

Тесты достижений (тесты действия, письменные, устные).

Тесты личности, как и личностные опросники, направлены на выявление личностных особенностей, однако уже не на основе самоописания этих особенностей испытуемым, а через выполнение им ряда заданий с четко структурированной, фиксированной процедурой. Например, тест замаскированных фигур (EFT) подразумевает поиск испытуемым простых черно-белых фигур внутри сложных цветных фигур. Результаты дают информацию о перцептивном стиле личности, определяющим показателем которого авторы теста считают «поле-зависимость» или «поле-независимость».

Тесты интеллекта направлены на оценку уровня интеллектуального развития. При узкой трактовке понятия «интеллект» применяются методики, позволяющие оценить только умственные (мыслительные) особенности человека, его умственный потенциал. При широком понимании категории «интеллект» применяются методики, позволяющие характеризовать в дополнение к мышлению и другие познавательные функции (память, пространственную ориентировку, речь и др.), а также внимание, воображение, эмоционально-волевой и мотивационный компоненты интеллекта.

Измерению в тестах интеллекта подлежит как понятийное (словесно-логическое), так и образное и наглядно-действенное (предметное) мышление. В первом случае задания обычно носят вербальный (речевой) характер и предлагают испытуемому установить логические отношения, выявить аналогии, произвести классификацию или провести обобщение между различными словами, обозначающими какие-либо предметы, явления, понятия. Применяются также математические задачи. Во втором случае предлагается выполнить задания невербального (неречевого) характера: операции с геометрическими фигурами, складывание картинок из разрозненных изображений, группировка графического материала и т. п.

Конечно, диада «образное мышление – понятийное мышление» не то же самое, что диада «невербальное мышление – вербальное мышление», поскольку словом обозначаются не только понятия, но и образы и конкретные предметы, а мыслительная работа с предметами и образами требует обращения к понятиям, например при классификации или обобщении невербального материала. Тем не менее в диагностической практике вербальные методики часто соотносятся с изучением вербального интеллекта, основным компонентом которого считается понятийное мышление, а невербальные методики – с изучением невербального интеллекта, основой которого выступает образное или предметное мышление.

Учитывая сказанное, было бы корректнее говорить не об изучении видов мышления или интеллекта, а о видах применяемых методик по изучению интеллекта: вербальные – невербальные методы. К первой категории относятся такие тесты, как «Простые и сложные аналогии», «Логические связи», «Отыскание закономерностей», «Сравнение понятий», «Исключение лишнего» (в вербальном варианте), школьный тест умственного развития (ШТУР). Примеры методик второй категории: «Пиктограммы», «Классификация картинок», тест «Прогрессивные матрицы» Дж. Равена и т. п.

Как правило, в современных тестах интеллекта в одной методике совмещаются и вербальные, и невербальные задания, например в тестах А. Бине, Р. Амтхауэра, Д. Векслера. Такие тесты являются комплексными. Тест Д. Векслера (WAIS), один из самых популярных, состоит из 11 субтестов: шести вербальных и пяти невербальных. Задания вербальных субтестов направлены на выявление общей осведомленности, понятливости, легкости оперирования числовым материалом, способностей к абстрагированию и классификации, задания невербальных субтестов – на изучение сенсомоторной координации, особенностей зрительного восприятия, способностей к организации фрагментов в логическое целое и т. д. По результатам выполнения заданий вычисляются коэффициенты интеллекта: вербального, невербального и общего.

Тесты интеллекта подвергаются постоянной критике, поскольку в большинстве случаев неясно, что же они измеряют: то ли действительно умственный потенциал человека, то ли степень обученности, т. е. его знания и навыки, которые очень сильно зависят от условий развития и воспитания. Этот факт даже послужил основанием для обозначения результатов тестирования как тестовый, или психометрический, интеллект. Систематически наблюдаемые рассогласования между фактическими достижениями в умственной деятельности и тестовым интеллектом привели к введению в психодиагностическую практику понятия «несправедливых» тестов. Особенно резко эта «несправедливость» проявляется при использовании тестов, разработанных для одной общности (социальной группы, социального слоя, национальности и т. п.), в обследовании людей другой общности, с другими культурными традициями, иным уровнем образования. В психодиагностике постоянно предпринимаются попытки создать тесты интеллекта, свободные от влияния культуры (культурно-свободный тест Р. Кеттелла).

Принято считать, что классические тесты интеллекта позволяют измерять только уровень конвергентного мышления – нетворческого, «осторожного». Другой компонент интеллекта – дивергентное (творческое) мышление – подобному тестированию не поддается. Получаемые коэффициенты (IQ) не дают представления об этой стороне интеллекта, что привело к попыткам разработки специальных методов – тестов креативности (см. ниже).

Тесты способностей – это методы, направленные на оценку возможностей человека в овладении знаниями, умениями и навыками как общего, так и частного характера. В первом случае речь идет об оценке общих способностей (сенсорных, моторных, мнемических и т. д.), во втором – об оценке способностей специальных, обычно связанных с профессиональной деятельностью (математических, музыкальных, художественных, скорости чтения и т. д.).

В зависимости от задач исследования тесты способностей часто объединяются в те или иные батареи; иногда они включаются в батареи с тестами интеллекта, например для более полной оценки способностей человека при проведении профотбора и профориентации. Батарея тестов общих способностей GATB, разработанная американской Службой занятости в 1956 г., содержит 12 субтестов на вербальные и математические способности, пространственное восприятие, моторику пальцев, моторику рук и т. д. В настоящий момент батарея GATB за счет разработки ряда ее модификаций для отдельных групп профессий относится к числу наиболее широко применяемых в зарубежной профессиональной диагностике, в частности в США.

Отдельный вид способностей представляют собой творческие способности. Совокупность творческих способностей называют креативностью. В теоретическом плане не проведена четкая грань между креативностью как качеством интеллекта, как творческой способностью и как свойством личности. Поэтому в группу тестов креативности входят весьма разнообразные методики. Наиболее известны тесты Дж. Гилфорда и Е. Торренса, разработанные на рубеже 1950-1960-х гг. Тест Е. Торренса состоит из трех субтестов, позволяющих оценить уровни развития вербального, образного и звукового творческого мышления, получить представление о качественном своеобразии этих структур креативности у разных людей. Задания требуют от испытуемого продуцировать идеи в вербальной форме, в форме некоторого рисунка, изображения. В зависимости от количества и оригинальности идей судят об уровне развития креативности испытуемого.

Тесты достижений предназначены для оценки уровня овладения знаниями, умениями и навыками в какой-либо конкретной деятельности и используются преимущественно в сферах обучения и профотбора. По типу задания различают тесты действия, письменные и устные тесты.

Тесты действия выявляют степень умения выполнять действия с определенными инструментами, орудиями, материалами, механизмами и т. п., например при тестировании машинистки, сборщика деталей, водителя автомобиля и т. д. Письменные тесты представляют собой систему вопросов и возможных ответов на специальном бланке. Иногда вопросы иллюстрируются рисунками, сопровождающими вопрос. Задача испытуемого – либо выбрать правильный словесный ответ, либо отметить на графике отображение описанной в вопросе ситуации, либо найти в рисунке деталь, дающую правильное решение соответствующего вопроса. Устные тесты – это системы устных вопросов, предусматривающие обход трудностей, возникающих из-за отсутствия у испытуемого опыта в формулировании ответов. Тесты достижений используются в первую очередь в сферах обучения и профотбора. В последнее время они приобрели огромную популярность в виде разнообразных игр на радио и телевидении.

Проективные тесты. В рамках проективного диагностического подхода получение информации основано на анализе особенностей действий испытуемого с внешне нейтральным, как бы безличным материалом, становящимся в силу его слабой структурированности и неопределенности объектом проекции. Соответственно, методики, основанные на использовании принципа проекции, называются проективными (прожективными). Понятие проекции для обозначения этих методик впервые было использовано французским психологом Л.К. Франком в 1939 г. и, несмотря на неоднократные попытки изменить их название, закрепилось, став общепринятым.

Необходимость смены названия была продиктована постепенным отходом в интерпретации методик этой группы от идей психоанализа. На сегодняшний день термин «проекция» в психологии имеет два значения; 1) в психоаналитическом понимании – один из защитных механизмов, посредством которого внутренние импульсы и чувства, неприемлемые для «Я», приписываются внешнему объекту и только тогда проникают в сознание (в этом смысле термин был впервые введен в науку 3. Фрейдом в 1894 г.); 2) в непсихоаналитическом понимании – проявления личности вовне. Каждое проявление активности (эмоциональное, речевое, двигательное) несет на себе отпечаток личности в целом. Чем менее стереотипны стимулы, побуждающие к активности, тем ярче проявление личности.

Первое описание проекции как естественной тенденции людей действовать под влиянием своих потребностей, интересов и всей психической организации (причем защитные механизмы могут проявляться, а могут и не проявляться) принадлежит американскому психологу Г.А. Мюррею. Создание теоретической концепции проекции в применимом для исследования личности виде обусловило бурное развитие проективных методик, которые в настоящий момент занимают видное положение в зарубежной психодиагностической практике.

Тестирование с помощью проективных методов имеет следующие наиболее общие особенности. В методиках используется неоднозначный, слабоструктурированный стимульный материал, допускающий большое число вариантов восприятия и интерпретации. При этом предполагается, что чем слабее он структурирован, тем выше степень проекции: «Субъект, поглощенный попытками интерпретировать вроде бы ничего субъективно не значащий материал, не замечает, как раскрывает свои волнения, страхи, желания и тревоги. Таким образом значительно снижается сопротивление при раскрытии личных, иногда очень болезненных проблем». Для преодоления сопротивления испытуемого инструкция дается ему без раскрытия истинной цели, а сама процедура тестирования нередко проходит в игровой форме. Испытуемый, как правило, не ограничивается в выборе ответов, и ответы не оцениваются как «правильные» или «ошибочные». Благодаря этим особенностям проективные методики нередко используются на начальных этапах психологической работы с клиентом или в начале комплексного психологического тестирования личности, поскольку позволяют установить контакт и вызвать интерес к обследованию. Немаловажным достоинством многих проективных методик является то, что ответы испытуемых не обязательно должны даваться в вербальной форме (как в случае с опросниками), что позволяет использовать их в работе и со взрослыми, и с детьми.

Классификация проективных методов принадлежит Л.К. Франку. Он предложил различать проективные методы в зависимости от характера реакций испытуемого. В современной, дополненной классификации проективных методов различают конститутивные, конструктивные, интерпретативные, катартические, экспрессивные, импрессивные, аддитивные методики.

Конститутивные методики характеризуются ситуацией, в которой от испытуемого требуется создать некую структуру из слабоструктурированного, аморфного материала, оформить стимулы, придать им смысл. Примером методик этой группы является тест Г. Роршаха, стимульный материал которого состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными «кляксами». Испытуемому предлагается ответить на вопрос, на что, по его мнению, похоже каждое пятно. В зависимости от ответов обследуемого судят о его переживаниях, особенностях взаимодействия с окружением, реалистичности восприятия действительности, тенденциях к беспокойству и тревожности и др. Тест Г. Роршаха в высокой степени удовлетворяет ориентацию проективной психологии на использование нестереотипных стимулов. Стимульный материал данного теста не навязывает испытуемому ответов, в связи с чем он является наиболее часто используемой в зарубежной психодиагностике проективной методикой. Попыткой дальнейшего развития принципа слабоструктурированности стимульного материала является методика «Картины облаков» В. Штерна и др., где используется напоминающий облака стимульный материал, не имеющий в отличие от «пятен Роршаха» симметрии и четкого контура. Испытуемому предлагается самостоятельно отметить контуры и рассказать о том, что изображено на картинках.

Конструктивные методики подразумевают конструирование, создание из оформленных деталей осмысленного целого. Например, стимульный материал методик «Деревня» и «Тест мира» состоит из небольших по величине предметов, количество которых в разных вариантах доходит до 300. Среди них школа, больница, мэрия, церковь, торговые лавки, деревья, автомобили, фигурки людей и животных и т. п. Испытуемому предлагается по своему усмотрению построить из этих предметов деревню, в которой он хотел бы жить, либо некоторое пространство своего существования (по терминологии авторов – «малый мир»). Определяется подход испытуемого к конструированию макета, реалистичность его построения, близость к характерным для разных контингентов построениям и т. д.

Интерпретативные методики подразумевают истолкование испытуемым какого-либо события, ситуации. Примерами являются тест тематической апперцепции (ТАТ), тесты словесных ассоциаций. Стимульный материал ТАТ представляет собой набор из 30 черно-белых изображений, на которых представлены относительно неопределенные сцены, допускающие неоднозначную интерпретацию. Испытуемому предлагается составить рассказ по каждому изображению: что там происходит, что переживают действующие лица, что этому предшествовало, чем ситуация закончится. На основе рассказа испытуемого создается представление о его переживаниях, осознаваемых и неосознаваемых потребностях, конфликтах и способах их разрешения. В тестах словесных ассоциаций стимульный материал состоит из списка не связанных между собой слов, на каждое из которых испытуемый должен как можно быстрее дать первое пришедшее на ум слово-ассоциацию. Характер и время реакции ответов дают возможность выделить наиболее «эмоционально заряженные» для данного испытуемого слова-стимулы, судить о наличии тех или иных проблемных тем.

Катартические методики представляют собой осуществление игровой деятельности в специально организованных условиях. К ним относят, в частности, психодраму Я. (Дж.) Морено, рассматриваемую как проективную методику исследования личности. В ходе мини-представления, в котором испытуемый (протагонист) играет роль самого себя или воображаемого лица в значимых для себя ситуациях, проявляются его личностные особенности, а путем аффективного отреагирования в драматических ситуациях, созвучных переживаниям испытуемого, достигается терапевтический эффект (катарсис – очищение и инсайт – озарение). Методика не имеет стандартной процедуры проведения, данных о валидности и надежности, вследствие чего применяется в качестве не столько психодиагностической, сколько психотерапевтической методики в групповой психотерапии.

В экспрессивных методиках получение информации основано на анализе рисунков испытуемого. Рисунки могут быть на свободную или заданную тему. Известны рисуночные методики «Несуществующее животное» М.З. Друкаревич, «Дом – дерево – человек» Дж. Бука, «Рисунок семьи» В. Халса, «Нарисуй человека» К. Маховер, «Мой жизненный путь» И.Л. Соломина, «Детская рука, которая беспокоит» Р. Давидо, «Лица и эмоции» А. Джахез и Н. Манши, многомерный рисуночный тест Р. Блоха, тест рисования пальцами Р. Шоу и др. По утверждению Д. Харриса, автора одной из модификаций теста «Рисунок человека» Ф. Гудинаф, «рисунки могут многое сказать об аффекте, темпераменте, отношении и личности человека, который их нарисовал».

Проведение рисуночных тестов не требует больших затрат времени, обычно допускает групповую форму. Основными подвергаемыми анализу элементами рисунка являются его размер, положение на листе (вверху, внизу, в центре, в углу), поворот рисунка влево или вправо, нажим (слабый, стандартный, сильный), характеристика линий (ровные, дрожащие, прерывистые, двойные), наклон фигуры, плотность и площадь штриховки, количество и характер деталей. Как правило, рисуночные методики подразумевают дополнение рисунка рассказом испытуемого об изображенном, составление истории по рисунку, опрос испытуемого по прилагаемому перечню вопросов. Анализируются и поведение испытуемого во время выполнения задания, его высказывания, вегетативные проявления, длительность работы над рисунком. Для увеличения достоверности интерпретации желательно проводить рисуночные методики в комплексе с другими тестами, дополнять их результатами беседы и наблюдения.

Импрессивные методики подразумевают предпочтение одних стимулов (как наиболее желательных) другим. Испытуемый оказывается в ситуации, когда необходимо либо выбрать наиболее предпочтительные стимулы, либо проранжировать стимулы по степени предпочтения. Например, в тесте Л. Сонди испытуемому предъявляются 48 портретов психически больных людей, разбитых на шесть серий, с инструкцией выбрать в каждой серии по два наиболее и наименее понравившихся портрета. В зависимости от предпочтений испытуемого судят о наиболее значимых для него «диагностических областях».

Отдельную подгруппу импрессивных тестов составляют тесты цветового выбора (цветовой тест отношений А.М. Эткинда, тест цветовых метафор И.Л. Соломина, тест цветных пирамид М. Пфистера и Р. Хайсса, «Попарные сравнения» Ю.И. Филимоненко и др.). Все эти тесты базируются на тесте швейцарского психолога М. Люшера, опубликованном в 1948 г. В основе теста Люшера лежит предположение о том, что выбор цвета отражает настроение, функциональное состояние и наиболее устойчивые черты личности. Каждый цвет спектра является пусковым сигналом, вызывающим у человека разнообразные, не осознаваемые в полной мере ассоциации. Например, с красным цветом человек сталкивается преимущественно в ситуациях опасности и напряженной борьбы (это цвет крови, огня), что приводит к ассоциированию этого цвета с соответствующим для таких ситуаций состоянием нервно-психического напряжения, мобилизованности, активного действия. Соответственно, предпочитать в ситуации тестирования красный цвет будет человек активный и хорошо отдохнувший, для которого ассоциативная специфика восприятия цвета будет соответствовать его энергетическим возможностям и мотивационным установкам, отвергать – человек утомленный и заторможенный, для которого возбуждение в данный момент неуместно, идет вразрез с наличным энергопотенциалом и установками.

Аддитивные методики подразумевают произвольное завершение испытуемым стимульного материала, например завершение предложения (методики А. Пейна, Д. Сакса и С. Леви, А. Тендлера, Дж. Роттера, Б. Форера, А. Роде и др.) или завершение истории (методики Л. Дюсса, М. Тома и др.). В зависимости от характера завершений судят о потребностях и мотивах испытуемого, его отношении к семье, сексу, вышестоящим по работе и т. д.

Классификация К. Франка неоднократно критиковалась за описательность, смешение критериев, нечеткое разделение групп методов. Непонятно, например, куда отнести тесты типа «Завершение рисунка» – к экспрессивным, конститутивным или аддитивным методам. При выделении группы катартических методов произошло смещение акцента с процесса на результат (катарсис). Вряд ли достаточно обоснован выбор характера реакций испытуемого в качестве критерия построения претендующей на полноту охвата классификации проективных методов, тем более что выделенные Франком категории оказались заданы не столько характером реакций испытуемого, сколько характером самого стимульного материала и целью исследования.

В связи с этим возникает необходимость в разведении проективных тестов по нескольким критериям. В.В. Никандров и В.В. Новочадов предлагают следующую классификационную систему проективных методик:

1) по задействованной модальности (методики с визуальной, тактильной, аудио– и иной стимуляцией);

2) по характеру стимульного материала (вербальные, невербальные);

3) по типу реакции испытуемого (ассоциативные, интерпретативные, манипулятивные, свободного выбора);

4) по наличию или отсутствию готовых вариантов ответа (проективные, полупроективные).

Большинство психодиагностических методик подразумевает задействование зрительной модальности. Это является отражением особой важности роли зрения в приеме информации у современного человека: допускается, что адресация стимульного материала глазам позволяет получать ответы, достаточно полно характеризующие личность. Тем не менее существуют методики, где стимуляция предъявляется испытуемому на слух, например в тесте словесных ассоциаций, где тестируемый должен как можно быстрее дать слово-ассоциацию на произносимое психодиагностом слово-стимул. Известны также попытки создания проективных методик, обращенных к тактильным ощущениям.

По характеру стимульного материала проективные методики могут быть вербальными, где в качестве стимула выступает слово, предложение или текст, и невербальными, с предметной, цветовой, рисуночной и прочей стимуляцией. В тестах словесных ассоциаций в качестве стимулов используются отдельные слова, в методиках типа «Завершение предложений» – незаконченные предложения, в методиках типа «Завершение истории» – неполные тексты.

Принято различать следующие типы ответов испытуемых: ассоциация, интерпретация, манипуляция (по шкале действий с предметами, материалами и др., имеющей полюсами творческую и репродуктивную манипуляцию), свободный выбор (т. е. некое распределение, ранжирование стимульного материала). В соответствии с этим проективные методики предложено делить на ассоциативные, интерпретативные, манипулятивные и методики свободного выбора.

В зависимости от наличия готовых вариантов ответа различают полупроективные методики, где испытуемому предлагается выбрать один из предложенных вариантов ответа на проективную стимуляцию (в некотором смысле – аналог закрытых опросников), и собственно проективные, где такие варианты отсутствуют. Примером полупроективной методики может быть тест Л. Сонди (обычно наиболее известные тесты называются только по фамилии, здесь именно такой случай), где испытуемому предлагается выбрать в каждой серии портретов по два понравившихся и два непонравившихся. Испытуемому может не понравиться ни один портрет, а ненравящихся может быть больше, чем два, однако принудительная инструкция ставит испытуемого в определенные условия, которым он должен следовать, что накладывает определенные ограничения на проявление его личностных свойств. Безусловными плюсами полупроективных методик являются простота количественной обработки результатов, доступность перевода методик в компьютерную форму, меньшая уязвимость относительно субъективизма интерпретатора.

Общепринятым является представление о том, что проективные тесты имеют преимущество над субъективными, поскольку позволяют выявить неосознаваемые компоненты психического. Однако необходимо заметить, что эти неосознаваемые компоненты вовсе не обязательно проявятся в результатах тестирования. По мнению Г.У. Оллпорта, нормальный, адекватно приспособленный субъект при проведении проективных тестов дает ответы, аналогичные сознательному отчету в субъективных тестах, либо благодаря достаточно развитому самоконтролю никак не проявляет свои доминирующие мотивы. Поэтому проективное тестирование приобретает особое значение только тогда, «когда в проективных реакциях обнаруживается эмоционально нагруженный материал, противоречащий сознательным отчетам. И только тогда можно с уверенностью говорить о наличии или отсутствии невротических тенденций».

Компьютерное тестирование. Это относительно молодое направление психодиагностики, связанное с использованием средств электронно-вычислительной техники. Появление компьютерной психодиагностики обусловлено развитием информационных технологий. Попытки автоматизировать предъявление испытуемому стимульного материала и последующую обработку результатов предпринимались начиная с 1930-х гг., но лишь с 1970-х гг. началось подлинное развитие компьютерной психодиагностики, обусловленное появлением персональных компьютеров. С 1980-х гг. компьютерные тесты стали разрабатываться в массовых масштабах: сначала – как компьютерные версии известных бланковых методик, а в 1990-е гг. – как специальные методики, учитывающие возможности современной техники и не употребимые в бланковом виде, поскольку рассчитаны на сложный, изменяющийся в пространстве и времени стимульный материал, специфическое звуковое сопровождение и т. п. Начало XXI в. отмечено тем, что управление тестированием все чаще передается компьютеру. Если в прошлые годы автоматизировались отдельные стадии исследования, например предъявление материала, обработка данных, интерпретация результатов, то на современном этапе все чаще можно встретить программы, которые берут на себя все обследование целиком вплоть до постановки диагноза, что сводит необходимость присутствия психолога к минимуму.

Безусловными достоинствами компьютерных тестов являются: быстрое проведение; высокая скорость и безошибочность обработки; возможность безотлагательного получения результатов; обеспечение стандартных условий тестирования для всех испытуемых; четкий контроль процедуры тестирования (невозможен пропуск вопросов, при необходимости может фиксироваться время каждого ответа, что особенно важно для тестов на интеллект); возможность исключения психолога как дополнительной переменной (что имеет особое значение при проведении экспертизы); наглядность и занимательность процесса (поддержка внимания с помощью цвета, звука, игровых элементов, что наиболее важно для обучающих программ); легкая архивация результатов; возможность объединения тестов в батареи (пакеты программ) с единой итоговой интерпретацией; мобильность экспериментатора (весь инструментарий на одной дискете); возможность проведения массовых исследований (например, через Интернет).

Недостатки компьютерных тестов: сложность, трудоемкость и дороговизна разработки программ; необходимость дорогостоящей компьютерной техники; сложность использования ЭВМ в полевых условиях; необходимость специального обучения испытуемого работе с компьютерными тестами; трудности работы с невербальным материалом, особая сложность перевода в компьютерную форму проективных тестов; отсутствие индивидуального подхода к тестируемому (потеря части психодиагностической информации, получаемой в беседе и наблюдении); латентность этапов обработки и интерпретации данных (качество этих процедур полностью зависит от разработчиков программ). У некоторых испытуемых при взаимодействии с компьютером могут возникать эффекты «психологического барьера» или «сверхдоверия». Поэтому данные о валидности, надежности и репрезентативности бланковых тестов не могут быть автоматически перенесены на их компьютерные аналоги, что ведет к необходимости новой стандартизации тестов.

Недостатки компьютерных тестов вызывают настороженное отношение к ним психологов. Мало используются такие тесты в клинической психологии, где цена ошибки слишком высока. Отечественный психолог Л.С. Выготский выделял три уровня психодиагностики: 1) симптоматический (выявление симптомов); 2) этиологический (выявление причин); 3) типологический (целостная, динамическая картина личности, на основе чего строится прогноз). Компьютерная психодиагностика на сегодняшний день находится на низшем уровне – уровне симптоматического диагноза, практически не давая материала для выявления причин и вынесения прогноза.

Тем не менее, по-видимому, компьютерные тесты имеют большое будущее. Многие из перечисленных недостатков компьютерной психодиагностики наверняка будут устранены благодаря дальнейшему развитию электронной техники и совершенствованию психодиагностических технологий. Залогом такого оптимизма является нарастающий интерес науки и практики к компьютерной диагностике, в арсенале которой уже сейчас имеется свыше 1000 компьютерных тестов.

Среди существующих компьютерных тестов можно выделить следующие их виды:

1) по структуре – аналоги бланковых тестов и собственно компьютерные тесты;

2) по количеству тестируемых – тесты индивидуального и группового тестирования;

3) по степени автоматизации тестирования – автоматизирующие один или несколько этапов обследования и автоматизирующие все обследование;

4) по задаче – диагностические и обучающие;

5) по адресату – профессиональные психологические, полупрофессиональные и непрофессиональные (развлекательные).

Пользователем профессиональных компьютерных тестов является психолог, поэтому они разрабатываются специализированными лабораториями или центрами компьютерной психодиагностики. Эти тесты имеют ряд специфических особенностей: а) наличие архива (базы данных); б) наличие пароля на вход в тест или базу данных для обеспечения конфиденциальности результатов; в) развернутая интерпретация результатов с использованием профессиональных терминов, коэффициентов, с построением графиков (профилей); г) наличие информации о разработчиках методики, сведений о валидности и надежности, справочных материалов о лежащих в основе методики теоретических положениях.

Полупрофессиональные компьютерные тесты ориентированы на специалистов смежных профессий, например на педагогов, менеджеров по персоналу. Такие тесты зачастую снабжены редуцированной интерпретацией без использования специальной лексики, просты в освоении и работе. Тесты подобного уровня могут быть предназначены и для неспециалиста, рядового пользователя персонального компьютера, интересующегося психологией. Наконец, существует также большое число непрофессиональных компьютерных тестов, направленных на популяризацию психологических идей или преследующих развлекательные цели.

Пользуясь профессиональными или полупрофессиональными компьютерными тестами, необходимо соблюдать те же этические принципы, что и при бланковом тестировании. Важно не распространять результаты тестирования и защищать свои файлы паролем, особенно если у компьютера несколько пользователей. И главное – «не сотворить себе кумира», т. е. помнить, что компьютерный тест является только средством, помощником и имеет свои границы применения.

6.4. Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.

В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.

Надежность теста. Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка ретестовой надежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее.

Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75.

Валидность теста. Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее.

Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.

Существуют следующие виды валидности теста.

Очевидная валидность. Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять.

Конкретная валидность (конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства.

Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями.

Конструктная валидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

С теоретической точки зрения единственным способом установления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вычислять значение «факторных нагрузок» – коэффициенты детерминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования.

Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

6.5. Требования к разработке, проверке и адаптации тестовых методик

Известны два пути создания психодиагностических методик: адаптация известных методик (зарубежных, устаревших, с иными целями) и разработка новых, оригинальных методик.

Адаптация теста – это комплекс мероприятий, обеспечивающих адекватность теста в новых условиях применения. Выделяют следующие этапы адаптации тестов:

1) анализ исходных теоретических положений автора теста;

2) для иностранных методик – перевод теста и инструкций к нему на язык пользователя (с обязательной экспертной оценкой соответствия оригиналу);

3) проверка надежности и валидности в соответствии с психометрическими требованиями;

4) стандартизация на соответствующих выборках.

Наиболее серьезные проблемы возникают при адаптации вербальных тестов (опросников, вербальных субтестов в составе тестов интеллекта). Эти проблемы связаны с языковыми и социокультурными различиями народов разных стран. Многовариантность перевода какого-либо термина, невозможность точной передачи идиоматических оборотов – обычное явление при переводах с языка на язык. Иногда бывает настолько сложно подобрать языковые и смысловые аналоги заданий теста, что полная его адаптация становится сопоставимой с разработкой оригинальной методики.

Понятие адаптации приложимо не только к зарубежным методикам, которые предполагается использовать в условиях нашей страны, но и к устаревшим отечественным методикам. Устаревают они достаточно быстро: в связи с развитием языка и изменчивостью социокультурных стереотипов методики должны корректироваться каждые 5–7 лет, что подразумевает уточнение формулировок вопросов, коррекцию нормативов, обновление стимульного материала, пересмотр интерпретационных критериев.

Самостоятельная разработка тестовой методики обычно состоит из следующих этапов.

1. Выбор предмета (явления) и объекта исследования (контингента).

2. Выбор вида теста (объективный, субъективный, проективный), типа заданий (с предписанными ответами, со свободными ответами) и шкал (числовые, вербальные, графические).

3. Подбор первичного банка заданий. Он может осуществляться двумя путями: вопросы формулируются исходя из теоретических представлений об измеряемом явлении (факторно-аналитический принцип) или же подбираются в соответствии с их дискриминативностью, т. е. способностью отделять испытуемых по наличию требуемого признака (критериально-ключевой принцип). Второй принцип эффективен при разработке тестов отбора (например, профессионального или клинического).

4. Оценка заданий первичного банка (содержательной валидности теста, т. е. соответствия каждого из заданий измеряемому явлению, и полноты охвата изучаемого явления тестом в целом). Проводится с помощью метода экспертной оценки.

5. Предварительное тестирование, формирование банка эмпирических данных.

6. Эмпирическая валидизация теста. Проводится с помощью корреляционного анализа оценок теста и показателей по внешнему параметру изучаемого свойства (например, школьной успеваемости при валидизации теста интеллекта, врачебного диагноза при валидизации клинических тестов, данных других тестов, валидность которых известна, и др.).

7. Оценка надежности теста (устойчивости результатов к действию случайных факторов, внешних и внутренних). Наиболее часто оцениваются ретестовая надежность (соответствие результатам повторного тестирования, обычно через несколько месяцев), надежность частей теста (устойчивость результатов отдельных задач или групп задач, например по методу «четное – нечетное») и надежность параллельных форм, если таковые существуют. Методика признается надежной, если коэффициент корреляции результатов (первичного и повторного тестирования, одной и другой частей теста, одной и другой параллельных форм) составляет не менее 0,75. При более низком показателе надежности производятся корректировка заданий теста, переформулирование вопросов, снижающих надежность.

8. Стандартизация теста, т. е. приведение процедуры и оценок к общепринятым нормативам. Стандартизация оценок подразумевает преобразование нормальной или искусственно нормализованной шкалы первичных оценок (эмпирических значений изучаемого показателя) в оценки шкальные (отражающие место в распределении результатов выборки испытуемых). Виды шкальных оценок: стены (1-10), станайны (1–9), 7-оценки (10-100) и др.

9. Определение прогностической валидности, т. е. информация о том, с какой степенью точности методика позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность также определяется по внешнему критерию, но данные по нему собираются спустя некоторое время после тестирования.

Таким образом, надежность и валидность – это собирательные понятия, включающие в себя несколько видов показателей, отражающих направленность методики на предмет исследования (валидность) и объект исследования (надежность). Степень надежности и валидности отражают соответствующие коэффициенты, указываемые в сертификате методики.

Создание методики – трудоемкая работа, требующая развитой системы заказа на методики с соответствующей оплатой труда разработчиков и гонорарами за использование авторских методик.

Тестирование – это исследовательский метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий. Такие задания принято называть тестами. Тест – это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности. Она должна быть соотносима с установленными для данной категории испытуемых нормами.

Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период.

Существуют определенные правила проведения тестирования и интерпретации полученных результатов. Эти правила достаточно четко проработаны, и основные из них имеют следующий смысл:

1) информирование испытуемого о целях проведения тестирования;

2) ознакомление испытуемого с инструкцией по выполнению тестовых заданий и достижение уверенности исследователя в том, что инструкция понята правильно;

3) обеспечение ситуации спокойного и самостоятельного выполнения заданий испытуемыми; сохранение нейтрального отношения к тестируемым, уход от подсказок и помощи;

4) соблюдение исследователем методических указаний по обработке полученных данных и интерпретации результатов, которыми сопровождается каждый тест или соответствующее задание;

5) предупреждение распространения полученной в результате тестирования психодиагностической информации, обеспечение ее конфиденциальности;

6) ознакомление испытуемого с результатами тестирования, сообщение ему или ответственному лицу соответствующей информации с учетом принципа «Не навреди!»; в этом случае возникает необходимость решения серии этических и нравственных задач;

7) накопление исследователем сведений, полученных другими исследовательскими методами и методиками, их соотнесение друг с другом и определение согласованности между ними; обогащение своего опыта работы с тестом и знаний об особенностях его применения.

Выделяют также несколько типов тестов, каждому из которых сопутствуют соответствующие процедуры тестирования.

Тесты способностей позволяют выявить и измерить уровень развития тех или иных психических функций, познавательных процессов. Такие тесты чаще всего связаны с диагностикой познавательной сферы личности, особенностей мышления и обычно называются также интеллектуальными.

К ним относятся, например, тест Равена, тест Амтхауэра, соответствующие субтесты теста Векслера и т.д., а также тесты-задания на обобщение, классификацию и множество других тестов исследовательского характера.

Тесты достижений ориентированы на выявление уровня сформированности конкретных знаний, умений и навыков и как меры успешности выполнения, и как меры готовности к выполнению некоторой деятельности. В качестве примеров могут служить все случаи тестовых экзаменационных испытаний. На практике обычно применяются «батареи» тестов достижений.

Личностные тесты предназначены для выявления свойств личности испытуемых. Они многочисленны и разнообразны: существуют опросники состояний и эмоционального склада личности (например, тесты тревожности), опросники мотивации деятельности и предпочтений, определения черт характера личности и отношений.

Имеется группа тестов, называемых проективными, которые позволяют выявить установки, неосознаваемые потребности и побуждения, тревоги и состояние страха.

Применение тестов всегда связано с измерением проявления того или иного психологического свойства и оценкой уровня его развития или сформированности. Поэтому важное значение имеет качество теста. Качество теста характеризуется критериями его точности, т.е. надежностью и валидностью.

Надежность теста определяется тем, насколько получаемые показатели являются стабильными и насколько они не зависят от случайных факторов. Разумеется, речь идет о сравнении показаний одних и тех же испытуемых. Это значит, что надежному тесту должна быть свойственна согласованность показателей тестирования, полученных при повторном тестировании, и можно быть уверенным в том, что тест выявляет одно и то же

свойство. Применяются разные способы проверки надежности тестов.

Один способ – это только что упомянутое повторное тестирование: если результаты первого и через определенное время проводимого повторного тестирования покажут наличие достаточного уровня корреляции, то это будет свидетельствовать о надежности теста. Второй способ связан с применением другой эквивалентной формы теста и наличием высокой корреляции между ними. Возможно и применение третьего способа оценки надежности, когда тест допускает его расщепление на две части и одна

и та же группа испытуемых обследуется с применением обеих частей теста. Надежность теста показывает, насколько точно измеряются психологические параметры и насколько высокой может быть мера доверия исследователя к полученным результатам.

Валидность теста отвечает на вопрос о том, что именно выявляет тест, насколько он пригоден для выявления того, для чего он предназначен. Например, тесты способностей нередко выявляют несколько иное: натренированность, наличие соответствующего опыта или, наоборот, его отсутствие. В таком случае тест не отвечает требованиям валидности.

В психодиагностике выделяют разные виды валидности. В простейшем случаеь валидность теста обычно определяется путем сопоставления полученных в результате тестирования показателей с экспертными оценками о наличии данного свойства у исследуемых (текущая валидность или валидность «по одновременности»), а также путем анализа данных, полученных в результате наблюдения за обследуемыми в различных ситуациях их жизни и деятельности, и их достижений в соответствующей области.

Вопрос о валидности теста может быть решен еще и сравнением его данных с показателями, полученными с помощью методики, связанной с данной методикой, валидность которой считается установленной.

Изучение продуктов деятельности – это исследовательский метод, который позволяет опосредованно изучать сформированность знаний и навыков, интересов и способностей человека на основе анализа продуктов его деятельности. Особенность этого метода заключается в том, что исследователь не вступает в контакт с самим человеком, а имеет дело с продуктами его предшествующей деятельности или размышлениями о том, какие

изменения произошли в самом испытуемом в процессе и в результате его включенности в некоторую систему взаимодействий и отношений.