Методология тестирования. Методы тестирования

  • 29.09.2019

Тестовые методы. Определение теста. Подходы к классификации тестов. Критерии качества товаров. Достоинства и недостатки тестов. Достоинства и недостатки тестовых методов.

Стандартизированные тесты должны обладать определенными психометрическими свойствами.

1. Надежность теста точность устойчивость - согласованность результатов теста, которые получаются при повторном применении теста к тем же обследуемым через время или в результате применения эквивалентных наборов заданий. Надежность показывает, в какой степени индивидуальные различия в тестовых результатах оказываются истинными, а в какой могут быть приписаны случайным ошибкам. Показатель надежности теста должен быть достаточно высоким (0,7- 0,8). Надежность теста не обязательно предполагает его валидность.

2. Валидность теста что

Справедливо следующее неравенство: валидность ≤ надежность.

3. Репрезентативность теста определяется возможностью его использования применительно к данной категории обследуемых лиц. Тест, стандартизированный на студентах, а тем более – на специалистах, будет нерепрезентативным в отношении учащихся средней школы.

4. Достоверность теста – его защищенность от мотивационных искажений (разновидность валидности применительно к тестовым самоотчетам).

Стандартный набор данных о тесте должен включать меру надежности (характеризует тест, когда он применяется в стандартных условиях и с обследуемыми, похожими на тех, кто участвовал в выборке стандартизации), информацию о валидности и способах ее определения.

При использовании психодиагностических тестов важно соблюдать следующие требования:

● четко определять цели, задачи и область применения теста;

● использовать заданный алгоритм проведения тестирования и обработки результатов.

В качестве резюмирующего требования к тестовой методике можно отметить наличие так называемого технического паспорта психодиагностического теста. Технический паспорт является интегральным документом, в котором подробно описывается тест, указываются авторство, время и место создания, формы и способы проведения, параметры надежности, валидности, репрезентативности теста, сведения об апробации, авторские инструкции, ключи и нормы к тесту, диапазон использования и ограничения.



Зачастую тесты для психодиагностики персонала распространяются без необходимых профессиональных атрибутов, и тесты, которые разрабатывались для определенных целей и условий, применяются в совершенно неподходящих областях. В помощь заказчикам психодиагностического тестирования можно выделить внешние признаки научного (а значит, эффективного) теста, которые следовало бы учитывать при выборе тестовых методик.

В основе этой категории методов лежит соблюдение достаточно строгих и сформулированных в явной форме правил. Эти методы обеспечивают диагноз (и на его основе прогноз) лишь с вероятностной точностью, этот диагноз оказывается более надежным по отношению к группе обследуемых, чем по отношению к отдельному обследуемому. Достоинства измерительных методов (объективный характер процедуры, возможность перепроверки) обеспечиваются не автоматически, а благодаря выполнению психометрических требований.

Тест (англ. test –опыт, проба) – система стандартизированных вопросов и задач, позволяющих измерить уровень развития у обследуемых определенных психологических качеств, необходимых теоретических знаний, практических умений, навыков.

Подходы к классификации тестов. Согласно общепринятой классификации тесты можно подразделить:

● по назначению – на общедиагностические, профессиональной пригодности, специальные;

● по комплектности – на изолированные и тестовые батареи;

● по степени однородности задач – на гомогенные и гетерогенные;

● по формам процедуры обследования – на групповые и индивидуальные;

● по форме ответа – на устные и письменные;

● по наличию временных ограничений в выполнении теста – на скоростные тесты, тесты возможностей (результативности) и смешанные;

● по особенностям используемых тестовых задач – на вербальные и невербальные;

● по характеру тестового материала, предъявляемого обследуемым, - на бланковые («карандаш-бумага») и аппаратурные (в том числе компьютерные);

● по предмету диагностирования – на тесты интеллекта, тесты личности, социально-психологические тесты, тесты достижений и др.

8. Надежность и валидность тестов: основные понятия.

1. Надежность теста – это характеристика методики, отражающая точность психодиагностических измерений и устойчивость результатов теста к действию посторонних случайных факторов (временных колебаний психологического или физического состояния обследуемого лица, факторов окружения и др.);

- согласованность результатов теста, которые получаются при повторном применении теста к тем же обследуемым через время или в результате применения эквивалентных наборов заданий.

Надежность показывает, в какой степени индивидуальные различия в тестовых результатах оказываются истинными, а в какой могут быть приписаны случайным ошибкам. Показатель надежности теста должен быть достаточно высоким (0,7- 0,8).

Надежность теста не обязательно предполагает его валидность.

2. Валидность теста – это оценка пригодности теста к измерению требуемого (искомого) качества. Валидность показывает, что тест измеряет и насколько хорошо он это делает; насколько результаты, полученные по тесту, совпадают с независимо наблюдаемым поведением.

Название теста часто не может служить указанием на его валидность (обоснованность), позволяя лишь отличить тест от других (название тестов слишком широко, расплывчато для того, чтобы определить, на диагностику каких особенностей тест ориентирован). Валидность теста выявляется в лабораторных условиях системой статистических методов. Справедливо следующее неравенство: валидность ≤ надежность.

Валидность теста связана также с его репрезентативностью и достоверностью.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

знание тестовый задание

Одним из способов быстрой проверки знаний является тестирование. Однако в настоящее время, в связи с развитием информационных технологий, дистанционного обучения и в частности адаптивных обучающих систем, тестирование может применяться как средство идентификации личности обучаемого для построения индивидуальной последовательности обучения, когда каждый обучаемый проходит учебные курсы в том порядке и в том объеме, которые наиболее соответствуют его уровню подготовленности. В технологии дистанционного обучения при отсутствии непосредственного контакта обучаемого с преподавателем тестирование становится одним из основных средств контроля знаний, поэтому особенно остро встает проблема создания качественных тестов, которые могли бы быстро, объективно и адекватно измерять уровень знаний обучаемых.

Можно различать три вида тестирования:

· предварительное;

· текущее;

· итоговое.

Предварительное тестирование применяется перед началом обучения и направлено на выявление предварительных знаний обучаемого по ряду дисциплин, которые ему предстоит изучать. Сюда же могут включаться психологические тесты для определения индивидуальных характеристик личности обучаемого, которые учитываются в ходе обучения для настройки на работу с конкретным обучаемым. По результатам предварительного тестирования строится предварительная последовательность изучения учебных курсов.

Текущее тестирование - это контроль или самоконтроль знаний по отдельному элементу учебного курса, например, разделу или теме. По его результатам строится последовательность изучения тем и разделов внутри курса, а также может осуществляться возврат к темам, которые были изучены недостаточно хорошо.

Итоговое тестирование - это контроль знаний по курсу в целом или по совокупности курсов. По его результатам корректируется последовательность изучения учебных курсов.

При работе с тестами всегда нужно учитывать надежность результатов тестирования. Под надежностью тестовых результатов понимается характеристика, показывающая точность измерения знаний заданиями теста. Нужно отметить, что речь идет не о надежности теста, а о надежности результатов тестирования, т.к. на нее сильно влияет степень однородности различных групп обучаемых, уровень их подготовленности и ряд других факторов, связанных не с самим тестом, а с условиями проведения процесса тестирования.

1. Классификация тестов, методы тестирования, достоинства и недостатки тестовой проверки знаний студентов

1.1 Тестирование как метод исследования

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида .

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжирования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

К тестам предъявляют следующие требования:

Строгая формализация всех этапов тестирования;

Стандартизация заданий и условий их выполнения;

Квантификация полученных результатов и их структурирование по заданной программе;

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий;

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится;

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученный результат .

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь необходимо учитывать, что переносить интерпретацию полученных результатов можно только на такие группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров;

2) введение поправочных коэффициентов с учетом характеристик выборки;

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос);

б) указаний относительно регистрации или интеграции полученных ответов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя, различают тесты объективные и субъективные.

К объективным тестам относится большинство тестов достижений и психофизиологические тесты. К субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

По формальной структуре различаются тесты простые, т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатистическими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой «идеальной норме» .

Разработка теста состоит из четырех этапов.

1) на первом этапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

2) на втором производится отбор предварительных пунктов испытания с последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

3) на третьем этапе тест проверяется повторно на той же самой популяции;

4) на четвертом калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его проявления (способности, уровень знаний, темперамент, интересы, установки);

б) связанную с этим валидизацию метода, т.е. определение того, насколько он измеряет требуемое свойство;

в) величину выборки из популяции, на которой должна проводиться оценка метода;

г) стимулирующий материал (таблички, изображения, игрушки, фильмы);

д) влияние исследователя в процессе инструктирования, постановки задач, разъяснений, ответов на вопросы;

е) условия ситуации;

ж) такие формы поведения испытуемого, которые свидетельствуют об измеряемом свойстве;

з) шкалиpование релевантных форм поведения;

и) сведение результатов по отдельным измеряемым пунктам в общие значения (суммирование ответов типа «Да»);

к) формулировку результатов в нормированной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам.

Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечая на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, кружочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал «лжи». Опросники применяются преимущественно для диагностики характера, диагностики личности (экстраверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

1.2 Достоинства и недостатки тес товой проверки знаний студентов

В системе высшего образования применение тестирования знаний студентов имеет свои предпосылки. Поэтому тестирование имеет как достоинства, так и недостатки которые будут рассмотрены ниже.

В качестве достоинств можно отметить следующее:

1. Тестирование является более качественным и объективным способом оценивания. Для заочного обучения в условиях предельного ограничения количества аудиторных часов тестирование часто является единственной возможностью формирования достаточно объективной оценки знаний студентов.

2. Тестирование - более справедливый метод, оно ставит всех студентов в равные условия, как в процессе контроля, так и в процессе оценки, исключая субъективизм преподавателя.

3. Тесты это более объёмный инструмент, поскольку позволяет установить уровень знаний студента по предмету в целом, чем при выполнении контрольной работы.

4. Тестирование существенно экономит время преподавателя, отводимое на контроль знаний студентов, по сравнению с проверкой и защитой контрольных работ студентами заочной форме обучения. Это связано с тем, что тестированию одновременно подвергается сразу группа студентов.

Однако тестирование имеет также некоторые недостатки:

1. Жесткие временные ограничения, применяемые при выполнении тестовых заданий, исключают возможности определить структуру и уровень подготовленности тех испытуемых, которые в силу своих психофизиологических особенностей думают и делают все медленно, но при этом качественно.

2. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов.

3. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений.

4. В тестировании присутствует элемент случайности и интуиции. Причиной этого может быть угадывание ответа студентом, поэтому при разработке теста необходимо предвидеть такую ситуацию .

2 . Модели тестирования

Остановимся на основных моделях тестирования.

Классическая модель. Данная модель является самой первой и самой простой. Имеется n заданий по определенной области знаний, по нескольким областям знаний или части области знаний (разделу, теме и т.п.). Из этого множества заданий случайным образом выбирается k заданий (k

Достоинство:

Простота реализации.

Недостатки:

Из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных;

Оценка зависит только от количества правильных ответов и не учитывает сложность заданий.

Классическая модель из-за своих недостатков имеет самую низкую надежность, т.к. отсутствие учета параметров заданий часто не позволяет объективно оценить знания обучаемого.

В настоящее время происходит уход от использования данной модели к более совершенным и эффективным моделям, например, к адаптивному тестированию.

Классическая модель с учетом сложности заданий. Это тестирование проводится аналогично предыдущему, однако каждое задание имеет определенный уровень сложности Ti, i= и при подсчете результата тестирования учитывается сложность вопросов, на которые обучаемый дал правильный ответ. Чем выше сложность вопроса, тем выше будет результат тестирования. Для вопросов, на которые был дан неправильный ответ, сложность не учитывается.

Недостаток: из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных.

Модели с учетом сложности заданий позволяют более адекватно подойти к оценке знаний. Но случайность выбора заданий не позволяет добиться параллельности тестов по сложности, т.е. одинаковости суммарных характеристик сложности заданий, что снижает надежность тестирования.

Модель с возрастающей сложностью. Имеется m уровней сложности. В тесте должны присутствовать задания всех уровней сложности. Из этого множества заданий случайным образом выбирается k заданий (k

Результат тестирования определяется аналогично модели с учетом сложности.

Данная модель обеспечивает параллельность тестов по сложности, т.е. надежность результатов тестирования еще выше, чем в предыдущих моделях.

Модель с разделением заданий по уровням усвоения.

Различают пять уровней усвоения учебного материала.

Нулевой уровень (Понимание) - это такой уровень, при котором обучаемый способен понимать, т.е. осмысленно воспринимать новую для него информацию. Фактически речь идет о предшествующей подготовке обучаемого .

Первый уровень (Опознание) - это узнавание изучаемых объектов при повторном восприятии ранее усвоенной информации о них или действиях с ними, например, выделение изучаемого объекта из ряда предъявленных объектов.

Второй уровень (Воспроизведение) - это воспроизведение усвоенных ранее знаний от буквальной копии до применения в типовых ситуациях. Примеры: воспроизведение информации по памяти, решение типовых задач по образцу.

Третий уровень (Применение) - это такой уровень усвоения информации, при котором обучаемый способен самостоятельно воспроизводить и преобразовывать усвоенную информацию для обсуждения известных объектов и применения ее в нетиповых ситуациях. При этом обучаемый способен генерировать новую для него информацию об изучаемых объектах. Примеры: решение нетиповых задач, выбор подходящего алгоритма из набора ранее изученных алгоритмов для решения конкретной задачи.

Четвертый уровень (Творческая деятельность) - это такой уровень владения учебным материалом темы, при котором обучаемый способен создавать новую информацию, ранее неизвестную никому. Пример: разработка нового алгоритма решения задачи.

Уровень представления обозначается a и может меняться от 0 до 4.

Задания составляются для каждого из пяти уровней. Сначала проводится тестирование с использованием заданий по уровню 0, затем по уровню 1, 2 и т.д. Перед переходом с уровня на уровень вычисляется степень владения учебным материалом на данном уровне и определяется возможность перехода на следующий уровень.

Для измерения степени владения учебным материалом на каждом уровне используют коэффициент:

где P 1 - количество правильно выполненных существенных операций в процессе тестирования;

Р 2 - общее количество существенных операций в тесте.

Под существенными операциями понимают те операции, которые выполняются на проверяемом уровне a. Операции, принадлежащие к более низким уровням, в число существенных не входят.

Исходя из этого: 0 ? К б? 1.

Таким образом, уровень усвоения учебного материала может быть использован для оценивания качества знаний у обучаемого и выставления оценки. Рекомендуются следующие критерии для выставления оценки:

К б < 0,7 Неудовлетворительно

0,7 ? К б <0,8Удовлетворительно

0,8 ? К б <0,9Хорошо

К б? 0,9 Отлично

При К б < 0,7 следует продолжать процесс обучения на том же уровне.

Модель с учетом времени ответа на задание. В данной модели при определении результата тестирования учитывается время ответа на каждое задание. Это делается для того, чтобы учесть возможность несамостоятельного ответа на задания: обучаемый может долго искать ответ в учебнике или других источниках, но в итоге его оценка все равно будет низкой, даже если на все вопросы он ответил правильно. С другой стороны, если он не пользовался подсказками, а долго думал над ответами, это означает, что он недостаточно хорошо изучил теорию, а в результате даже при правильных ответах оценка будет снижена.

Учет времени ответа может производиться, например, по формулам.

Результат ответа на i-е задание теста:

знание тестовый задание

Если R i > 1, то R i =1.

Если R i < 0, то R i =0.

где: t отв - время ответа на задание,

t max - время, в течение которого уменьшение оценки не происходит.

t max установлено для того, чтобы обучаемый имел возможность прочитать вопрос и варианты ответов, осмыслить их и выбрать правильный, по его мнению, ответ. Параметр t max может задаваться как константа для всех заданий теста или вычисляться для каждого отдельно взятого задания в зависимости от его сложности, т.е. t 2 max =f(T i), т.к. логично предположить, что для ответа на сложное задание требуется больше времени, чем на простое задание. Другая возможная зависимость параметра t max - от индивидуальных способностей обучаемого, которые должны быть определены ранее.

Результат тестирования:

Модели с учетом времени ответа на задание также позволяют повысить надежность результатов тестирования, особенно в сочетании с моделью с учетом сложности заданий.

Модель с ограничением времени на тест. Для оценки результатов тестирования берутся только те задания, на которые успел ответить обучаемый за данное время.

В настоящее время данная модель используется достаточно широко.

В некоторых работах рекомендуется обязательно сортировать задания по возрастанию сложности и устанавливать такое время тестирования, за которое на все задания теста не сможет ответить ни один, даже самый сильный обучаемый. Такой подход предлагается применять при тестировании на бланках, когда обучаемых видит перед собой сразу все задания. Суть его в том, что когда обучаемый ответит на все задания, а время у него еще останется, он может начать проверять свои ответы, сомневаться, а в итоге может исправить правильные ответы на неправильные. Поэтому рекомендуется или ограничивать время на тест или забирать бланк сразу после ответа на все задания теста.

Адаптивная модель. Данная модель является продолжением классической модели с учетом сложности заданий.

Адаптивным называется тест, в котором сложность заданий меняется в зависимости от правильности ответов испытуемого. Если обучаемый правильно отвечает на тестовые задания, сложность последующих заданий повышается, если неправильно - понижается. Также есть возможность задания дополнительных вопросов по темам, которые обучаемый знает не очень хорошо для более тонкого выяснения уровня знаний в данных областях. Таким образом, можно сказать, что адаптивная модель напоминает преподавателя на экзамене - если обучаемый отвечает на задаваемые вопросы уверенно и правильно, преподаватель достаточно быстро ставит ему положительную оценку. Если обучаемый начинает «плавать», то преподаватель задает ему дополнительные или наводящие вопросы того же уровня сложности или по той же теме. И, наконец, если обучаемый с самого начала отвечает плохо, оценку преподаватель тоже ставит достаточно быстро, но отрицательную.

Данная модель применяется для тестирования обучаемых с помощью компьютера, т.к. на бумажном бланке невозможно заранее разместить столько вопросов и в том порядке, сколько и в котором они должны быть предъявлены обучаемому.

Тестирование обычно начинается с заданий средней сложности, но можно начинать и с легких заданий, т.е. идти по принципу повышения сложности.

Тестирование заканчивается, когда обучаемый выходит на некоторый постоянный уровень сложности, например, отвечает подряд на некоторое критическое количество вопросов одного уровня сложности.

Достоинства:

1) позволяет более гибко и точно измерять знания обучаемых;

2) позволяет измерять знания меньшим количеством заданий, чем в классической модели;

3) выявляет темы, которые обучаемый знает плохо и позволяет задать по ним ряд дополнительных вопросов.

Недостатки:

1) заранее неизвестно, сколько вопросов необходимо задать обучаемому, чтобы определить его уровень знаний. Если вопросов, заложенных в систему тестирования, оказывается недостаточно, можно прервать тестирование и оценивать результат по тому количеству вопросов, на которое ответил обучаемый;

2) возможно применение только на ЭВМ.

Надежность результатов тестирования в данном случае самая высокая, т.к. осуществляется приспособление под уровень знаний конкретного обучаемого, что обеспечивает более высокую точность измерений.

Возможный алгоритм адаптивной модели тестирования. Данный алгоритм является достаточно простым и позволяет варьировать только уровень сложности, не учитывая статистику ответов на предыдущие вопросы. На каждом шаге тестирования по каждому уровню сложности обучаемому дается два задания, и по результатам ответов на них определяется уровень сложности для следующих заданий. Данное количество заданий (два) позволяют более адекватно оценивать уровень знаний, чем одно задание, на которое обучаемый может отгадать или случайно забыть ответ, и в то же время не дает большого количества сочетаний вариантов ответов, как в случае трех и тем более большего количества заданий.

Пусть имеется m уровней сложности. Вводится коэффициент k r =100/m.

Обозначим t - текущий уровень знаний обучаемого, t н - нижний уровень знаний, t в - верхний уровень знаний. Все уровни знаний будем измерять от 0 до 100 (0 - нет знаний, 100 - абсолютное знание) .

1. Установить t = 50; t н = 0; t в = 100.

2. Вычислить текущий уровень сложности T=t/k r .

3. Выдать два задания сложности T. Пусть k пр - количество правильных ответов, k пр?.

4. Пересчет уровня знаний:

· если k пр = 2, то t н = t; t в = t в + 0.5t. Если t в > 100, то t в = 100;

· если k пр = 1, то t н = t н / 4; t в = t в + 0.1t. Если t в > 100, то t в = 100;

· если k пр = 0, то t н = t н / 2; t в = t.

5. Если |t-t 1 |<е, то уровень знаний равен t 1 , выход.

6. Перейти к шагу (2).

е устанавливается исходя из необходимой точности оценки знаний. Однако с уменьшением е возрастает число вопросов, необходимых для включения в тест.

Модель тестирования по сценарию. Данная модель также является продолжением классической модели. Данная модель реализуется в системе Дистанционного Асинхронного Обучения, разрабатываемой в Татарском Институте Содействия Бизнесу (ТИСБИ) .

Существенным недостатком классической модели является непараллельность тестов для различных обучаемых, т. к. нельзя заранее определить, какие задания по сложности и по каким темам достанутся обучаемому. Поэтому при сценарном тестировании преподаватель перед тестированием формирует сценарий тестирования, где может указывать:

· количество заданий по каждой теме, которые должны быть включено в тест;

· количество заданий каждого уровня сложности, которые должны быть включено в тест;

· количество заданий каждой формы, которые должны быть включено в тест»;

· время прохождения теста

· и другие параметры.

Сценарий может создаваться по любому объему учебного материала: разделу, предмету, специальности и т.д.

Существует четыре формы тестовых заданий:

1. Задания с выбором, которые делятся на 3 подгруппы: задания с выбором одного правильного ответа или одновариантные задания, задания с выбором нескольких правильных ответов или многовариантные задания, задания с выбором наиболее правильного ответа.

2. Открытые задания.

3. Задания на установление соответствия.

4. Задания на установление правильной последовательности.

Непосредственно при тестировании выборка заданий каждого уровня сложности, по каждой теме, каждой формы и т.д. производится случайным образом из общей базы заданий, поэтому каждый обучаемый получает свои задания. Получаемые тесты для всех обучаемых являются параллельными, т.е. имеют одинаковое число заданий и одинаковую суммарную сложность. Но в отличие от модели с возрастанием сложности, которая также обеспечивает параллельность, здесь разработчик теста решает сам, сколько и каких заданий должно быть предъявлено по каждой теме, следовательно, обеспечиваются абсолютно одинаковые условия тестирования для всех обучаемых.

По сравнению с адаптивной моделью данная модель является менее эффективной, т.к. не настраивается под индивидуальные особенности каждого обучаемого, однако имеет преимущество психологического характера: при тестировании по адаптивной модели обучаемые отвечают на разное количество вопросов и как будто бы находятся в разных условиях. В случае тестирования по сценарию все обучаемые получают одинаковое количество вопросов по каждой теме и по каждому уровню сложности.

Надежность результатов тестирования сопоставима с надежностью, получаемой при тестировании с возрастанием сложности.

Модель на нечеткой математике. Цель введения нечеткой математики - попытка математической формализации нечетких, качественных явлений и объектов с размытыми границами, встречающихся в реальном мире. Нечеткое управление оказывается особенно полезным, когда описываемые процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты по сравнению с получаемым при общепринятых алгоритмах управления. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности .

Данная модель тестирования является развитием любой предыдущей модели, в которой вместо четких характеристик тестовых заданий и ответов используются их нечеткие аналоги. Примерами могут служить:

Сложность задания («легкое», «среднее», «выше среднего», «сложное» и т.п.);

Правильность ответа («правильно», «частично правильно», «скорее неправильно», «неправильно» и т.п.);

Время ответа («маленькое», «среднее», «большое», «очень большое» и т.п.);

Процент правильных ответов («маленький», «средний», «большой», «очень большой» и т.п.);

Итоговая оценка;

Введение нечетких характеристик может помочь преподавателям разрабатывать тесты. Например, преподаватель может достаточно быстро определить, является ли задание сложным или нет. Но сказать точно, насколько оно сложно, например, по 100-бальной шкале или точно оценить разницу сложностей двух заданий будет для него достаточно трудно. С точки зрения обучаемого нечеткая оценка его знаний в виде «хорошо», «отлично», «не очень хорошо» и т.п. более понятна ему, чем четкое количество баллов, которое он набрал в результате тестирования.

Модели могут быть комбинированными, например:

Классическая модель с учетом сложности заданий и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с ограничением времени на тест;

Модель с учетом времени ответа на задание и адаптивная модель;

Модель с учетом времени ответа на задание и модель на нечеткой математике;

Модель с разделением заданий по уровням усвоения и модель с учетом сложности заданий;

3 . Разработка тестовых заданий

3.1 Создание компьютерного тестирования

Компьютерный тест - инструмент, предназначенный для измерения обученности учащегося, состоящий из системы тестовых заданий в электронном виде, определённой процедуры проведения, обработки и анализа результатов. Компьютерный тест формируется программным способом из электронного банка тестовых заданий в соответствии со спецификацией (планом, паспортом теста).

Систематическая проверка знаний большого числа проверяемых приводит к необходимости автоматизации проведения тестирования знаний, использованию компьютерной техники и соответствующих программ проверки знаний.

Компьютерное тестирование как эффективный способ проверки знаний находит в образовании все большее применение. Одним из его достоинств является минимум временных затрат на получение надежных итогов контроля, и получение результатов практически сразу по завершении контролирующего теста. От традиционных оценок и контроля знаний - тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные критерии.

Главные требования к системе компьютерного контроля заключаются в том, что:

Тестовые вопросы и варианты ответов на них должны быть четкими и понятными по содержанию;

Компьютерный тест должен быть простым в использовании;

Тестовых вопросов должно быть настолько много, чтобы совокупность этих вопросов охватывала весь материал, который обучающийся должен усвоить;

Вопросы должны подаваться испытуемому в случайном порядке, чтобы исключить возможность механического запоминания их последовательности;

Варианты возможных ответов должны следовать так же в случайном порядке;

Необходимо проводить учет времени, затраченного на ответы, и ограничивать это время.

Был создан тест для проверки знаний студентов физического факультета по дисциплине специализации «Допуски, посадки и технические измерения». Опрос в форме тестирования проводится в течение 15 минут и включает в себя 15 вопросов, которые последовательно предъявляются студенту в автоматизированном режиме. Во время тестирования на экране монитора располагается только одно тестовое задание.

Каждый студент имеет право пройти тест только один раз. По истечении 15 минут компьютерная программа автоматически завершает процедуру тестирования и выдает на экран монитора итоговый результат.

Во время тестирования переговоры между студентами не разрешаются. С вопросами, не касающимися содержания учебного материала, следует обращаться к преподавателю или администратору компьютерного класса, предварительно подняв руку, чтобы не отвлекать других испытуемых во время тестирования.

Наличие учебных и справочных материалов во время сеанса тестирования не допускается. Выходить из компьютерного класса во время сеанса тестирования не разрешается.

Для компьютерного тестирования была использована программа «Краб 2», в которой случайным образом из 50 вопросов выбирается 15 и предлагаются студенту. На каждый вопрос дается по 4 варианта ответа. Правильными может быть от одного до трёх ответов.

Рисунок 1 - Пример вопроса с одним правильным ответом

Рисунок 2 - Пример вопроса с несколькими правильными ответами

При тестировании допускается пропускание вопроса, возвращение к предыдущему вопросу, а также своевременное завершение теста. Результат тестирования выводится на экран при завершении теста. Указывается количество правильных, неправильных и пропущенных ответов. По завершению теста можно посмотреть все задания, на который студент дал неверный ответ.

Рисунок 3 - Результат тестирования

3.2 Тестовые задания

1. Качество изделия следует рассматривать:

a. на протяжении всего «жизненного цикла»;

b. на этапе изготовления;

c. на этапе эксплуатации;

d. нет правильного ответа

2. Термин, условно применяемый для обозначения наружных элементов деталей, включая и нецилиндрические элементы:

a. отверстие;

b. вал;

d. шарнир.

3. Размер элемента, установленный измерением:

a. наименьший предельный размер;

b. номинальный;

c. предельный размер;

d. действительный размер.

Какая схема изображена на представленном рисунке

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

4. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

5. Какая схема изображена на представленном рисунке:

a. схемы посадок в системы основного отверстия;

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

c. поля допусков с разными основными отклонениями и уровнями относительной точности;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

6. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

a. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

c. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

7. Какие калибры обеспечивают контроль по наибольшему и наименьшему придельным значениям параметров:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

8. Калибры, предназначенные для контроля деталей в процессе их изготовления:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

9. Калибры, предназначенные для контроля рабочих калибров-скоб:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

10. Допуск формы - это:

a. нормативные ограничения отклонения формы назначенными полями допусков;

b. характеристики любой реальной поверхности;

c. прямолинейность осей поверхности вращения;

d. прямолинейность цилиндра и конуса.

11. Какие виды взаимозаменяемости различают:

a. функциональная;

b. алгебраическая;

c. геометрическая;

d. полная.

12. К суммарным отклонениям формы и расположения относятся:

a. торцовое биение;

b. заданное биение;

c. радиальное биение;

d. нормальное биение.

13. Условный знак допуска плоскости выглядит:

a. ;

14. Условный знак допуска формы заданной поверхности:

c. ;

15. По каким классам точности установлены общие допуски размеров:

a. последний, средний;

b. нормальный, точный;

c. точный, средний;

d. грубый, очень грубый.

16. Какое обозначение имеет шариковый радиальный подшипник:

a. 0;

17. Какое обозначение имеет шариковый радиальный сферический подшипник:

b. 1;

18. Какое обозначение имеет роликовый радиальный с витыми роликами подшипник:

d. 5.

19. Какое обозначение имеет шариковый радиально-упорный подшипник:

c. 6;

20. Основными достоинствами резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

21. Основными недостатками резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

22. Для метрических резьб стандартизированы:

a. профиль резьбы;

b. номинальные диаметры и шаги;

c. нормы точности;

d. нет правильного ответа.

23. В зависимости, от каких характеристик функционирования различают резьбовые соединения:

a. неподвижные;

b. подвижные;

c. стандартные;

d. нестандартные.

24. Качество измерений, отражающее близость к нулю систематических погрешностей и их результат:

a. правильность измерений;

b. сходимость измерений;

d. нормальность измерений.

25. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

26. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

27. Какой взаимозаменяемости полная взаимозаменяемость предполагает наличие:

a. полная;

b. неполная;

c. начальная;

d. конечная.

28. Предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

29. Действительный размер это:

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

30. Номинальный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

31. Наибольший предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

32. Действительное отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

33. Предельное отклонение это:

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

34. Верхнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

35. Нижнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

36. Основное отклонение это:

a. одно из двух предельных отклонений определяющее положение поля допуска относительно нулевой линии;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

37. Квалитет - это:

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

38. Допуск - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

d. отверстие, нижнее отклонение которого равно нулю.

39. Поле допуска - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

40. Основное отверстие - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

41. Характер соединения двух деталей, определяемый разностью их размеров до сборки:

a. допуск;

b. посадка;

42. Разность между размерами отверстия и вала до сборки, если размер отверстия больше размера вала:

a. допуск;

b. посадка;

c. зазор;

43. Разность между размерами вала и отверстия до сборки, если размер вала больше размера отверстия:

a. допуск;

b. посадка;

d. натяг.

44. Разность между наибольшим и наименьшим предельными размерами или алгебраическая разность между верхним и нижним отклонениями:

a. допуск;

b. посадка;

45. Наименьший зазор - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

46. Наибольший зазор - это:

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

47. Посадка с натягом - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке.

48. Наименьший натяг - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наименьший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

49. Наибольший натяг - это:

a. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке;

b. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

c. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

Заключение

Тестирование является одним из основных видов проверки знаний, как во время вступительной комиссии в высшее учебное заведение, так и в процессе обучения. Этот метод проверки знаний позволяет давать оценку беспристрастно, системно, объективно и достаточно быстро, исключая субъективные особенности экзаменатора.

В курсовой работе были рассмотрены основные модели тестовых заданий (классический, адаптивный, с учетом времени, с учетом сложности), их достоинства и недостатки. Так же было разработано компьютерное тестирование для проверки знаний у студентов физического факультета по темам: «Допуски, посадки и технические измерения».

Тестовые задания познавательны для обучающихся, они способствуют развитию интереса к предмету и повышают качество знаний. Обучающиеся с разным уровнем подготовки чувствуют себя психологически комфортно при проведении теста. Тестовые задания способствуют развитию мышления, учат сопоставлять и сравнивать, анализировать и делать выводы, планировать дальнейшую деятельность.

На основе материала данной курсовой работы можно сказать, что использование тестов для проверки знаний студентов является надежным и перспективным методом и может широко использоваться и в дальнейшем.

Список использованных источников

знание тестовый задание

1. Социологический справочник / под ред. В.И. Воловича. - Киев, 1990. - 379 с.

2. Социологический словарь / сост.: А.Н. Елсуков, К.В. Шульга. - Мн., 1991. - 528 с.

3. Фонд времени и мероприятия в социальной сфере / под ред. В.Д. Патрушева. - М.: Наука, 1989. - 176 с.

4. Беспалько, В.П. Системно-методическое обеспечение учебно-воспитательного процесса подготовки специалистов / В.П. Беспалько, Ю.Г. Татур - М.: «Высшая школа», 1989. - 144 с.

6. Глова, В.И. Мягкие вычисления (soft computing) и их приложения / В.И. Глова, И.В. Аникин, М.А. Аджели. - Казань: 2000. - 98 с.

Подобные документы

    История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

    презентация , добавлен 07.04.2014

    Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

    курсовая работа , добавлен 30.08.2010

    Значение проверки знаний учащихся по биологии. Классификация тестовых заданий. Основные формы и методы проверки знаний и умений учащихся. Использование тестовых заданий для текущей и итоговой проверки. Обучение учащихся работе с тестовыми заданиями.

    курсовая работа , добавлен 17.03.2010

    Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

    курсовая работа , добавлен 28.10.2008

    Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

    реферат , добавлен 31.03.2011

    Цель проведения и методы оценочной процедуры. Составление контрольно-измерительных материалов для итоговой аттестации по технической механике. Структуризация банка заданий. Оценка результатов тестирования. Экспертиза и апробация банка тестовых заданий.

    дипломная работа , добавлен 25.05.2014

    Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

    курсовая работа , добавлен 27.12.2011

    История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

    реферат , добавлен 05.02.2008

    Методологические основы создания тестовых заданий, их особенности, класификация, критерии качества, экспертиза. Проверка в тестовых заданиях законов сохранения энергии, сохранения импульса и сохранения момента импульса.

    дипломная работа , добавлен 29.07.2011

    Теоретико-методические основы тестовых заданий и его видов. Психолого-педагогические основы. Тесты на уроках математики. Анализ опыта учителей по применению тестовых заданий. Краткая характеристика преимуществ использования тестовой формы контроля.

Психологическое тестирование - термин зарубежной психологии, обозначающий процедуру установления и измерения индивидуально-психологических отличий.

Психологическое тестирование используется в различных сферах: профориентации, профотборе, психологическом консультировании, планировании коррекционной работы и т.д.

Психологический тест - стандартизированное задание, по результатам выполнения которого судят о психофизиологических и личностных характеристиках, знаниях, умениях и навыках испытуемого.

На создание эффективного психологического теста уходит от 10 лет работы авторских коллективов. Качество теста обеспечивается многоступенчатой процедурой проверки и стандартизации его шкал.

С появлением первых тестов наиболее употребляемым термином, с помощью которого обозначается измерение индивидуально-психологических особенностей, стал термин «психологическое тестирование». Первоначально термин «психологическое тестирование» использовался широко, включая в себя любое измерение в психологической науке. По мере развития тестов, сфера психологического тестирования сузилась до измерения личностных и когнитивных особенностей.

Характеристики психологических тестов:

Стандартность - тестовая методика проходит стандартизацию, по итогам которой получаемые данные должны соответствовать закону нормального распределения или же норме социокультурного характера. В соответствии с нормами формируются диапазоны значений говорящие нам о силе выраженности исследуемого признака.

Надежность - свойство теста давать при повторном измерении близкие результаты. Надежная методика дает сходные результаты независимо от времени года или пола экспериментатора, влияния подобных фоновых факторов, должно сводится к минимуму самой методикой, что и определяет ее надежность.

Валидность - соответствие результатов теста той характеристике, для измерения которой он предназначен. Различают внутреннюю и внешнюю валидность. В случае с внешней это соответствие может быть проверенно положительной корреляцией, с объективными достижениями, результаты по тесту интеллекта, могут сопоставляться с академической успеваемостью. В случае с внутренней все сложнее, здесь речь идет о теоретической связи, о том, насколько выстроенная модель реально моделирует заявленный аспект.

Виды тестов:

Психологический тест - стандартизированное испытание, по результатам выполнения которого судят о психофизиологических и личностных свойствах (чертах, способностях, состояниях) испытуемого. Тесты, по которым судят о знаниях, умениях и навыках испытуемого, занимают промежуточное положение между психологическими, образовательными и проф. тестами.

Вербальный тест - тест, построенный на использовании языка, когда тестируемый, выполняя задание, должен не совершать действия, а описать их словами.

Стандартизованный тест - психологический тест с четко определенными неизменным списком вопросов, инструкцией, методами обработки результатов и подсчета баллов.

Тесты личности - тесты психологического тестирования, направленные на изучение характера, способностей, эмоций, потребностей и других свойств человеческой личности. Личностные тесты подразделяются на: проективные тесты, личностные опросники и тесты деятельности (ситуационные тесты).

Тест достижений - стандартизированный тест, используются также в целях профессионального отбора: конструируемый на учебном материале; предназначенный для оценки уровня овладения учебными знаниями и навыками.

Тест имитации - психологический тест, состоящий в том, что человеку предлагается выполнить задание, хотя ситуация, в которой предстоит выполнить задание, не воссоздается. Тест имитации используется в процессе отбора претендентов на работу.

Тест на профессиональную пригодность - психологический тест, направленный на выявление индивидуальных интересов и предпочтений. Такие тесты помогают определить работу наиболее предпочтительную для конкретного человека.

Тест интеллекта - тесты психологического тестирования, направленные на изучение степени развития интеллекта у человека. Задания тестов интеллекта: адресуются к словесно-логическому мышлению или направлены и на оценку развития наглядно-образного и наглядно-действенного мышления; позволяют характеризовать память, внимание, пространственную ориентировку, вербальное развитие и др.

Методы психологии - основные пути и приемы научного показания психических явлений и их закономерностей.

В психологии принято выделять четыре группы методов изучения психики.

Одним из видов эмпирических методов является тестирование.

Тест - кратковременное задание, выполнение которого может служить показателем совершенства некоторых психических функций. Задачей тестов является не получение новых научных дачных, а испытание, проверка.

Тесты – более или менее стандартизированные кратковременные испытания свойств личности. Существуют тесты, направленные на оценку интеллектуальных, перцептивных способностей, двигательных функций, личностных особенностей, порога возникновения тревоги, досады в определенной ситуации или интереса, проявляемого к тому или иному виду активности. Хороший тест – результат большой предварительной экспериментальной проверки. Теоретически обоснованные и экспериментально апробированные тесты имеют научное (дифференциация испытуемых по уровню развития того или иного свойства, особенностей и т.п.) и, главное, практическое (профотбор) значение.

Наиболее широко известны и популярны личностные тесты, направленные на определение уровня интеллектуального развития личности. Однако в настоящее время они все меньше и меньше применяются для отбора, хотя первоначально были созданы именно для этого. Такое ограничение применения данных тестов может быть объяснено целым рядом - причин. Но именно благодаря их использованию, критике по поводу злоупотребления тестами и мерам, предпринятым для их улучшения, стали значительно лучше понимать сущность и функционирование интеллекта.

При разработке первых тестов были выдвинуты два основных требования, которым должны удовлетворять «хорошие» тесты: валидность и надежность.

Валидность теста заключается в том, что он должен оценивать именно то качество, для которого предназначен.

Надежность теста заключается в том, что его результаты воспроизводятся с хорошим постоянством у одного и того же человека.

Также очень важным является требование нормализации теста. Это означает, что для него в соответствии с данными испытания эталонной группы должны быть установлены нормы. Такая нормализация может не только четко определить группы лиц, к которым может быть применен данный тест, но и располагать результаты, получаемые при тестировании испытуемых, на кривой нормального распределения эталонной группы. Очевидно, было бы нелепо использовать нормы, полученные на студентах университета, для оценки (с помощью тех же тестов) интеллекта детей начальной школы, или применить нормы для детей из западных стран при оценке умственных способностей молодых африканцев или азиатов.

Таким образом, критерии интеллекта в такого рода тестах обусловливаются преобладающей культурой, т.е. теми ценностями, которые первоначально сложились в западно-европейских странах. При этом не учитывается, что у кого-то могут быть совершенно иное семейное воспитание, иной жизненный опыт, иные представления (в частности, о значении теста), а в некоторых случаях и плохое владение тем языком, на котором говорит большинство населения.

Подходы к изучению эмоций

Методами научного познания называются методы, при помощи которых ученые получают надежные и достоверные знания о психологических явлениях. Эти знания в отличие от тех, которые получают и имеют люди в обычной, повседневной жизни, представляются достаточно точными и проверяемыми. Последнее означает, что правильность научных знаний можно повторно проверить в специальном исследовании, если оно организовано и проводится в соответствии с правилами науки. К таким правилам, в частности, относятся законы строгой логики мышления, следование которым позволяет получать достоверные знания.

В каждой науке существуют свои методы познания, соответствующие природе тех явлений, которые в данной науке изучаются. Вместе с тем, в разных науках используются одинаковые методы исследования. Это, например, наблюдение и эксперимент.

Каким образом можно изучать эмоции? Их можно изучать, непосредственно наблюдая за ними, фиксируя, оценивая и описывая их в том виде, в каком они представлены в ощущениях человека. Интроспекция с давних пор применяется в психологии. Однако этот метод не вполне надежен, так как с его помощью невозможно получать в должной степени достоверную, объективную информацию о психических явлениях. Он не позволяет изучать те явления, которые человеком не полностью осознаются. Тем не менее это единственный метод, с помощью которого психические явления можно наблюдать и оценивать непосредственно.

Косвенно об эмоциях можно судить по тем внешним признакам, в которых они проявляются. Это – двигательные и другие телесные реакции человека, непосредственно связанные с эмоциями, его речь и поступки. Подобный метод изучения психических явлений называют объективным, имея в виду то, что о психических явлениях в данном случае судят по внешним, отчетливо наблюдаемым признакам. Данный метод также далеко не всегда позволяет получать абсолютно точные и вполне достоверные знания о психических явлениях, так как между психическими явлениями, телесными изменениями, словесными реакциями и поведением человека нет однозначной связи.

О психических явлениях, в принципе, можно судить по тому, что сам человек говорит о них. Такой метод изучения психических явлений называется самоотчетом или опросом. Для того чтобы делать правильные выводы о законах, которым подчиняются психические явления, можно создать условия, при которых эти явления будут целенаправленно изменяться, и далее внимательно следить за их изменениями. Этот метод исследования психических явлений получил название эксперимента. Он был заимствован психологами из других, более развитых, чем психология, наук и способствовал тому, что психология стала признанной, современной наукой.

В художественной литературе описано немало случаев (особенно в детективах), когда экспериментатор специально моделирует ситуацию, а испытуемый в этой ситуации проявляет те или иные эмоции, свидетельствующие о причастности его к преступлению. Об эмоциональном состоянии творческого человека можно судить по его произведению. Однако художественное произведение не всегда точно отражает эмоциональное состояние автора. В данном случае примешивается степень «вхождения в роль». Более точное представление об эмоциональном состоянии человека могут дать его дневники. В дневниках человек обычно излагает не только свои мысли, но и переживания.

Хорошее представление об эмоциональном состоянии человека можно получить, исследуя его письма. В произведении Т. Драйзера «Американская трагедия» описана ситуация, когда письма Роберты к Клайду, в которых отражено эмоциональное состояние Роберты незадолго до ее смерти произвели настолько сильное впечатление на присяжных и публику, что Клайда приговорили к казни.

Психологическими тестами называются методы, с помощью которых можно достаточно точно описывать и количественно оценивать изучаемые психологические явления. Психологические тесты являются стандартизированными в указанном выше смысле слова методами научного исследования, их нельзя произвольно изменять и необходимо применять точно так, как описано в соответствующей инструкции. Тесты составляют основную группу современных методов изучения психических явлений, в том числе и психических.

Искусно составленные тесты также могут быть одним из подходов к изучению эмоциональных свойств личности. Однако составление таких тестов должно быть научно обоснованным. Например, зачастую в психологии используются тесты, основанные на выборе цветов при рисовании той или иной картинки. Однако, например, картинки, в которых преобладает черный цвет не всегда свидетельствует о том, что испытуемый был в мрачном эмоциональном состоянии. Ученик, зная о том, что проводится тестирование, мог нарочно нарисовать картинку в мрачных тонах.

Таким образом, необходимо составлять тесты таким образом, чтобы по ним можно было определить и другие свойства личности.

ЗАКЛЮЧЕНИЕ

Эмоции играют очень большую роль в жизни каждого человека. С помощью эмоций мы определяем значимость внешних воздействий и оцениваем собственное поведение. Все наши победы и поражения окрашены эмоциями. Многие жизненные события запоминаются именно благодаря пережитым эмоциям. Воспитание культуры эмоций и чувств учащихся составляет важное направление в общей воспитательной работе семьи и школы, является актуальной задачей литературы, искусства, средств массовой информации. Неумение управлять своими эмоциями нарушает его межличностные взаимодействия с другими людьми, не позволяет адекватно строить производственные, семейные, дружеские отношения, становится препятствием для выбора и успешного овладения многими профессиями. Гармоничное развитие эмоциональной сферы необходимо каждому человеку для полноценной жизни в обществе, адекватного отношения к другим людям и самому себе, для сохранения своего здоровья.

В эмоциях объективно переживаются, становятся внутренним событием отношения человека к миру и к самому себе, поэтому эмоции и чувства так или иначе присутствуют во всей психологии личности.

Эмоции представляют собой важную, выразительно яркую и значимую сторону исконной, атрибутивной субъективности психического образа мира.

Практические переживания есть у человека всегда, хотя и не обязательно выражены, представлены его сознанию и самосознанию.

Личность существует, функционирует и развивается во взаимодействиях, общении, в отношении с другими людьми. Эти отношения закладываются в направленности личности, выражаются в ее характере, а переживаются в эмоциях, т.е. становятся для личности некоторым субъективно отмеченным фактом ее психической жизни, поэтому эмоции и чувства по определению взаимодействуют со всей психикой человека. Они феноменологически и функционально пересекаются с деятельностями, потребностями, способностями, сознанием и самосознанием, темпераментом и характером, психическим опытом и речью, с познавательной, оценочной, волевой и регулярной сферами психики.

Также на основании анализа литературных источников можно сделать следующие выводы:

1. Эмоции можно изучать, непосредственно наблюдая за ними, фиксируя, оценивая и описывая их в том виде, в каком они представлены в ощущениях человека.

2. Интроспекция с давних пор применяется в психологии. Однако этот метод не вполне надежен, так как с его помощью невозможно получать в должной степени достоверную, объективную информацию о психических явлениях.

3. О психических явлениях, в принципе, можно судить по тому, что сам человек говорит о них. Такой метод изучения психических явлений называется самоотчетом или опросом.

4. Для того чтобы делать правильные выводы о законах, которым подчиняются психические явления, можно создать условия, при которых эти явления будут целенаправленно изменяться, и далее внимательно следить за их изменениями. Этот метод исследования психических явлений получил название эксперимента.

5. При изучении психических явлений можно использовать тесты, однако они должны быть искусно составлены.


Похожая информация.


Тестирование программного обеспечения - это оценка разрабатываемого программного обеспечения/продукта, чтобы проверить его возможности, способности и соответствие ожидаемым результатам. Существуют различные типы методов, используемые в области тестирования и обеспечения качества о них и пойдет речь в данной статье.

Тестирование программного обеспечения является неотъемлемой частью цикла разработки программного обеспечения.

Что такое тестирование программного обеспечения?

Тестирование программного обеспечения - это не что иное, как испытание куска кода к контролируемым и неконтролируемым условиям эксплуатации, наблюдение за выходом, а затем изучение, соответствует ли он предварительно определенным условиям.

Различные наборы тест-кейсов и стратегий тестирования направлены на достижение одной общей цели - устранение багов и ошибок в коде, и обеспечения точной и оптимальной производительности программного обеспечения.

Методика тестирования

Широко используемыми методами тестирования являются модульное тестирование, интеграционное тестирование, приемочное тестирование, и тестирование системы. Программное обеспечение подвергается этим испытаниям в определенном порядке.

3) Системное тестирование

4) Приемочные испытания

В первую очередь проводится модульный тест. Как подсказывает название, это метод испытания на объектном уровне. Отдельные программные компоненты тестируются на наличие ошибок. Для этого теста требуется точное знание программы и каждого установленного модуля. Таким образом, эта проверка осуществляется программистами, а не тестерами. Для этого создаются тест-коды, которые проверяют, ведет ли программное обеспечение себя так, как задумывалось.


Отдельные модули, которые уже были подвергнуты модульному тестированию, интегрируются друг с другом, и проверяются на наличие неисправностей. Такой тип тестирования в первую очередь выявляет ошибки интерфейса. Интеграционное тестирование можно осуществлять с помощью подхода "сверху вниз", следуя архитектурному сооружению системы. Другим подходом является подход «снизу вверх», который осуществляется из нижней части потока управления.

Системное тестирование

В этом тестировании, вся система проверяется на наличие ошибок и багов. Этот тест осуществляется путем сопряжения аппаратных и программных компонентов всей системы, и затем выполняется ее проверка. Это тестирование числится под методом тестирования "черного ящика", где проверяются ожидаемые для пользователя условия работы программного обеспечения.

Приемочные испытания

Это последний тест, который проводится перед передачей программного обеспечения клиенту. Он проводится, чтобы гарантировать, что программное обеспечение, которое было разработано отвечает всем требованиям заказчика. Существует два типа приемо-сдаточных испытаний - то, которое осуществляется членами команды разработчиков, известно, как внутреннее приемочное тестирования (Альфа-тестирование), а другое, которое проводится заказчиком, известно, как внешнее приемочное тестирования.

Если тестирование проводится с помощью предполагаемых клиентов, оно называется приемочными испытаниями клиента. В случае если тестирование проводится конечным пользователем программного обеспечения, оно известно, как приемочное тестирование (бета-тестирование).

Есть несколько основных методов тестирования, которые формируют часть режима тестирования программного обеспечения. Эти тесты обычно считаются самодостаточными в поиске ошибок и багов во всей системе.

Тестирование методом черного ящика

Тестирование методом черного ящика осуществляется без каких-либо знаний внутренней работы системы. Тестер будет стимулировать программное обеспечение для пользовательской среды, предоставляя различные входы и тестируя сгенерированные выходы. Этот тест также известен как Black-box, closed-box тестирование или функциональное тестирование.

Тестирование методом белого ящика

Тестирование методом "Белого ящика", в отличие от "черного ящика", учитывает внутреннее функционирование и логику работы кода. Для выполнения этого теста, тестер должен иметь знания кода, чтобы узнать точную часть кода, имеющую ошибки. Этот тест также известен как White-box, Open-Box или Glass box тестирование.

Тестирование методом серого ящика

Тестирование методом серого ящика или Gray box тестирование, это что-то среднее между White Box и Black Box тестированием, где тестер обладает лишь общими знаниями данного продукта, необходимыми для выполнения теста. Эта проверка осуществляется посредством документации и схемы информационных потоков. Тестирование проводится конечным пользователем, или пользователям, которые представляются как конечные.

Нефункциональные тесты

Безопасность приложения является одной из главных задач разработчика. Тестирование безопасности проверяет программное обеспечение на обеспечение конфиденциальности, целостности, аутентификации, доступности и безотказности. Индивидуальные испытания проводятся в целях предотвращения несанкционированного доступа в программный код.

Стресс-тестирование является методом, при котором программное обеспечение подвергается воздействию условий, которые выходят за рамки нормальных условий работы программного обеспечения. После достижения критической точки, полученные результаты записываются. Этот тест определяет устойчивость всей системы.


Программное обеспечение проверяется на совместимость с внешними интерфейсами, такими как операционные системы, аппаратные платформы, веб-браузеры и т.д. Тест на совместимость проверяет, совместим ли продукт с любой программной платформой.


Как подсказывает название, эта методика тестирования проверяет объем кода или ресурсов, которые используются программой при выполнении одной операции.

Это тестирование проверяет аспект удобства и практичности программного обеспечения для пользователей. Легкость, с которой пользователь может получить доступ к устройству формирует основную точку тестирования. Юзабилити-тестирование охватывает пять аспектов тестирования, - обучаемость, эффективность, удовлетворенность, запоминаемость, и ошибки.

Тесты в процессе разработки программного обеспечения

Каскадная модель использует подход "сверху-вниз", независимо от того, используется ли она для разработки программного обеспечения или для тестирования.

Основными шагами, участвующими в данной методике тестирования программного обеспечения, являются:

  • Анализ потребностей
  • Тест дизайна
  • Тест реализации
  • Тестирование, отладка и проверка кода или продукта
  • Внедрение и обслуживание

В этой методике, вы переходите к следующему шагу только после того, как вы завершили предыдущий. В модели используется не-итерационный подход. Основным преимуществом данной методики является ее упрощенный, систематический и ортодоксальный подход. Тем не менее, она имеет много недостатков, так как баги и ошибки в коде не будут обнаружены до этапа тестирования. Зачастую это может привести к потере времени, денег, и других ценных ресурсов.

Agile Model

Эта методика основана на избирательном сочетании последовательного и итеративного подхода, в дополнение к довольно большому разнообразию новых методов развития. Быстрое и поступательное развитие является одним из ключевых принципов этой методологии. Акцент делается на получение быстрых, практичных, и видимых выходов. Непрерывное взаимодействие с клиентами и участие является неотъемлемой частью всего процесса разработки.

Rapid Application Development (RAD). Методология быстрой разработки приложений

Название говорит само за себя. В этом случае методология принимает стремительный эволюционный подход, используя принцип компонентной конструкции. После понимания различных требований данного проекта, готовится быстрый прототип, а затем сравнивается с ожидаемым набором выходных условий и стандартов. Необходимые изменения и модификации вносятся после совместного обсуждения с заказчиком или группой разработчиков (в контексте тестирования программного обеспечения).

Хотя этот подход имеет свою долю преимуществ, он может быть неподходящим, если проект большой, сложный, или имеет чрезвычайно динамический характер, в котором требования постоянно меняются.

Спиральная модель

Как видно из названия, спиральная модель основана на подходе, в котором есть целый ряд циклов (или спиралей) из всех последовательных шагов в каскадной модели. После того, как начальный цикл будет завершена, выполняется тщательный анализ и обзор достигнутого продукта или выхода. Если выход не соответствует указанным требованиям или ожидаемым стандартам, производится второй цикл, и так далее.

Rational Unified Process (RUP). Рациональный унифицированный процесс

Методика RUP также похожа на спиральную модель, в том смысле, что вся процедура тестирования разбивается на несколько циклов. Каждый цикл состоит из четырех этапов - создание, разработка, строительство, и переход. В конце каждого цикла продукт/выход пересматривается, и далее цикл (состоящий из тех же четырех фаз) следует при необходимости.

Применение информационных технологий растет с каждым днем, также и важность правильного тестирования программного обеспечения выросло в разы. Многие фирмы содержат для этого штат специальных команд, возможности которых находятся на уровне разработчиков.