Понятие тестовых норм в психодиагностике

На этапе разработки теста, и любого другого способа проводится процедура стандартизации, которая включает три этапа.

Первый этап стандартизации психотерапевтического теста пребывает в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической обстановке.

Второй этап стандартизации психотерапевтического теста пребывает в создании единообразной оценки исполнения теста: стандартной интерпретации взятых результатов и предварительной стандартной обработки. Данный этап предполагает кроме этого сравнение взятых показателей с нормой исполнения этого теста для данного возраста (к примеру, в тестах интеллекта), пола и т.д.

Третий этап стандартизации психотерапевтического теста пребывает в определении норм исполнения теста.

Нормы разрабатываются для разных возрастов, профессий, полов и др. Вот кое-какие из существующих видов норм:

Школьные нормы разрабатываются на базе тестов школьных достижений либо тестов школьных свойств. Они устанавливаются для каждой школьной ступени и действуют по всей стране.
Опытные нормы устанавливаются на базе тестов для различных опытных групп (к примеру, механиков различного профиля, машинисток и др.).
Локальные нормы устанавливаются и используются для узких категорий людей, отличающихся наличием неспециализированного- показателя – возраста, пола, географического района, социо-экономического статуса и др. К примеру, для теста Векслера на интеллект нормы ограничены возрастными рамками.
Национальные нормы разрабатываются для представителей данной народности, нации, страны в целом. Необходимость таких норм определяется конкретной культурой, традициями и моральными требованиями каждой нации.

Наличие нормативных данных (норм) в стандартизованных способах психодиагностики есть их значительной чёртом. Нормы нужны при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования.

Определение норм для теста

На этапе создания теста формируется некая несколько испытуемых, на которой проводится этот тест. Средний итог исполнения этого теста в данной группе принято вычислять нормой. Средний итог – это не единственное число, а диапазон значений.Существуют определенные правила формирования таковой группы испытуемых, либо, как ее в противном случае именуют, выборки стандартизации. Правила формирования выборки стандартизации:

1. выборка стандартизации обязана складываться из опрощеных, на которых в принципе ориентирован этот тест, другими словами в случае, если создаваемый тест ориентирован на детей (к примеру, тест Амтхауэра), то и стандартизация обязана происходить на детях заданного возраста;

2. выборка стандартизации должна быть репрезентативной, другими словами воображать собой уменьшенную модель популяции по таким параметрам, как возраст, пол, профессия, географическое распределение и т.д. Под популяцией понимается, к примеру, несколько дошкольников 6-7 лет, начальников, подростков и т.д.

Значительно чаще в управлениях к тому либо иному тесту возможно встретить выражения нормы не в виде сырых баллов, а в виде стандартных производных показателей. Перевод сырых значений (первичных показателей) в стандартные (производные) делается чтобы результаты, полученные по различным тестам, возможно было сравнивать между собой. Производные показатели получаются методом математической обработки первичных показателей. Первичные показатели по различным тестам нельзя сравнивать между собой по обстоятельству того, что тесты имеют разное внутреннее строение. К примеру, IQ, полученный посредством теста Векслера, нельзя сравнивать с IQ, взятым посредством теста Амтхауэра, поскольку эти тесты исследуют различные изюминки интеллекта и IQ как суммарный показатель по субтестам складывается из показателей различных по содержанию и строению субтестов.

Каждая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которых она вырабатывалась… Применительно к психотерапевтическим тестам они (нормы) никоим образом не безотносительны, не универсальны и не постоянны. Они просто выражают исполнение теста испытуемыми из выборки стандартизации.

15. устойчивость норм, стандартные шкалы в психодиагностике

Репрезентативность – одна из главных психометрических черт теста. Она говорит о возможности применения тестовых норм, выработанных на выборке стандартизации при разработке теста, для всей главной совокупности испытуемых, для которых этот тест рекомендован.

Репрезентативность свидетельствует, что с некоей определенной статистически погрешностью можно считать, что представленное в выборочной совокупности распределение изучаемых психологических особенностей соостветствует их настоящему распределению

В случае, если распределение тестовых баллов отличается от обычного, то для проверки репрезентативности нужно решить вопрос об устойчивости тестовых норм. Для этого производится расщепление выборки пополам и сравнение распределений тестовых баллов в первой и второй половине выборки. Если не распознано различий, то распределение тестовых баллов есть устойчивым, а тестовые нормы репрезентативными.

Репрезентативность тестовых норм — это возможность применения тестовых норм, взятых по итогам выборочного тестирования, для оценки главной совокупности испытуемых.

Психодиагностическая шкала представляет собой количественную модель измеряемого диагностического свойства. Тестовый балл испытуемого соответствует шкальному значению измеряемого психологического свойства. Для сравнения между собой показателей одного и того же испытуемого по различным шкалам применяют стандартные тестовые шкалы (шкала стенок, Т-шкала, IQ).

Диагностические шкалы подразделяют по типам, предусмотренным в математической теории измерения: шкала наименований (номинальная шкала), шкала порядка, шкала промежутков.

В психодиагностике употребляются пара типов стандартных шкал, разрешающих сравнивать между собой показатели различных тестов (субшкал одного теста) в едином масштабе. В большинстве случаев, стандартные шкалы основаны на модели обычного распределения и описываются двумя параметрами значением среднего и стандартного (либо среднеквадратического) отклонения. Перевод в стандартную шкалу проводится методом процедуры стандартизации.

Под стандартизацией шкалы знают линейное преобразование масштаба обычной (либо искусственно нормализованной) шкалы.

Шкала наименований (номинальная шкала). Это самая несложная из всех шкал. В ней числа делают роль ярлыков и помогают для различения и обнаружения изучаемых объектов. Числа, составляющие шкалу наименований, разрешается поменять местами. В данной шкале нет взаимоотношений типа «больше—меньше», исходя из этого кое-какие считают, что использование шкалы наименований не следует вычислять измерением. При применении шкалы наименований смогут проводится лишь кое-какие математические операции. К примеру, ее числа нельзя складывать и вычитать, но возможно подсчитывать, сколько раз (как довольно часто) видится то либо иное число.
Шкала порядка. Места, занимаемые размерами в шкале порядка, именуются рангами, а сама шкала именуется ранговой, либо неметрической. В таковой шкале составляющие ее числа упорядочены по рангам (т.е. занимаемым местам), но промежутки между ними совершенно верно измерить запрещено. В отличие от шкалы наименований шкала порядка разрешает не только установить факт равенства либо неравенства измеряемых объектов, но и выяснить темперамент неравенства в виде суждений: «больше—меньше», «лучше—хуже» и т.п.
Шкала промежутков. Это такая шкала, в которой числа не только упорядочены по рангам, но и поделены определенными промежутками. Особенность, отличающая ее от обрисовываемой дальше шкалы взаимоотношений, пребывает в том, что нулевая точка выбирается произвольно. Примерами смогут быть календарное время (начало летоисчисления в различных календарях устанавливалось по случайным обстоятельствам, температура, потенциальная энергия поднятого груза, потенциал электрического поля и др.).
Шкала взаимоотношений. Эта шкала отличается от шкалы промежутков лишь тем, что в ней строго выяснено положение нулевой точки. Именно поэтому шкала взаимоотношений не накладывает никаких ограничений на математический аппарат, применяемый для обработки результатов наблюдений.

Шкала полных размеров. Во многих случаях напрямую измеряется величина чего-либо. К примеру, конкретно подсчитывается число недостатков в изделии, количество единиц произведенной продукции, сколько студентов присутствует на лекции, количество прожитых лет и т.д. и т.п. При таких измерениях на измерительной шкале отмечаются безотносительные количественные значения измеряемого.

БИЛЕТ 16

Надежность — черта, отражающая точность измерения личных психотерапевтических линия при помощи данного теста. Как мы знаем, что на итог тестирования воздействуют многие факторы: повышенное эмоциональное напряжение, утомление, личности диагноста и особенности обстановки, мотивация испытуемого.

В классической тестологии термин «надёжность» свидетельствует относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых.

Надёжность методики – это критерий, что говорит о точности психотерапевтических измерений, другими словами разрешает делать выводы о том, как внушают доверие полученные результаты.

Это согласованность результатов тестирования испытуемых в различные моменты времени, при первичном и вторичном тестировании и с применением различных по эквивалентности, по содержанию заданий. Надежность характеризует тесты особенностей, но не состояний. Свойства:

1. Воспроизводимость рез-тов изучения.

2. Точность измерения.

3. Устойчивость результатов.

Степень надёжности методик зависит от многих обстоятельств. Среди негативных факторов чаще всего именуются следующие:

1. нестабильность диагностируемого свойства;

2. несовершенство диагностических методик (неосторожно составлена инструкция, задания по собственному характеру разнородны, нечётко сформулированы указания по предъявлению методики испытуемым и т.д.);

3. изменяющаяся обстановка обследования (различное время дня, в то время, когда проводятся опыты, различная освещённость помещения, наличие либо отсутствие посторонних шумов и т.д.);

4. различия в манере поведения экспериментатора (от опыта к опыту по-различному предъявляет инструкции, по-различному стимулирует исполнение заданий и т.д.);

5. колебания в функциональном состоянии испытуемого (в одном опыте отмечается хорошее самочувствие, в другом – утомление и т.д.);

6. элементы субъективности в интерпретации результатов и способах оценки (в то время, когда ведётся протоколирование ответов испытуемых, оценивают ответы по степени полноты, оригинальности.

Одним из наиболее значимых средств увеличения надежности методики есть единообразие процедуры обследования, его строгая регламентация: однообразная ситуация, однотипный темперамент руководств, однообразные для всех временные ограничения, особенности и способы контакта с испытуемыми и без того потом.

На чёрта надёжности методик громадное влияние оказывает исследуемая выборка. Она может, как снижать, так и завышать данный показатель, к примеру, надежность, возможно искусственно завышена, в случае, если в выборке маленькой разброс результатов, т.е. в случае, если результаты по своим значениям близки друг к другу. Исходя из этого в управлении в большинстве случаев делается описание выборки, на котором определялась надёжность методики.

На данный момент надежность все чаще определяется на самые однородных выборках, т.е. на выборках, схожих по полу, возрасту, уровню образования, опытной подготовке и т.п.

Разновидностей надёжности методик так же довольно много, как и условий, воздействующих на результаты диагностических опробований. Так как все виды надёжности отражают степень согласованности двух независимо взятых последовательностей показателей, то математико-статистический приём, благодаря которому устанавливается надёжность методики, — это корреляции (по Пирсону либо Спирмену). Надёжность тем выше, чем больше полученный коэффициент корреляции приближается к единице, и напротив.

НАДЕЖНОСТЬ — одна из тестов характеристик и важнейших методик психодиагностических — один из параметров их качества, относимый к точности измерений психотерапевтических. Отражает точность измерения психотерапевтического и устойчивость результатов к действию посторонних факторов. Чем выше надежность теста либо методики, тем они довольно свободнее от погрешностей измерения. При одном из подходов надежность теста рассматривается как устойчивость, стабильность результатов при повторном тестировании. При втором подходе — как проявление степени эквивалентности двух однообразных по цели и форме (параллельных) тестов. Надежность возможно установить двумя неспециализированными методами: 1) методом сравнения результатов, приобретаемой при помощи данной методики либо теста различными диагностами; 2) методом сравнения результатов, приобретаемой применением данной методики либо теста в аналогичных условиях. Различается множество конкретных способов и видов надёжности определения их уровня. Определение надежности теста не редкость связано с понятием внутренней состоятельности теста; это выражается в расчленении теста на части с последующим сопоставлением результатов частей. Надежность теста определяется кроме этого способами анализа дисперсионного и факторного.

БИЛЕТ 17

Динамичные внутренние факторы, по-различному действующие на различных испытуемых на протяжении тестирования (время так называемой врабатываемости — выхода на точности действий и стабильные показатели темпа по окончании начала тестирования, скорость утомления и т. п.). (Надёжность).

Помехоустойчивость — свойство противостоять действию внешних и внутренних помех. Внешние помехи — это шум, посторонние раздражители, источник внутренних помех — интерференция мнемических следов. Интерференция проявляется или в утрата информации под влиянием последующего поступления нового материала, или в неточностях, вызванных борьбой мнемических следов. Ее воздействие обнаруживается как в краткосрочной, так и в долгосрочной памяти. В краткосрочной памяти деятельность, вклинивающаяся между проверкой сохранения и предъявлением материала, увеличивает скорость утраты информации в зависимости от характера интерференции. В долгосрочной памяти новая поступающая информация интерферирует с уже хранящимся в том месте материалом.

БИЛЕТ 18

Виды надежности. .

Надежность как устойчивость к побочным факторам.

В классической тестологии термин «надежность» свидетельствует относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Надежность методики — это таковой критерий, что говорит о точности психотерапевтических измерений, т. е. разрешает делать выводы о том, как внушают доверие полученные результаты.

Степень надежности методик зависит от многих обстоятельств. Исходя из этого ответственной проблемой практической диагностики есть выяснение факторов, снижающих точность измерений. Была сделана попытка составить классификацию таких факторов:

1.нестабильность диагностируемого свойства;

2.несовершенство диагностических методик (неосторожно составлена инструкция, задания по собственному характеру разнородны, нечетко сформулированы указания, как методику предъявлять испытуемым, и т. д.);

3.изменяющаяся обстановка обследования;

4.различия в манере поведения экспериментатора;

5.колебания в функциональном состоянии испытуемого;

6.элементы субъективности в интерпретации результатов и способах оценки (в то время, когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т. п.).

Виды. К. М. Гуревич внес предложение толковать надежность как комплексную чёрта, включающую:

1.надежность самого измерительного инструмента; коэффициентом надежности

2.стабильность изучаемого показателя; коэффициентом стабильности

3.константность, т. е. относительную независимость результатов от личности экспериментатора; коэффициентом константности.

Определение надежности измерительного инструмента. От того, как составлена методика, как верно подобраны задания с позиций их взаимосогласованности, как она однородна, зависит точность, объективность любого психотерапевтического измерения. Внутренняя однородность методики говорит о том, что ее задания актуализируют одно да и то же свойство, показатель.

Для проверки надежности измерительного инструмента, говорящего о его однородности (либо гомогенности), употребляется так называемый способ «расщепления». В большинстве случаев задания делятся на четные и нечетные, раздельно обрабатываются, а после этого результаты двух взятых последовательностей коррелируются между собой. Для применения этого метода необходимо поставить испытуемых в такие условия, дабы они смогли успеть решить (либо постараться решить) все задания. В случае, если методика однородна, то громадной отличия в успешности ответа по таким половинкам не будет, и, следовательно, коэффициент корреляции будет высоким.

Возможно дробить задания и вторым методом. К примеру, возможно сопоставить первую половину теста со второй, первую и третью четверть со второй и четвертой и т. п. Но «расщепление» на четные и нечетные задания представляется наиболее целесообразным, потому, что этот метод самый свободен от влияния таких факторов, как врабатываемость, тренировка, утомление и пр. Методика согласится надежной, в то время, когда полученный коэффициент не ниже 0,75-0,85. Лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.

Определение стабильности изучаемого показателя. Выяснить надежность самой методики — это не означает решить все вопросы, которые связаны с ее применением. Необходимо еще установить, как устойчив, стабилен показатель, что исследователь собирается измерять. Было бы методологической неточностью рассчитывать на полную стабильность психотерапевтических показателей. В том, что измеряемый показатель со временем изменяется, нет ничего страшного для надежности. Все дело в том, в каких пределах варьируются результаты от опыта к опыту у одного и того же испытуемого, не приводят ли эти колебания к тому, что испытуемый по непонятным обстоятельствам оказывается то в начале, то в середине, то в конце выборки. Сделать какие-то конкретные выводы об уровне представленности измеряемого показателя у для того чтобы испытуемого запрещено. Так, колебания показателя не должны иметь непредсказуемый темперамент. Если не ясны обстоятельства, по которым происходит резкое колебание, то таковой показатель не может быть использован в диагностических целях.

Для проверки стабильности диагностируемого показателя, свойства употребляется прием, узнаваемый называющиеся тест-ретест. Он содержится в повторном обследовании испытуемых посредством той же методики. О стабильности показателя делают выводы по коэффициенту корреляции между результатами первого и второго обследования. Он будет свидетельствовать о сохранении либо несохранении каждым испытуемым собственного порядкового номера в выборке.

На степень устойчивости, стабильности диагностируемого свойства воздействуют разнообразные факторы. Число их велико. Выше уже говорилось о том, как принципиально важно выполнять требования единообразия процедуры проведения опыта. Так, к примеру, в случае, если первое тестирование проводилось в утренние часы, то и повторное должно быть совершено утром; в случае, если первый опыт сопровождался предварительным показом заданий, то и при повторном опробовании это условие кроме этого должно быть соблюдено и т. д.

При определении стабильности показателя громадное значение имеет временной отрезок между первым и вторым обследованием. Чем меньше срок от первого до второго опробования, тем (при других равных условиях) больше шансов, что диагностируемый показатель сохранит уровень первого опробования. С повышением временного промежутка стабильность показателя имеет тенденцию понижаться, поскольку возрастает число посторонних факторов, воздействующих на нее. Следовательно, напрашивается вывод, что целесообразно проводить повторное тестирование через маленький срок по окончании первого. Однако тут имеется собственные сложности: в случае, если срок между первым и вторым опытом маленькой, то кое-какие испытуемые смогут воспроизвести собственные прошлые ответы по памяти и, так, отойдут от смысла исполнения заданий. В этом случае результаты двух предъявлений методики уже нельзя рассматривать как свободные.

Тяжело четко ответить на вопрос, какой срок можно считать оптимальным для повторного опыта. Лишь исследователь, исходя из психотерапевтической сущности методики, условий, в которых она проводится, изюминок выборки испытуемых, обязан выяснить данный срок. Наряду с этим таковой выбор должен быть научно обоснован. В тестологической литературе чаще всего именуются временные промежутки в пара месяцев (но не более полугода). При обследовании детей младшего возраста, в то время, когда развитие и возрастные изменения происходят весьма скоро, эти промежутки смогут быть порядка нескольких недель. Коэффициент стабильности методики должен быть высоким (не ниже 0,80).

Определение константности (относительной независимости результатов от личности экспериментатора). Потому, что методика, созданная для диагностических целей, не предназначена чтобы всегда оставаться в руках собственных создателей, очень принципиально важно знать, в какой мере ее результаты поддаются влиянию личности экспериментатора. Не смотря на то, что диагностическая методика постоянно снабжается подробными руководствами по ее применению, примерами и правилами, показывающими, как проводить опыт, но регламентировать манеру поведения экспериментатора, скорость его речи, тон голоса, паузы, выражение лица весьма тяжело. Испытуемый в собственном отношении к опыту постоянно отразит то, как сам экспериментатор к этому опыту относится (допускает неосторожность либо действует совершенно верно в соответствии с требованиями процедуры, проявляет требовательность, настойчивость либо бесконтрольность и т. п.).

Не смотря на то, что в тестологической практике критерием константности пользуются нечасто, но это не может служить основанием для его недооценки. В случае, если у авторов методики появляются подозрения по поводу вероятного влияния личности экспериментатора на финал диагностической процедуры, то целесообразно проверить методику по этому критерию. Наряду с этим принципиально важно иметь в виду следующий момент. В случае, если под действием нового экспериментатора все испытуемые в однообразной степени стали работать несколько лучше либо несколько хуже, то сам по себе данный факт (не смотря на то, что и заслуживает внимания) на надежность методики не окажет влияния. Надежность изменится только тогда, в то время, когда действие экспериментатора на испытуемых различно: одни стали работать лучше, другие хуже, а третьи равно как и при первом экспериментаторе. Иначе говоря в случае, если испытуемые при новом экспериментаторе поменяли собственные порядковые места в выборке.

Коэффициент константности определяется методом корреляции результатов двух опытов, совершённых в довольно однообразных условиях на одной и той же выборке испытуемых, но различными экспериментаторами. Коэффициент корреляции не должен быть ниже 0,80.

Так как надежность отражает степень согласованности двух независимо взятых последовательностей показателей, то математико-статистический прием, благодаря которому устанавливается надежность методики — это корреляции (по Пирсону либо Спирмену). Надежность тем выше, чем ближе полученный коэффициент корреляции подходит к единице, и напротив.

БИЛЕТ 19

Характеристики психотерапевтических тестов

• Валидность – соответствие результатов теста той характеристике, для измерения которой он рекомендован.

• Надёжность – свойство теста давать при повторном измерении родные результаты. Надёжность как внутренняя согласованность – направленность всех элементов тестовой щкалы на измерение одного качества.

Вали?дность (англ. validity) – мера соответствия того, как результаты и методика изучения соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии.

Как в экспериментальной психологии, так и в статистике валидное измерение – такое измерение, которое измеряет то, что оно должно измерять. Другими словами, например, при валидном измерении интеллекта измеряется конкретно интеллект, а не что-то второе. Безукоризненный опыт (вероятный только в теории) будет владеть безукоризненной валидностью: он будет совершенно верно показывать, что экспериментальный эффект был вызван трансформацией свободной переменной, он будет абсолютно соответствовать действительности, его результаты возможно обобщить без ограничений.

В то время, когда говорят о степени валидности, рассматривается то, как результаты изучения соответствуют поставленным задачам (но наряду с этим валидность не измеряется в каких-либо условных единицах).

БИЛЕТ 20

Виды валидности

Внешняя валидность (англ. external validity) – вид валидности, определяющий то, как результаты конкретного изучения возможно распространить на целый класс аналогичных обстановок/явлений/объектов. Данное понятие возможно разглядывать как междисциплинарное: оно активно используется в экспериментальной психологии, а также в других сферах науки.

Операциональная валидность – частный случай внешней валидности, степень плана эксперимента и соответствия методики контролируемой догадке.

Операциональная валидность определяет степень соответствия применяемой экспериментальной методики (экспериментальных утверждений) теоретическим положениям, каковые положены в проведения и основу организации данного опыта.

Частью операциональной валидности можно считать конструктную валидность

Констру?ктная вали?дность – частный случай операциональной валидности, степень адекватности способа интерпретации экспериментальных данных теории, которая определяется правильностью потребления терминов той либо другой теории.

Конструктная валидность имеет отношение к попыткам обозначения любых качеств опыта. Опасности нарушения конструктной валидности заключаются в неправильном обозначении эффекта и причины посредством абстрактных терминов, терминов, забранных из обыденного языка либо формальной теории.

Внутренняя валидность (англ. internal validity) – вид валидности, степень влияния свободной переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше возможность того, что изменение зависимой переменной позвано трансформацией конкретно свободной переменной (а не чего-либо ещё) Данное понятие возможно разглядывать как междисциплинарное: оно активно используется в экспериментальной психологии, а также в других сферах науки.

Экологическая валидность – степень соответствия условий опыта исследуемой действительности. К примеру, в известном опыте Курта Левина по изучению типов лидерства отношения в группах подростков мало соответствовали отношениям в стране, следовательно, была нарушена экологическая валидность.

Надёжность как устойчивость

Устойчивость результатов теста – возможность получения однообразных результатов у испытуемых в разных случаях.

Устойчивость определяется посредством повторного тестирования (ретеста):

В данном способе предлагается совершить пара замеров с некоторым промежутком времени (от семь дней до года) одним и тем же тестом. В случае, если корреляция между результатами разных замеров будет высокой, следовательно, тест достаточно надежный. Но надежность не всех тестов возможно контролировать этим способом, поскольку оцениваемое уровень качества, явление либо эффект смогут быть сами по себе нестабильны (к примеру, отечественное настроение, которое может изменяться от одного замера к следующему). Еще один недочёт МР – это – эффект привыкания. Испытуемые уже привычны с этим тестом, а возможно, кроме того не забывают солидную часть собственных ответов по окончании прошлого заполнения.

Общий психологический практикум. Лекция 9. Прогрессивные матрицы Равена. Тест интеллекта Кеттелла


Интересные записи:

Понравилась статья? Поделиться с друзьями: