страница 1 ... страница 3 | страница 4 | страница 5 страница 6 страница 7 | страница 8
Преимущества метода
- позволяет обрабатывать практически неограниченное число переменных
- допускает многомерное шкалирование
Недостатки
- не так надежен, как метод парных сравнений.
Домашнее задание:
Самостоятельно разберите, что такое надежность, надежность тестов, и чем она отличается от валидности тестов.
ЦЕЛЬ
|
ТИП ДАННЫХ
|
Шкала интервалов или равных отношений
(распределение Гаусса)
|
Шкала порядка или негауссово распределение
|
Шкала наименований
|
описание одной группы
|
Среднее,
стандартное отклонение
|
Медиана,
Внутриквартильный размах
|
Мода
|
определение зависимости между двумя переменными
|
коэффициент корреляции Пирсона
|
Спирмена
b Кенделла
|
Коэффициент сопряженности C
V Крамера,
|
сравнение двух групп
(межгрупповая экспериментальная схема,
НП имеет 2 уровня)
|
непарный t- критерий
(Стьюдента)
|
U-критерий (Манн-Уитни)
|
2 (Пирсона)
|
сравнение трех или более групп
(межгрупповая экспериментальная схема,
НП имеет более 2-х уровней)
|
однофакторный
дисперсионный анализ
для несвязных выборок
|
Критерий Краскала-Уоллиса
|
2 (Пирсона)
|
сравнение группы с самой собой
(интра-индивидуальная схема,
НП имеет 2 уровня)
|
парный t- критерий (Стьюдента)
| Критерий Вилкоксона
|
2 МакНемара
|
сравнение группы с самой собой несколько раз
(интра-индивидуальная схема,
НП имеет более 2-х уровней)
|
однофакторный
дисперсионный анализ
для связных выборок
|
Критерий Фридмана ()
|
Q- критерий Кочрена (Cochran)
|
поиск взаимодействия и главных эффектов при многофакторной экспериментальной схеме
(несколько НП)
|
Многофакторный дисперсионный анализ
|
|
Логлинейный анализ
|
предсказание значения по другой измеряемой переменной
|
Линейная или нелинейная регрессия
|
Непараметрическая регрессия
|
|
4
основы проведения эксперимента
Литература - [1] - гл. 1, 5, 6, [2] - гл. 4
Эксперимент - это тест, проведенный для получения причинных объяснений.
Основы экспериментирования заложил Джон Стюарт Миль (1843-1930). Он считал, что причинность может быть установлена если некоторый результат Х следует из события А; А и Х изменяются вместе; и можно показать, что А дает результат Х.
Чтобы выполнить эти условия, должен быть использован метод, который Миль назвал методом согласия и различий. Согласно этому методу, если происходит А, то происходит и Х; если нет А, то и Х не происходит:
А Х
А Х
Это структура идеального эксперимента, а вот структура реального эксперимента:
А Х
В Х
Основная идея эксперимента - это сравнение, когда появление либо непоявление некоторой переменной контролируется и наблюдается результат. Поэтому понятие контроля имеет большое значение, оно следует из метода согласия и различий. Контроль в эксперименте осуществляется при помощи непосредственного воздействия (А происходит или не происходит), что дает нам основание (базис) для сравнения, а также контроль помогает устранить альтернативные объяснения. Поэтому различают 3 свойства (типа) контроля:
-
сравнение (наличие контрольных (нейтральных) условий для цели сравнения)
-
воздействие (уровни независимой переменной могут быть получены (произведены))
-
постоянство (экспериментальные условия могут быть созданы таким образом, что некоторые аспекты остаются неизменными)
Сравнение, воздействие и постоянство - это и есть определение эксперимента.
Эксперимент происходит, когда производится некоторое сравнение в то время, как остальные аспекты ситуации остаются неизменными.
Преимущества эксперимента:
-
может быть этичным
-
экономичен
-
позволяет контроль
-
может вести к выявлению причинной связи
Переменные в экспериментах
независимые
|
Экспериментатор выбирает их из расчета, что они могут вызвать изменения в поведении. Когда изменения уровня (величины) независимой переменной ведет к изменению поведения, то мы говорим, что поведение контролируется независимой переменной. Если независимая переменная не контролирует поведение, то это называется нулевой результат.
Нулевой результат может иметь несколько интерпретаций:
-
Экспериментатор ошибся, думая, что независимая переменная влияет на поведение. Тогда нулевой результат верен.
-
Изменения независимой переменной не были валидны.
|
зависимые
|
Они зависят от поведения испытуемых, которое, в свою очередь, зависит от независимых переменных. Хорошая зависимая переменная должна быть надежной (т.е., когда мы повторяем эксперимент - те же испытуемые, те же уровни независимых переменных, ... - зависимая переменная должна быть примерно той же. Зависимая переменная ненадежна, если есть проблемы со способом измерения. Другая проблема с зависимой переменной, которая может привести к нулевому результату - это то, что зависимая переменная застряла на самой низкой или самой высокой отметке шкалы. Это называется потолочным эффектом. Этот эффект не дает проявиться влиянию независимой переменной на зависимую переменную. И, наконец, нулевой результат может появиться благодаря статистической обработке данных. Результаты статистического теста могут не подтвердить неверность нуль-гипотезы, в то время как она не верна.
|
контрольные
|
В любом эксперименте существует больше переменных, чем реально можно контролировать, т.е. не существует идеальных экспериментов.
Экспериментатор пытается контролировать как можно больше значимых переменных и надеется, что остальные неконтролируемые переменные будут давать маленький эффект по сравнению с эффектом независимой переменной. Чем меньше эффект независимой переменной, тем тщательнее должен быть контроль.
Нулевые результаты можно также получить, если недостаточно контролировать различные факторы. Это особенно характерно для не лабораторных условий. Вы помните, наверно, что мы называет влияние этих неконтролируемых факторов смешением.
|
5
ЭКСПЕРИМЕНТАЛЬНЫЕ СХЕМЫ
Литература - [1] - гл. 2, 7, 8, [2] - гл. 5
Есть две основные возможности:
-
распределять нескольких испытуемых на каждый уровень независимой переменной
-
распределять всех испытуемых на все уровни
Первая возможность называется
межгрупповая экспериментальная схема - это предъявление каждого из условий независимой переменной разным группам испытуемых.
Вторая возможность называется
Интраиндивидуальная экспериментальная схема - это предъявление одному (или нескольким) испытуемому всех исследуемых условий. Иногда такая схема называется также еще схемой индивидуального эксперимента.
межгрупповая экспериментальная схема
безопасна, так как надежна: один уровень независимой переменной не влияет на другой уровень независимой переменной, так как каждый испытуемый не получает обоих уровней в испытаниях.
НЕДОСТАТОК: существует возможность, что испытуемые в двух группах достаточно различны, чтобы это различие повлияло на эффекты независимой переменной.
Любой межгрупповой эксперимент имеет потенциальную опасность смешения из-за разницы в испытуемых в группах.
Экспериментальной группой называется группа испытуемых, которая подвергается некоторому воздействию, соответствующему важному уровню (значению) независимой переменной.
Контрольная группа - это группа испытуемых, не подвергающихся никакому воздействию или подвергающихся воздействию, соответствующему нулевому уровню независимой переменной.
Существуют разные техники распределения испытуемых по группам, которые помогают избежать этого нежелательного эффекта:
-
распределение по условиям (стратегия попарного отбора)
Это такое распределение, когда экспериментальные и контрольные группы составляются из индивидов, эквивалентных по значимым для экспериментатора побочным параметрам.
Проблемы:
-
невозможность соотнести все характеристики с условиями эксперимента
-
экспериментатор может не знать, какие характеристики надо брать во внимание.
-
даже если группы поделены по характеристикам, все равно экспериментатор может пропустить какую-либо характеристику, потенциально связанную с экспериментальными условиями. Поэтому распределение производится по переменной, которая вероятнее всего может вызвать смешение.
-
распределение по одной переменной может нарушить распределение по другим переменным
-
наконец, есть еще проблема - потеря испытуемых (смертность). Это значит, что один или несколько испытуемых не участвуют в эксперименте до конца, или их поведение меняется радикально по причинам, далеким от независимой переменной. Испытуемый может заболеть, животное может умереть или выполнять тесты с таким количеством ошибок, что результаты становятся не интерпретируемыми. Человек может отказаться от дальнейшего участия. В длительном эксперименте испытуемые могут взрослеть и их характеристики изменятся. И если мы очень тщательно распределили испытуемых по группам по некоторым характеристикам (условиям), то потеря даже одного испытуемого в группе сделает группы неравными и все распределение идет коту под хвост.
Следующая техника распределения делает последнюю проблему менее острой. Это
2) распределение случайным образом (рандомизация)
Эта техника употребляется чаще. При этом методе характеристики испытуемых игнорируются, и распределение по группам является случайным и непредвзятым. Это значит, что любой испытуемый имеет равные шансы попасть в любую группу.
Способы формирования групп:
-
дать испытуемым номера и написать номера на бумажках. Тащить бумажки из шляпы
-
кидать монетку
-
пользоваться таблицей случайных чисел
ПРОБЛЕМЫ:
случайное распределение не гарантирует равенство групп
-
стратегия случайного распределения слоев
Это смешанная стратегия. Выделяется несколько "слоев" (например, мужчины и женщины), а внутри каждого слоя распределение случайное.
Интраиндивидуальная экспериментальная схема
обычно более эффективна, так как каждый испытуемый сравнивается сам с собой при различных экспериментальных условиях. Тогда понятно, что если и есть какой эффект, то он получился из-за разницы в уровнях независимой переменной, а не из=за разницы в испытуемых.
Однако и эта схема не без недостатков:
Существует возможность влияния условий одного испытания на последующие, что приведет к невалидности эксперимента.
Каким образом избежать этой трудности? - Существует два способа, которые могут помочь.
-
Случайное распределение. Но не испытуемых, а порядка предъявления уровней независимой переменной.
-
Позиционное УРАВНИВАНИЕ - это достижение численного равенства средних позиций каждого из уровней независимой переменной в последовательности (или наборе последовательностей) их предъявления.
Полное уравнивание требует, чтобы все возможные порядки испытаний были использованы.
Частичное уравнивание:
Каждое условие (уровень независимой переменной) встречается одинаково часто в каждой части эксперимента. Например, условие А встречается 1-м, 2-м, 3-м,... одинаково часто; условие В - тоже, условие С - тоже ... Такая организация называется латинский квадрат.
№
испытуемого
ПОРЯДОК
-
П
Количество испытуемых должно равняться по крайней мере количеству испытаний.
РАВИЛО:
Обычно лучше испытывать больше испытуемых. Это из-за статистики. Тогда их число должно быть кратно п.
-
Можно использовать тот же самый квадрат. После проведения эксперимента стоит провести статистический тест на единственность квадрата. Если тест статистически значимый, то это значит, что частичное уравнивание провалилось и результаты под вопросом. Если тест не значимый, то все хорошо.
-
Можно использовать другой латинский квадрат на каждые следующие п испытуемых. Это хорошо тем, что ближе к полному уравниванию, но хуже тем. Что не существует статистического теста на единственность квадрата. Если предположения о частичном уравнивании были неверны, то мы об этом никогда не узнаем.
-
Существует еще один вид латинского квадрата. Это сбалансированный латинский квадрат:
№
испытуемого
ПОРЯДОК
-
1
|
А
|
В
|
С
|
Д
|
2
|
В
|
Д
|
А
|
С
|
3
|
С
|
А
|
Д
|
В
|
4
|
Д
|
С
|
В
|
А
|
Каждое условие идет до и после каждого другого условия
Многие исследователи верят, что лучше использовать этот квадрат, хотя нет никакого статистического теста, подтверждающего такую точку зрения. В любом случае не повредит его использовать. Правда, такой латинский квадрат имеет недостаток - он не подходит, когда число условий нечетное.
КАК ВЫБИРАТЬ ЭКСПЕРИМЕНТАЛЬНУЮ СХЕМУ
Если независимая переменная дает какой-то предполагаемый длительный эффект, то лучше использовать межгрупповую ЭС. Это случается, когда у вас следующие независимые переменные:
-
вызывающие изменения в развитии или состоянии испытуемого (перепады давления или отравления до рождения…),
-
практически все виды физиологических повреждений, (травмы, повреждения мозга,...)
-
большинство переменных, зависящих от времени (сюда входят вызывающие обучение)
-
большинство переменных, характеризующих испытуемых - пол, возраст, национальность...., но они не являются настоящими независимыми переменными.
6
Сложные (Многофакторные) экспериментальные схемы.
Многофакторные схемы - это экспериментальные схемы, включающие более одной независимой переменной. Каждая переменная может иметь несколько значений. Слово "многофакторный" показывает, что в эксперименте все возможные комбинации уровней всех независимых переменных использованы.
Эксперименты с одной независимой переменной - редкость. Обычно независимых переменных используется несколько (от 2 до 4 - оптимальное число).
Преимущества использования нескольких независимых переменных:
-
Эксперимент с k-мя независимыми переменными эффективнее (дешевле, быстрее), чем k отдельных эксперимента.
-
Экспериментальный контроль обычно лучше в таких случаях, так как в одном эксперименте больше фиксированных переменных - время дня, влажность, температура,.... - чем в k разных экспериментах.
-
Результаты такого эксперимента можно обобщить на условия с k независимыми переменными, то есть показать, что результаты верны в нескольких ситуациях
-
Использование нескольких независимых переменных помогает определить, являются ли результаты валидными при всех уровнях независимой переменной.
Эффект одной независимой переменной в факторном эксперименте называется главным (основным) эффектом - main effect.
Когда эффект, производимый одной независимой переменной, меняется при изменении уровней (величины) другой независимой переменной, то мы получаем взаимодействие (interaction).
Взаимодействие - это количественный результат, обусловленный соотношением между действием двух или нескольких независимых переменных, выделенный в эксперименте. Вычисляется как разность между различиями значений зависимой переменной, полученных при действии разных условий первой, второй и т.д. переменных.
-
Поиск взаимодействия - самая главная причина использовать более одной переменной в эксперименте.
Виды взаимодействия
Главные эффекты статистически независимы от эффектов взаимодействия. Это значит, что зная величину и направление главных эффектов, мы ничего не можем сказать о взаимодействии.
ПРИМЕР:
Независимая переменная 1 Независимая переменная 2
А
|
В
|
В-А
|
|
1
|
2
|
2-1
|
50
|
70
|
20
|
|
30
|
90
|
60
|
-
нет взаимодействия
-
|
А
|
В
|
1
|
30
|
30
|
2
|
70
|
110
|
есть взаимодействие
-
Это пересекающееся взаимодействие. Оно самое надежное, так как не может быть объяснено проблемами измерений и шкалирования зависимой переменной.
Главные эффекты в таблицах одинаковы, а графики все разные.
Мораль: Взаимодействие надо рассматривать прежде, чем делать выводы в эксперименте, где более одной независимой переменной.
КОНТРОЛЬ В МЕЖГРУППОВОЙ ФАКТОРНОЙ СХЕМЕ.
Межгрупповая факторная схема - каждая комбинация независимых переменных дается отдельной группе испытуемых.
Поэтому важно распределять испытуемых по группам непредвзято.
Способы
-
Случайно
-
Используйте сбалансированный латинский квадрат
-
Используйте распределение по условиям (метод попарного отбора).
КОНТРОЛЬ в СЛОЖНОЙ ИНТРАИНДИВИДУАЛЬНОЙ СХЕМЕ
Надо смотреть, нет ли влияния предыдущих условий на последующие. Для уменьшения влияния используем
-
рандомизацию (случайное распределение), но не испытуемых, а уровней независимой переменной
-
случайное распределение блоками (блок-рандомизацию). Главное отличие случайного распределение блоками от случайного распределения - это то, что порядок испытаний рандомизирован дважды (трижды,....). Каждое из n первых условий появляется в случайном порядке в первые 6 испытаний, а затем опять в случайном порядке во вторые n испытаний, ... . Преимущество - гарантирует, что каждое условие будет протестировано перед тем, как все пойдет по второму кругу.
-
уравнивание. Можно использовать латинские квадраты опять.
СМЕШАННАЯ СХЕМА
Это схема, где используется одна или более межгрупповых переменных и одна или более интраиндивидуальных переменных.
Эта схема популярна в изучении поведения при обучении и в физиологических исследованиях, где нас интересует взаимодействие некоторой переменной с практикой или временем. Обычно интересующая нас переменная может оказывать большой эффект влияния, поэтому она изменяется между группами. Практика или время - внутригрупповая переменная, так как тестируются одни и те же испытуемые.
7
Эксперименты с небольшим количеством испытуемых.
Это эксперименты, в которых проводится много наблюдений на маленьком количестве испытуемых. По-английски называются small-n design.
В настоящее время такие экспериментальные схемы используются в основном (но не только!) в
-
психофизике
-
клинической медицине.
ПСИХОФИЗИЧЕСКИЕ ЭКСПЕРИМЕНТЫ.
Психофизика, как нам известно, - это область психологии, которая пытается поставить психологические ощущения в соответствие физическим стимулам. В типичном психофизическом эксперименте небольшое количество испытуемых дает оценку большому количеству стимулов. Часто испытуемому надо оценить одно и то же ощущение несколько раз.
Психофизика включает определение психологической реакции на физические события. Разработка методов, которые позволяют измерять отношения между внутренними впечатлениями и внешним миром - это начало научной психологии.
Измерять ощущения трудно, т.к.
-
они недоступны объективному измерению, как масса камня или интенсивность света
-
внутренние суждения не идентичны количеству физической энергии, влияющей на сенсорный аппарат
Домашнее задание:
Повторите законы Вебера и Фехнера, чтобы вспомнить, что такое психофизика.
Обратная схема
Логика обратной схемы проста: сначала требуется найти базовую величину измерения поведения испытуемого, потом посмотреть, как измениться поведение, когда введена независимая переменная, и наконец, изменить условия обратно к первоначальным и измерить поведение снова.
Основная форма такой схемы записывается как
А - В - А схема.
А и В тут относятся к различным фазам эксперимента. Использование схемы АВ без повторной фазы А не позволяет экспериментатору сделать выводы об эффекте независимой переменной, потому что мы не знаем, произошли ли изменения из-за экспериментальных условий или чего-то еще. Поэтому третья фаза экспериментальной схемы служит, чтобы предотвратить эффект смешения. Если наблюдаемое в третьей фазе поведение вернулось к базисной величине, то мы можем заключить, что это независимая переменная повлияла на изменение поведения в фазе В.
РАСШИРЕННАЯ ОБРАТНАЯ СХЕМА
В стандартном интраиндивидуальном эксперименте иногда случается эффект влияния одного уровня независимой переменной на другие. Тогда обратная схема является непрактичной. Мы рассмотрим один из способов решения проблемы - расширенная обратная схема.
Такие схемы может быть разных видов. Например, Роуз (Rose, 1978) предложила использовать следующую схему:
АСАВСВСВ,
где А - это базисные измерения, В и С - включают разные независимые переменные.
Кушаем крашеное печенье
На примере 2-х гиперактивных девочек 8 лет поверяли, влияют ли искусственные красители на поведение.
Фаза А - девочки сидят на строгой К-Р диете.
Фаза В - другой тип базы (едим то, что ели, и еще овсяное печенье)
Фаза С - едим все, что ели, но овсяное печенье содержит краситель.
Несколько наблюдателей регистрировали поведение девочек в школе.
КЛИНИЧЕСКАЯ ПСИХОЛОГИЯ
Nissen et.al. (1988) исследовал 45-летнюю белую женщину, которая разводилась 5 раз. Она показывала 22 различных личности от 5 до 45 лет. Трое были мужчинами и трое левшами. Тестировали только 8 личностей.
Идея эксперимента была следующей: некоторый материал давался одной личности, потом пациента просили сменить личность и новой личности давали тест, чувствительный к информации, полученной предыдущей личностью.
Результаты показали, что есть задачи, где знания одной личности влияют на другую личность и есть такие задачи, где влияния не обнаружено.
Например, когда Алиса смотрит фотографии, чтобы определить выражения лица, Бонни эти фотографии кажутся знакомыми. А вот когда Алиса оценивает приятность слов, это не дает никакого прайминга для Бонни в задании окончить слово. Однако если Бонни оценивает приятность слов, то через 5 дней она имеет сильный прайминг-эффект.
Это тоже эксперимент с небольшим числом испытуемых (всего 1). Он интересен тем, что сочетает исследование частного случая с исследованиями памяти.
8
Квази-эксперименты.
Квази-эксперименты - это эксперименты, в которых исследователь не изменяет прямо независимую переменную как в типичном лабораторном эксперименте. В квази-эксперименте некоторые независимые переменные выбираются, что значит, что они не контролируются экспериментатором. Иногда это некоторые естественные условия (например, стихийные бедствия, несчастья...), иногда это переменные, характеризующие испытуемых (возраст, пол, вес, ...). В любом случае следует беспокоиться о внутренней валидности, так как экспериментатор не управляет переменными. Значит, метод согласия и различий не под непосредственным нашим контролем. Квази-эксперименты бывают очень интересны, а так же позволяют использовать переменные, которые неэтично менять по нашему усмотрению.
Естественные события.
Ex post factо анализ эффектов некоторых событий (например, несчастье или смена школьной программы) обычно являются важными и интересными, но их трудно интерпретировать как причинные явления.
Большинство квази-экспериментов, которые включают естественные события, имеют структуру
А - В - А,
похожую на ту, что мы проходили для экспериментов с небольшим количеством испытуемых.
Например, мы можем оценить достижения в чтении 3-го класса до и после (фаза А) введения нового метода обучения техники чтения (фаза В)
Это значит наблюдение-условие-наблюдение. Однако условие тут не под контролем экспериментатора и обычно имеет длительный эффект влияния. В то же время изменения происходят и с испытуемыми. Если мы исследуем эффект новой методики обучения на первоклассников, то их возраст изменится в конце эксперимента. Следовательно, возможно смешение двух переменных - возраста и методики преподавания. Хотя возраст сам по себе ничего не изменяет, много разных вещей коррелирует с возрастом: лучшее знакомство со школьной жизнью, увеличение способности решать проблемы, улучшение лингвистических навыков, биологическое взросление, ... Эти факторы, которые обычно называются взрослением, практически всегда вызывают смешение в исследованиях с естественными событиями. Кроме того, в эксперименте в классе существует еще очень много всяких посторонних влияний, которые могут так или иначе влиять на результаты. Так как исследователь не может контролировать способ и место проведения эксперимента, испытуемые не изолированы от многочисленных посторонних влияний как в настоящем эксперименте. Этот источник смешения называется историей.
История и взросление могут изменяться оба или по одному прямо или обратно пропорционально интересующему нас событию или не изменяться вовсе. Один способ, который можно применить в этом случае, - это найти контрольную группу. Тогда квази-экспериментальная схема будет выглядеть так:
Время
Это выглядит как обычная экспериментальная схема, но на самом деле у нас нет непосредственного контроля над ситуацией. Поэтому такая схема часто называется схемой неэквивалентной контрольной группы, так как случайного распределения испытуемых по группам не было, а распределение по условиями происходит только после события.
Так как распределение испытуемых происходило не случайным образом, то возникает проблема предвзятого выбора. Так как мы не распределяем испытуемых по группам, а выбираем группы, у нас нет гарантии, что наш выбор будет таким же непредвзятым как рандомизация в настоящем эксперименте.
Исследование частных случаев
происходит следующим образом: у нас есть некий индивид, с которым что-либо интересующее нас происходило достаточно долгое время. После этого мы делаем наблюдения и измерения какого-либо поведения этого индивида. Это будет схема вида
А - В.
А - это история, В - это текущее (настоящее) поведение.
Сразу же нам виден источник невалидности: не существует контрольного условия.
Анализ отклонения (deviant case analysis) - это способ получить контрольную группу в исследовании частных случаев. В этом случае мы находим индивида как можно подобнее на исследуемого, только с которым не происходило событий, в которых мы интересуемся. (напр., отец-алкоголик, страшная болезнь,...). Потом мы производим сравнение этих двух индивидов.
пример
P.Z. - известный ученый, который страдал потерей памяти. Анализ этого случая был сделан для того, чтобы определить, может ли являться причиной потери памяти неумеренное употребление алкоголя. Коллега P.Z. одинакового с ним возраста был взят для сравнения. Оба ученых исследовались на имена и факты, которые были им знакомы. P.Z. показал практически полную потерю памяти, а его непьющий коллега хорошо все помнил. Вывод, сделанный Butters&Cermak, 1986 - алкоголь вызывает потерю памяти.
Употребление алкоголя - это квази-переменная, т.е. такая, которая была выбрана, а не изменяема. Испытуемый для сравнения тоже был выбран, а не приписан к этому условию случайно, поэтому контроль нельзя считать надежным. Такая контрольная группа иногда называется неэквивалентной.
Все это делает проблематичным возможность сформулировать обоснованные причинные заключения. Все, на что можно надеяться, - это отбросить некоторые факторы как не являющиеся причинными.
В нашем случае очевидно, что возраст и занятие наукой не являются причиной потери памяти. Дополнительный анализ показал, что неспособность P.Z. запоминать новую информацию была подобной на неспособности других алкоголиков (тоже неэквивалентная контрольная группа). Поэтому алкоголь остается первым подозреваемым.
В некотором смысле изучать и интерпретировать историю частного случая - это как работать сыщиком. Типичное исследование включает много независимых переменных. Поэтому исследователь, который хочет делать причинные утверждения, должен искать важные зацепки (ниточки) и интерпретировать их значение в контексте других наблюдений. Увеличивая количество и сложность наблюдений можно добиться лучшего контроля. Однако следует помнить, что частные случаи часто включают ретроспективные сообщения, а это значит, что некоторые события могут быть забыты или искажены, то есть могут не являться внутренне валидными.
Исследование частных случаев - основной источник данных для клинической психологии.
Чтобы увеличить внутреннюю валидность, надо использовать
-
анализ отклонений
-
неэквивалентный контроль
-
много независимых переменных
Длительные исследования с прерыванием
Это исследования вида
наблюдения - условие (событие) - наблюдения.
В простейшем случае мы имеем одну экспериментальную группу, для которой делаем многочисленные наблюдения до и после некоторого события. Вместо того, чтобы исследовать один или 2 класса, мы наблюдаем все классы в городе в течение многих лет до конца их школьной жизни. Мы должны знать, когда последовательность времени была прервана некоторым событием. Тогда мы сравниваем наблюдения до и после интересующего нас события чтобы посмотреть, произошли ли изменения.
Измеряем успеваемость школьников до и после добавления в воду городского водопровода флуорида:
Можно ли сказать, что флуорид вызывает лучшую успеваемость?
А может флуорид вызывает только большую посещаемость? Тогда полезно нарисовать кривую посещаемости рядом с кривой успеваемости. Или найти квази-контрольную (неэквивалентную) группу, которая похожа на нашу экспериментальную, но не употребляла флуорида.
Совет такой:
-
использовать много независимых переменных
-
вести очень аккуратные и точные записи
Даже с записями трудности весьма многочисленны: все меняется (учителя, программа, экономическая обстановка,...) и смешение неизбежно. Самый большой источник невалидности для таких исследований - смертность. Это значит, что испытуемые не могут по какой-либо причине принимать участие в эксперименте (уезжают или умирают). Тогда невозможно сравнить наблюдения и измерения до и после события. Кроме того, эффект исследуемого события может быть вовсе не немедленным. (Например, флуорид способствует необразованию кариеса, а это длительный процесс - годы пройдут, прежде, чем результаты будут заметны). А еще некоторое другое событие может погасить эффект интересующего нас события (например, фабрика конфет переехала в наш город - смерть зубам).
Однако длительные исследования могут быть полезны, особенно в прикладных исследованиях.
Phillips (1972, 1977, 1978, 1983) - боксерские матчи
исследовал причины убийств и самоубийств. Его стратегия - определять количество смертей до и после некоторого события. Количество смертей - зависимая переменная, независимая переменная (квази) - событие, которое прерывает последовательность времени, в течение которого ведутся наблюдения.
Phillips исследовал период 1973-1978 и нашел 12.4% увеличение убийств после проф. боксерских матчей, демонстрировавшихся по телеку. Количество убийств не уменьшалось перед матчами - значит, матчи не запускают убийства, которые и так должны были произойти, если количество совершаемых убийств более-менее постоянно. Во-вторых, азарт тоже ни при чем. Бейсбольные матчи или хоккей не дают увеличения количества убийств.
Поэтому Phillips заключил, что это - результат моделирования (имитации). Убивают людей похожих на проигравшего на ринге.
Чтобы увеличить внутреннюю валидность, надо использовать
-
неэквивалентный контроль
-
много независимых переменных
Экспериментальные схемы с переменными, характкризующие испытуемых.
Переменная, характеризующая испытуемого, - это измеряемая характеристика человека (IQ, вес, тревожность, возраст, пол, а также многочисленные патологии - шизофрения, алкоголизм, травмы мозга, ...). Так как такие переменные не могут быть изменены, то экспериментальная схема называется квази-экспериментальной. Экспериментатор не может изменять такие переменные, он только выбирает испытуемых, которые уже имеют переменные определенной величины и затем сравнивает их с интересующим его поведением. Если испытуемые, различные по IQ, отличаются по поведению, мы не можем сказать, что это IQ вызывает разницу в поведении, так как соответствующие группы испытуемых отличаются также и по мотивации, образованию и т.д. Такая экспериментальная схема дает нам корреляцию, и следовательно, смешение.
Исследуем шизофреников - они хуже нормальных понимают семантические аспекты языка. Это может быть из-за того, что шизофреники не так хорошо образованы, не так умны, не так мотивированы, а может это проблемы с языком вызывают шизофрению?
Что же делать? Можно провести распределение по условиям. Для шизофреников подбираем группу невротиков с похожими IQ, образованием и другими характеристиками. Однако, распределение по условиям имеет серьезные проблемы:
-
требует много усилий, так как некоторые переменные тяжело измерять
-
когда переменные измерены может оказаться, что испытуемых невозможно распределить по группам, так как испытуемых слишком мало (попробуй, найди много шизофреников или народа с нужной травмой мозга)
-
такое распределение резко уменьшает размер выборки, а это влияет на надежность статистических процедур
-
возможно взаимодействие между переменными, по которым мы распределяем испытуемых
-
проблема возврата к средней величине. Среднее значение группы - это сумма всех значений поделенная на количество испытуемых в группе. Обычно если испытуемые, получившие экстремальные значения какой-либо переменной (наибольшие или наименьшие), тестируются повторно, то они получают значения гораздо ближе к среднему группы. Экстремальные значения обычно получаются из-за ошибки измерения. Квази-эксперименты с переменными, характеризующими испытуемых, часто проводятся для оценки образовательных программ. Поэтому помните, что без распределения по условиям практически ничего нельзя сказать о результатах, а если мы распределяем испытуемых по условиям, то нам грозит проблема возврата к среднему.
Возраст как переменная
Возраст - особая переменная, так как она употребляется в психологии развития и является такой неприятной, что были созданы специальные техники работы с нею. На самом деле - это не переменная, это измерение, вдоль которого мы можем исследовать поведение. Некоторые психологи даже предлагают рассматривать возраст как зависимую переменную, потому что она изменяется вместе с другими переменными от рождения до смерти.
Методы:
межвозрастной
(cross-sectional)
|
Если мы хотим посмотреть, как что-либо изменяется с возрастом, мы выбираем группы определенных возрастов (например, 7 и 12 лет) и исследуем эти группы одновременно.
В этом случае мы получаем смешение возраста и поколения. 20 лет назад все было другое - и игры, и фильмы, и отношения,...
|
долговременный
(longitudinal)
|
При этом методе мы выбираем группы испытуемых и исследуем ее на протяжении длительного времени (например, первый раз - в 7 лет, второй раз - в 12). Тут мы исследуем одно поколение. Но неизвестно, произошли ли изменения, которые мы исследуем из-за изменений в возрасте или из-за изменений в мире.
|
возрастной
(time-lag)
|
Этот метод пытается определить эффект времени, фиксируя постоянный возраст (например, только 19-летние тестируются).
|
Возрастно-периодический
(cross-sequential)
|
Это тестирование двух или более возрастных групп в течение двух или более периодов времени. В этом случае вероятнее определить эффекты смешения. Однако проводить такие исследования - адская работа, поэтому такая схема редко используется.
|
Пример:
год
рождения год тестирования
|
1991
|
1992
|
1993
|
1994
|
|
1972
|
19
|
20
|
21
|
22
|
долговременный
|
1973
|
18
|
19
|
20
|
21
|
|
1974
|
17
|
18
|
19
|
20
|
|
1975
|
16
|
17
|
18
|
19
|
возрастной
|
меж- возрастно-
возрастной периодический
Тактика использования возраста и настоящей независимой переменной значит, что исследователь ищет взаимодействие. Любая переменная, которая смешивается с возрастом, может по-другому реагировать на другую независимую переменную. Психолог пытается выяснить, какие компоненты возраста определяют поведение, и в этом поиск определенных взаимодействий может помочь.
Наконец, есть еще метод - вместо поиска взаимодействий попытаться разорвать эффекты переменной, характеризующей испытуемого, и переменных, которые коррелируют с ней и связать результаты определенной теорией.
Пиаже с теорией предсказывает поведение ребенка в зависимости от возраста. Хотя стадии развития ребенка ассоциируются с некоторым хронологическим возрастом, они являются функциями взросления и опыта.
ВЫВОДЫ:
Мы можем выделить следующие источники невалидности квази-экспериментов:
-
история
-
взросление
-
предвзятый выбор
-
смертность
-
медленно проявляющиеся эффекты
-
проблема возврата к средней величине
исследовательская процедура
|
опасности для внутренней валидности
|
пути повышения внутренней валидности
|
частные случаи
| -
история
-
взросление
-
предвзятый выбор
| -
анализ отклонений (неэквивалентный контроль)
-
детективная работа
|
длительные исследования с прерыванием
| -
изменения в испытуемых и окружении
-
медленно проявляющиеся эффекты
| -
неэквивалентная контрольная группа
-
детективная работа
|
схемы с переменными, характеризующими испытуемых
| -
условия, по которым распределять испытуемых
-
возврат к среднему
| -
распределение по условию
-
включение настоящих независимых переменных и поиск взаимодействий
|
схемы с использованием возраста как переменной
|
смешение с
-
временем тестирования
-
поколением испытуемых
| -
включение настоящих независимых переменных и поиск взаимодействий
-
возрастно-периодический метод
|
страница 1 ... страница 3 | страница 4 | страница 5 страница 6 страница 7 | страница 8
|