Лекция: Модифицированный критерий Стьюдента
(парный t-тест) сравнения выборочных средних двух зависимых выборок
Модифицированный критерий Стьюдента.
Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной выборке одинаковых объемов, варианты в которых попарно зависимы. Такие выборки называются зависимыми.
Поскольку обычно хi¹уi (i=1,…n), то необходимо установить, являются ли значимыми различия между результатами попарно зависимых измерений хi и уi. Значимость различия между ними определяется с помощью модифицированного критерия Стьюдента.
Рассматриваемый в этом параграфе критерий применяется для сравнения двух методов исследования, осуществляемых одной лабораторией, или сравнения результатов исследований, проведенных одним и тем же методом, но в разных лабораториях.
Разность (расхождение) наблюдаемых величин обозначается через di=хi-уi, тогда среднее расхождений равно. Требуется проверить основную гипотезу Н0: =0 при альтернативной гипотезе Н1: ¹0.
Наблюдаемое значение модифицированного критерия Стьюдента вычисляется по формуле:
, (4.5)
где величина называется ошибкой средней разности и вычисляется по формуле:
, (4.6)
где объем выборки n=nх=nу, di=хi-уi, суммирование проводится по всем парам наблюдений.
Правило принятия решения при использовании модифицированного критерия Стьюдента.
По таблице критических точек распределения Стьюдента (или вычисляется в Excel) для заданного уровня значимости a и числа степеней свободы распределения Стьюдента, равного
k=n-1, (4.7)
находится критическая точка двусторонней критической области ta(k). Это значение сравнивается с наблюдаемым значением критерия :
· если <ta(k), то нет оснований отвергнуть основную гипотезу, то есть результаты измерений различаются незначимо;
· если ³ta(k), то основная гипотеза отвергается, то есть различие между результатами измерений признается существенным, систематическим.
Сравнение средних двух зависимых выборок в Excel.
Проверка значимости различия между результатами попарно зависимых измерений по модифицированному критерию Стьюдента (4.5) осуществляется в Excel с помощью инструмента анализа Парный двухвыборочный t-тест для средних. Для его вызова следует выполнить команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выбрать инструмент Парный двухвыборочный t-тест для средних и нажатьОК. В появившемся диалоговом окне с названием выбранного инструмента анализа порядок заполнения точно такой же, как и в диалоговых окнах для t-тестов независимых выборок, описанных в предыдущем параграфе. После заполнения всех необходимых полей этого окна и нажатия на кнопкуОК появится таблица с названием Парный двухвыборочный t-тест для средних, в которой будут содержаться результаты вычислений.
Данный тест вычисляет средние и дисперсии обеих выборок, их объемы, коэффициенты корреляции (в строке: Корреляция Пирсона), число степеней свободы (4.7) (в строке: df), наблюдаемое значение модифицированного критерия Стьюдента (4.5) (в строке: t-статистика), остальные строки называются также как и в таблицах t-тестов независимых выборок, описанных в предыдущем параграфе.
Вычисленное в этом тесте наблюдаемое значение критерия (4.5), находящееся в строке t-статистика, сравнивается с критической точкой распределения Стьюдента, находящееся в строке t критическое двухстороннее (для двухсторонней критической области), а затем принимается решение согласно указанному выше правилу.
Практические задания
5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок
Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:
| хi |
| уi |
Установить с уровнем значимости a=0,05, влияет ли данный препарат на зрительную память?
Для выполнения этого задания проделайте следующие пункты.
1. Наберите исходные данные в две колонки: — в столбец А, — в столбец В.
2. Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду Сервис®Анализ данных.
3. В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.
4. В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными А1: А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.
5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными В1: В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.
6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа установлено значение 0,05.
7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.
8. В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины.
Полученная таблица должна иметь вид:
| Двухвыборочный F-тест для дисперсии | ||
| Переменная 1 | Переменная 2 | |
| Среднее | 10,16666667 | 8,25 |
| Дисперсия | 2,333333333 | 2,022727273 |
| Наблюдения | ||
| df | ||
| F | 1,153558052 | |
| P(F<=f) одностороннее | 0,408471047 | |
| F критическое одностороннее | 2,817927225 |
9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.
10. Из полученной таблицы следует, что средние =10,16666667; =8,25 (Среднее); исправленные дисперсии =2,333333333; =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n=12; числа степеней свободы (4.2) распределения Фишера (df) kх=11 и kу=11; наблюдаемое значение критерия Фишера (F) =1,153558052; критические точки распределения Фишера для заданного уровня значимости a=0,05 правосторонней критической области (F критическое одностороннее) Fa(kх, kу)=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее)P( <Fa)=0,408471047.
11. Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,15<2,815=F0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).
12. Теперь следует сравнить средние двух выборок. Поскольку с помощью F-теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.
13. Для его вызова выполните команду Сервис®Анализ данных, выделите нужный инструмент и нажмите ОК.
14. В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группеПараметры вывода в поле Выходной интервал укажите адрес ячейки С12.
15. После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t-теста должна появиться таблица:
| Двухвыборочный t-тест с одинаковыми дисперсиями | ||
| Переменная 1 | Переменная 2 | |
| Среднее | 10,16666667 | 8,25 |
| Дисперсия | 2,333333333 | 2,022727273 |
| Наблюдения | ||
| Объединенная дисперсия | 2,178030303 | |
| Гипотетическая разность средних | ||
| df | ||
| t-статистика | 3,181194744 | |
| P(T<=t) одностороннее | 0,002159563 | |
| t критическое одностороннее | 1,717144187 | |
| P(T<=t) двухстороннее | 0,004319126 | |
| t критическое двухстороннее | 2,073875294 |
17. Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F-теста. После t-теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) s2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k=22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( <ta)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P(½ ½<ta)=0,004319126 критические области.
18. Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =3,18>2,07=t0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.
5.2. Сравнение выборочных средних двух зависимых выборок
В результаты семилетних испытаний ячменя и овса на урожайность получены следующие данные:
| xi | 7,7 | 9,0 | 9,4 | 7,4 | 7,4 | 10,9 | 8,0 |
| yi | 8,26 | 7,22 | 8,43 | 5,57 | 6,35 | 8,00 | 9,13 |
где xi – урожайность ячменя в ц/га и yi – урожайность овса в ц/га в i-ом году. Установить, являются ли эти результаты существенно различными?
Для выполнения этого задания проделайте следующие пункты.
1. Занесите исходные данные в две колонки: xi — в столбец А, yi -в столбец В.
2. Поскольку результаты испытаний связаны попарно, то следует использовать модифицированный критерий Стьюдента (парный t-тест для средних).
3. Выполните команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выберите среди Инструментов анализа необходимый в данном случае Парный двухвыборочный t-тест для средних и нажмите ОК.
4. В появившемся диалоговом окне Парный двухвыборочный t-тест для средних в группе Входные данные поместите курсор в поле Интервал переменной 1. Затем введите адрес интервала ячеек с данными xi A1:A7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.
5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными уi В1: В7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.
6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа находится 0,05.
7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в поле Выходного интервала. Нажмите ОК.
8. В результате появится таблица с вычисленными значениями выборочных средних, дисперсии, коэффициента корреляции и модифицированного критерия Стьюдента. Сразу, не сбрасывая выделения этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины. Полученная таблица должна иметь вид:
| Парный двухвыборочный t-тест для средних | ||
| Переменная 1 | Переменная 2 | |
| Среднее | 8,542857143 | 7,565714286 |
| Дисперсия | 1,686190476 | 1,574161905 |
| Наблюдения | ||
| Корреляция Пирсона | 0,393061395 | |
| Гипотетическая разность средних | ||
| df | ||
| t-статистика | 1,83746639 | |
| P(T<=t) одностороннее | 0,057891988 | |
| t критическое одностороннее | 1,943180905 | |
| P(T<=t) двухстороннее | 0,115783975 | |
| t критическое двухстороннее | 2,446913641 |
9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся вычисленные значения соответствующих статистических характеристик для переменных хi и уi.
10. Из полученной таблицы следует, что средние =8,542857143; =7,565714286; исправленные дисперсии =1,686190476; =1,574161905; число наблюдений n=7; коэффициент корреляции (Корреляция Пирсона) rв=0,393061395; число степеней свободы (4.7) распределения Стьюдента (df) k=6; наблюдаемой значение (4.5) модифицированного критерия Стьюдента (t-статистика) =1,83746639; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,943180905 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,446913641; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( <ta)=0,057891988 и в двухстороннюю (P(T<=t) двухстороннее) P(½ ½<ta)=0,115783975 критические области.
11. Воспользовавшись правилом принятия решения из §5.4. для модифицированного критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,84<2,45=t0,05(6), то нет оснований отвергнуть основную гипотезу, то есть различие между ежегодной урожайностью ячменя и овса является статистически недостоверной (незначимой).