Лекция: Модифицированный критерий Стьюдента

(парный t-тест) сравнения выборочных средних двух зависимых выборок

Модифицированный критерий Стьюдента.

Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной выборке одинаковых объемов, варианты в которых попарно зависимы. Такие выборки называются зависимыми.

Поскольку обычно хi¹уi (i=1,…n), то необходимо установить, являются ли значимыми различия между результатами попарно зависимых измерений хi и уi. Значимость различия между ними определяется с помощью модифицированного критерия Стьюдента.

Рассматриваемый в этом параграфе критерий применяется для сравнения двух методов исследования, осуществляемых одной лабораторией, или сравнения результатов исследований, проведенных одним и тем же методом, но в разных лабораториях.

Разность (расхождение) наблюдаемых величин обозначается через di=хi-уi, тогда среднее расхождений равно. Требуется проверить основную гипотезу Н0: =0 при альтернативной гипотезе Н1: ¹0.

Наблюдаемое значение модифицированного критерия Стьюдента вычисляется по формуле:

, (4.5)

где величина называется ошибкой средней разности и вычисляется по формуле:

, (4.6)

где объем выборки n==, di=хi-уi, суммирование проводится по всем парам наблюдений.

 

Правило принятия решения при использовании модифицированного критерия Стьюдента.

По таблице критических точек распределения Стьюдента (или вычисляется в Excel) для заданного уровня значимости a и числа степеней свободы распределения Стьюдента, равного

k=n-1, (4.7)

находится критическая точка двусторонней критической области ta(k). Это значение сравнивается с наблюдаемым значением критерия :

· если <ta(k), то нет оснований отвергнуть основную гипотезу, то есть результаты измерений различаются незначимо;

· если ³ta(k), то основная гипотеза отвергается, то есть различие между результатами измерений признается существенным, систематическим.

 

Сравнение средних двух зависимых выборок в Excel.

Проверка значимости различия между результатами попарно зависимых измерений по модифицированному критерию Стьюдента (4.5) осуществляется в Excel с помощью инструмента анализа Парный двухвыборочный t-тест для средних. Для его вызова следует выполнить команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выбрать инструмент Парный двухвыборочный t-тест для средних и нажатьОК. В появившемся диалоговом окне с названием выбранного инструмента анализа порядок заполнения точно такой же, как и в диалоговых окнах для t-тестов независимых выборок, описанных в предыдущем параграфе. После заполнения всех необходимых полей этого окна и нажатия на кнопкуОК появится таблица с названием Парный двухвыборочный t-тест для средних, в которой будут содержаться результаты вычислений.

Данный тест вычисляет средние и дисперсии обеих выборок, их объемы, коэффициенты корреляции (в строке: Корреляция Пирсона), число степеней свободы (4.7) (в строке: df), наблюдаемое значение модифицированного критерия Стьюдента (4.5) (в строке: t-статистика), остальные строки называются также как и в таблицах t-тестов независимых выборок, описанных в предыдущем параграфе.

Вычисленное в этом тесте наблюдаемое значение критерия (4.5), находящееся в строке t-статистика, сравнивается с критической точкой распределения Стьюдента, находящееся в строке t критическое двухстороннее (для двухсторонней критической области), а затем принимается решение согласно указанному выше правилу.

Практические задания

 

5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок

 

Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:

 

хi
уi

 

Установить с уровнем значимости a=0,05, влияет ли данный препарат на зрительную память?

 

Для выполнения этого задания проделайте следующие пункты.

1. Наберите исходные данные в две колонки: — в столбец А, — в столбец В.

2. Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду Сервис®Анализ данных.

3. В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.

4. В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными А1: А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными В1: В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа установлено значение 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины.

Полученная таблица должна иметь вид:

 

Двухвыборочный F-тест для дисперсии  
Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения
df
F 1,153558052  
P(F<=f) одностороннее 0,408471047  
F критическое одностороннее 2,817927225  

 

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.

10. Из полученной таблицы следует, что средние =10,16666667; =8,25 (Среднее); исправленные дисперсии =2,333333333; =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n=12; числа степеней свободы (4.2) распределения Фишера (df) =11 и =11; наблюдаемое значение критерия Фишера (F) =1,153558052; критические точки распределения Фишера для заданного уровня значимости a=0,05 правосторонней критической области (F критическое одностороннее) Fa(, )=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее)P( <Fa)=0,408471047.

11. Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,15<2,815=F0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).

12. Теперь следует сравнить средние двух выборок. Поскольку с помощью F-теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.

13. Для его вызова выполните команду Сервис®Анализ данных, выделите нужный инструмент и нажмите ОК.

14. В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группеПараметры вывода в поле Выходной интервал укажите адрес ячейки С12.

15. После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t-теста должна появиться таблица:

 

Двухвыборочный t-тест с одинаковыми дисперсиями
Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения
Объединенная дисперсия 2,178030303  
Гипотетическая разность средних  
df  
t-статистика 3,181194744  
P(T<=t) одностороннее 0,002159563  
t критическое одностороннее 1,717144187  
P(T<=t) двухстороннее 0,004319126  
t критическое двухстороннее 2,073875294  

 

17. Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F-теста. После t-теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) s2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k=22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( <ta)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P(½ ½<ta)=0,004319126 критические области.

18. Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =3,18>2,07=t0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.

 

5.2. Сравнение выборочных средних двух зависимых выборок

 

В результаты семилетних испытаний ячменя и овса на урожайность получены следующие данные:

xi 7,7 9,0 9,4 7,4 7,4 10,9 8,0
yi 8,26 7,22 8,43 5,57 6,35 8,00 9,13

где xi – урожайность ячменя в ц/га и yi – урожайность овса в ц/га в i-ом году. Установить, являются ли эти результаты существенно различными?

 

Для выполнения этого задания проделайте следующие пункты.

1. Занесите исходные данные в две колонки: xi — в столбец А, yi -в столбец В.

2. Поскольку результаты испытаний связаны попарно, то следует использовать модифицированный критерий Стьюдента (парный t-тест для средних).

3. Выполните команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выберите среди Инструментов анализа необходимый в данном случае Парный двухвыборочный t-тест для средних и нажмите ОК.

4. В появившемся диалоговом окне Парный двухвыборочный t-тест для средних в группе Входные данные поместите курсор в поле Интервал переменной 1. Затем введите адрес интервала ячеек с данными xi A1:A7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными уi В1: В7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа находится 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в поле Выходного интервала. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями выборочных средних, дисперсии, коэффициента корреляции и модифицированного критерия Стьюдента. Сразу, не сбрасывая выделения этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины. Полученная таблица должна иметь вид:

 

Парный двухвыборочный t-тест для средних  
Переменная 1 Переменная 2
Среднее 8,542857143 7,565714286
Дисперсия 1,686190476 1,574161905
Наблюдения
Корреляция Пирсона 0,393061395  
Гипотетическая разность средних  
df  
t-статистика 1,83746639  
P(T<=t) одностороннее 0,057891988  
t критическое одностороннее 1,943180905  
P(T<=t) двухстороннее 0,115783975  
t критическое двухстороннее 2,446913641  

 

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся вычисленные значения соответствующих статистических характеристик для переменных хi и уi.

10. Из полученной таблицы следует, что средние =8,542857143; =7,565714286; исправленные дисперсии =1,686190476; =1,574161905; число наблюдений n=7; коэффициент корреляции (Корреляция Пирсона) =0,393061395; число степеней свободы (4.7) распределения Стьюдента (df) k=6; наблюдаемой значение (4.5) модифицированного критерия Стьюдента (t-статистика) =1,83746639; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,943180905 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,446913641; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( <ta)=0,057891988 и в двухстороннюю (P(T<=t) двухстороннее) P(½ ½<ta)=0,115783975 критические области.

11. Воспользовавшись правилом принятия решения из §5.4. для модифицированного критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,84<2,45=t0,05(6), то нет оснований отвергнуть основную гипотезу, то есть различие между ежегодной урожайностью ячменя и овса является статистически недостоверной (незначимой).

 

еще рефераты
Еще работы по биологии