Презентация на тему: Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3

Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3
1/42
Средняя оценка: 4.6/5 (всего оценок: 70)
Код скопирован в буфер обмена
Скачать (9653 Кб)
1

Первый слайд презентации

Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3

Изображение слайда
2

Слайд 2

Мощность - вероятность отвергнуть Н 0 в эксперименте, когда Н 0 действительно неверна. Мощность

Изображение слайда
3

Слайд 3

Мощность Т.е., масса землероек в Заповеднике на самом деле больше, чем 90 г. Мощность – вероятность того, что проведённое нами исследование установит этот факт. H 0 : μ ≤ 90 г; H 1 : μ > 9 0 г Ошибка 2-го рода + мощность = 1 β + (1- β ) =1 (это 2 возможных результата теста, если Н 0 не верна)

Изображение слайда
4

Слайд 4

Мощность Мощность предполагаемого статистического теста - ключевой элемент планирования исследования «Реальное значение» параметра: Во всей мировой популяции землероек μ = 90 г. Пусть «реальное значение» средней массы в заповеднике = 94 г.

Изображение слайда
5

Слайд 5

Мощность Нарисуем распределения выборочных средних для μ = 90 и μ = 94 (стандартное отклонение σ = 20). Размер выборки n = 25 зверей

Изображение слайда
6

Слайд 6

Мощность Если мы поймаем 25 землероек в заповеднике, у нас есть вероятность лишь 24%, что мы найдём различия! Т.к. лишь в 24% случаев среднее из нашей будущей выборки попадёт в критическую область.

Изображение слайда
7

Слайд 7

Мощность Как увеличить мощность? Большей МОЩНОСТИ критерия способствуют: Большой размер выборки ; Большие различия между популяциями ( effect size ); Маленькое стандартное отклонение ; Большой уровень значимости ( α =0.05 а не α =0.01); Выбор одностороннего теста вместо двустороннего

Изображение слайда
8

Слайд 8

Мощность Если в действительности средняя масса землероек в заповеднике равна 98 г, мощность теста будет уже 64%.

Изображение слайда
9

Слайд 9

Мощность Здесь стандартное отклонение уменьшили вдвое, и мощность теста тоже стала 64%.

Изображение слайда
10

Слайд 10

Мощность При планировании исследования мы можем рассчитать размер выборки, необходимый для того, чтобы «разглядеть» предполагаемые различия между выборками. ( Реальные различия нам, очевидно, неизвестны, но можно задать минимальные, имеющие биологическое значение ). Ещё мы можем после проведения теста (в котором мы не отвергли Н 0 ) оценить вероятность ошибки (2-го рода). Пример про пациентов в больнице Как использовать понятие мощности критерия:

Изображение слайда
11

Слайд 11

Расчёт мощности для двухвыборочного t -критерия для независимых выборок.

Изображение слайда
12

Слайд 12

Изображение слайда
13

Слайд 13

ANOVA Сравнение ДВУХ И БОЛЕЕ групп Дисперсионный анализ ANOVA ( analysis of variance ) Sir Ronald Aylmer FISHER

Изображение слайда
14

Слайд 14

ANOVA Мы тестировали гипотезы о среднем значении для одной и двух выборок. Как быть, если выборок три или больше ? Предположим, у нас 4 группы тигров, которых кормят по-разному. Различается ли средняя масса тигра в этих группах?

Изображение слайда
15

Слайд 15

ANOVA Формулируем гипотезу Н 0 : Тигров кормили: овощами; фруктами; рыбой; мясом. Зависимая переменная: масса; Независимая (группирующая) – тип еды. Это сложная гипотеза ( omnibus hypothesis ). Она включает в себя много маленьких гипотез (для 3-х групп – 3, для 4-х – 12 …): ... Парные (pairwise) нулевые гипотезы Комплексные ( complex ) нулевые гипотезы

Изображение слайда
16

Слайд 16

НЕВЕРНО! Мы отвергаем общую Н 0 гипотезу если верна хотя бы одна из маленьких частных альтернативных гипотез (парных или комплексных)! Какая именно – ANOVA не говорит. Формулируем альтернативную гипотезу: ANOVA ? Н 1 : или или ...

Изображение слайда
17

Слайд 17

(Ошибка использования критерия Стьюдента) Эффект МНОЖЕСТВЕННЫХ СРАВНЕНИЙ ( при попарном сравнении нескольких групп ). При уровне значимости α =0,05 вероятность ошибиться в хотя бы в одном из k сравнений примерно равна: Р ошибки =1-(1-0,05) k Например, для попарного сравнения 4-х групп k =6, т.е., Р ошибки =1-(1-0,05) 6 = 0,265 (Р ошибки ~0,05k) Почему бы не сравнить группы попарно t - критерием? мы таким образом проверяем не все гипотезы, которые содержатся в сложной гипотезе; резко увеличивается вероятность найти различия, где их нет !! (общая вероятность ошибки 1-го рода ). ANOVA

Изображение слайда
18

Слайд 18

ANOVA Общая логика ANOVA Формируем 4 независимых случайных выборки и считаем выборочные средние для каждой из них (они оценивают популяционные средние). Если Н 0 верна, выборочные средние должны быть примерно ( насколько примерно? ) одинаковы. Чем дальше друг от друга отстоят средние значения в группах, тем меньше вероятность, что верна Н 0 (т.е., средние в 4-х популяциях равны) В t- тесте сходство выборочных средних оценить легко – просто посчитать разность. Но с 3-мя (4, 5...) группами так не получится!

Изображение слайда
19

Слайд 19

ANOVA Пусть все группы будут одинакового размера ( для простоты объяснения ). Если Н 0 верна, то 4 наших группы получены из ОДНОЙ популяции с конкретными средним μ и дисперсией σ 2. Получим 2 независимые оценки σ 2 и сравним их! На этой идее основана АНОВА.

Изображение слайда
20

Слайд 20

овощи фрукты мясо рыба 151 108 147 130 135 94 138 128 137 84 143 140 118 87 135 142 132 82 153 139 135 79 137 145 131 74 148 144 137 73 140 140 121 67 144 141 140 78 146 140 152 63 151 142 133 90 145 137 151 81 146 148 132 96 147 142 139 83 150 143 96 89 144 140 133,7 83 144,6 140,1 1. Оценка общей дисперсии по разбросу МЕЖДУ группами число групп -1 (3 - 1 = 2) средние в каждой группе общее среднее размер группы различия большие - Н 0 не верна df B = k -1 MS B – m ean s quare between groups, оценка расстояния между средними в группах.

Изображение слайда
21

Слайд 21

ANOVA 2. Оценка общей дисперсии по разбросу ВНУТРИ групп число групп сумма квадратов стандартных отклонений внутри групп статистика: df W = n G - k овощи фрукты мясо рыба 151 108 147 130 135 94 138 128 137 84 143 140 118 87 135 142 132 82 153 139 135 79 137 145 131 74 148 144 137 73 140 140 121 67 144 141 140 78 146 140 152 63 151 142 133 90 145 137 151 81 146 148 132 96 147 142 139 83 150 143 96 89 144 140 133,7 83 144,6 140,1 ANOVA

Изображение слайда
22

Слайд 22

ANOVA F = оценка дисперсии между группами оценка дисперсии внутри групп Статистика критерия: F Статистика = параметр выборки – параметр популяции стандартная ошибка параметра выборки Не соответствует общей формуле Приводится как, т.е., например, F 3,60

Изображение слайда
23

Слайд 23

ANOVA Статистика критерия: F Принципиально ненаправленный (двусторонний) тест

Изображение слайда
24

Слайд 24

ANOVA источник изменчивости SS df MS F между SS B df B MS B F внутри SS W df W MS W общее SS T df T ANOVA table SS это суммы квадратов отклонений ( sum of squares ) : SS B - средних в группах от общего среднего = Effect ; SS W – измерений от средних в группах = Error.

Изображение слайда
25

Слайд 25

ANOVA ANOVA effect size «Практическая значимость» результата: 1. f = 0.1 – маленький эффект f = 0.25 – средний эффект f = 0.4 – большой эффект 2. «доля объяснённой изменчивости» R 2 = 0. 0 1 – маленький эффект R 2 = 0. 06 – средний эффект R 2 = 0. 1 4 – большой эффект

Изображение слайда
26

Слайд 26

ANOVA В каком случае значение F -статистики будет больше?

Изображение слайда
27

Слайд 27

ANOVA В каком случае значение F -статистики будет больше?

Изображение слайда
28

Слайд 28

ANOVA В каком случае значение F -статистики будет больше?

Изображение слайда
29

Слайд 29

ANOVA В каком случае значение F -статистики будет больше?

Изображение слайда
30

Слайд 30

У нас только одна независимая (группирующая) переменная. Такой анализ называется One-way ANOVA требования и ограничения – как в критерии Стьюдента ANOVA

Изображение слайда
31

Слайд 31

One-way ANOVA

Изображение слайда
32

Слайд 32

assumptions: нормальность, гомогенность

Изображение слайда
33

Слайд 33

One-way ANOVA

Изображение слайда
34

Слайд 34

мы отвергаем Н 0. тип еды влиял на массу тигров внутри групп между группами

Изображение слайда
35

Слайд 35

ANOVA post hoc tests Сложная «омнибусная» гипотеза АНОВЫ: Похожа на стрельбу из дробовика: не нужно особенно точно целиться, НО непонятно, какая дробинка попала в какую мишень! Какая же из отдельных гипотез не верна? Ответить поможет апостериорный (post hoc) тест!

Изображение слайда
36

Слайд 36

Если у нас 3 и более групп: Сначала сравнить ВСЕ группы между собой с помощью ANOVA Если различия есть, использовать методы множественного сравнения (группы сравнивают попарно, но вводят поправки) Если различий нет, мы НЕ ИМЕЕМ ПРАВА ПРЕДПРИНИМАТЬ ДАЛЬНЕЙШИЙ АНАЛИЗ! ANOVA post hoc tests

Изображение слайда
37

Слайд 37

Поправка Бонферрони ( Bonferroni correction для небольших k) если мы хотим обеспечить уровень значимости α, то в каждом из k сравнений нужно принять уровень значимости α/ k Простейшая поправка, но очень грубая! Не работает при большом числе групп – с увеличением их числа очень сильно падает мощность теста. Сегодня почти не используется. ANOVA post hoc tests

Изображение слайда
38

Слайд 38

ANOVA post hoc tests Тест Тьюки (Tukey HSD test ) Наиболее распространённый и рекомендуемый в литературе тест. Рекомендуется для близких по размеру групп. Проверяет только ПАРНЫЕ (но не комплексные) гипотезы. … ?

Изображение слайда
39

Слайд 39

ANOVA post hoc tests Другие апостериорные тесты Критерий Ньюмена-Кейлса ( Newman-Keuls test ) - наименее строгий. Все средние упорядочивают по возрастанию и вычисляют критерий; начинают от сравнения наибольшего с наименьшим. Критерий Шеффе ( Scheffe test ) – поверяет не только парные гипотезы, но и комплексные. Критерий Даннетта ( Dunnett test ) – используется для сравнения нескольких групп с контрольной группой.

Изображение слайда
40

Слайд 40

Поправки для множественных сравнений и сравнений с контрольной группой

Изображение слайда
41

Слайд 41

Изображение слайда
42

Последний слайд презентации: Мощность статистического теста. Дисперсионный анализ ANOVA Занятие 3

Изображение слайда