Презентация на тему: Критерий согласия и таблицы сопряженности

Реклама. Продолжение ниже
Критерий согласия и таблицы сопряженности
1. Критерий согласия
Пример. Вкусовые предпочтения
Пример. Вкусовые предпочтения
Наблюдаемые и ожидаемые частоты
Что проверяет критерий согласия
Статистика
Что значит «частоты согласуются»
Статистика
Статистика
Решение задачи
Решение задачи
Решение задачи
Решение задачи
Решение задачи
Решение задачи
Решение задачи
Применение критерия согласия
Применение критерия согласия
Применение критерия согласия
Применение критерия согласия
Применение критерия согласия
Решение задачи
Применение критерия согласия
Применение критерия согласия
Применение критерия согласия
Решение задачи
6.2 Таблицы сопряженности
Обработка данных
Критерий согласия и таблицы сопряженности
Наблюдаемые частоты ( Observed frequencies)
Шаг 1. Гипотезы
Ожидаемые частоты (Expected frequencies)
А – случайно выбранный медработник – медсестра B – случайно выбранный медработник согласен с эффективностью препарата
А – случайно выбранный медработник – медсестра B – случайно выбранный медработник согласен с эффективностью препарата
Ожидаемые частоты (Expected frequencies)
Ожидаемые частоты (Expected frequencies)
Критерий проверки гипотезы
Вычисление статистики
Уровень значимости и критическая область
Получение выводов
1/41
Средняя оценка: 4.7/5 (всего оценок: 7)
Код скопирован в буфер обмена
Скачать (338 Кб)
Реклама. Продолжение ниже
1

Первый слайд презентации: Критерий согласия и таблицы сопряженности

18 февраля 2019 г. Критерий согласия и таблицы сопряженности 6.1. Критерий согласия 6.2. Таблицы сопряженности 6.3. Проверка независимости качественных признаков

Изображение слайда
1/1
2

Слайд 2: 1. Критерий согласия

18 февраля 2019 г. 1. Критерий согласия

Изображение слайда
1/1
3

Слайд 3: Пример. Вкусовые предпочтения

Маркетолог хочет узнать, какому из пяти вкусов нового напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса 100 человек: Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10

Изображение слайда
1/1
4

Слайд 4: Пример. Вкусовые предпочтения

Маркетолог хочет узнать, какому из пяти вкусов нового напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса 100 человек: Если нет каких-либо особых вкусовых предпочтений, то каждый вид напитка покупают с одинаковой частотой. В таком случае каждая частота должна быть равна 100/5 = 20, то есть приблизительно по 20 человек выберут каждый вид сока. Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10 Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10 20 20 20 20 20 Наблюдаем Ожидаем

Изображение слайда
1/1
5

Слайд 5: Наблюдаемые и ожидаемые частоты

Наблюдаемые частоты - частоты полученные по выборке. Ожидаемые частоты - частоты, полученные путем вычисления на основе теоретических представлений о предполагаемом распределении. Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10 20 20 20 20 20 Наблюдаемые частоты Ожидаемые частоты

Изображение слайда
1/1
6

Слайд 6: Что проверяет критерий согласия

Критерий согласия позволяет выяснить, насколько согласуются между собой наблюдаемые частоты и ожидаемые, иными словами, существенны или нет различия между ними. Гипотезы для примера с предпочтениями запишутся так: Н 0 : У покупателей нет предпочтений по поводу вкусов сока. Н 1 : У покупателей есть предпочтения. Наблюдаемая частота должна быть не меньше 5.

Изображение слайда
1/1
7

Слайд 7: Статистика

Для проверки гипотезы используется статистика : Н – наблюдаемая частота О – ожидаемая частота Если значение X велико, гипотезу Н 0 следует отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)

Изображение слайда
1/1
Реклама. Продолжение ниже
8

Слайд 8: Что значит «частоты согласуются»

Если наблюдаемые и ожидаемые значения близки друг к другу, значение X будет небольшим. Гипотеза Н 0 не будет отвергнута. Имеется хорошее соответствие наблюдаемых данных и исследовательской модели. Хорошее соответствие Плохое соответствие

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
9

Слайд 9: Статистика

Для проверки гипотезы используется статистика : Н – наблюдаемая частота О – ожидаемая частота Если значение X велико, гипотезу Н 0 следует отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны) 0 X крит

Изображение слайда
1/1
10

Слайд 10: Статистика

0 X крит Критическое значение находим по таблице 2 -распределения или с помощью функции Excel =ХИ2ОБР(альфа, m-1) m – количество слагаемых в сумме

Изображение слайда
1/1
11

Слайд 11: Решение задачи

Шаг 1. Нулевая и альтернативная гипотезы: Н 0 : У покупателей нет предпочтений по поводу вкусов сока. Н 1 : У покупателей есть предпочтения.

Изображение слайда
1/1
12

Слайд 12: Решение задачи

Шаг 1. Нулевая и альтернативная гипотезы: Н 0 : У покупателей нет предпочтений по поводу вкусов сока. Н 1 : У покупателей есть предпочтения. Шаг 2. Уровень значимости =0,05.

Изображение слайда
1/1
13

Слайд 13: Решение задачи

Шаг 1. Нулевая и альтернативная гипотезы: Н 0 : У покупателей нет предпочтений по поводу вкусов сока. Н 1 : У покупателей есть предпочтения. Шаг 2. Уровень значимости =0,05. Шаг 3. По выборке находим значение статистики: Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10 20 20 20 20 20 Наблюдаемые частоты Ожидаемые частоты

Изображение слайда
1/1
14

Слайд 14: Решение задачи

Шаг 1. Нулевая и альтернативная гипотезы: Н 0 : У покупателей нет предпочтений по поводу вкусов сока. Н 1 : У покупателей есть предпочтения. Шаг 2. Уровень значимости =0,05. Шаг 3. По выборке находим значение статистики: Вишня Клубника Апельсин Лайм Виноград 32 28 16 14 10 20 20 20 20 20 Наблюдаемые частоты Ожидаемые частоты

Изображение слайда
1/1
Реклама. Продолжение ниже
15

Слайд 15: Решение задачи

Шаг 4. Критическое значение находим по таблице 2 -распределения или с помощью функции Excel =ХИ2ОБР(альфа, m-1)

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
16

Слайд 16: Решение задачи

Шаг 5. Сравним полученное значение с критической областью: 18 > 9,488. Значение попало в критическую область. 0 9,488 Х=18 18

Изображение слайда
Изображение для работы со слайдом
1/2
17

Слайд 17: Решение задачи

Шаг 5. Сравним полученное значение с критической областью: 18 > 9,488. Значение попало в критическую область. 0 9,488 Х=18 18 Существуют значимые предпочтения покупателей по поводу вида напитка.

Изображение слайда
Изображение для работы со слайдом
1/2
18

Слайд 18: Применение критерия согласия

Маркетолог хочет определить, одинаково ли распределено количество покупателей магазина по дням недели. Была выбрана наугад неделя, и получены следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05? День Пн Вт Ср Чт Пт Сб Вс Частота 280 320 250 240 380 330 290

Изображение слайда
1/1
19

Слайд 19: Применение критерия согласия

Маркетолог хочет определить, одинаково ли распределено количество покупателей магазина по дням недели. Была выбрана наугад неделя, и получены следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05? День Пн Вт Ср Чт Пт Сб Вс Частота 280 320 250 240 380 330 290 Всего 2090 покупателей

Изображение слайда
1/1
20

Слайд 20: Применение критерия согласия

Маркетолог хочет определить, одинаково ли распределено количество покупателей магазина по дням недели. Была выбрана наугад неделя, и получены следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05? День Пн Вт Ср Чт Пт Сб Вс Частота 280 320 250 240 380 330 290 Всего 2090 покупателей. Если число покупателей распределено равномерно по дням недели то теоретическая частота для каждого дня 2090/7=299 покупателей

Изображение слайда
1/1
21

Слайд 21: Применение критерия согласия

Маркетолог хочет определить, одинаково ли распределено количество покупателей магазина по дням недели. Была выбрана наугад неделя, и получены следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05? День Пн Вт Ср Чт Пт Сб Вс Частота 280 320 250 240 380 330 290 Ожидаемая частота 299 299 299 299 299 299 299

Изображение слайда
1/1
22

Слайд 22: Применение критерия согласия

День Пн Вт Ср Чт Пт Сб Вс Н 280 320 250 240 380 330 290 О 299 299 299 299 299 299 299 Н-О -19 21 -49 -59 81 31 -9 (Н-О)^2 361 441 2401 3481 6561 961 81 (Н-О)^2/О 1,21 1,47 8,03 11,64 21,94 3,21 0,27 Сумма 47,8

Изображение слайда
1/1
23

Слайд 23: Решение задачи

0 9,488 Х=47,8 47,8 Число покупателей неравномерно распределено по дням недели.

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
24

Слайд 24: Применение критерия согласия

Опрос, проведенный год назад, показал, что 25% покупателей предпочитает расплачиваться за покупки наличными, 70% использует карту, а у 5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.

Изображение слайда
1/1
25

Слайд 25: Применение критерия согласия

Опрос, проведенный год назад, показал, что 25% покупателей предпочитает расплачиваться за покупки наличными, 70% использует карту, а у 5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.

Изображение слайда
Изображение для работы со слайдом
1/2
26

Слайд 26: Применение критерия согласия

Опрос, проведенный год назад, показал, что 25% покупателей предпочитает расплачиваться за покупки наличными, 70% использует карту, а у 5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.

Изображение слайда
Изображение для работы со слайдом
1/2
27

Слайд 27: Решение задачи

0 9,2104 Х=5,28 5,28 Предпочтения покупателей не изменились

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
28

Слайд 28: 6.2 Таблицы сопряженности

18 февраля 2019 г. 6.2 Таблицы сопряженности

Изображение слайда
1/1
29

Слайд 29: Обработка данных

Данные эксперимента Таблица сопряженности Номер респондента Признак 1 Пол? Признак 2 Курит? 1 Мужчина Курит 2 Женщина Не курит 3 Женщина Курит 4 Мужчина Курит 5 Мужчина Не курит 6 Женщина Не курит 7 Мужчина Не курит 8 Мужчина Курит 9 Женщина Не курит 10 Женщина Не курит Курит Не курит Мужчина 3 2 Женщина 1 4 Таблица сопряженности составляется для двух признаков и содержит частоты для каждого набора значений.

Изображение слайда
1/1
30

Слайд 30

Данная таблица имеет два ряда и три столбца: r = 2, c = 3. Признак 2. Отношение к новому препарату Согласны Не согласны Воздержались Медсестры F 11 F 1 2 F 1 3 Врачи F 2 1 F 22 F 23 Признак 1. Категория персонала В общем виде таблица сопряженности состоит из r рядов и c столбцов. Каждая клетка таблицы определяется номером ее ряда ( Row) и столбца ( Column).

Изображение слайда
1/1
31

Слайд 31: Наблюдаемые частоты ( Observed frequencies)

В результате эксперимента мы получаем наблюдаемые частоты. Подсчитаем суммы по срокам и столбцам. Согласны Не согласны Воздержались ВСЕГО Медсестры 100 80 20 200 Врачи 50 120 30 200 ВСЕГО 150 200 50 400 отношение к новому препарату Зависит ли отношение к препарату от категории персонала?

Изображение слайда
1/1
32

Слайд 32: Шаг 1. Гипотезы

Критерий согласия используется для проверки гипотезы о независимости качественных признаков. Гипотезы выглядят так: Н 0 : признаки независимы. Н 1 : признаки зависимы.

Изображение слайда
1/1
33

Слайд 33: Ожидаемые частоты (Expected frequencies)

Вычислим теоретические ожидаемые частоты (в предположении независимости признаков). А – случайно выбранный медработник – медсестра B – случайно выбранный медработник согласен с эффективностью препарата случайно выбранный медработник – медсестра, согласная с эффективностью препарата Если события A и B независимы, то

Изображение слайда
1/1
34

Слайд 34: А – случайно выбранный медработник – медсестра B – случайно выбранный медработник согласен с эффективностью препарата

Согласны Не согласны Воздержались ВСЕГО Медсестры 200 Врачи 200 ВСЕГО 150 200 50 400

Изображение слайда
1/1
35

Слайд 35: А – случайно выбранный медработник – медсестра B – случайно выбранный медработник согласен с эффективностью препарата

Согласны Не согласны Воздержались ВСЕГО Медсестры 200 Врачи 200 ВСЕГО 150 200 50 400 На 400 человек ожидаемая частота медсестер согласных с эффективностью препарата

Изображение слайда
1/1
36

Слайд 36: Ожидаемые частоты (Expected frequencies)

Вычислим теоретические частоты (в предположении независимости признаков). В первую клетку надо поставить частоту: Согласны Не согласны Воздержались ВСЕГО Медсестры 75 200 Врачи 200 ВСЕГО 150 200 50 400

Изображение слайда
1/1
37

Слайд 37: Ожидаемые частоты (Expected frequencies)

Вычислим теоретические частоты. Согласны Не согласны Воздержались ВСЕГО Медсестры 75 100 2 5 200 Врачи 75 100 2 5 200 ВСЕГО 150 200 50 400

Изображение слайда
1/1
38

Слайд 38: Критерий проверки гипотезы

Если бы признаки были независимыми, то частоты должны быть распределены так, как показано в таблице ожидаемых частот. Критерий согласия позволяет оценить, насколько сильно различаются наблюдаемые частоты от ожидаемых. Если сильно, тогда мы признаем наличие зависимости признаков. 100 80 20 50 120 30 75 100 2 5 75 100 2 5 Наблюдаемые частоты Ожидаемые частоты

Изображение слайда
1/1
39

Слайд 39: Вычисление статистики

100 80 20 50 120 30 75 100 2 5 75 100 2 5 Наблюдаемые частоты Ожидаемые частоты

Изображение слайда
1/1
40

Слайд 40: Уровень значимости и критическая область

Критическое значение находим с помощью функции ХИ2ОБР(альфа ;(r-1)*(c-1)

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
41

Последний слайд презентации: Критерий согласия и таблицы сопряженности: Получение выводов

Поскольку значение статистики попало в критическую область, 26,67 > 5,991, мы отклоняем гипотезу о независимости признаков. Вывод. Признаки зависимы. Отношение к новому лекарству существенно зависит от категории персонала. 5,991 26,67

Изображение слайда
1/1
Реклама. Продолжение ниже