Презентация на тему: Аналіз зв’язку між змінними: кореляція і регресія

Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Регресійний аналіз
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
Аналіз зв’язку між змінними: кореляція і регресія
1/30
Средняя оценка: 4.6/5 (всего оценок: 56)
Код скопирован в буфер обмена
Скачать (1152 Кб)
1

Первый слайд презентации: Аналіз зв’язку між змінними: кореляція і регресія

Поняття кореляційного зв’язку. Кореляційний і регресійний аналіз. Параметричний кореляційний аналіз. Непараметричний кореляційний аналіз. Регресійний аналіз. Лінійна регресія.

Изображение слайда
2

Слайд 2

Функціональний зв’язок – вид зв’язку, коли конкретному значенню одного показника відповідає єдине значення іншого показника Кореляційний зв’язок – вид зв’язку, коли конкретному значенню одного показника відповідає деякий діапазон значень іншого показника. у = f(x)

Изображение слайда
3

Слайд 3

Приклад множинного (кореляційного) зв'язку

Изображение слайда
4

Слайд 4

Наша мета полягає в тому, щоб вміти відповісти на чотири запитання : (1) Чи існує зв'язок між двома або більше змінними ? (2) Який тип даного зв'язку ? (3) Наскільки він сильний ? (4) Який прогноз можна зробити, грунтуючись на цьому зв'язку ?

Изображение слайда
5

Слайд 5

Незалежна змінна - це та змінна в регресії, яку можна змінювати. Змінна « кількість годин занять» є незалежною і позначається х. Залежна змінна - це змінна в регресії, яку не можна змінювати. « Екзаменаційна оцінка » є залежною змінною. Вона позначається у. позитивна лінійна залежність - чим більше годин, тим вище оцінка.

Изображение слайда
6

Слайд 6

негативна лінійна залежність - чим більше годин, тим нище оцінка. відсутність залежності.

Изображение слайда
7

Слайд 7

Зв’язок поділяють : - за напрямком: прямий і зворотній (обернений), Якщо при збільшенні однієї змінної збільшується друга, то такий зв’язок є позитивним і, навпаки, коли збільшення однієї змінної супроводжується зменшенням значень другої, то це є негативний зв’язок. - за силою: слабкий, середній і сильний, - за формою: лінійний (рівномірна зміна х та y) і нелінійний (рівномірна зміна х та нерівномірна зміна у)

Изображение слайда
8

Слайд 8

Коефіцієнт кореляції ( вибірковий r, генеральний ρ ( ро ) ) – показник, який показує силу і напрямок зв’язку між двома параметрами ( наприклад, х і у) Коефіцієнт кореляції обчислюється за формулою: Це, так званий, коефіцієнт кореляції Пірсона, що дорівнює добутку моментів. Він названий по імені статистика Карла Пірсона, який перший провів дослідження в цій галузі.

Изображение слайда
9

Слайд 9

Значення коефіцієнту кореляції Коефіцієнт кореляції змінюється на відрізку від -1 до +1. Якщо між змінними існує сильний позитивний зв'язок, то значення r буде близьким до +1. Якщо між змінними існує сильний негативний зв'язок, то значення r буде близьким до -1. Коли між змінними немає лінійного зв'язку або він дуже слабкий, значення r буде близьким до 0.

Изображение слайда
10

Слайд 10

Інтерпретація коефіцієнта кореляції Значення r Рівень зв'язку між змінними 0,75 - 1.00 Дуже висока позитивна 0,50 - 0.74 Висока позитивна 0,25 - 0.49 Середня позитивна 0,00 - 0.24 Слабка позитивна 0,00 - -0.24 Слабка негативна -0,25 - -0.49 Середня негативна -0,50 - -0.74 Висока негативна -0,75 - -1.00 Дуже висока негативна

Изображение слайда
11

Слайд 11: Регресійний аналіз

Регресійний аналіз – це методи статистичного аналізу, які встановлюють як кількісно змінюється одна ознака при зміні іншої Регресійна залежність : y=f(x), де х – незалежна змінна, у – залежна змінна Регресія – це зміна функції (у) при зміні одного чи декількох аргументів (х)

Изображение слайда
12

Слайд 12

Знаходження коефіцієнтів лінійної регресії Наше завдання полягає в тому, щоб побудувати найкращу лінію. Яким чином ми її знайдемо ? Рівняння гіпотетичної лінії : y = a + b х Завдання полягає в обчисленні невідомих коефіцієнтів a і b. Лінія буде найкращою, якщо сума квадратів різниць між y i і y = a + b х буде мінімальна.

Изображение слайда
13

Слайд 13

а – вільний член рівняння, b – коефіцієнт регресії, що показує нахил лінії регресії Оскільки показники регресії характеризують кореляційний зв'язок двосторонньо, то рівняння регресії слід записувати:

Изображение слайда
14

Слайд 14

Коефіцієнт регресії показує наскільки в середньому величина однієї ознаки у змінюється при зміні на одиницю міри другої, кореляційно пов'язаної з У ознаки Х коли коефіцієнт кореляції не відомий, то

Изображение слайда
15

Слайд 15

Зв’язок між коефіцієнтами регресії та кореляції 1 2 Це дозволяє: за відомими значеннями коефіцієнтів регресії b xy, b yx визначати коефіцієнт кореляції, перевіряти правильність розрахунку показника кореляційного зв'язку між змінними ознаками Х та У

Изображение слайда
16

Слайд 16

ЗНАЧИМІСТЬ КОЕФІЦІЄНТУ КОРЕЛЯЦІЇ Коефіцієнт кореляції генеральної сукупності ρ - це кореляція, розрахова з використанням усіляких пар значень ознак (х, у) генеральної сукупності. Нам потрібно оцінити коефіцієнт кореляції генеральної сукупності ρ на основі значення коефіцієнту кореляції вибірки r. Вибірковий коефіцієнт кореляції r використовується для оцінки ρ, якщо виконані наступні припущення : - Змінні х і у лінійно залежні - Змінні є випадковими - Обидві змінні мають нормальний розподіл

Изображение слайда
17

Слайд 17

послідовність дій Щоб прийняти вірне рішення, скористаємося процедурою перевірки гіпотези. Вона включає традиційні крок и : Крок 1 Сформулювати гіпотези. Крок 2 Побудувати критичну область. Крок 3 Обчислити значення критерію. Крок 4 Порівняти, прийняти рішення. Крок 5 Знайти коефіцієнт кореляції та рівняння регресії. Крок 6 Побудувати розумні прогнози: для значення незалежної змінної х передбачити значення залежної змінної у. Крок 7. Оцінити надійність прогнозу: знайти коефіцієнт детермінації, стандартну помилку оцінки та інтервал передбачення.

Изображение слайда
18

Слайд 18

гіпотези Гіпотези сформульовані наступним чином : Основна гіпотеза Н0 : ρ = 0 Альтернативна гіпотеза Н1 : ρ ≠ 0 Основна гіпотеза стверджує, що не існує кореляції між ознаками х та у у генеральній сукупності. Альтернативна гіпотеза стверджує, що кореляція між ознаками х та у у генеральній сукупності значима. Коли основна гіпотеза відкидається на певному рівні значущості, це означає, що існує значуща відмінність між значенням r і 0. Коли основна гіпотеза приймається, це означає, що значення r не сильно відрізняється від 0 і є випадковим.

Изображение слайда
19

Слайд 19

Для перевірки гіпотези використовується t- критерій з df = n - 2 ступенями свободи : Порівнюють з табличним значенням t- розподілу.

Изображение слайда
20

Слайд 20

Хто більше дивиться телевізор ? Дослідник хоче визначити, чи існує зв'язок між віком людини і тим, скільки годин на день він або вона дивиться телевізор. Statistica : модуль «Основні статистики і таблиці» ( Basic statistics\Tables ) процедура Кореляція ( Correlation matrices ) вік 18 24 36 40 58 Кіл-ть годин 3,9 2,6 2 2,3 1,2

Изображение слайда
21

Слайд 21

Параметричний критерій - кореляційний аналіз Пірсона

Изображение слайда
22

Слайд 22

Представлення результату р = 0,029, тому кореляція між ознаками х та у значима 2. r = - 0, 92, тому кореляційний зв’язок сильний зворотній. 3. Знаючи вік можна визначити кількість годин перегляду за моделлю у =0,0583*х Отримана модель високоінформативна r 2 = 0,85, або 85 % варіації Х визначає варіацію У r 2 - коеф. детермінації, що показує, яка доля варіації однієї ознаки залежить від варіювання другої ознаки

Изображение слайда
23

Слайд 23

НЕПАРАМЕТРИЧНІ КРИТЕРІЇ кореляція за Спірменом (використовують для оцінки зв'язку кількісних і\або порядкових ознак), 2. кореляція за Кендалом ( використовують для оцінки зв'язку двох порядкових ознак або порядкової та кількісної), 3. гамма-кореляція ( використовують коли в ознаках багато даних, що повторюються).

Изображение слайда
24

Слайд 24

Statistica : модуль « Непараметрика » ( nonparametrics ) процедура Кореляція ( Corelation ) p = 0,037, R =-0,90

Изображение слайда
25

Слайд 25

П'ять видів зв'язку між змінними Прям ий причинно- наслідковий зв'язок 2. Зворотній причинно- наслідковий зв'язок 3. Зв'язок викликан ий третьою ( прихованою ) змінною 4. Взаємозв'язок викликаний декількома прихованими змінними 5. Зв'язку немає, залежність випадкова

Изображение слайда
26

Слайд 26

Прямий зв'язок Прямий причинно- наслідковий зв'язок між змінними ( змінна х визначає значення змінної у). Наявність води прискорює ріст рослин. Отрута викликає смерть. Температура повітря прямо впливає на швидкість танення льоду.

Изображение слайда
27

Слайд 27

2. Зворотній зв'язок Зворотний причинно- наслідковий зв'язок між змінними ( змінна у визначає значення змінної х). Дослідник може думати, що надмірне споживання кави викликає нервозність. Але, не може бути, дуже нервова людина випиває каву, щоб заспокоїти свої нерви ?

Изображение слайда
28

Слайд 28

3. Зв'язок викликаний третьою змінною Зв'язок між змінними може бути викликаний третьою змінною. Дослідник встановив, що існує якась залежність між числом потонулих людей і числом випитих безалкогольних напоїв в літній час. А може бути, обидві змінні зв'язані зі спекою і потребою людей у воді ?

Изображение слайда
29

Слайд 29

4. Кілька змінних Взаємозв'язок може бути визначений декількома прихованими змінними. Дослідник може виявити значимий зв'язок між оцінками студентів в університеті та оцінками в школі. Але, можливо, діють і інші змінні : IQ, кількість годин занять, вплив батьків, мотивація, вік.

Изображение слайда
30

Последний слайд презентации: Аналіз зв’язку між змінними: кореляція і регресія

5. Залежність випадкова Дослідник може знайти значиму залежність між збільшенням кількості людей, які займаються спортом і збільшенням кількості людей, які скоюють злочин. Але здоровий глузд говорить, що будь- який зв'язок між цими двома змінними повинна бути випадковістю.

Изображение слайда