Презентация на тему: Элементы математической статистики

Элементы математической статистики
«статистика»
Элементы математической статистики
Элементы математической статистики
Математическая статистика
Элементы математической статистики
Элементы математической статистики
Закон больших чисел –
Статистический подход
Аппарат математической статистики
Элементы математической статистики
Характеристика областей применения аппарата
Предмет исследования в математической статистике
Элементы математической статистики
Элементы математической статистики
Элементы математической статистики
Элементы математической статистики
Выборка из генеральной совокупности должна обладать следующими свойствами:
Формы представления выборки из генеральной совокупности
Пример:
Элементы математической статистики
Элементы математической статистики
Пример:
Элементы математической статистики
Пример:
Элементы математической статистики
Элементы математической статистики
Элементы математической статистики
Представление выборки в группированном виде.
Элементы математической статистики
Элементы математической статистики
Последовательность процедуры группирования неупорядоченной выборки из генеральной совокупности
Элементы математической статистики
Элементы математической статистики
Элементы математической статистики
Пример
В EXCEL
Элементы математической статистики
В «Число1» ставим курсор и выделяем весь диапазон, в котором находится выборка, нажимаем ОК:
Получаем в соответствующей ячейке искомое значение:
Далее действуем аналогично:
Элементы математической статистики
Так получаем основные числовые характеристики:
Представим выборку в группированном виде.
Элементы математической статистики
Элементы математической статистики
Элементы математической статистики
Используя полученные результаты и с помощью стандартных функций Excel получаем таблицу:
Строим соответствующие графики: полигон
гистограмма
кумулята:
Это важно!
Элементы математической статистики
Элементы математической статистики
1/54
Средняя оценка: 4.7/5 (всего оценок: 38)
Код скопирован в буфер обмена
Скачать (361 Кб)
1

Первый слайд презентации: Элементы математической статистики

Ахмеджанова Т.Д.

Изображение слайда
2

Слайд 2: статистика»

происходит от латинского слова status - состояние, положение вещей. Первоначально оно употреблялось в значении «политическое состояние». В научный обиход это слово вошло в XVIII в. и первоначально употреблялось в значении «государствоведение».

Изображение слайда
3

Слайд 3

Математическая статистика возникла и развивалась параллельно с теорией вероятностей (XVII в.) Дальнейшее развитие математической статистики (вторая половина XIX — начало XX в.) обязано П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, К. Гауссу, А. Кетле, Ф. Гальтону, К.Пирсону и др.

Изображение слайда
4

Слайд 4

В XX в. наиболее существенный вклад в математическую статистику был сделан советскими : В. И. Романовский, Е. Е. Слуцкий, А.Н. Колмогоров, Н. В. Смирнов; английскими: Стьюдент, Р. Фишер, Э. Пирсон; американскими математиками: Ю. Нейман, А. Вальд.

Изображение слайда
5

Слайд 5: Математическая статистика

– раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Такое определение сформулировано математиками А.Н. Колмогоровым и Ю.В. Прохоровым.

Изображение слайда
6

Слайд 6

Математическая статистика исходит из предположения, что наблюдаемая изменчивость окружающего мира имеет два источника: действие известных причин и факторов. Они порождают изменчивость, закономерно объяснимую. действие случайных причин и факторов. Большинство природных и общественных явлений обнаруживают изменчивость, которая не может быть целиком объяснена закономерными причинами. В таком случае прибегают к концепции случайной изменчивости. Выражение «случайный» в данном контексте означает «подчиняющийся законам теории вероятностей».

Изображение слайда
7

Слайд 7

Проверка различных научных гипотез и моделей является случайным событием, так как результаты исследования определяются большим количеством заранее непредсказуемых факторов. Определенные закономерности можно выявить только в случае массовых наблюдений вследствие закона больших чисел.

Изображение слайда
8

Слайд 8: Закон больших чисел –

это объективный математический закон, согласно которому совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

Изображение слайда
9

Слайд 9: Статистический подход

– выявление закономерной изменчивости на фоне случайных факторов и причин. Методы математической статистики позволяют оценить параметры имеющихся закономерностей, проверить те или иные гипотезы об этих закономерностях.

Изображение слайда
10

Слайд 10: Аппарат математической статистики

является инструментом для отсеивания закономерностей от случайностей. Задача исследователя - накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей.

Изображение слайда
11

Слайд 11

В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых целиком известны. Предмет теории вероятностей – свойства и взаимосвязи этих величин (распределений). Математическая статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи.

Изображение слайда
12

Слайд 12: Характеристика областей применения аппарата

Теория вероятностей Модель, описывающая изучаемое явление или объект, известна априори (до опыта). Есть сведения обо всей генеральной совокупности, описывающей исследуемое явление. Используемый математический аппарат не зависит от предметной области. Выводы о поведении исследуемого объекта или явления делаются по всей генеральной совокупности. Математическая статистика Модель, описывающая исследуемое явление, априори неизвестна. Для определения модели можно проводить пробные испытания (сформировать выборку из генеральной совокупности). Иногда модель может быть задана априори с точностью до неизвестных параметров. Значения неизвестных параметров модели могут быть приближенно получены по выборке из генеральной совокупности. Выводы о поведении объекта или явления делаются по выборке ограниченного объема и распространяются на всю генеральную совокупность.

Изображение слайда
13

Слайд 13: Предмет исследования в математической статистике

- совокупность объектов, однородных относительно некоторых признаков. Например: дети 10 лет г. Братска; пловцы-мастера спорта России.

Изображение слайда
14

Слайд 14

Допустим, повторением одного и того же случайного эксперимента в одинаковых условиях получен набор числовых результатов. При этом у исследователя возникают вопросы: Если мы наблюдаем одну случайную величину – как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении? Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин — что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость?

Изображение слайда
15

Слайд 15

Если сделать предположения о распределении или о его свойствах до эксперимента, то по опытным данным обычно требуется подтвердить или опровергнуть эти гипотезы с определенной степенью достоверности. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента: о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т.д.

Изображение слайда
16

Слайд 16

Пусть каждому i объекту соответствует значение x i,, где N - количество всех исследуемых объектов. Совокупность всех возможных значений (теоретически домысливаемых) N объектов называется генеральной совокупностью, а N – объемом генеральной совокупности. Генеральная совокупность может быть конечной или бесконечной. Например, изучение физической подготовленности детей 10 лет г. Иркутска.

Изображение слайда
17

Слайд 17

Пусть количество реально наблюдаемых объектов из N равно n. Тогда x i – выборка из генеральной совокупности, n – объем выборки.

Изображение слайда
18

Слайд 18: Выборка из генеральной совокупности должна обладать следующими свойствами:

каждый элемент x i выбран случайно; все x i имеют одинаковую вероятность попасть в выборку; n должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной).

Изображение слайда
19

Слайд 19: Формы представления выборки из генеральной совокупности

Представление выборки из генеральной совокупности в негруппированном виде. Этот ряд называется простым статистическим рядом. Такая форма связана с наличием сведений о каждом элементе выборки.

Изображение слайда
20

Слайд 20: Пример:

измерена масса тела 10 девочек 6 лет. Полученные данные образуют простой статистический ряд: 24 22 23 26 24 23 25 27 25 25

Изображение слайда
21

Слайд 21

Отдельные значения статистического ряда называются вариантами. Если варианта х i появилась m раз, то число m называют частотой, а ее отношение к объему выборки m/n – относительной частотой (частостью).

Изображение слайда
22

Слайд 22

2. Представление выборки в виде вариационного ряда (в упорядоченном виде): х (1) ≤ х (2) ≤ … ≤ х (i) ≤... ≤ х (n). В этом случае х (i) – член вариационного ряда, или варианта. Часто х (i) называют порядковой статистикой.

Изображение слайда
23

Слайд 23: Пример:

Вариационный ряд: 22 23 23 24 24 25 25 25 26 27

Изображение слайда
24

Слайд 24

Таблица, в первой строке которой записаны все значения величины (варианты), во второй –- соответствующие им частоты, называется также вариационным рядом по значениям.

Изображение слайда
25

Слайд 25: Пример:

Изображение слайда
26

Слайд 26

Понятие репрезентативная выборка не всегда можно связать с её объемом n. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоёмкости и стоимости получения наблюдений или измерений для формирования выборки.

Изображение слайда
27

Слайд 27

Форма представления выборки из генеральной совокупности в виде вариационного ряда не приводит к потере информации о каждом элементе выборки, но искажает информацию, устанавливая зависимость между соседними элементами выборки.

Изображение слайда
28

Слайд 28

Необходимо помнить! Члены вариационного ряда, в отличие от элементов исходной выборки, уже не являются взаимно независимыми (по причине их предварительной упорядоченности).

Изображение слайда
29

Слайд 29: Представление выборки в группированном виде

Такая форма представления выборки из генеральной совокупности связана с разбиением области задания случайной величины Х на L интервалов группирования. При этом известно только количество элементов выборки n j,, попавших в j интервал и последовательность границ интервалов разбиения.

Изображение слайда
30

Слайд 30

Для определения числа L интервалов искусственного группирования пользуются формулой Старджеса

Изображение слайда
31

Слайд 31

Иногда L может быть задано природой исследуемого явления или условиями проведения эксперимента. В этом случае ширина каждого интервала может быть отличной от других ( неравноточное группирование ). На некоторых этапах статистического анализа необходимо исходную выборку представлять в группированном виде.

Изображение слайда
32

Слайд 32: Последовательность процедуры группирования неупорядоченной выборки из генеральной совокупности

Формирование вариационного ряда. Выделение минимального и максимального элементов выборки х min = х (1), х max = х (n). Определение числа интервалов группирования осуществляется из соображения точности и устанавливается эмпирическим путем в зависимости от объема выборки, либо по формуле Старджеса, либо определяется природой явления или условиями проведения эксперимента. Округление при нахождении L осуществляется до ближайшего целого числа.

Изображение слайда
33

Слайд 33

Определение ширины интервалов гистограммы (при равноточном группировании) Если при вычислении h необходимо округлить результат, следует помнить, что последний интервал группирования будет меньше ширины h при округлении в большую сторону и больше h - при округлении в меньшую сторону. Формирование последовательности границ интервалов разбиения. Образуемый вариационный ряд границ интервалов группирования будет выглядеть как х (1), х (1) + h, х (1) + 2h, …, х (1) + (L-1) ×h, х (n).

Изображение слайда
34

Слайд 34

Для того чтобы x (1) и х (n) попали внутрь соответственно 1-го и L-го интервалов группирования, границы х (1) и х(n) корректируют следующим образом: x' (1) = x (1) - h/ 2, x' (n) = x (n) + h /2. Следовательно, число интервалов разбиения увеличивается на 1 L ′ = L + 1.

Изображение слайда
35

Слайд 35

При этом последовательность границ интервалов разбиения будет представлена в виде x’ (1), х ’ (1) + h, х ’ (1) + 2h, …, х ’ (1) + L×h, х ’ ( n ) Определение количества элементов выборки n j, попавших в каждый j интервал.

Изображение слайда
36

Слайд 36: Пример

Даны объемы ежедневной выработки в течение месяц (в тыс. руб.) пятидесяти продавцов молочных изделий, работающих в разных районах города 15 19 6 18 21 16 20 17 15 10 16 20 7 19 22 17 21 19 16 11 19 10 8 18 20 8 18 16 20 12 16 21 21 9 19 19 14 18 19 19 12 20 20 8 13 10 18 17 22 18.

Изображение слайда
37

Слайд 37: В EXCEL

Находим основные числовые характеристики выборки: выборочную среднюю, выборочную дисперсию, стандартное отклонение, моду, медиану. Для этого в Excel в отдельные ячейки вводим данные выборки, устанавливаем курсор в желаемой ячейке, выбираем «мастер функций» «статистические», «СРЗНАЧ», нажимаем ОК:

Изображение слайда
38

Слайд 38

Изображение слайда
39

Слайд 39: В «Число1» ставим курсор и выделяем весь диапазон, в котором находится выборка, нажимаем ОК:

Изображение слайда
40

Слайд 40: Получаем в соответствующей ячейке искомое значение:

Изображение слайда
41

Слайд 41: Далее действуем аналогично:

Изображение слайда
42

Слайд 42

Изображение слайда
43

Слайд 43: Так получаем основные числовые характеристики:

Изображение слайда
44

Слайд 44: Представим выборку в группированном виде

1. Формируем вариационный ряд 6 9 12 15 16 18 19 19 20 21 7 10 12 16 17 18 19 19 20 21 8 10 13 16 17 18 19 19 20 21 8 10 14 16 17 18 19 20 20 21 8 11 15 16 18 18 19 20 21 22. Находим х (1) = 6, х (n) = 22.

Изображение слайда
45

Слайд 45

3. Определяем число интервалов разбиения по формуле Старджеса L = 1 + 3,322 lg50 = 6.6, L = 7. 4. Находим ширину интервала разбиения h h = (22 - 6) / 7 = 2.2857. Ограничимся двумя знаками после запятой и получим h = 2.28. Так как h округлено в сторону уменьшения, последний интервал будет шире предыдущих.

Изображение слайда
46

Слайд 46

Строим вариационный ряд границ интервалов группирования (без корректировки границ первого и последнего интервалов): [6; 8.28), [8.28; 10.56), [10.56; 12.84), [12.84; 15.12), [15.12; 17.4), [17.4; 19.68), [19.68; 22].

Изображение слайда
47

Слайд 47

6. Находим количество элементов выборки n j, попавших в j интервал: Группированная форма представления случайной величины не содержит информации о каждом элементе выборки. При этом часто в качестве значения случайной величины на интервале принимается его середина. j 1 2 3 4 5 6 7 n j 5 4 3 4 8 14 12

Изображение слайда
48

Слайд 48: Используя полученные результаты и с помощью стандартных функций Excel получаем таблицу:

Изображение слайда
49

Слайд 49: Строим соответствующие графики: полигон

Изображение слайда
50

Слайд 50: гистограмма

Изображение слайда
51

Слайд 51: кумулята:

Изображение слайда
52

Слайд 52: Это важно!

От негруппированной выборки всегда можно перейти к группированной, но не наоборот. Переход к группированной форме представления выборки сопряжен с потерей информации об исследуемом объекте, процессе или явлении.

Изображение слайда
53

Слайд 53

Характеристики случайной величины, полученные по выборке из генеральной совокупности, называются выборочными или эмпирическими характеристиками, а характеристики, полученные по генеральной совокупности, – теоретическими или генеральными характеристиками.

Изображение слайда
54

Последний слайд презентации: Элементы математической статистики

Все методы математической статистики можно разделить на параметрические методы, основанные на использовании знаний о вероятностной модели, и непараметрические, когда априорных представлений о виде модели нет, или она не используется.

Изображение слайда