Презентация на тему: Математическая статистика. Лекция №1

Математическая статистика. Лекция №1
Математическая статистика
Математическая статистика. Лекция №1
Генеральная совокупность
Генеральная совокупность (продолжение)
Выборка
Математическая статистика. Лекция №1
Ранжирование выборки
Ранжирование выборки
Вариационный ряд
Дискретный статистический ряд
Характеристики дискретного статистического ряда:
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Эмпирическая функция распределения.
Математическая статистика. Лекция №1
Эмпирическая плотность распределения
Математическая статистика. Лекция №1
Графическое изображение статистических данных.
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
Математическая статистика. Лекция №1
1/28
Средняя оценка: 4.5/5 (всего оценок: 88)
Код скопирован в буфер обмена
Скачать (299 Кб)
1

Первый слайд презентации: Математическая статистика. Лекция №1

Изображение слайда
2

Слайд 2: Математическая статистика

Математическая статистика - это раздел прикладной математики, в котором рассматриваются методы отыскания законов и характеристик случайных величин по результатам наблюдений и экспериментов. Основные задачи математической статистики : 1. Создание методов сбора и группировки обрабатываемого статистического материала, полученного в результате наблюдений за случайными процессами. 2. Разработка методов анализа полученных статистических данных. 3. Получение выводов по данным наблюдений.

Изображение слайда
3

Слайд 3

Анализ статистических данных включает оценку вероятностей события, функции распределения вероятностей или плотности вероятностей, оценку параметров известного распределения, оценку связей между случайными величинами. Математическая статистика опирается на теорию вероятностей и в свою очередь служит основой для разработки методов обработки и анализа статистических результатов в конкретных областях человеческой деятельности.

Изображение слайда
4

Слайд 4: Генеральная совокупность

Основными понятиями математической статистики являются генеральная совокупность и выборка. Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины. Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов.

Изображение слайда
5

Слайд 5: Генеральная совокупность (продолжение)

Не следует смешивать понятие генеральной совокупности с реально существующими совокупностями. Например, на склад поступила продукция некоторого цеха за месяц, что является реально существующей совокупностью, которую нельзя назвать генеральной, поскольку выпуск продукции можно мысленно продолжить сколь угодно долго.

Изображение слайда
6

Слайд 6: Выборка

Выборкой (выборочной совокупностью) называется совокупность случайно отобранных объектов из генеральной совокупности. Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности. Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность.

Изображение слайда
7

Слайд 7

Способы получения выборки: 1) Простой отбор – случайное извлечение объектов из генеральной совокупности с возвратом или без возврата. 2) Типический отбор, когда объекты отбираются не из всей генеральной совокупности, а из ее «типической» части. 3) Серийный отбор – объекты отбираются из генеральной совокупности не по одному, а сериями. 4) Механический отбор - генеральная совокупность «механически» делится на столько частей, сколько объектов должно войти в выборку и из каждой части выбирается один объект. Число N объектов генеральной совокупности и число n объектов выборки - объемы генеральной и выборочной совокупностей соответственно. При этом предполагают, что N>>n (значительно больше).

Изображение слайда
8

Слайд 8: Ранжирование выборки

Полученные различными способами отбора данные образуют выборку. Обычно это множество чисел, расположенных в беспорядке. По такой выборке трудно выявить какую-либо закономерность их изменения ( варьирования ). Для обработки данных используют операцию ранжирования : наблюдаемые значения случайной величины располагают в порядке возрастания.

Изображение слайда
9

Слайд 9: Ранжирование выборки

Пример 1. Дана выборка : Проведем ранжирование выборки : После проведения операции ранжирования значения случайной величины группируют так, что в каждой отдельной группе значения случайной величины одинаковы. Каждое такое значение - вариант. Варианты обозначаются строчными буквами латинского алфавита с индексами, соответствующими порядковому номеру группы. Изменение значения варианта называется варьированием.

Изображение слайда
10

Слайд 10: Вариационный ряд

Вариационный ряд- последовательность вариантов, записанная в возрастающем порядке. Число, показывающее, сколько раз встречаются соответствующие значения вариантов в ряде наблюдений, называется частотой или весом варианта, и обозначается n i, где i - номер варианта. Отношение частоты данного варианта к общей сумме частот называется относительной частотой или частность (долей) соответствующего варианта и обозначается или, где m – чисто вариантов. Частность является статистической вероятностью появления варианта. Естественно считать частность аналогом вероятности появления значения случайной величины Х.

Изображение слайда
11

Слайд 11: Дискретный статистический ряд

Дискретным статистическим рядом называется ранжированная совокупность вариантов ( х i ) с соответствующими им частотами ( n i ) или частностями ( ). Дискретный статистический ряд удобно записывать в виде таблицы. 1 2 3 4 7 2 2 3 1 2

Изображение слайда
12

Слайд 12: Характеристики дискретного статистического ряда:

Размах варьирования R= Мода ( ) – вариант, имеющий наибольшую частоту Медиана ( ) – значение случайной величины, приходящееся на середину ряду. Пусть n - объём выборки. Если n=2k, то есть ряд имеет чётное число членов, то . Если n =2 k+1, то есть ряд имеет нечётное число членов, то .

Изображение слайда
13

Слайд 13

Если изучаемая случайная величина Х является непрерывной или число значений её велико, то составляют интервальный статистический ряд. Сначала определяют число интервалов m, в зависимости от объёмов выборки с помощью таблицы: Затем определяют длину частичного интервала h : , где h – шаг, m – число интервалов. Объем выборки 25-40 40-60 60-100 100-200 более 200 Число интервалов 5-6 6-8 7-10 8-12 10-15

Изображение слайда
14

Слайд 14

Более точно шаг можно рассчитать с помощью формулы Стерджеса: , число интервалов m ≈ 1+ 3,322* lg n. Если шаг окажется дробным, то за длину интервала берут ближайшее целое число или ближайшую простую дробь (обычно берут интервалы одинаковые по длине, но могут быть интервалы и разной длины.)

Изображение слайда
15

Слайд 15

За начало первого интервала рекомендуется брать величину , а конец последнего должен удовлетворять условию:. Промежуточные интервалы получают, прибавляя к концу предыдущего интервала шаг. Просматривая результаты наблюдений, определяют количество значений случайной величины, попавшей в каждый конкретный интервал. При этом в интервал включают значения большие или равные нижней границе интервала и меньшие – верхней границы.

Изображение слайда
16

Слайд 16

В первую строку таблицы статистического распределения вписывают частичные промежутки: Во вторую строку статистического ряда вписывают количество наблюдений n i, ( где i = 1, m), попавших в каждый интервал, то есть, частоты соответствующих интервалов.

Изображение слайда
17

Слайд 17: Эмпирическая функция распределения

Пусть получено статистическое распределение выборки, и каждому варианту из этой выборки поставлена в соответствии его частность. Эмпирической функцией (функцией распределения выборки) называется функция F*( x ), определяющая для каждого значения х частость события, где n – число выборки, n x – число наблюдений, меньших x ( х R ). При увеличении объёма выборки частость события приближается к вероятности этого события. Эмпирическая функция F* ( х ) является оценкой интегральной функции F( x ) в теории вероятностей.

Изображение слайда
18

Слайд 18

Функция F *(х) обладает теми же свойствами, что и функция F(x) : 1. 2. F*(x) – неубывающая функция 3. =0, =1.

Изображение слайда
19

Слайд 19: Эмпирическая плотность распределения

Для интегральной функции распределения F(x) справедливо приближённое равенство:, где f( x ) – дифференциальная функция распределения (функция плотности вероятности). Поэтому естественно выборочным аналогом функции f(x) считать функцию: , где F * (x +∆ ) - F*(x) – частость попадания наблюдаемых значений случайной величины Х в интервал. Таким образом, значение f*(x) характеризует плотность частости на этом интервале.

Изображение слайда
20

Слайд 20

Пусть наблюдаемые значения непрерывной случайной величины представлены в виде интервального вариационного ряда. Полагая, что - частость попадания наблюдаемых значений в интервал, где h – длина частичного интервала, выборочную функцию плотности f(x) можно задать соотношением : , Где а m+1 – конец последнего m – интервала. Так как функция f*(x) является аналогом распределения плотности случайной величины, площадь области под графиком этой функции равна 1.

Изображение слайда
21

Слайд 21: Графическое изображение статистических данных

Статистическое распределение изображается графически с помощью полигона и гистограммы. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами (х i ;n i ) ; полигоном частностей - с координатами (х i ; ), где =, i = 1, m. Полигон служит для изображения дискретного статистического ряда. Полигон частостей является аналогом многоугольника распределения дискретной случайной величины в теории вероятностей.

Изображение слайда
22

Слайд 22

Гистограммой частот ( частостей ) называют ступенчатую фигуру, состоящую из прямоугольников, основания которых расположены на оси Ох и длины их равны длинам частичных интервалов ( h ), а высоты равны отношению: - для гистограмных частот ; - для гистограммы частостей. Гистограмма является графическим изображением интервального ряда. Площадь гистограммы частот равна n, а гистограммы частостей равна 1. Можно построить полигон для интервального ряда, если преобразовать его в дискретный ряд. В этом случае интервалы заменяют их серединными значениями и ставят в соответствие интервальные частоты ( частости ).

Изображение слайда
23

Слайд 23

Пример 1. Дана выборка значений случайной величины Х объёма 20: 12, 14, 19, 15, 14, 18, 13, 16, 17, 12 18, 17, 15, 13, 17, 14, 14, 13, 14, 16 Требуется: -построить дискретный вариационный ряд -найти размах варьирования R, моду, медиану -построить полигон частей. Ранжируем выборку: 12, 12, 13, 13, 13, 14, 14, 14, 14, 14 15, 15, 16, 16, 17, 17, 17, 18, 18, 19. 2) Находим частоты вариантов и строим дискретный вариационный ряд. 12 13 14 15 16 17 18 19 2 3 5 2 2 3 2 1

Изображение слайда
24

Слайд 24

3) По результатам таблицы находим: R= 19-12=7, =14, = 4) Строим полигон частостей.

Изображение слайда
25

Слайд 25

Пример 2. Результаты измерений отклонений от нормы веса сердец кур-несушек дали численные значения (в мкм), приведённые в таблице. Для данной выборки: -построить интервальный -построить гистограмму и полигон частостей. -1,760 -0,291 -0,110 -0,450 0,512 -0,158 1,701 0,634 0,720 0,490 1,531 -0,433 1,409 1,740 -0,266 -0,058 0,248 -0,095 -1,488 -0,361 0,415 -1,382 0,129 -0,361 -0,087 -0,329 0,086 0,130 -0,244 -0,882 0,318 -1,087 0,899 1,028 -1,304 0,349 -0,293 0,105 -0,056 0,757 -0,059 -0,539 -0,078 0,229 0,194 0,123 0,318 0,367 -0,992 0,529

Изображение слайда
26

Слайд 26

1) Строим интервальный ряд. По данным таблицы определяем х min = -1,76 x max =1,74; Для определения длины интервала h используем формулу Стерджеса: Число интервалов m ≈ 1+3,322* lg 50. Примем h =0,6, m = 7. За нчало первого интервала примем величину:

Изображение слайда
27

Слайд 27

Строим интервальный ряд: Интервалы Подсчет частот 2 6 11 15 Интервалы Подсчет частот 11 3 2

Изображение слайда
28

Последний слайд презентации: Математическая статистика. Лекция №1

Строим гистограмму частостей. Вершинами полигона являются середины верхних оснований прямоугольников гистограммы. Убедимся, что площадь гистограммы равна 1. S = 0,6*(0,07+0,2+0,37+0,5+0,37+0,1+0,07)= 0,6*1,68=1,008 ≈ 1.

Изображение слайда