Презентация на тему: Анализ данных

Реклама. Продолжение ниже
Анализ данных
Взаимосвязь переменных
Корреляционный анализ
Коэффициент корреляции
Диаграммы рассеяния (1)
Диаграммы рассеяния (2)
Диаграммы рассеяния (3)
Диаграммы рассеяния (4)
Язык R
Что такое R
Язык R
Среда R
Интерфейс
Но…
Импорт данных
Просмотр и редактирование
Анализ данных
Стандартные графики
Окно скриптов
Почему R ?
Примеры
Примеры
Примеры
Модель данных R
Доступ к элементу массива
Управляющие структуры
Элементы синтаксиса
Некоторые функции
Пакеты
Пример установки пакета
RStudio
Некоторые ссылки
Анализ данных
1/33
Средняя оценка: 4.8/5 (всего оценок: 58)
Код скопирован в буфер обмена
Скачать (2438 Кб)
Реклама. Продолжение ниже
1

Первый слайд презентации: Анализ данных

Осенний семестр 2014 Анализ данных

Изображение слайда
1/1
2

Слайд 2: Взаимосвязь переменных

Метрическая шкала Бинарная шкала Метрическая шкала Коэффициент корреляции Пирсона t- критерий Стьюдента Ранговая шкала ( < 30) Коэффициент корреляции Спирмена Критерий Манна-Уитни Бинарная шкала t- критерий Стьюдента Хи-квадрат Номинальная шкала ( > двух уровней) ANOVA (дисперсионный анализ) Хи-квадрат 1 2 3 3 1 4 ?

Изображение слайда
1/1
3

Слайд 3: Корреляционный анализ

Изображение слайда
1/1
4

Слайд 4: Коэффициент корреляции

Связь между двумя переменными Значения от -1 до 1 0 = отсутствие линейной зависимости < 0 – при увеличении одного значения другое уменьшается > 0 – значения уменьшаются или увеличиваются одновременно чем дальше от 0, тем связь сильнее

Изображение слайда
1/1
5

Слайд 5: Диаграммы рассеяния (1)

Изображение слайда
Изображение для работы со слайдом
1/2
6

Слайд 6: Диаграммы рассеяния (2)

Изображение слайда
Изображение для работы со слайдом
1/2
7

Слайд 7: Диаграммы рассеяния (3)

Изображение слайда
Изображение для работы со слайдом
1/2
Реклама. Продолжение ниже
8

Слайд 8: Диаграммы рассеяния (4)

Изображение слайда
Изображение для работы со слайдом
1/2
9

Слайд 9: Язык R

Средства анализ данных

Изображение слайда
1/1
10

Слайд 10: Что такое R

Язык программирования для статистического анализа и визуализации его результатов С вободная  программная среда вычислений с открытым исходным кодом Официальный сайт проекта http :// www.r-project.org/

Изображение слайда
Изображение для работы со слайдом
1/2
11

Слайд 11: Язык R

был создан сотрудниками Оклендского университета Россом Ихака и Робертом Джентельменом имеет двух родителей: коммерческий язык программирования S/S-PLUS, из которого была позаимствована большая часть синтаксиса, и язык программирования Scheme, предоставивший многие семантические структуры возник в 1997 году и сразу стал пользоваться успехом у пользователей и разработчиков R. Ihaka R. Gentelman

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
12

Слайд 12: Среда R

Среда R доступна в бинарном виде для многих компьютерных платформ, в том числе Linux, Windows, Mac OS X и Mac OS Classic Предоставляется также исходный код для компиляции на других платформах

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
Изображение для работы со слайдом
1/4
13

Слайд 13: Интерфейс

Используется интерфейс командной строки

Изображение слайда
Изображение для работы со слайдом
1/2
14

Слайд 14: Но…

доступны и несколько графических интерфейсов пользователя, например пакет  RCommander

Изображение слайда
Изображение для работы со слайдом
1/2
Реклама. Продолжение ниже
15

Слайд 15: Импорт данных

Изображение слайда
Изображение для работы со слайдом
1/2
16

Слайд 16: Просмотр и редактирование

Изображение слайда
Изображение для работы со слайдом
1/2
17

Слайд 17: Анализ данных

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
18

Слайд 18: Стандартные графики

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
19

Слайд 19: Окно скриптов

Изображение слайда
Изображение для работы со слайдом
1/2
20

Слайд 20: Почему R ?

является  свободным программным обеспечением поддерживает широкий спектр статистических и численных методов (классические статистические методы, линейные и нелинейные модели, методы классификации, кластеризации, анализ временных рядов…) хорошая расширяемость с помощью пакетов возможность создания качественной графики

Изображение слайда
1/1
21

Слайд 21: Примеры

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
Изображение для работы со слайдом
Изображение для работы со слайдом
Изображение для работы со слайдом
Изображение для работы со слайдом
1/7
22

Слайд 22: Примеры

Изображение слайда
Изображение для работы со слайдом
1/2
23

Слайд 23: Примеры

Изображение слайда
Изображение для работы со слайдом
Изображение для работы со слайдом
1/3
24

Слайд 24: Модель данных R

Базовым объектом данных в R является вектор > 1 [1] 1 > # Сохраняем вектор > x <- c (168, 177, 177, 177, 178, 165, 170) > x # выводим вектор [1] 168 177 177 177 178 165 170 Работа с (многомерными) массивами, структурами данных, (разнородными) списками и матрицами Операции поэлементны

Изображение слайда
1/1
25

Слайд 25: Доступ к элементу массива

> z [,1] [,2] [,3] [1,] 19 22 25 [2,] 20 23 26 [3,] 21 24 27 > z[,3] [1] 25 26 27 > z[1,3] [1] 25

Изображение слайда
1/1
26

Слайд 26: Управляющие структуры

Условный оператор if (условие) { выполняется если условие верно } else {выполняется если условие не верно} Циклы for (k in 1:5){ действие } while ( условие ){ действие } Функции fname =function(a) { описание } Неявные циклы apply ()  может применить функцию к элементу матрицы или массиву

Изображение слайда
1/1
27

Слайд 27: Элементы синтаксиса

регистрозависимость <- присваивание, например : x <- 7 # комментарий == равенство <=, >= сравнение с равенством <> неравенство {} блок

Изображение слайда
1/1
28

Слайд 28: Некоторые функции

!!! help(function) # справка mean(x) # среднее min(x) # минимальное значение det (M) # определитель матрицы inv(M) # обратная матрица plot( x,y ) # график lm( y~x ) # линейная регрессия …

Изображение слайда
1/1
29

Слайд 29: Пакеты

Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения В  базовую поставку R включен основной набор пакетов, а всего по состоянию на 2012 год доступно более 4100 пакетов

Изображение слайда
1/1
30

Слайд 30: Пример установки пакета

Пакеты → Установить пакет(ы) Для R Commander ищем Rcmdr NB! для запуска R Commander каждый раз необходимо включать этот пакет: Пакеты → Включить пакет… → Rcmdr

Изображение слайда
Изображение для работы со слайдом
1/2
31

Слайд 31: RStudio

среда для работы с R подсветка кода работа с пакетами просмотр графиков удобная работа со скриптами …

Изображение слайда
Изображение для работы со слайдом
1/2
32

Слайд 32: Некоторые ссылки

http ://www.ibm.com/developerworks/ru/library/l-r1 / (Статистическое программирование на R: Часть 1. Купаемся в изобилии статистических возможностей) http:// www.r-project.org/ The R Project for Statistics http:// cran.r-project.org/doc/manuals/R-intro.pdf http :// ru.wikibooks.org/wiki/ Язык_программирования _R http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html?_r=0 ( Data Analysts Captivated by R’s Power )

Изображение слайда
1/1
33

Последний слайд презентации: Анализ данных

Вопросы?

Изображение слайда
1/1