Слайд 2: Взаимосвязь переменных
Метрическая шкала Бинарная шкала Метрическая шкала Коэффициент корреляции Пирсона t- критерий Стьюдента Ранговая шкала ( < 30) Коэффициент корреляции Спирмена Критерий Манна-Уитни Бинарная шкала t- критерий Стьюдента Хи-квадрат Номинальная шкала ( > двух уровней) ANOVA (дисперсионный анализ) Хи-квадрат 1 2 3 3 1 4 ?
Слайд 4: Коэффициент корреляции
Связь между двумя переменными Значения от -1 до 1 0 = отсутствие линейной зависимости < 0 – при увеличении одного значения другое уменьшается > 0 – значения уменьшаются или увеличиваются одновременно чем дальше от 0, тем связь сильнее
Слайд 10: Что такое R
Язык программирования для статистического анализа и визуализации его результатов С вободная программная среда вычислений с открытым исходным кодом Официальный сайт проекта http :// www.r-project.org/
Слайд 11: Язык R
был создан сотрудниками Оклендского университета Россом Ихака и Робертом Джентельменом имеет двух родителей: коммерческий язык программирования S/S-PLUS, из которого была позаимствована большая часть синтаксиса, и язык программирования Scheme, предоставивший многие семантические структуры возник в 1997 году и сразу стал пользоваться успехом у пользователей и разработчиков R. Ihaka R. Gentelman
Слайд 12: Среда R
Среда R доступна в бинарном виде для многих компьютерных платформ, в том числе Linux, Windows, Mac OS X и Mac OS Classic Предоставляется также исходный код для компиляции на других платформах
Слайд 13: Интерфейс
Используется интерфейс командной строки
Слайд 14: Но…
доступны и несколько графических интерфейсов пользователя, например пакет RCommander
Слайд 17: Анализ данных
Слайд 18: Стандартные графики
Слайд 20: Почему R ?
является свободным программным обеспечением поддерживает широкий спектр статистических и численных методов (классические статистические методы, линейные и нелинейные модели, методы классификации, кластеризации, анализ временных рядов…) хорошая расширяемость с помощью пакетов возможность создания качественной графики
Слайд 21: Примеры
Слайд 23: Примеры
Слайд 24: Модель данных R
Базовым объектом данных в R является вектор > 1 [1] 1 > # Сохраняем вектор > x <- c (168, 177, 177, 177, 178, 165, 170) > x # выводим вектор [1] 168 177 177 177 178 165 170 Работа с (многомерными) массивами, структурами данных, (разнородными) списками и матрицами Операции поэлементны
Слайд 25: Доступ к элементу массива
> z [,1] [,2] [,3] [1,] 19 22 25 [2,] 20 23 26 [3,] 21 24 27 > z[,3] [1] 25 26 27 > z[1,3] [1] 25
Слайд 26: Управляющие структуры
Условный оператор if (условие) { выполняется если условие верно } else {выполняется если условие не верно} Циклы for (k in 1:5){ действие } while ( условие ){ действие } Функции fname =function(a) { описание } Неявные циклы apply () может применить функцию к элементу матрицы или массиву
Слайд 27: Элементы синтаксиса
регистрозависимость <- присваивание, например : x <- 7 # комментарий == равенство <=, >= сравнение с равенством <> неравенство {} блок
Слайд 28: Некоторые функции
!!! help(function) # справка mean(x) # среднее min(x) # минимальное значение det (M) # определитель матрицы inv(M) # обратная матрица plot( x,y ) # график lm( y~x ) # линейная регрессия …
Слайд 29: Пакеты
Пакеты представляют собой библиотеки для работы специфических функций или специальных областей применения В базовую поставку R включен основной набор пакетов, а всего по состоянию на 2012 год доступно более 4100 пакетов
Слайд 30: Пример установки пакета
Пакеты → Установить пакет(ы) Для R Commander ищем Rcmdr NB! для запуска R Commander каждый раз необходимо включать этот пакет: Пакеты → Включить пакет… → Rcmdr
Слайд 31: RStudio
среда для работы с R подсветка кода работа с пакетами просмотр графиков удобная работа со скриптами …
Слайд 32: Некоторые ссылки
http ://www.ibm.com/developerworks/ru/library/l-r1 / (Статистическое программирование на R: Часть 1. Купаемся в изобилии статистических возможностей) http:// www.r-project.org/ The R Project for Statistics http:// cran.r-project.org/doc/manuals/R-intro.pdf http :// ru.wikibooks.org/wiki/ Язык_программирования _R http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html?_r=0 ( Data Analysts Captivated by R’s Power )