ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Нижегородский государственный университет им. Н. И. Лобачевского
Национальный исследовательский университет
Учебно-научный и инновационный комплекс
«Модели, методы и программные средства»
Зорин А. В. , Федоткин М. А. Введение в прикладной статистический анализ
в пакете R
(Учебно-методическое пособие)
Мероприятие 1. 2. Совершенствование образовательных технологий, укрепление
материально-технической базы учебного процесса
Учебные дисциплины: «Теория вероятностей и математическая статистика», «Ком-
пьютерные технологии анализа статистических данных»
Специальности, направления: «Прикладная математика и информатика», «При-
кладная информатика», «Информационные технологии»
ННГУ
2010
Введение
Специализированные программные комплексы для статистического анализа
данных играют важную роль во многих областях науки и бизнеса. Такие про-
граммы должны обладать несколькими специфическими особенностями: уметь
эффективно хранить данные разных типов и обеспечивать легкий доступ к ним,
эффективно выполнять трудоемкие вычислительные задачи, осуществлять пре-
образование данных из разных форматов, представлять графически данные и ре-
зультаты анализа, иметь встроенный язык для создания расширений и добавления
новой функциональности в различных прикладных областях, обладать богатым
набором методов решения основных статистических задач. В настоящее время
существует несколько конкурирующих между собой коммерческих продуктов, та-
ких как SPSS, STATISTICA, и т. д. , поддерживающих весь спектр возможностей. Отметим также наличие статистических функций и дополнительных надстроек у
программ электронных таблиц Microsoft Excel и OpenOffice Calc.
Наконец, прак-
тически все современные программы для проведения математических расчетов
(Mathematica, Maple, Matlab, Mathcad, Scilab, Octave, и т. д. ) общего назначения
имеют функции для выполнения основных процедур прикладного статистического
анализа. В научном сообществе пользуется популярностью пакет статистического ана-
лиза данных R [1]. Это свободно распространяемые на условиях лицензии GNU
язык и среда вкупе с большим набором библиотек, доступные для всех основных
платформ — UNIX, Linux, Windows и MacOS. Постоянно выходят новые версии
и расширения. Важным показателем популярности продукта является выход книг
с описанием применения R для тех или иных видов анализа [2, 3, 4]. Знакомство
с этим пакетом позволит получить базовые навыки постановки статистической
проблемы и решения ее «до числа», продемонстрирует основные методы про-
ведения статистического анализа данных и интерпретации численных значений
разнообразных статистик и оценок, возникающих в повседневной практике. Минимальная сессия в R представлена ниже. На ее примере мы объясним
некоторые принятые шрифтовые и типографский соглашения.
1 R version 2. 11. 1 (2010-05-31)
2 Copyright (C) 2010 The R Foundation for Statistical
3 Computing ISBN 3-900051-07-0
4
5 R -- это свободное ПО, и оно поставляется безо всяких
6 гарантий.