Комплексная статистическая обработка экспериментальных данных
Министерство
образования и науки УкраиныПояснительная
запискак курсовой
работепо дисциплине
СтатистикаКомплексная
статистическая обработка экспериментальных данныхРеферат
Объектом исследования
данной работы является комплексный анализ сгенерированных выборок случайных величин и подбор их закона распределения.Целью работы является изучение методов и приемов анализа
статистической информации, получение навыков и опыта работы в пакете STATISTICA.В данной работе применялись широко используемые
статистические методы обработки и анализа данных.Результатом работы
является освоение методов обработки данных статистического наблюдения, их
анализа с помощью обобщающих показателей, установление теоретических законов
распределения случайных величин и доказательство адекватности этих законов.Данную курсовую работу
можно использовать в качестве наглядного пособия
по обработке статистических данных для различных учебных целей и задач.Задание на курсовой проект
По специально
сгенерированному имитатору получить последовательности случайных чисел двух
типов:а) ,
где – номер варианта,
номер измерения случайной величины,
– случайное число, возвращаемое при обращении к
стандартной функции выбранного языка программирования – датчику случайных
чисел.б) .
Для исследований
предусмотреть следующие объёмы измерений для каждой из случайных величин: 100,
200, …, 1000 (объёмы выборок).Произвести статистический
анализ каждой из полученных выборок для двух случайных величин в следующей
последовательности:а) найти размах
варьирования;б) определить
целесообразное количество групп по формуле Стерджесса, построить группировку и
интервальный ряд;в) привести графическое
изображение полигона частот, гистограммы, кумуляты и эмпирической функции
распределения;г) вычислить и
проанализировать точечные оценки и для простого и интервального рядов; построить и
проанализировать зависимость величины точечной оценки от объема выборки и от
номера эксперимента (10 выборок для объема выборки 1000);д) построить
доверительные интервалы для и , используя различные значения доверительной
вероятности (0,9; 0,95; 0,975; 0,995; 0,999) и проанализировать зависимость
длины доверительного интервала от объёма выборки и от величины доверительной
вероятности;е) вычислить и
проанализировать медиану, коэффициент вариации, коэффициент асимметрии и
эксцесс, моду; проанализировать зависимости числовых характеристик от объема
выборки;ж) оценить однородность
каждой из выборок, используя:1) коэффициент вариации;
2) метод -статистик Ирвина.
з) определить, близки ли
к нормальному распределению полученные эмпирические распределения на основе:1) анализа числовых
характеристик положения и вариации;2) на основе критерия
согласия Пирсона;и) по виду гистограмм
выдвинуть гипотезу о предполагаемых законах распределений исследуемых случайных
величин, определить оценки параметров предполагаемых распределений (метод
моментов и максимального правдоподобия) и проверить гипотезу о законе
распределения по критерию Пирсона.Введение
С
давних пор человечество осуществляло учет многих сопутствующих его
жизнедеятельности явлений и предметов, а также связанных с ними вычислений.
Люди получали разносторонние, хотя и различающиеся полнотой сведения на
различных этапах общественного развития. Данные учитывались повседневно в
процессе принятия хозяйственных решений, а в обобщенном виде и на
государственном уровне – при определении направления экономической и социальной
политики, характера внешнеполитической деятельности.Выполняя самые
разнообразные функции сбора, систематизации и анализа сведений, характеризующих
экономическое и социальное развитие общества, статистика всегда играла роль
главного поставщика факторов для управленческих, научно-исследовательских и
прикладных практических нужд различного рода структур, организаций и населения.
Роль статистики в нашей жизни настолько значительна, что люди, часто не
задумываясь и не осознавая, постоянно используют элементы статистической
методологии в повседневной практике.Применяя статистические методы в экономических исследованиях,
можно осуществлять стратегическое планирование, а также анализировать и
прогнозировать рыночную конъюнктуру, уменьшая степень неопределенности в
отношении внешнего окружения.С увеличением объемов
информации, становится актуальным вопрос ее компьютерной обработки. Получение
навыков обработки и анализа экспериментальных данных с помощью компьютера,
например, в пакете STATISTICA дает
возможность получить полную информацию об исследуемом объекте и найти
оптимальное решение конкретной поставленной задачи.1. Генерация исходных данных
В данной курсовой работе вместо статистического наблюдения
используются случайные величины, сгенерированные по следующим формулам:1) непрерывная случайная величина X, определяемая по формуле 1.1;
(1.1)
2) непрерывная случайная величина У, определяемая по формуле
1.2.(1.2)
где , значения случайной величины X и У в различных опытах;
случайное число, равномерно распределенное на
отрезке [0, 1], возвращаемое при обращении к стандартной функции на выбранном
языке программирования к датчику случайных чисел; Для генерации исходных
данных были использованы следующие методы:1) Для случайной величины в окне Variable в поле Long Name была введена формула 1.3:
(1.3)
2) Для случайной величины был создан программный имитатор в модуле STATISTICA BASIC. Реализация алгоритма генерации данных в модуле STATISTICA BASIC приведена в приложении А.
В результате были
получены выборки, объемом 100, 200…1000 значений для каждой из случайных
величин.2. Первичная обработка результатов наблюдения
2.1 Построение вариационного ряда
Вариационный ряд упорядоченные по возрастанию значения
признака.Построение вариационного ряда в пакете STATISTICA производилось следующим образом:
в модуле Basic Statistics and Tables: Analysis → Frequency
tables → кнопка Variables для выбора переменной → отметили All distinct values → ОК.Размах варьирования – абсолютная величина разности между максимальным и минимальным значениями (вариантами) изучаемого признака:
(2.1)
Построение размаха
варьирования в пакете STATISTICA производилось следующим образом:в модуле Basic Statistics and Tables:
Analysis → Descriptive statistics → Variables (выбрать переменную) → нажали Box & whisker plot
for all variables → выбрали
Median / Quart. / Range → ОК.Значения размаха
варьирования для заданных выборок в таблице 2.1.Таблица 2.1 – Размах
варьирования для заданных выборок
|
|
|||||
Выборка |
|
|
|
|
|
|
100 | 25,201 | 6,993 | 18,209 | 28,805 | 2,429 | 26,376 |
500 | 25,110 | 6,984 | 18,126 | 33,695 | 0,196 | 33,499 |
1000 | 25,237 | 6,711 | 18,466 | 33,962 | 1,574 | 35,536 |
Случайная величина имеет меньший размах, чем случайная величина .
2.2 Группировка
статистических данных
Число групп определяется по формуле Стерджесса (2.2):
, (2.2)
где – количество групп;
– объем выборки.
После определения числа групп следует определить интервалы
группировки значения варьирующего признака, лежащие в определенных границах.
Величина равного интервала определяется по формуле (2.3):
(2.3)