Вы находитесь на странице: 1из 17

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

Учреждение образования
«Гомельский государственный технический университет
имени П.О. Сухого»

Гуманитарно-экономический факультет

Кафедра «Экономика»

Расчетно-графическая работа
по курсу «Статистика»

Выполнил студент группы МТ-21


Амелькович Владислав Сергеевич
Проверил д.э.н., профессор
Брикач Георгий Евгеньевич

Гомель 2019
Содержание

2
Исходные данные

3
ОПИСАТЕЛЬНАЯ СТАТИСТИКА

При проведении сложного статистического анализа можно упростить


процесс, используя надстройку "Пакет анализа". Чтобы выполнить анализ с
помощью этого пакета, следует указать входные данные и выбрать
параметры. Расчет будет выполнен с использованием подходящей
статистической макрофункции, а результат будет помещен в выходной
диапазон.
Инструмент «Описательная статистика» дает возможность построить
таблицу параметров описательной статистики для одного или более наборов
входных данных. Для каждого набора входных данных в выходном
интервале строится таблица со следующей информацией: Среднее,
Стандартная ошибка, Медиана, Мода, Стандартное отклонение, Дисперсия
выборки, Эксцесс, Асимметричность, Интервал, Минимум, Максимум,
Сумма, Счет. Статистической обработке подвергается один или несколько
наборов данных, располагаемых в интервале, ссылка на который задается в
поле Входной интервал. Как и другие инструменты Пакета анализа,
инструмент Описательная статистика создает таблицу параметров.
Задача описательной статистики заключается в том, чтобы с
использованием математических инструментов свести сотни значений
выборки к нескольким итоговым показателям, которые дают представление о
выборке. В качестве таких статистических показателей используются:
среднее, медиана, мода, дисперсия, стандартное отклонение и др.
Цель описательной статистики — обработка эмпирических данных, их
систематизация, наглядное представление в форме графиков и таблиц, а так-
же их количественное описание посредством основных статистических пока-
зателей.

Ход выполнения задания

При выполнении команды Анализ данных вызывается диалоговое окно


Анализ данных, в котором выбирается режим Описательная статистика; в
одноименном диалоговом окне задаются необходимые установки.

Параметры диалогового окна «Описательная статистика» имеют


следующий смысл.

4
Входной интервал – блок ячеек, содержащий значения исследуемого
показателя. Надо ввести ссылку на ячейки, содержащие анализируемые
данные.
Для определения Группирования надо установить переключатель в
положение По столбцам или По строкам в зависимости от расположения
данных во входном диапазоне.
Вывод описательной статистики осуществляется по месту указания в
поле Выходной интервал. Здесь вводится ссылка на левую верхнюю ячейку
выходного диапазона.
Этот инструмент анализа выводит два столбца сведений для каждого
набора данных. В левом столбце содержатся метки статистических данных; в
правом - статистические данные.
Для определения итоговой статистики(полного вывод показателей
описательной статистики) надо установить флажок, если в выходном
диапазоне необходимо получить по одному полю для каждого из следующих
видов статистических данных: Среднее, Стандартная ошибка (среднего),
Медиана, Мода, Стандартное отклонение, Дисперсия выборки, Эксцесс,
Асимметричность, Интервал, Минимум, Максимум, Сумма, Счет.
 Мода – значение применяемого признака, которое встречается
максимально число раз.
 Среднее значение – сумма всех значение измеренного признака,
деленная на количество измеренных значений.
 Размах (R = Xmax – Xmin) – разница меду максимальным и
минимальным числом выборки.
 Стандартная ошибка - показатель надежности расчетного
параметра. Стандартная ошибка – это стандартное отклонение оценок,
которые будут получены при многократной случайной выборке данного
размера из одной и той же совокупности. Стандартная ошибка – это
убывающая функция объема выборки: чем меньше стандартная ошибка, тем
более достоверной является оценка;
 Медиа́на (от лат. mediāna — середина) в математической
статистике — число, характеризующее выборку (например, набор чисел).
Если все элементы выборки различны, то медиана — это такое число
выборки, что ровно половина из элементов выборки больше него, а другая
половина меньше него. В более общем случае медиану можно найти,
упорядочив элементы выборки по возрастанию или убыванию и взяв
средний элемент.
Мода и медиана - важные показатели, они отражают структуру данных и
иногда используются вместо средней арифметической.
 Стандартное отклонение, в СТАТИСТИКЕ степень отклонения
данных наблюдений или множеств от СРЕДНЕГО значения. Обозначается
буквами s или s. Небольшое стандартное отклонение указывает на то,
что данные группируются вокруг среднего значения, а значительное - что
начальные данные располагаются далеко от него. Стандартное отклонение
5
равно квадратному корню величины, называемой дисперсией. Она есть
среднее число суммы возведенных в квадрат разностей начальных данных,
отклоняющихся от среднего значения.
 Выборочная дисперсия в математической статистике
— это оценка теоретической дисперсии распределения, рассчитанная на
основе данных выборки.
Дисперсия меняется от нуля до бесконечности. Крайнее значение 0
означает отсутствие изменчивости, когда значения переменной постоянны.
 Эксцесс — показатель остроты пика графика
распределения.Эксцесс симметричного распределения равно 0. Если
эксцесс больше 0, то график называется плосковершинным. Если эксцесс
меньше 0, то график называется островершинным.
 Асимметрия (Skewness), или коэффициент асимметрии, является
мерой несимметричности распределения. Если этот коэффициент
значительно отличается от 0, распределение является асимметричным, т.е.
несимметричным.
 Интервал — это значения варьирующего признака, лежащие в
определенных границах. Каждый интервал имеет верхнюю и нижнюю
границы или одну из них. Нижней границей называется наименьшее
значение признака в интервале.
 Минимум и максимум (Minimum&Maximum) — это
минимальное и максимальное значения переменной.
1. Проводим Анализ данных с помощью инструмента «Описательная
статистика».

6
2. Сортируем данные по возрастанию.

3. Функция распределения:

4. Строим график зависимости нормы распределения.

7
Вывод: Построив графики функций распределения можно сделать
вывод о том, что статистические ряды представляют собой упорядоченное
распределение единиц изучаемой совокупности на группы.
Анализируемые переменные выборки подчиняются нормальному
закону распределения.
Параметр Х3 имеет самое большое значение дисперсии и,
следовательно, самое большое отклонения или разброс данных.
Параметр Х2 имеет самое маленькое значение дисперсии. Это говорит
о значимом влиянии этого параметра на производительность труда.

8
ГИСТОГРАММНЫЙ АНАЛИЗ

Инструмент "Гистограмма" применяется для вычисления выборочных


и интегральных частот попадания данных в указанные интервалы значений.
При этом рассчитываются числа попаданий для заданного диапазона ячеек.
Гистограммы или линейчатые диаграммы – удобное средство для
обработки результатов измерений. Область значений измеряемой величины
разбивается на несколько интервалов, называемых также карманами, в
которых в виде столбцов откладывается количество попавших в этот
интервал измерений, называемое частотой. Карманы не обязательно должны
быть равными, но они должны располагаться по возрастанию границ.
Microsoft Excel нужно равномерно распределиьт карманы в интервале от
минимального до максимального значения исходных данных. Число
карманов будет равно корню квадратному из количества исходных значений.
В столбце Частота выводится число исходных значений, которые
больше или равны левой границы кармана, но меньше левой границы
следующего кармана. Последним значением столбца является число
исходных значений, больших или равных левой границе последнего кармана.
Столбец интервалов для карманов дублируется в столбец Карман.
Инструмент Гистограмма генерирует таблицу числовых констант. В
тех случаях, когда необходима связь с исходными значениями, следует
использовать формулы с табличной функцией ЧАСТОТА (массив данных;
массив карманов).

Ход выполнения задания

Для обработки данных используют Пакет анализа. Предварительно его


необходимо настроить в Excel:
 щелкнуть по кнопке Сервис;
 далее по кнопе Надстройки Exel;
 выбрать «Пакет инструментов анализа».
На вкладке Данные появится команда Анализ данных.
При выполнении команды Анализ данных вызывается диалоговое окно
Анализ данных, в котором выбирается режим Гистограмма; в одноименном
диалоговом окне задаются необходимые установки.

9
Параметры диалогового окна «Гистограмма» имеют следующий смысл.
Входной интервал – это блок ячеек, содержащий значения
исследуемого показателя.
Надо ввести ссылку на ячейки, содержащие анализируемые данные.
Вывод гистограммного анализа осуществляется по месту указания в
поле Выходной интервал. Здесь надо ввести ссылку на левую верхнюю
ячейку выходного интервала. Этот инструмент анализа выводит два столбца
сведений для каждого набора данных.
Левый столбец содержит границы интервалов группировки (карман);
правый столбец – частота попадания признака выборки в интервал (частота).
Гистограмма – это столбиковая диаграмма частот. По горизонтальной
оси показываются границы интервалов группировки, по вертикальной –
частота встречаемости этих значений. Высота каждого столбца показывает
частоту (количество) значений из набора данных, принадлежащих
соответствующему интервалу, равному ширине этого столбца.

Для Y - Производительность труда:

10
Для X1 - удельный вес рабочих в составе ППП;

Для X2 - удельный вес покупных изделий;

Для Х3 – Среднегодовая стоимость ОПФ:

11
Для Х4 – Среднегодовой фонд заработной платы ППП:

Для Х5 – Непроизводственные расходы:

Вывод: В данном случае по графикам можно увидеть, что наиболее


часто встречается Х5 (непроизводственные расходы), что в свою очередь
означает, что параметр Х5 (непроизводственные расходы) больше остальных
параметров влияет на значение У (производительность труда). Затем идет
среднегодовой фонд заработной платы ППП (Х4) – он также оказывает
небольшое влияние на производительность труда (Y).

12
ГРУППИРОВКА ПО ЧАСТОТЕ

Статистическая группировка – первый тип статистической сводки, поз-


воляющий выделить из массы исходного статистического материала одно-
родные группы единиц, объединяющих общим сходством в количественном
и качественном отношениях. Важно понимать, что группировка – это не
субъективный технический прием разделения совокупности на части, а
научно обоснованный процесс разделения множества единиц совокупности
по определенному признаку.

Ход выполнения задания

Для того что бы сгруппировать по частоте, необходимо, для начала, Х


отсортировать по возрастанию, после этого найти с помощью функций
максимум, минимум, среднее и квадратическое отклонение. Далее посчитать
норму распределения и плотность распределения, так же с помощью функций
=НОРМ.РАСП., только при рассчитывании нормы распределения интегральную
функцию набираем 1, а плотности- 0. Для того что бы посчитать частоту
необходимо рассчитать логарифм, интервал и группы. Логарифм:
=LOG(53;2)+1, где 53-это количество колхозов. Интервал: разница между мин и
макс, делённая на логарифм. Логарифм= 7, следовательно находим 7 групп.
Находим первую группу: к первому значению Х прибавляем значение
интервала. Далее к полученной группе прибавляем снова значение интервала и
получаем вторую группу, и так далее.
Находим частоту: выделяем семь ячеек и выбираем функцию частота, где
массив данных это все значения Х, а массив интервалов это все значения групп,
нажимаем ctrl+alt+enter.
Рассчитываем процентиль, квантиль и персентиль. Всё делаем с помощью
функций Excel.
После этого строим график зависимости нормы и плотности
распределения.
Повторяем эти действия для всех параметров Х.

По удельному весу рабочих в составе ППП:

13
По удельному весу покупных изделий:

По среднегодовой стоимости ОПФ

14
По среднегодовому фонду заработной платы ППП

По непроизводственным расходам

15
Частота показывает, частоты появления случайной величины в
интервалах значений и выводит их как массив цифр.

Вывод: Изучив графики можно заметить, что графики частоты и


плотности распределения имеют одинаковую тенденцию изменений. Частота
показывает, частоты появления случайной величины в интервалах значений и
выводит их как массив цифр. Эти графики частот похожи на графики
нормального распределения.
Значения удельного веса рабочих в составе ППП (Х1) в диапазоне от
46-47 встречаются наиболее часто. Это положительная тенденция для
предприятий, т.к. Повышение удельного веса рабочих в составе
ППП способствует снижению бюрократических издержек.
Значения удельного веса покупных изделий (Х2) встречается наиболее
часто в диапазоне от 31 до 47. Это не очень хорошо для предприятий, так как
чем больше продукции покупается, тем сильнее растёт себестоимость
собственной продукции.
При Х3 (среднегодовая стоимость ОПФ) часто встречающийся
диапазон почти отсутствует (44 и 46), это говорит нам о постоянной
стоимости ОПФ.
Среднегодовой фонд заработной платы ППП колеблется в небольшом
диапазоне от 46 до 47. Это также означает, что значительных изменений не
произошло.
При Х5 мы наблюдаем тенденцию непрерывного роста
непроизводственных расходов, это плохо отражается на деятельности
предприятия. Причинами, которые чаще всего приводят к росту
непроизводственных расходов, являются несоответствие квалификации
действующего персонала уровню, которого фирма добилась вследствие
постоянного прогресса, задержки в принятии и реализации управленческих
решений, попустительское отношение к процессу управления. Как правило,
16
любые непроизводственные издержки можно минимизировать на любом
этапе – руководителю лишь нужно осознать необходимость принятия мер
(например, решиться на увольнение старых работников).

17