Вы находитесь на странице: 1из 17

Наука и Здравоохранение, 1, 2016 Методология научных исследований

Получена: 11 декабря 2015 / Принята: 18 января 2016 / Опубликована online: 25 Марта 2016
УДК 614.2 + 303.4

ОПИСАТЕЛЬНАЯ СТАТИСТИКА С ИСПОЛЬЗОВАНИЕМ


ПАКЕТОВ СТАТИСТИЧЕСКИХ ПРОГРАММ
STATISTICA И SPSS

Андрей М. Гржибовский 1-4, http://orcid.org/0000-0002-5464-0498,


Сергей В. Иванов 5, http://orcid.org/0000-0003-0254-3941
Мария А. Горбатова 2, http://orcid.org/0000-0002-6363-9595
1
Национальный Институт Общественного Здравоохранения, г. Осло, Норвегия
2
Северный Государственный Медицинский Университет, г. Архангельск, Россия
3
Международный Казахско-Турецкий Университет им. Х.А. Ясави, г. Туркестан,
Казахстан
4
Северо-Восточный Федеральный Университет, г. Якутск, Россия
5
Северо-Западный Государственный Медицинский Университет им. И.И. Мечникова,
г. Санкт-Петербург, Россия

В настоящей работе представлены основные методы предварительной статистической


обработки данных с использованием программного обеспечения Statistica и SPSS для начинающих
исследователей. Описаны различные типы данных, встречающихся в биомедицинских
исследованиях, параметры нормального распределения количественных признаков, способы
графического представления количественных результатов и методы проверки типа
распределения. Настоящая статья призвана дать общие сведения об описательной статистике и
проверке распределения данных, и не заменяет прочтения специализированной литературы по
статистике и клинической эпидемиологии.
Ключевые слова: Statistica, SPSS, описательная статистика, распределение, Казахстан.

DESCRIPTIVE STATISTICS USING


STATISTICA AND SPSS SOFTWARE

Andrej M. Grjibovski 1-4, http://orcid.org/0000-0002-5464-0498,


Sergej V. Ivanov 5, http://orcid.org/0000-0003-0254-3941
Mariya A. Gorbatova 2, http://orcid.org/0000-0002-6363-9595
1
Norwegian Institute of Public Health, Oslo, Norway
2
Northern State Medical University, Arkhangelsk, Russia
3
North-Eastern Federal University, Yakutsk, Russia
4
International Kazakh-Turkish University, Turkestan, Kazakhstan
5
North-Western State Medical University n.a. I.I. Mechnikov, St. Petersburg, Russia

This is the first paper of a series of articles where we describe basic principles of statistical data
analysis using Statistica and SPSS software for beginners. Step-be-step algorithms for presentation of
quantitative and qualitative data including normality testing are presented. Measures of central tendency
and variability are explained and practical examples using the data from earlier studies are given. The
main aim of this paper is to provide basic knowledge on descriptive statistics with practical examples
using popular software. The article complements, but does not substitute specialized literature on
biostatistics and clinical epidemiology.
Keywords: Statistica, SPSS, descriptive statistics, distribution, Kazakhstan.

7
Research methodology Science & Healthcare, 1, 2016

STATISTICA ЖӘНЕ SPSS СТАТИСТИКАЛЫҚ


БАҒДАРЛАМАЛАРЫ ПАКЕТТЕРІН ҚОЛДАНУМЕН
СИПАТТАУШЫ СТАТИСТИКА
Андрей М. Гржибовский1-4, http://orcid.org/0000-0002-5464-0498,
Сергей В. Иванов5, http://orcid.org/0000-0003-0254-3941
Мария А. Горбатова2, http://orcid.org/0000-0002-6363-9595
1
Қоғамдық Денсаулық сақтау Ұлттық Институты, Осло қ., Норвегия;
2
Солтүстік Мемлекеттік Медициналық Университеті, Архангельск қ., Ресей;
3
Х.А. Ясави ат. Халықаралық Қазақ – Түрік Университеті, Туркестан, Қазақстан;
4
Солтүстік - Шығыс Федералдық Университеті, Якутск қ., Ресей;
5
И. И. Мечников атынд. Солтүстік – Батыс мемлекеттік медициналық
университеті, Санкт-Петербург қ., Ресей.

Осы жұмыста бастаушы зерттеушілер үшін Statistica және SPSS бағдарламалық


қамсыздандыруды қолданумен мәліметтерді алдын ала статистикалық өңдеудің негізгі
әдістері көрсетілген. Биомедициналық зерттеулерде кездесетін әртүрлі мәліметтер түрлері
суреттелген, сандық белгілерді қалыпты бөлу параметрлері, сандық нәтижелердің
графикалық көріністері әдістері және бөлу сияқты тексеру әдістері. Осы мақала сипаттаушы
стаистика және мәліметтерді таратуды тексеру туралы жалпы мәліметтер беруге бейімделген
және статистика және клиникалық эпидемиология бойынша мамандандырылған әдебиетті
оқуды ауыстырмайды.
Негізгі сөздер: Statistica, SPSS, суреттеме статистика, тарату, Қазақстан.

Библиографическая ссылка:
Гржибовский А. М., Иванов С. В., Горбатова М. А. Описательная статистика с использованием пакетов
статистических программ Statistica и SPSS / / Наука и Здравоохранение. 2016. №1. С. 7-23.
Grjibovski A. M., Ivanov S. V., Gorbatova M. A. Descriptive statistics using Statistica and SPSS software.
Nauka i Zdravookhranenie [Science & Healthcare]. 2016, 1, pp. 7-23.
Гржибовский А. М., Иванов С. В., Горбатова М. А. Statistica және SPSS статистикалық
бағдарламалары пакеттерін қолданумен сипаттаушы статистика / / Ғылым және Денсаулық сақтау. 2016.
№1. Б. 7-23.

Настоящая статья открывает серию 2. Обучение начинающего исследователя


публикаций, посвященных статистическому основным практическим навыкам
анализу данных биомедицинских статистической обработки результатов
исследований. В последующих статьях будут собственных исследований с использованием
последовательно представлены базисные современного программного обеспечения.
статистические методы, наиболее часто 3. Предупреждение типичных ошибок,
используемые для анализа результатов возникающих в процессе статистической
биомедицинских исследований, а также обработки данных и приводящих к
особенности их применения и интерпретация некорректной интерпретации результатов
полученных результатов. анализа.
По мнению авторов, настоящая серия Для наиболее полного понимания
статей направлена на решение трех задач: представленного материала, авторы
1. Формирование у начинающего настоящей статьи настоятельно рекомендуют
исследователя базисных представлений о читателю предварительно ознакомиться с
статистическом анализе данных. литературой по эпидемиологии и получить
8
Наука и Здравоохранение, 1, 2016 Методология научных исследований

достаточные базисные представления о убывания (например, состояние пациента,


планировании, организации и проведении стадия сердечной недостаточности, степень
эпидемиологических исследований [14, 22, 24]. угнетения сознания). Хотя порядковые
Практические аспекты организации и анализа переменные, как и количественные, могут быть
результатов различных типов научных представлены в числовом выражении, но они
исследований в здравоохранении принципиально отличаются от количественных
(одномоментных, когортных, экологических, тем, что не могут быть подвергнуты
экспериментальных исследований и «случай- арифметическим операциям. В случае
контроль») представлены в серии статей, порядковых данных невозможно оценить
опубликованных в журнале «Наука и степень различий между находящимися рядом
Здравоохранение» в 2015 году [7, 8, 9, 10, 11]. уровнями переменной. Например, если между
Настоящая статья посвящена значениями количества гемоглобина 105 г/л,
предварительной статистической обработке 106 г/л и 107 г/л разница, в любом случае,
данных, представлению различных типов составляет 1 г/л, то в случае оценки тяжести
данных, описательной статистике и проверке состояния пациента невозможно утверждать,
типа распределений изучаемых признаков. что состояние средней тяжести в той же
В результате любого исследования ученый степени хуже удовлетворительного состояния,
получает некий набор сведений, которые в которой состояние средней тяжести хуже
необходимо соответствующим образом тяжелого состояния.
классифицировать и систематизировать для Выделяют также дихотомические
последующего анализа. Определение типов (бинарные) переменные, которые относятся к
собственных данных является необходимым качественным переменным, и могут принимать
условием их корректного представления и только два взаимоисключающих значения
правильного выбора методов статистической (например, мужской или женский пол, больной
обработки [1, 18]. или здоровый участник исследования,
Все признаки, характеризующие какое-либо благоприятный или неблагоприятный исход
явление или процесс, прежде всего, делятся на заболевания, наличие или отсутствие
количественные (числовые) и качественные осложнений). Типы признаков (переменных) в
(категориальные) [6, 15, 17, 21]. Количествен- биомедицинских исследованиях представлены
ные признаки названы так потому, что их на рисунке 1.
количественная мера точно определена, и они, Помимо исходных данных, полученных
в свою очередь, делятся на непрерывные, непосредственно в результате исследования,
которые могут принимать любое значение для статистического анализа используются
(например, масса тела, артериальное также и производные данные (например,
давление, уровень гемоглобина, концентрация индекс массы тела, рассчитываемый на
вещества и др.) и дискретные, которые могут основании измеренных роста и массы тела).
выражаться только целыми числами Качественные данные, как правило, могут
(например, количество рецидивов заболевания, быть представлены в виде частот или
количество беременностей, число заболевших процентов (например, доля мужчин в изучае-
и др.). Качественные признаки не имеют мой выборке пациентов, распространенность
непосредственной количественной меры и инфекционного заболевания в городе, частота
характеризуют принадлежность явления к встречаемости различных степеней ожирения и
какой-либо определенной категории. др.). Следует учесть, что если исследование
Качественные признаки подразделяются на является выборочным, то есть не включает в
номинальные, то есть просто имеющие себя всю популяцию, на которую будут
определенное наименование (например, номер транслированы результаты выборочного
палаты, семейное положение, основная или исследования, корректно представлять данные
контрольная группа наблюдения), и порядковые о частотах в виде 95% доверительных
(ранговые, ординальные), которые отличаются интервалов, алгоритмы расчета которых
от номинальных тем, что могут быть представлены в соответствующей литературе
размещены в порядке возрастания или [5, 25].

9
Research methodology Science & Healthcare, 1, 2016

Переменные

Количественные Качественные

Непрерывные Дискретные Номинальные Порядковые

Дихотомические

Рис. 1. Типы признаков (переменных) в биомедицинских исследованиях.

Представление количественных данных рассмотрено нормальное (гауссовское)


производится с использованием определен- распределение количественных данных.
ного набора показателей. При этом для того, Нормальное распределение характерно
чтобы выбрать, какие именно показатели для многих биологических явлений и
использовать для корректного представления процессов. Например, нормальному
количественных данных, и какие распределению подчиняется рост людей в
статистические критерии использовать, важно генеральной совокупности: у наибольшего
предварительного оценить тип распределения количества людей рост средний, меньшее
изучаемого признака. количество людей обладает ростом ниже и
Существуют различные виды распределе- выше среднего, и совсем немного людей
ний (биномиальное распределение, распреде- имеют очень низкий или очень высокий рост.
ление Пуассона и др.), с которыми можно Примеры нормального и некоторые виды
ознакомиться в специальной литературе по отличного от нормального распределений
статистике [17]. В настоящей статье будет представлены на рисунке 2.

Нормальное Скошенное распределение Равномерное распределение


распределение (правосторонняя асимметрия)

Рис. 2. Некоторые виды распределения количественных признаков.

Нормальное распределение может быть X1 + X2 + X3 + … + Xi


математически описано с использованием М=
n
двух параметров – среднего арифметического
значения и стандартного отклонения. где
Среднее арифметическое значение X1 … Xi – значения количественного признака,
рассчитывается по формуле: n – количество наблюдений.

10
Наука и Здравоохранение, 1, 2016 Методология научных исследований

Стандартное отклонение рассчитывается суммой квадратов отклонений значений


путем извлечения квадратного корня из признака от среднего арифметического
значения дисперсии (σ2), которая является значения:

(X1 – М)2 + (X2 – М)2 + (X3 – М)2 + … + (Xi – М)2


σ =√ σ2 = √ ( )
n

Стандартное отклонение является мерой целесообразно использовать медиану и


разброса значений вокруг среднего квартили. Медиана – значение признака,
арифметического: в область от M – σ до M + σ которое делит распределение пополам –
попадает 68% всех значений количественного половина значений признака располагается
показателя, в область от M – 1,96σ до M + слева, а другая половина – справа от
1,96σ попадает 95% значений, а область от M медианы. 25-й процентиль (или первый
– 2,58σ до M + 2,58σ включает в себя 99% квартиль) отсекает четверть самых низких
всех значений признака. значений признака, а 75-й процентиль (или
Для графического представления значений третий квартиль) – четверть самых высоких
количественного признака, имеющего нормаль- значений (медиана является 50-м
ное распределение, можно использовать процентилем, или вторым квартилем). Таким
столбчатую диаграмму, с указанием границ образом, между 1-м и 3-м квартилями
значения стандартного отклонения (рис. 3, располагается 50% значений признака.
слева). В то же время, во многих журналах Для графического представления значений
рекомендуется представлять не одно, а два признака, имеющего отличное от нормального
стандартных отклонения на столбчатой распределение, можно использовать
диаграмме, то есть 95% доверительный интервал. квартильную диаграмму, представленную на
Если же распределение отличается от рисунке 3 (диаграмма типа «ящик с усами»,
нормального, то для описания данных англ. «box-whisker plot».

Столбиковая диаграмма Квартильная диаграмма

Рис. 3. Графическое представление количественных данных:


при нормальном распределении (столбиковая диаграмма) и
при распределении, отличном от нормального (квартильная диаграмма).

Более подробно о распределении Наличие нормального распределения


признаков и математическом описании данных изучаемого признака расширяет возможности
можно узнать из литературы по статистике [4, исследователя в отношении использования
15, 17]. методов статистического анализа данных и

11
Research methodology Science & Healthcare, 1, 2016

повышает чувствительность статистических неблагополучной социально-экологической


критериев. Поэтому, если фактическое ситуации в Южном Казахстане [12, 13, 16]. В
распределение похоже на скошенное влево ходе данного исследования получены
или вправо нормальное распределение, во значения массы тела и уровня холестерина
многих случаях рекомендуется приблизить крови 298 пациентов. Масса тела и уровень
распределение к нормальному с помощью холестерина крови являются непрерывными
математического преобразования количественными признаками, вариационные
(разумеется, если это возможно). Например, ряды которых будут в проанализированы с
при правосторонней асимметрии (рисунок 2) использованием программного обеспечения
извлекают квадратный корень из значений, Statistica 10 [19, 2] и SPSS 20 [3]. Выбор данных
проводят логарифмическое преобразование с пакетов статистических программ обусловлен
использованием натурального или тем, что они являются одними из наиболее
десятичного логарифма или гармоническое удобных в использовании начинающими
преобразование по формуле x’ = - 1/x. При исследователями инструментами анализа
левосторонней симметрии данные возводят во данных, не требуют специального
вторую или третью степень [6]. Подбор того образования и приобрели заслуженную
или иного способа «нормализации» популярность среди исследователей стран
распределения, как правило, проводят СНГ, работающих в области медицины.
эмпирически. Важной причиной популярности данного
Сопоставление фактического распределе- программного обеспечения является, в том
ния количественных данных и нормального числе и, наличие русифицированных версий
распределения проводится следующими обеих программ. Демо-версии программ
взаимодополняющими методами: Statistica и SPSS можно загрузить с
1. Построение гистограммы официальных сайтов разработчиков
распределения: колоколообразная форма (www.stаstsoft.com и http://www-
гистограммы свидетельствует в пользу 01.ibm.com/software/analytics/spss/
нормального распределения. соответственно).
2. Построение квантильной диаграммы: Следует отметить, что представленные
расположение точек на прямой линии ниже алгоритмы действий являются только
свидетельствует в пользу нормального инструментом анализа данных, так как
распределения. корректная интерпретация получаемых
3. Проверка соответствия имеющегося результатов требует наличия базисных знаний
распределения нормальному с помощью в области биомедицинской статистики,
критерия Колмогорова-Смирнова с поправкой которые можно приобрести путем изучения
Lilliefors (для больших выборок) и критерия соответствующей литературы [4, 15, 17, 23, 25].
Шапиро-Уилка (для небольших выборок). Если
достигнутое в результате расчета значения Анализ вариационного ряда с
критериев значение статистической использованием программы Statistica 10.
значимости превышает 0,05 (p > 0,05) то Для начала работы необходимо открыть
фактическое распределение можно файл 1_Bodymass.sta, который необходимо
формально считать не отличающимся от загрузить с сайта журнала «Наука и
нормального. Здравоохранение». В данном файле
С целью приобретения читателем представлен один вариационный ряд значений
практических навыков представления массы тела пациентов.
описательных статистических данных и Далее следует выполнить ряд действий,
проверки распределения, в качестве целью которых является настройка вывода
практического примера будет рассмотрен программой необходимых данных.
фрагмент данных, которые были собраны в Выберем меню «Statistics» и войдем в
процессе крупного исследования, раздел «Basic Statistics/Tables» (рисунок 4),
направленного на изучение метаболического где выберем раздел «Descriptive Statistics»,
синдрома и его детерминант в условиях подтвердив выбор нажатием на кнопку ОК.

12
Наука и Здравоохранение, 1, 2016 Методология научных исследований

Рис. 4. Меню «Statistics» программы Statistica 10.


Далее в появившемся окне «Descriptive анализа вариационный ряд «Body mass», как
Statistics» нажмем на кнопку «Variables» (в показано на рисунке 5, после чего подтвердим
левом верхнем углу окна) и выберем для выбор нажатием на кнопку ОК.

Рис. 5. Выбор вариационного ряда для последующего анализа в программе Statistica 10.
Далее в окне «Descriptive Statistics» (Shapiro-Wilk’s W test), как это показано на
настроим процесс проверки распределения: рисунке 6. Здесь же можно указать количество
для этого нажмем на вкладку «Normality» и интервалов (столбиков) гистограммы, на
проставим галочки, напротив позиций, которые будет разбита выборка (Number of
соответствующих расчету значений критериев intervals), которое по умолчанию задано
Колмогорова-Смирнова (Kolmogorov-Smirnov & равным 10-ти. Количество интервалов, на
Lilliefors test for normality) и Шапиро-Уилка которые необходимо разбить выборку для

13
Research methodology Science & Healthcare, 1, 2016

построения гистограммы распределения, 298, и рассчитанное значение количества


можно рассчитать с помощью формулы интервалов равно 9, то есть оно всего лишь на
Стерджеса: m = 1 + 3,32 × Lg n, где n – единицу отличается от количества
количество наблюдений в выборке [23]. В интервалов, указанному программой по
нашем случае количество наблюдений равно умолчанию.

Рис. 6. Вкладка «Normality» окна «Descriptive Statistics» программы Statistica 10.

Далее нажмем на вкладку «Advanced» и, арифметического значения (Mean), медианы


как указано на рисунке 7, проставим галочки, (Median), стандартного отклонения (Standard
соответствующие выводу показателей Deviation), степени асимметрии (Skewness) и
описательной статистики: среднего эксцесса (Kurtosis).

Рис. 7. Вкладка «Advanced» окна «Descriptive Statistics» программы Statistica 10.

14
Наука и Здравоохранение, 1, 2016 Методология научных исследований

Также целесообразно указать минимум и Колмогорова-Смирнова (K-S), который


максимум (Minimum & maximum) и верхний и составил > 0,20. Для критерия Колмогорова-
нижний квартили (Lower & upper quartiles). При Смирнова с поправкой Lilliefors он также
необходимости можно выбрать и другие составил > 0,20, для критерия Шапиро-Уилка
показатели описательной статистики (моду, (Shapiro-Wilk W) – 0,053. В правом верхнем
дисперсию, коэффициент вариации, стандарт- углу окна вывода данных представлена
ную ошибку среднего арифметического, квантильная диаграмма (Normal P-plot), на
межквартильный интервал и другие). которой видно, что почти все точки
Для запуска анализа в той же вкладке располагаются на одной линии. В левом
«Advanced» нажмем на кнопку G1, которая нижнем углу окна представлены значения
активизирует вывод графиков, результатов показателей описательной статистики,
расчетов показателей и значений которые были выбраны на этапе настройки
статистических критериев. анализа данных. В правом нижнем углу окна
Результаты анализа представлены на представлена диаграмма по типу «box plot»,
рисунке 8. В левом верхнем углу окна вывода которую не следует путать с квартильной
данных расположена гистограмма диаграммой, так в представленной диаграмме
распределения, имеющая колоколообразную центральное значение занимает среднее
форму. Выше гистограммы размещены арифметическое, а не медиана, а верхним и
результаты расчета значений и нижним значениями «ящика» являются
статистической значимости критериев соответственно, значения M – σ и M + σ
проверки на соответствие фактического (выбор различных вариантов вывода
распределения нормальному: уровень диаграмм «box plot» можно настроить во
статистической значимости (p) для критерия вкладке «Options» окна «Descriptive Statistics»).

Рис 8. Результаты анализа переменной «Body mass» в программе Statistica 10.

15
Research methodology Science & Healthcare, 1, 2016

Таким образом, по результатам следующий практический смысл: в границы от


представленных программой графиков и 61,3 до 91,7 кг (M ± SD) попадает масса тела
расчетов следует заключить, что 68% пациентов, а в границы от 46,1 до 106,9
распределение имеет форму, близкую к (M ± 1,96*SD) попадает масса тела 95%
колоколообразной, статистическая значимость пациентов.
критериев проверки распределения на
нормальности имеет значение, превышающее Анализ вариационного ряда с
0,05, почти все точки на квантильной использованием программы SPSS 20.
диаграмме располагаются на прямой линии, Для начала работы необходимо открыть
значение среднего арифметического и файл 1_Cholesterol.sav, который потребуется
медианы близки друг к другу, а значения загрузить с сайта журнала «Наука и
асимметрии и эксцесса не превышают здравоохранение». В данном файле
значение 1 (либо не ниже значения - 1), что в представлен один вариационный ряд значений
совокупности свидетельствует в пользу уровня холестерина крови пациентов.
нормальности распределения массы тела Как и в процессе работы с программой
пациентов – участников исследования. Statistica, прежде всего потребуется
Значение массы тела пациентов можно подготовить параметры вывода данных. Для
представить в виде среднего арифметического этого войдем в меню «Analyze», раздел
и стандартного отклонения: M=76,5, (SD=15,2) «Descriptive Statistics», и выберем подраздел
кг. Данное математическое выражение имеет «Explore», как показано на рисунке 9.

Рис. 9. Меню «Analyze» программы SPSS 20.

В открывшемся окне «Исследовать» с 11), после чего программа снова вернется к


помощью стрелочки между полями перенесем окну «Explore».
переменную «Cholesterol» из левого поля в Далее нажмем на кнопку «Plots», и в
поле «Dependent List» (рисунок 10), после чего открывшемся окне «Explore: Plots» отметим
настроим ряд параметров вывода данных. Для позиции «Factor levels together» (поле
этого нажмем на кнопку «Statistics», и в «Boxplots»), «Histogram» (поле «Descriptive») и
открывшемся окне отметим позиции «Normality plots with tests», подтвердив выбор
«Descriptives» и «Percentiles», подтвердив нажатием кнопки «Continue» (рисунок 12).
выбор нажатием кнопки «Continue» (рисунок

16
Наука и Здравоохранение, 1, 2016 Методология научных исследований

Рис. 10. Раздел «Explore» программы SPSS 20.

Рис. 11. Окно «Statistics» раздела «Explore» программы SPSS 20.

Рис. 12. Окно «Explore: Plots» раздела «Explore» программы SPSS 20.

17
Research methodology Science & Healthcare, 1, 2016

Программа снова вернется к окну «Analyze» данной таблице следует обратить внимание на
(Рисунок 10), в котором нажатием на кнопку 25-й процентиль, соответствующий 1-му
«ОК» запустим анализ данных. квартилю, и 75-й процентиль, соответствующий
Рассчитанные параметры описательной 3-му квартилю (50-й процентиль соответствует
статистики для уровня холестерина крови медиане).
пациентов программа представляет в виде Результаты проверки распределения
таблиц и графиков. изучаемого признака с помощью
В таблице 1 представлены среднее статистических критериев представлены в
арифметическое и его 95% доверительный таблице 3. Уровень статистической
интервал, медиана, дисперсия, стандартное значимости («Sig.») оказался меньше 0,001 как
отклонение, асимметрия и эксцесс, а также ряд для рассчитанного критерия Колмогорова-
других параметров переменной «Cholesterol». Смирнова с поправкой Lilliefors, так и для
В таблице 2 представлены процентили значения критерия Шапиро-Уилка.
(квартили) для переменной «Cholesterol». В
Таблица 1.
Описательная статистика для переменной «Cholesterol»
Statistic Std. Error

Mean 5,0548 ,06155


Lower
4,9337
95% Confidence Bound
Interval for Mean Upper
5,1759
Bound
5% Trimmed Mean 4,9614
Median 4,8600
Cholesterol Variance 1,129
Std. Deviation 1,06258
Minimum 3,18
Maximum 10,79
Range 7,61
Interquartile Range 1,19
Skewness 1,735 ,141
Kurtosis 4,760 ,281
Таблица 2.
Процентили (квартили) для переменной «Cholesterol»
Percentiles
5 10 25 50 75 90 95
Weighted Average
Cholesterol 3,8195 4,0870 4,3000 4,8600 5,4925 6,4240 6,9615
(Definition 1)
Таблица 3.
Результаты проверки распределения переменной «Cholesterol»
с помощью статистических критериев
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Cholesterol ,127 298 ,000 ,874 298 ,000
a. Lilliefors Significance Correction

18
Наука и Здравоохранение, 1, 2016 Методология научных исследований

Гистограмма распределения, сформирован- колоколообразной формы, характерной для


ная программой SPSS, представлена на нормального распределения.
рисунке 13. На рисунке видно, что данная Квантильная диаграмма распределения
гистограмма не имеет равносторонней представлена на Рисунке 14: видно, что точки
отклоняются от прямой линии.

Рис. 13. Гистограмма распределения Рис. 14. Квантильная диаграмма переменной


переменной «Cholesterol», «Cholesterol», сформированная программой
сформированная программой SPSS 20. SPSS 20.

Квартильная диаграмма уровня диаграммы, представляют собой значения,


холестерина представлена на рисунке 15. превышающие уровень 90-го процентиля.
Точки, расположенные выше верхней границы

Рис. 15. Квартильная диаграмма переменной «Cholesterol»,


сформированная программой SPSS 20.

Таким образом, по результатам отличную от формы нормального


представленных программой SPSS данных распределения, статистическая значимость
видно, что распределение имеет форму, критериев проверки распределения на

19
Research methodology Science & Healthcare, 1, 2016

нормальность имеет значение меньше 0,001, распределение считают нормальным, если


точки на квантильной диаграмме отклоняются графики и значения асимметрии и эксцесса не
от прямой линии, что в совокупности говорят об обратном.
свидетельствует в пользу того, что Но возможны ситуации, когда для
фактическое распределение значений уровня представления данных используются
холестерина существенно отличается от параметры нормального распределения, хотя
нормального распределения. фактические данные распределены иначе.
В связи с отличием распределения уровня Примером такой ситуации являются
холестерина от нормального, использовать результаты исследования, посвященного
для представления данных среднее проблеме кариеса у детей и подростков,
арифметическое значение и стандартное выполненные по методике ВОЗ [26, 27, 28]. В
отклонение будет некорректным. Значение вышеупомянутых работах описаны значения
уровня холестерина пациентов следует индекса КПУ («кариес-пломбы-удаленные»),
представить в виде медианы и квартилей (Ме который рассчитывается как сумма кариозных
(Q1; Q3)): 4,86 (4,30; 5,49) ммоль/л. Данное зубов, пломбированных зубов и зубов,
математическое выражение имеет следующий удаленных по поводу кариеса или его
практический смысл: в границы уровня осложнений. В данных публикациях для
холестерина от 4,30 до 5,49 ммоль/л попадают представления описательной статистики
50% пациентов, у 25% уровень холестерина индекса КПУ для различных категорий
будет выше 5,49 ммоль/л, у 25% – ниже 4,30 детского и подросткового населения было
ммоль/л. использовано среднее арифметическое
Результаты проверки распределения на значение и его 95% доверительный интервал,
нормальность следует всегда учитывать в а для статистического сравнения различных
совокупности. Так, результаты проверки с категорий детского и подросткового населения
помощью одних только статистических – непараметрический критерий Манна-Уитни.
критериев Колмогорова-Смирнова и Шапиро- В данном случае использование
Уилка следует интерпретировать с непараметрического критерия обусловлено
осторожностью, так как они чувствительны к обнаруженным отличием фактического
объему выборок: вероятность получить распределения значений индекса КПУ от
статистически значимое отличие фактического нормального, а представление данных в виде
распределения от нормального (p < 0,05) при среднего арифметического значения
количестве наблюдений n = 1000 значительно обусловлено требованиями ВОЗ описывать
выше, чем, например, при n = 30. Существуют индекс КПУ как признак, имеющий нормальное
следующие практические рекомендации: при распределение. Согласно центральной
количестве наблюдений от 30 до 100, если предельной теореме, при достаточно большом
критерии проверки на нормальность покажут размере выборки средние значения имеют
отличие распределения от нормального нормальное распределение, поэтому при
следует считать его отличным от нормального больших выборких допускается использование
только в том случае, если гистограмма параметрических методов статистики даже
распределения, квантильная диаграмма и при отклонениях фактического распределения
значения асимметрии и эксцесса не от нормального. Кроме того, если известно,
свидетельствуют об обратном. Для условного что в генеральной совокупности
соответствия фактического распределения распределение признака является
нормальному допускается нахождение нормальным, то данне можно представлять с
показателей асимметрии и эксцесса в помощью параметров нормального
пределах от -1 до 1 (некоторые исследователи распределения и анализировать с помощью
сужают допустимые границы до значений от - параметрических методов статистики
0,5 до 0,5). Если количество наблюдений незавимио от распределения признака в
превышает 100, и статистическая значимость выборке.
критериев проверки распределения на В следующем выпуске будет представлен
нормальность превышает 0,05, то алгоритм статистического сравнения

20
Наука и Здравоохранение, 1, 2016 Методология научных исследований

количественных данных двух независимых пищевого поведения и абдоминальное


выборок с использованием программ Statistica ожирение // Медицина. 2015. №4. С. 92-95.
и SPSS. 13. Жунисова М.Б., Шалхарова Ж.С.,
Шалхарова Ж.Н., Нускабаева Г.О., Садыкова
Литература: К.Ж., Маденбай К.М., Гржибовский А.М.
1. Аканов А.А., Турдалиева Б.С., Психоэмоциональный стресс как предиктор
Изекенова А.К., Рамазанова М.А., Абдраимова типа пищевого поведения в Казахстане //
Э.Т., Гржибовский А.М. Оценка использования Экология человека. 2015. №5. С. 36-45.
статистических методов в научных статьях 14. Зуева Л.П, Яфаев Р.Х. Эпидемиология
медицинских журналов Казахстана // Экология : учебник. СПб : ООО «Издательство
человека. 2013. №5. С. 61-64. Фолиант», 2008. 752 с.
2. Боровиков В. STATISTICA. Искусство 15. Лакин Г.Ф. Биометрия. М. : Высшая
анализа данных на компьютере: для школа, 1990. 351 с.
профессионалов. СПб. : Питер, 2003. 688 с. 16. Маденбай К.М., Шалхарова Ж.С.,
3. Бююль А., Цефель П. SPSS: искусство Шалхарова Ж.Н., Жунисова М.Б., Садыкова
обработки информации. Анализ К.Ж., Нускабаева Г.О., Гржибовский А.М.
статистических данных и восстановление Оценка связи между площадью подкожной
скрытых закономерностей. СПб. : ООО жировой ткани и показателями
«ДиаСофтЮП», 2005. 608 с. электронейромиографии // Экология человека.
4. Гланц С. Медико-биологическая 2015. №7. С. 58-64.
статистика. М. : Практика, 1998. 459 с. 17. Петри А., Сэбин К. Наглядная
5. Гржибовский А.М. Доверительные статистика в медицине. М. : ГЭОТАР-Мед,
интервалы для частот и долей // Экология 2003. 140 с.
человека. 2008. №5. С. 57-60. 18. Рахыпбеков Т.К., Гржибовский А.М. К
6. Субботина А.В., Гржибовский А.М. вопросу о необходимости повышения качества
Описательная статистика и проверка казахстанских научных публикаций для
нормальности распределения количественных успешной интеграции в международное
данных // Экология человека. 2014. №2. С. 51- научное сообщество // Наука и
57. Здравоохранение. 2015. №1. С. 5-11.
7. Гржибовский А.М., Иванов С.В. 19. Реброва О.Ю. Статистический анализ
Исследования типа «случай-контроль» в медицинских данных. Применение пакета
здравоохранении // Наука и Здравоохранение. прикладных программ STATISTICA. М. :
2015. № 4. С. 5-17. МедиаСфера, 2002. 312 с.
8. Гржибовский А.М., Иванов С.В. 20. Садыкова К.Ж., Шалхарова Ж.С.,
Когортные исследования в здравоохранении/ / Нускабаева Г.О., Садыкова А.Д., Жунисова
Наука и Здравоохранение. 2015. № 3. С. 5-16. М.Б., Маденбай К.М., Гржибовский А.М.
9. Гржибовский А.М., Иванов С.В. Распространенность анемии, ее социально-
Поперечные (одномоментные) исследования в демографические детерминанты и возможная
здравоохранении // Наука и Здравоохранение. связь с метаболическим синдромом в г.
2015. № 2. С. 5-18. Туркестан, Южный Казахстан // Экология
10. Гржибовский А.М., Иванов С.В. человека. 2015. №8. С. 58-64.
Экологические (корреляционные) 21. Субботина А.В., Гржибовский А.М.
исследования в здравоохранении // Наука и Описательная статистика и проверка
Здравоохранение. 2015. № 5. С. 5-18. нормальности распределения количественных
11. Гржибовский А.М., Иванов С.В. данных // Экология человека. 2014. №2. С. 51-
Экспериментальные исследования в 57.
здравоохранении // Наука и Здравоохранение. 22. Флетчер Р. Клиническая эпидемиоло-
2015. № 6. С. 5-17. гия. Основы доказательной медицины: пер. с
12. Жунисова М.Б., Шалхарова Ж.С., англ. / Р. Флетчер, С. Флетчер, Э. Вагнер. М. :
Шалхарова Ж.Н., Гржибовский А.М. Типы Медиа Сфера, 1998. 352 с.

21
Research methodology Science & Healthcare, 1, 2016

23. Юнкеров В.И., Григорьев С.Г. proportions]. Ekologiya cheloveka [Human


Математико-статистическая обработка данных Ecology]. 2008. No.5. PP. 57-60. [in Russian].
медицинских исследований. СПб : ВМедА, 6. Subbotina A.V., Grjibovski A.M.
2002. 266 с. Opisatelnaya statistika I proverka normalnosti
24. Beaglehole R., Bonita R. Basic kolichestvennykh dannykh [Descriptive statistics
epidemiology. World Health Organization, and normality testing for quantitative data].
Geneva, 1993. Ekologiya cheloveka [Human Ecology]. 2014.
25. Cleopas T.J. et al. Statistics Applied to No.2. PP. 51-57. [in Russian].
Clinical Trials. 4th ed. Springer, 2009. 7. Grjibovski A.M., Ivanov S.V.
26. Gorbatova M.A., Gorbatova L.N., Issledovaniya tipa sluchay-kontrol v
Grjibovski A.M. Dental caries experience among zdravoohranenii [Case-control studies in health
15-year-old adolescents in north-west Russia // sciences]. Nauka i Zdravoohranenie [Science &
Int. J. Circumpolar Health. 2011. Vol. 3. P. 232- Healthcare]. 2015, 2, pp. 5-17. [in Kazakhstan].
235. 8. Grjibovski A.M., Ivanov S.V. Poperechnie
27. Gorbatova M.A., Gorbatova L.N., Pastbin (odnomomentnie) issledovanoya v
M.U., Grjibovski A.M. Urban-rural differences in zdravoohranenii [Cross-sectional studies in health
dental caries experience among 6-year-old sciences]. Nauka i Zdravoohranenie [Science &
children in the Russian north // Rural Remote Healthcare]. 2015, No2, PP. 5-18.
Health. 2012. Vol. 12. P. 1999. 9. Grjibovski A.M., Ivanov S.V. Kogortnie
28. Gorbatova M.A., Grjibovski A.M., issledovaniya v zdravoohranenii [Cohort studies
Gorbatova L.N., Honkala E. Dental caries in health sciences]. Nauka i Zdravoohranenie
experience among 12-year-old children in [Science & Healthcare]. 2015, 3, pp. 5-16.
Northwest Russia // Community Dent. Health. 10. Grjibovski A.M., Ivanov S.V.
2012. Vol. 1. P. 20-24. Ekologicheskiye (korrelyatsionnye) issledovaniya
v zdravoohranenii [Ecological (correlational)
References: studies in health sciences]. Nauka i
1. Akanov A.A., Turdalieva B.S., Izekenova Zdravoohranenie [Science & Healthcare]. 2015,
A.K., Ramazanova M.A., Abdraimova, Grjibovski 5, pp. 5-18. [in Kazakhstan].
A.M. Otsenka ispolzovania statisticheskih 11. Grjibovski A.M., Ivanov S.V.
metodov v nauchnih statyakh Kazakhstana Eksperimentalnie issledovaniya v
[Assesment of use of statistical methods in zdravookhranenii [Experimental studies in health
scientific articles of the Kazakhstan’s medical sciences]. Nauka i Zdravoohranenie [Science &
journals]. Ekologiya cheloveka [Human Ecology]. Healthcare]. 2015, 6. pp. 5-17. [in Kazakhstan].
2013. No.5. PP. 61-64. [in Russian] 12. Zhunissova M.B., Shalkarova Zh.S.,
2. Borovikov V. STATISTICA. Iskusstvo Shalkarova Zh. N., Nuskabayeva G.O., Sadykova
analiza dannikh na kompyutere: dlya K. Zh., Madenbay K.M., Grjibovski A.M. Tipy
professionalov [STATISTICA. The art of data pischevogo povedeniya i abdominalnoe ozhirenie
analysis using computer: for professionals]. SPb.: [Eating behavior types and abdominal obesity].
Piter, 2003. P. 688. Meditsina [Medicine]. 2015. No.4. PP. 92-95.
3. Buhl A., Zofel P. SPSS: isskustvo 13. Zhunissova M.B., Shalkarova Zh.S.,
obrabotki informatsii. Analiz statisticheskih Shalkarova Zh. N., Nuskabayeva G.O., Sadykova
daanikh i vosstanovlenie skritikh K. Zh., Madenbay K.M., Grjibovski A.M.
zakonomernostey [SPSS: the art of information Psykhoemotsionalniy stress kak predictor tipa
analysis. Statistical data analysis and hidden pischevogo povedeniya v Kazakhstane
regularities identification]. SPb. : OOO [Psychoemotional stress and eating behavior in
«DiaSoftUP», 2005. P. 608. [in Russian] Kazakhstan]. Ekologiya cheloveka [Human
4. Glants S. Mediko-biologicheskaya Ecology]. 2015. No.5. PP. 36-45. [in Russian]
statistika [The biomedical statistics]. M. : Praktika, 14. Zueva L.P, Yafaev R.H. Epidemiologiya:
1998. PP. 459. [in Russian] uchebnik [Epidemiology: the textbook]. SPb :
5. Grjibovski A.M. Doveritel'ny eintervaly OOO «Izdatelstvo Foliant», 2008. P. 752. [in
dlya chastot i dolei [Confidence intervals for Russian].

22
Наука и Здравоохранение, 1, 2016 Методология научных исследований

15. Lakin G.F. Biometria [Biometrics]. M. : Southern Kazakhstan]. Ekologiya cheloveka


Viscshaya shkola. 1990. P. 351. [in Russian] [Human Ecology]. 2015. No.8. P. 58-64. [in
16. Madenbay K.M., Shalkarova Zh.S., Russian]
Shalkarova Zh. N., Zhunissova M.B., Sadykova 21. Subbotina A.V., Grjibovski A.M.
K. Zh., Nuskabayeva G.O., Grjibovski A.M. Opisatelnaya statistika I proverka normal’nosti
Otsenka svyazi mezhdu ploshadyu podkojnoy raspredeleniya kolichestvennih dannikh
jirovoy tkani I pokazatelyami electroneyromiografii [Descriptive statistics and normality testing for
[Assesment of the relationship between quantitative data]. Ekologiya cheloveka [Human
subcutaneous fat tissue an results of Ecology]. 2014. No.2. PP. 51-57. [in Russian]
electromyoneurography]. Ekologiya cheloveka 22. Fletcher R. et al. Klinicheskaya
[Human Ecology]. 2015. 7. PP. 58-64. [in Russian] ehpidemiologiya. Osnovy dokazatel'noi meditsiny
17. Petri A., Sebin K. Naglyadnaya statistika [Clinical epidemiology. Basics of the evidence-
v meditsine [Demonstrative statistics in medicine]. based medicine] / R. Fletchtr, C. Fletcher, E.
M. : GEAOTAR-Med, 2003. p. 140. [in Russian] Vagner. M. : Media Sphere, 1998. 352 p. [in
18. Rakhypbekov T.K., Grjibovski A.M. K Russian].
voprosu o nedhodimosti povisheniya kachestva 23. Yunkerov V.I., Grigoryev S.G.
kazakhstanskih nauchih publicatsiy dlya Matematiko-statisticheskaya obraboka daanikh
uspeshnoy integratsii v mezhdunarodnoe meditsinskih issledovaniy [Mathematical and
nauchnoe soobschestvo [The need for statistical analysis of medical research data]. SPb
improvement of the quality of Kazakhstani : VMedA, 2002. P. 266. [in Russian]
publications for successful integration in the 24. Beaglehole R., Bonita R. Basic
international research community]. Nauka i epidemiology. World Health Organization,
Zdravoohranenie [Science & Healthcare]. 2015. Geneva, 1993.
No.1. PP. 5-11. 25. Cleopas T.J. et al. Statistics Applied to
19. Rebrova O. Yu. Statisticheskiy analiz Clinical Trials. 4th ed. Springer, 2009.
meditsinskih daanikh. Primenenie paketa 26. Gorbatova M.A., Gorbatova L.N.,
prikladnikh program STATISTICA [Statistical Grjibovski A.M. Dental caries experience among
analysis of medical data. Using of STATISTICA 15-year-old adolescents in north-west Russia. Int.
software]. M. : MediaSphera, 2002. P. 312. J. Circumpolar Health. 2011. Vol. 3. P. 232-235.
20. Sadykova K.Zh., Shalkharova Zh.S., 27. Gorbatova M.A., Gorbatova L.N., Pastbin
Shalkharova Zh.N. Nuskabaeva G.O., Sadykova M.U., Grjibovski A.M. Urban-rural differences in
A.D., Zhunissova M.B., Madenbay K.M., dental caries experience among 6-year-old
Grjibovski A.M. Rasprostranennost' anemii , yeye children in the Russian north. Rural Remote
sotsial'no - demograficheskiye determinanty i Health. 2012. Vol. 12. P. 1999.
vozmozhnaya svyaz' s metabolicheskim 28. Gorbatova M.A., Grjibovski A.M.,
sindromom v g. Turkestan , Yuzhniy Kazakhstan Gorbatova L.N., Honkala E. Dental caries
[Prevalence of anemia, its socio-demographic experience among 12-year-old children in
determinants and potential association with Northwest Russia. Community Dent. Health.
metabolic syndrome in residents of Turkestan, 2012. Vol. 1. P. 20-24.

Контактная информация:
Гржибовский Андрей Мечиславович – доктор медицины, Старший советник Национального
Института Общественного Здравоохранения, г. Осло, Норвегия; Руководитель отдела
международных программ и инновационного развития ЦНИЛ СГМУ, г. Архангельск, Россия;
Профессор кафедры общественного здоровья и здравоохранения Северо-Восточного
Федерального Университета, г. Якутск, Россия; Профессор, почетный доктор Международного
Казахско-Турецкого Университета г. Туркестан, Казахстан; Почетный профессор ГМУ г. Семей,
Казахстан.
Почтовый адрес: INFA, Nasjonalt folkehelseinstitutt, Postboks 4404 Nydalen, 0403 Oslo, Norway.
E-mail: Andrej.Grjibovski@gmail.com
Телефон: +4745268913 (Норвегия), +79214717053 (Россия), +77471262965 (Казахстан)

23

Вам также может понравиться