Вы находитесь на странице: 1из 68

План лекции 5 / Lecture plan 5

1 Эпидемиологические исследования в здравоохранении, их


классификация. Эмпирические и экспериментальные исследования.
2 Скрининговые тесты: характеристика и основные требования.
Факторы риска.
3 Обзор современных методов статистического анализа
(дисперсионный, многофакторный, кластерный).

1 Epidemiological studies in health care, their classification. Empirical


and experimental studies.
2 Screening tests: characteristics and basic requirements. Risk factors.
3 Review of modern methods of statistical analysis (dispersion,
multifactor, cluster).

1
1 Эпидемиологические исследования в здравоохранении, их
классификация. Эмпирические и экспериментальные исследования.
1 Epidemiological studies in health care, their classification. Empirical
and experimental studies.

2
Элементы общей эпидемиологии
Elements of General epidemiology

3
Классификация эпидемиологических
исследований
Classification of epidemiological studies

4
Пирамида докательности исследований
Pyramid of evidence-based practice research
Таблица сопряженности (2x2) для эпидемиологических
исследований
Contingency table (2x2) for epidemiological studies
Наличие Отсутствие
Болезни Болезни Всего
Presence Absence Just
diseases diseases
Фактор риска
Присутствует
a b a+b
The risk factor is
present
Фактор риска
отсутствует/ The c d c+d
risk factor is absent
Всего/Just
a+c b+d a+b+c+d

a – экспонированные, у которых есть болезнь a-exposed who have the disease


b – экспонированные, у которых нет болезни b-exhibited that have no disease
c – неэкспонированные, у которых есть болезнь c-unexposed who have the disease
d – неэкспонированные, у которых нет болезни d-unexposed who have no disease
Случаи – лица с изучаемой болезнью.

Контроль – лица, которые были бы отнесены к числу


больных, если бы у них развилась изучаемая
болезнь.

Cases-persons with the studied disease.

Control-persons who would be referred to the number of


patients if they developed the disease under study.
Исследование случай-контроль/ Case-control study

8
Исследование случай-контроль/ Case-control study

9
Схема исследования случай-контроль
Case-control study scheme
НАСЕЛЕНИЕ НАСЕЛЕНИЕ
POPULATION POPULATION
Измерение результата
The measurement result

Выборка
Sample
СЛУЧАИ (БОЛЬНЫЕ) КОНТРОЛЬ (ЗДОРОВЫЕ)

CASES (PATIENTS) Измерение воздействия Control


Measuring the impact

Экспонированные Неэкспонированные Экспонированные Неэкспонированные

Exposed Unexposed Exposed Unexposed


АНАЛИЗ
ANALYSIS 10
Таблица 2x2 для результатов исследования
случай-контроль
The 2x2 table for the results of the study case-control
Результат/Result
ДА/Yes НЕТ/No
Воздействие ДА/Yes a b a+b
(Экспозиция) НЕТ/No c d c+d
Impact(Exposition)
a+c b+d a+b+c+d
Направление
Direction
Облитерирующий артериит
Obliterating arteritis
ДА/Yes НЕТ/No
Воздействие Курящий 150 130 280
(Экспозиция) Smoker
Impact(Exposition) Некурящий 90 190 280
Nonsmoker
240 320 560
Направление
Direction
Анализ данных исследования случай-контроль
Case-control study data analysis
a
 Шанс наличия экспозиции среди случаев : Oddsслучаи 
case c
The odds of having the exposure among the cases :
b
 Шанс наличия экспозиции среди контролей : Oddsконтроль 
The odds of having the exposure among controls :
control d
 Отношение шансов – Odds Ratio (OR):

a / c ad Oddsслучаи case
OR   
b / d bc Oddsконтроль control
! Отношение шансов (Odds Ratio–OR) – шансы наличия
экспозиции среди случаев, деленные на шансы наличия
экспозиции среди контролей.
! The odds ratio (Odds Ratio–OR) – the odds of having the
exposure among the cases divided by the odds of having the
exposure among controls.
Оценка Odds Ratio
OR<1 OR=1 OR>1
Шанс экспозиции
Шанс экспозиции у
Отношение у случаев больше
случаев меньше чем
шансов Шансы экспозиции чем у контролей
у контролей
случаи/контр равны The chance of
The chance of
оль The chances of exposure of the
exposure of the cases
Odds ratio exposure are equal cases more than
is less than that of
cases/control controls
controls

Экспозиция не
Экспозиция
Экспозиция снижает является фактором
увеличивает риск
риск заболевания риска
заболевания
Экспозиция (защитный фактор) (нейтральный
(фактор риска)
Exposition Exposure reduces the фактор)
Exposure increases
risk of disease Exposure is not a
risk of disease
(protective factor) risk factor (neutral
(risk factor)
factor)
Преимущества исследований случай-контроль
Benefits of case-control studies
Когортное исследование/ Cohort study
Когортное исследование/ Cohort study
Когортное исследование/ Cohort study

17
Когортное исследование/ Cohort study
Схема когортного исследования первого типа
Scheme of cohort study of the first type

Sample
Схема когортного исследования второго типа
Scheme of cohort study of the second type
ЭКСПОНИРОВАННОЕ НЕЭКСПОНИРОВАННОЕ
НАСЕЛЕНИЕ НАСЕЛЕНИЕ
EXPOSED POPULATION UNEXPOSED POPULATION
Выборка
Sample

ЭКСПОНИРОВАННАЯ КОГОРТА НЕЭКСПОНИРОВАННАЯ КОГОРТА


EXPOSED COHORT UNEXPOSED COHORT

Наблюдение
Observation
Измерение результата
The measurement result

РЕЗУЛЬТАТ РЕЗУЛЬТАТ РЕЗУЛЬТАТ РЕЗУЛЬТАТ


ДА НЕТ ДА НЕТ
RESULT RESULT RESULT RESULT
Yes No Yes No
АНАЛИЗ
ANALYSIS
Таблица 2x2 для результатов когортного
исследования
The 2x2 table of results from a cohort study
Результат/Result
ДА/Yes НЕТ/No
Экспозиция ДА/Yes a b a+b
Exposition НЕТ/No c d c+d
Направление
Direction
Цирроз/Cirrhosis
ДА/Yes НЕТ/No
Алкоголь DA a b a+b
Alcohol NО c d c+d
Направление
Direction
Анализ данных когортного исследования
Cohort study data analysis
a
 Риск результата у экспонированных: R'эксп 
The risk of outcome in exposed:
exp ab
c
 Риск результата у неэкспонированных : Rнеэксп 
The risk of outcome in unexposed : unexp cd
a /  a  b  a c  d  Rэксп
Относителный риск: RR   
c /  c  d  c a  b  Rнеэксп

Relative risk:

The risk difference (attributable risk):


 Разница рисков (атрибутивный риск):
a c
RA    Rэксп  Rнеэксп
ab cd exp unexp
Оценка риска, когортное исследование
Risk assessment, cohort study

Вывод
RR RA
Conclusion
Фактор риска
RR>1 RA>0
Risk factor
Нейтральный
RR=1 RA=0 фактор
Neutral factor
Защитный
RR<1 RA<0 фактор
Protective factor
3. Дизайн эпидемиологического исследования
Под дизайном эпидемиологического исследования, понимают все
особенности проведения конкретного исследования, предусмотренные
его планом (от англ. Design - план). Эти особенности выражаются
численными методами эпидемиологических исследований, а также их
различными сочетаниями, что и характеризует виды дизайна и его
разнообразие, например дизайн когортных исследований, дизайн
исследований случай-контроль, дизайн поперечных (одномоментных и
экологических (корреляционных) исследований.

3. Design of an epidemiological study

Under the design of an epidemiological study, understand all the features of a


specific study provided by its plan (from the English. Design - plan).
These features are expressed by numerical methods of epidemiological studies, as
well as their various combinations, which characterizes the types of design and its
diversity,
for example,
design of cohort studies,
case-control research design,
transverse (simultaneous and environmental (correlation) research design. 24
эпидемиологическое исследование
epidemiological study

Одномоментні Динамические (Продольные)


One moment (Cross) Dynamic (Longitudinal)

Когортные Случай-контроль
cohorts Case control

Экспериментальные
experimental

КЛАССИФИКАЦИЯ ЭПИДЕМИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ ПО


ПРОДОЛЖИТЕЛЬНОСТИ НАБЛЮДЕНИЯ

CLASSIFICATION OF EPIDEMIOLOGICAL STUDIES BY DURATION OF


OBSERVATION

25
PRACTICAL TASKS
 В районном населенном пункте, Н. области с численностью взрослого населения
18400 человек, необходимо организовать и провести многоцелевое выборочное
эпидемиологическое исследование по выявлению заболеваний органов дыхания и
установления их факторов риска с целью разработки программы по сохранению и
укреплению здоровья населения. Известно, что предполагаемая распространенность
заболеваний кожи среди взрослого населения составляет 80 ‰. (I = 80 ‰) и
населенный пункт расположен в непосредственной близости от крупного химического
комбината.

 In a regional settlement, N. region with an adult population of 18400 people, it is necessary


to organize and conduct a multipurpose selective epidemiological study to identify diseases
of the respiratory system and identify their risk factors in order to develop a program to
preserve and promote the health of the population. It is known that the estimated prevalence
of skin diseases in the adult population is 80 ‰. (I = 80 ‰) and the settlement is located in
close proximity to a large chemical plant.
PRACTICAL TASKS
 Для этого необходимо:
 - установить степень достоверности запланированного исследования;
 - определить количество населения для включения в выборочную статистической
совокупности;
 - определить оптимальные методы эпидемиологического исследования для
достижения данной цели, в зависимости от задачи (задачи представлены в таблице

 This requires:
 - establish the degree of reliability of the planned study;
 - determine the population size for inclusion in the sample statistical population;
 - to determine the optimal methods of epidemiological study to achieve this goal, depending
on the task (the tasks are presented in the table;;
Решение задачи: Exercise solution

 1. Исходные данные и установления  1. The initial data and establish the degree of
степени достоверности запланированного
исследования: reliability of the planned study:
 N - численность населения- 18 400
 N - population - 18,400 people.
человек.  I - the probable prevalence of lung disease is
 I - вероятная распространенность 80%.
заболевания легких 80 %.  t - is the reliability criterion, we assume that it is
 t - критерий достоверности, принимаем, equal to 1.96  2.
что он равен 1,96  2.
  - максимально допустимую
  - the maximum permissible error is
погрешность определяем не более 25% от determined by no more than 25% of the value
величины показателя (I). Таким образом, of the indicator (I). In this way,
  составит 25% от 80,0 т:  = (25*80,0) /
100 = 20,0 ‰,  2 = 400,0 %   will be 25% of 80.0 tons:
  = (25 * 80.0) / 100 = 20.0 ‰,  2 = 400.0 %
 2. Определение количества населения  2. Determining the number of people to
для включения в выборочную be included in the sample statistical
статистической совокупности для population for the study of incidence;
изучения заболеваемости;

 При известной численности


 With a known population size, the
популяции размер выборки sample size is determined by the
определяют по формуле : formula
 где:
 Where:
 n - численность выборки, необходимо  n - is the number of samples to be found;
найти;  N - is the population size;
 N - численность популяции;  t - reliability criterion (most often equal to
 t - критерий достоверности (чаще всего 1.96  2)
равна 1,96  2)
 I - estimated frequency of diseases
 I - предполагаемая частота заболеваний
 q = (R- I) где, R - используемая
 q = (R- I) where, R is the used dimension of
размерность показателя I the indicator I
  - выбрана предельно допустимая   - the maximum permissible error of the
ошибка показателя. Обычно максимально indicator is selected. Usually the maximum
допустимая погрешность составляет не permissible error is not more than 25% of the
более 25% от величины показателя (I).  value of the indicator (I).  = 20.0 ‰
= 20,0 ‰

n = (80,0 * (1000-80,0) * 22 * 18400) / (18400 * 400,0)+(80,0 * (1000-80,0) * 22) =


707 человек, people.
3. Определить оптимальные методы эпидемиологического исследования для достижения
данной цели, в зависимости от задачи.

3. To determine the best methods of epidemiological research to achieve this goal, depending on
the task.
Вопрос / question Метод исследования / Research method
Распространенность / prevalence Описательные, сиюминутные исследования /
Descriptive, momentary research
Частота возникновения новых Аналитические, когортные исследования /
случаев (заболеваний, их Analytical, cohort studies
последствий) / The frequency of
occurrence of new cases (diseases,
their consequences)
Риск / risk Аналитические, когортные исследования,
исследования типа «случай-контроль» /
Analytical, cohort studies, case-control
studies
Прогнозирование / prognostication когортные исследования / cohort studies
Диагностика / Diagnostics сиюминутные исследования / momentary
research
Лечение / treatment Клинические испытания / Clinical trials
Профилактика / Prevention Виды профілактики / Types of prevention
Причина / Cause Аналитические, исследования типа «случай-
контроль», когортные, клинические
испытания / Analytical, case-control studies,
cohort, clinical trials
 вывод:
 1. Для получения выборочных
данных, соответствующих
требуемой достоверности с  conclusion:
18400 взрослого населения
следует обследовать 707 человек.  1. To obtain sample data corresponding to
 2. Оптимальные методы the required reliability from 18,400 adults,
707 people should be examined.
эпидемиологического
исследования для решения задач
исследования представлены в
 2. The optimal methods of
таблице.
epidemiological research for solving
research problems are presented in the
table.
2 Скрининговые тесты: характеристика и основные требования. Факторы
риска.
2 Screening tests: characteristics and basic requirements. Risk factors.

Скрининг / Screening
Раннее (до появления симптомов) выявление заболевания или
фактора риска на основании:
- опроса
- физикального исследования
- лабораторного исследования
- или с помощью других процедур, которые могут быть выполнены
относительно быстро
- Early (before symptoms) detection of disease or risk factor based on:
- - survey's
- physical research
- laboratory research
- or with other procedures that can be performed relatively quickly 33
Критерии для проведения скрининга
Criteria for screening
 насколько велика тяжесть заболевания
 насколько эффективен скрининговый тест
 какова эффективность вмешательства
или лечения
 how great is the severity of the disease
 how effective is the screening test
 what is the effectiveness of the intervention or
treatment
Тяжесть заболевания
Disease severity
 смерть Death
 болезнь Disease
 инвалидность Disability
 дискомфорт Discomfort
 неудовлетворенность Dissatisfaction
 Лишения Нardship
Зависимость эффективности скрининга от
распространенности заболевания
The dependence of the efficiency of screening of the
prevalence of the disease
 чем реже встречается заболевание, тем больше лиц придется
обследовать, чтобы его выявить
 рекомендации по обследованию женщин для выявления рака
молочной железы
 рекомендации по проведению скрининга для выявления
опухоли Баретта
 the less common the disease, the more individuals will have to be
examined to identify it
 recommendations for the examination of women for breast cancer
 recommendations for screening for the Detection of Barrett's
tumor
Показатели частоты заболевания.
Распространённость (prevalence)
Indicators of the frequency of the disease. Prevalence
(prevention)
 Распространённость – это частота некоторого состояния в
группе
 P = кол-во людей с изучаемым состоянием в опред.
популяции в данный момент времени/ все обследованные
 Априорная вероятность (претестовая)
 Prevalence is the frequency of some state in a group
 P = number of people with the studied condition in the
population definitions at a given time/ all surveyed
 The prior probability (protestowa)
Эффективность теста
Test efficiency
 чувствительность Sensitivity
 специфичность Specificity
 простота Simplicity
 стоимость Cost
 безопасность Security
 приемлемость Admissibility
 эффект ярлыка Label effect
Чувствительность скринингового теста
The sensitivity of a screening test
 вероятность положительного результата диагностического
теста при наличии болезни
 до 45% патологических результатов может быть пропущено
 чувствительность до 94% достигается в централизованных
скринингах
 опасность ложноотрицательного результата
 the probability of a positive result of the diagnostic test in the
presence of the diseaseup
 to 45% of pathological results may be skipped
 sensitivity up to 94% is achieved in centralized screenings the
 danger of a false-negative result
Специфичность/ Specificity

 вероятность отрицательного результата


диагностического теста в отсутствии болезни
 опасность ложноположительного результата
 низкая распространенность заболеваний
низкая прогностическая ценность
 the probability of a negative diagnostic test result
in the absence of disease
 the risk of false positive result
 low disease prevalence low prognostic value
Скрининговые тесты при эпидемиологических
исследованиях должны отвечать следующим
требованиям:
 метод должен быть –достоверен;
 достаточно точным (требуемая степень точности
зависит от цели исследования);
 удобным, практичным, простым, доступным,
адекватно воспринимаемым населением и
персоналом.
Screening tests for epidemiological studies should
meet the following requirements:
 the method must be-reliable;
 sufficiently accurate (the required degree of accuracy
depends on the purpose of the study);
 convenient, practical, simple, accessible, adequately
perceived by the population and staff.
Методы установления требуемых критериев
должны быть достаточно объективными и
воспроизводимыми, достаточно
чувствительными и высокоспецифичными.
В эпид. исследованиях используется таблица 2х2.

Methods for establishing the required criteria should


be sufficiently objective and reproducible,
sufficiently sensitive and highly specific.Epid.the
research used a 2 × 2 table.
Полное обсле- Всего
дование Just
Full inspection
«+» «-» ответы
Ответы answers
answers
«+» A B A+B
Скрининг ответы
Screening answers

Ответы
«-» C D C+D
answers Ответы
answers
 а – истинно положительные ответы, которые совпадают как
положительные при скрининговом и полном обследовании;
 d – истинно отрицательные ответы, которые совпадают как
отрицательные при скрининговом и полном обследовании;
 b – ложноположительные ответы;
 c – ложноотрицательные ответы.

 a-truly positive answers that match as positive in screening and full


examination;
 d – true negative that is the same as a negative at screening and full
examination;
 b-false positive answers;
 c-false negative answers.
 Чувствительность метода –
способность выявить большую часть
истинноположительных ответов
Чувствительность
Sensitivity of the method-the ability to
identify most of the true positive
responses
Sensitivity

a
  100
ac
 Специфичность метода –
способность относительно редко
давать ложноположительные ответы.
 Специфичность
 The specificity of the method is the ability
to give false positive answers relatively
rarely.
 Specificity
d
  100
bd
Идеальный метод обладает высокой
чувствительностью и высокой
специфичностью, т.е. позволяет выделить
максимальное число больных и крайне редко
дает ложноположительную информацию
(здоровый ложно оценивается как больной).

The ideal method has high sensitivity and high


specificity, ie allows you to allocate the maximum
number of patients and rarely gives false positive
information (healthy falsely assessed as the
patient).
 Воспроизводимость результатов оценивается
по показателям соответствия и
воспроизводимости при сопоставлении
данных двух обследований, проведенных в
одинаковых условиях.
 показатель соответствия
 показатель воспроизводимости
 The reproducibility of the results is assessed in
terms of compliance and reproducibility when
comparing data from two surveys conducted
under the same conditions.
 compliance rate
 reproducibility index
показатель ad
соответствия   100,
abcd
compliance rate

a
показатель   100.
воспроизводимости abc
reproducibility index
Оценочная шкала показателей
воспроизводимости / Estimated scale of
reproducibility
Оценка Показатель Показатель
Assessment соответствия, % воспроизводимости,
Measure of % Indicator of
compliance, % reproducibility, %
Хорошая 90-100 75-100
Good
Средняя 75-89 50-74
Average
Неудовл. 75 50
Unsurprisingl
y
Для любого результата теста, мы можем сравнить вероятность
получения результата при условии , что пациент действительно
болен с соответствующей вероятностью, если бы он был
здоров. Это отношение называется отношением
правдоподобия и указывает на значимость теста для
повышения уверенности относительно положительного
диагноза
Чувствительность
(1- специфичность)

For any test result , we can compare the probability of obtaining a


result provided that the patient is really sick with an appropriate
probability if he was healthy. This ratio is called the likelihood ratio
and indicates the significance of the test to increase confidence
about a positive diagnosis
Sensitivity
(1-specificity)
3 Обзор современных методов статистического анализа
(дисперсионный, многофакторный, кластерный).

3 Review of modern methods of statistical analysis (dispersion, multifactor,


cluster).

Дисперсионный анализ представляет собой совокупность


статистических методов, предназначенных для проверки гипотез о
связи между определенным признаком и исследуемыми
факторами, которые не имеют количественного описания, а также
для установления степени влияния факторов и их взаимодействия.
В специальной литературе дисперсионный анализ часто называют
ANOVA (от англоязычного названия Analysis of Variations).
Впервые этот метод был разработан Г. Фишером в 1925 г.
Analysis of variance is a set of statistical methods designed to test
hypotheses about the relationship between a certain feature and the
studied factors that do not have a quantitative description, as well as to
determine the degree of influence of factors and their interaction. In the
literature, analysis of variance is often referred to as ANOVA (from the
English name Analysis of Variations). This method was first developed
by G. Fisher in 1925.
52
Факторный анализ
Factor analysis
 Это метод, применяемый для
изучения взаимосвязей между
значениями переменных.
Предполагается, что известные
переменные зависят от меньшего
количества неизвестных
переменных и случайной ошибки.
 It is a method used to study
relationships between variable values.
It is supposed that the variables
depend on a smaller number of
unknown variables and a random error.
Задачи и возможности факторного анализа
Tasks and opportunities of factor analysis
Факторный анализ позволяет решить две важные
проблемы исследователя: описать объект измерения
всесторонне и в то же время компактно.
С помощью факторного анализа возможно выявление
скрытых переменных факторов, отвечающих за наличие
линейных статистических корреляций между
наблюдаемыми переменными.
 Factor analysis allows to solve two important problems of the

researcher: to describe the object of measurement


comprehensively and at the same time compactly.
 With the help of factor analysis it is possible to identify

hidden variables responsible for the presence of linear


statistical correlations between the observed variables.
Задачи и возможности факторного анализа
Tasks and opportunities of factor analysis
Две основные цели факторного анализа:
 определение взаимосвязей между

переменными, (классификация переменных);


 сокращение числа переменных необходимых

для описания данных.

 Two main objectives of factor analysis:


 determination of relationships between variables
(classification of variables);reduce the number of
variables required to describe the data.
Этапы факторного анализа
The stages of factor analysis
 Как правило, факторный анализ проводится в
несколько этапов.
Этапы факторного анализа:
1. Отбор факторов
2. Классификация и систематизация факторов.
3. Моделирование взаимосвязей между результативным
и факторными показателями\

As a rule, factor analysis is carried out in several stages.


The stages of factor analysis:
1.Factor selection
2.Classification and systematization of factors.
3.Modeling linkages between effective and factor indicators
Этапы факторного анализа
The stages of factor analysis
4.Расчет влияния факторов и оценка роли каждого из
них в изменении величины результативного
показателя
5.Практическое использование факторной модели
(подсчет резервов прироста результативного
показателя)
4.Calculation of the influence of factors and assessment of
the role of each of them in changing the value of the
effective indicator
5.Practical use of the factor model (calculation of reserves
of growth of the effective indicator)
Условия применения факторного анализа
The conditions of application of factor analysis
Практическое выполнение факторного анализа начинается с проверки
его условий.
В обязательные условия факторного анализа входят:
 все признаки должны быть количественными;
 число наблюдений должно быть не менее чем в два раза больше
числа переменных;
 выборка должна быть однородна;
 исходные переменные должны быть распределены симметрично;
 факторный анализ осуществляется по коррелирующим
переменным

 The practical implementation of factor analysis begins with the


verification of its conditions.
Mandatory conditions of factor analysis includes:
 all signs should be quantitative;
 the number of cases must be at least twice the number of variables;
 sampling should be uniform;
 the source variables must be distributed symmetrically;
 factor analysis is carried out by correlating variables
Виды факторного анализа
Types of factor analysis
Факторный анализ может быть:
 разведочным — он осуществляется при исследовании

скрытой факторной структуры без предположения о числе


факторов и их нагрузках;
 конфирматорным (подтверждающим), предназначенным

для проверки гипотез о числе факторов и их нагрузках.


 Factor analysis can be:

 exploration-it is carried out in the study of hidden factor

structure without the assumption of the number of factors and


their loads;
 confirmatory (confirming), designed to test hypotheses about

the number of factors and their loads.


Кластерный анализ
Cluster analysis
 Это многомерная статистическая процедура, выполняющая сбор
данных, содержащих информацию о выборке объектов, и затем
упорядочивающая объекты в сравнительно однородные группы.
 Существует около 100 разных алгоритмов кластеризации,
однако, наиболее часто используемые - иерархический
кластерный анализ и кластеризация методом k-средних.

 It is a multidimensional statistical procedure that collects data that


contains information about a selection of features and then orders
the features into relatively homogeneous groups.
 There are about 100 different clustering algorithms, but the most
commonly used are hierarchical cluster analysis and k - means
clustering.
Кластерный анализ
Cluster analysis
 Результат кластерного анализа обозначен
раскрашиванием точек в соответствии с
принадлежностью к одному из трёх
кластеров.
 Прелесть данного метода - он работает
даже тогда, когда данных мало и не
выполняются требования нормальности
распределений случайных величин и
другие требования классических методов
статистического анализа.

 The result of cluster analysis is indicated by


coloring the points according to belonging to
one of the three clusters.

 The beauty of this method - it works even


when the data is small and do not meet the
requirements of normal distributions of random
variables and other requirements of classical
methods of statistical analysis.
Задачи кластерного анализа
Objectives of cluster analysis
Кластерный анализ выполняет следующие основные задачи:
 Разработка типологии или классификации
 Исследование полезных концептуальных схем группирования
объектов
 Порождение гипотез на основе исследования данных
 Проверка гипотез или исследования для определения,
действительно ли типы (группы), выделенные тем или иным
способом, присутствуют в имеющихся данных

Cluster analysis performs the following main tasks:


 Development of typology or classification
 Study useful conceptual schemes of grouping objects
 Generation of hypotheses based on data research
 Hypothesis testing or research to determine whether the types
(groups) allocated one way or another, are present in the available
data
Примеры применения кластерного
анализа
 Examples of разбиение
В менеджменте: the application
персоналаof
на cluster analysis
различные по уровню мотивации группы,
классификация поставщиков, выявление
схожих производственных ситуаций, при
которых возникает брак.
 В медицине - классификация симптомов,
пациентов, препаратов.
 В социологии - разбиение респондентов на
однородные группы.
 In management: the division of staff into groups
of different levels of motivation, the classification
of suppliers, the identification of similar
production situations in which there is a
marriage.
 In medicine - classification of symptoms,
patients, drugs.
 In sociology, the division of respondents into
homogeneous groups.
Анализ данных выживаемости
Analysis of survival data
 Статистические методы анализа продолжительных (во времени)
данных, отражающих наступление событий
 К событиям относятся: смерть, травма, наступление заболевания,
выздоровление (бинарные показатели), или переход через
пороговое значение какой-либо интервальной переменной
(например, снижение уровня лейкоцитов ниже нормы)
 Включает данные рандомизированных контролируемых
исследований или исследований когортного дизайна

 Statistical methods of analysis of long (in time) data reflecting the


occurrence of events
 Events include: death, injury, onset of illness, recovery (binary), or
passing through a threshold value of an interval variable (for example, a
decrease in white blood cell levels below normal)
 Includes data from randomized controlled trials or cohort design studies
 Выживаемость: вероятность прожить более n
времени с момента события
 Время до наступления события: время с
момента включения в исследование до
наступления заранее оговоренного (и точно
определенного) исхода
 Цензурирование: вариант развития событий,
когда пациенты выбывают или исключаются из
исследования до наступления интересующего
исхода. В этом случае пациенты считаются
живыми или с ненаступившим целевым исходом
на момент последнего контакта
 Survival: the probability to live more than n time
since the event
 Time to event: time from inclusion in the study to a
predetermined (and well-defined) outcome
 Censoring: a scenario in which patients are
dropped out or excluded from the study before the
outcome of interest. In this case, the patients are
considered alive or with a non-targeted outcome at
the time of the last contact
Кривые Каплана-
Мейера

Curves Kaplan-Meier
Непараметрическая оценка функции
выживания
 Эмпирическая вероятность выжить после
определенного времени (с учетом цензурирования)

Nonparametric estimation of survival function


 The empirical possibility of survival after a certain

period of time (subject to redaction)


Кривые Каплана-Мейера
Curves Kaplan-Meier
 Обычно используется для сравнения двух исследуемых популяций
 Интуитивное графическое представление
 It is usually used to compare two studied populations
 Intuitive graphical representation

Survival

Time, hours
СПАСИБО ЗА ВНИМАНИЕ!

THANK YOU FOR ATTENTION!