Вы находитесь на странице: 1из 29

Epidemiologia

Indicadores de Sade

Profa. Dra. Ivana Maria Saes Busato

Ol! O vdeo a seguir mostra os contedos que sero estudados nesta


aula. Venha conferir!

Introduo
A estatstica uma ferramenta imprescindvel a qualquer pesquisador ou
pessoa que necessite tomar decises. Como disciplina cientfica, inicialmente
foi utilizada como estratgia mercantil e poltica, destinada a dimensionar as
doenas e seus efeitos para a Epidemiologia.
Com isso, iniciaremos esta aula com os conceitos bsicos da Estatstica
aplicada Epidemiologia, o que dar a base para a compreenso das anlises
exploratrias de dados (univariada, bivariada e multivariada).

Conceitos Bsicos em Estatstica


Ao emitir uma hiptese, o cientista tenta explicar os fatos j conhecidos.
Hiptese uma suposio que se faz a respeito de alguma coisa, deve estar
fundamentada em uma boa questo de pesquisa, a priori, e deve ser
simples e especfica.

Para testar a significncia estatstica, a hiptese de pesquisa deve ser


formulada de modo que categorize a diferena esperada entre grupos de
estudo.

Epidemiologia | Indicadores de Sade

A hiptese pode ser, ainda:

Varivel
Para analisar uma hiptese, necessrio coletar uma varivel uma
caracterstica de interesse que pode ser medida; as variveis poder ser
independentes e dependentes.

Variveis independentes so aquelas manipuladas, enquanto as variveis


dependentes so apenas medidas ou registradas.
As variveis que assumem valores numricos so denominadas
quantitativas, e as no numricas, qualitativas. Uma varivel qualitativa
quando seus valores so atributos ou qualidades (sexo, raa, classe social). Se
tais variveis possuem uma ordenao natural, indicando intensidades
crescentes de realizao, so classificadas de qualitativas ordinais (classe
social baixa, mdia ou alta). Se no for possvel estabelecer uma ordem natural
entre seus valores, so classificadas como qualitativas nominais (sexo
masculino ou feminino).

Epidemiologia | Indicadores de Sade 3

J as variveis quantitativas podem ser classificadas em discretas ou


contnuas. As variveis discretas so resultantes de contagens e assumem, em
geral, valores inteiros (nmero de filhos), enquanto as variveis contnuas
podem assumir qualquer valor dentro de um intervalo especificado e so,
geralmente, resultado de uma mensurao (peso, em kg; altura, em metros).
A validade de um estudo depende da capacidade que as variveis tm
de representar os fenmenos de interesse. Para isso, devemos considerar:
Preciso est na capacidade de reproduo, quando maior for a preciso,
maior o poder estatstico que um determinado tamanho da amostra tem para
estimar os valores mdios e para testar a hiptese, ou seja, a questo de
pesquisa. Enfim, uma varivel tem valores semelhantes quando medida
vrias vezes. A preciso afetada pelo erro aleatrio (acaso) e pode ser
causada pelo observador, sujeito ou instrumento;
Acurcia a capacidade de representar realmente o que deveria
representar, tem influncia na validade interna e externa do estudo. Melhor
forma de avaliar a acurcia est na comparao com um padro de
referncia ameaada pelo erro sistemtico (vis) causado pelo observador,
sujeito ou instrumento.

Os estudos de diferentes variveis com muita frequncia fazem uso de


intervalo de confiana, como em estudos descritivos de prevalncia ou
incidncia. Se nossos estudos avaliassem toda a populao-alvo do estudo,
teramos plena confiana nos resultados. Contudo, j vimos que isso no
realizado e, portanto, utilizamos amostras em vez da populao.

Ao estudar uma parte da populao (amostra), podemos encontrar o acaso, ou


seja, um resultado que difere da realidade. Devemos estimar, portanto, a preciso
estatstica do resultado.

Epidemiologia | Indicadores de Sade

Podemos realizar 100 estudos da mesma populao, o que traria


diversos resultados. a variabilidade entre esses resultados que chamamos de
intervalo de confiana. O intervalo de confiana no nvel 95% (95% IC)
significa que o resultado est dentro de um intervalo e faz-se a leitura correta
do intervalo de confiana afirmando que, em 95 de 100 amostras hipotticas, o
resultado est dentro desse intervalo.
Quanto mais estreito o intervalo de confiana, mais precisa a
estimativa e exatamente essa a definio estatstica para preciso a
capacidade de um resultado se repetir em diferentes medidas da mesma
realidade. Se a medida em questo possuir um valor que representa a hiptese
nula, podemos usar o intervalo de confiana para obter a significncia
estatstica.
No necessrio fazer 100 estudos para calcular o intervalo de
confiana, podemos obt-lo com apenas um estudo realizado e o fazemos
estudando apenas uma amostra e utilizando frmulas estatsticas que levam
em considerao o tamanho amostral, a

variabilidade de uma varivel

contnua ou a frequncia do desfecho quando a varivel categrica. Essas


frmulas nos fornecem o erro-padro a medida de incerteza do estudo.

Plano amostral
A inferncia estatstica um processo de raciocnio indutivo em que se
procura tirar concluses partindo do particular para o geral, estudando apenas
alguns elementos dessa populao, ou seja, uma amostra, que, a partir das
propriedades verificadas, infere propriedades para a populao, utilizando a
probabilidade como instrumento.
Um experimento aleatrio tem que satisfazer algumas condies:
1. Poder ser repetido indefinidamente;
2. Ser capaz de descrever todos os possveis resultados do experimento,
mas no predizer com certeza qual ocorrer;
3. Obedecer regularidade estatstica.
Epidemiologia | Indicadores de Sade 5

Mtodos aleatrios ou probabilsticos acontecem quando cada elemento


da populao tem uma probabilidade conhecida de fazer parte da amostra.
Esses mtodos possibilitam a determinao da distribuio de probabilidade e
permitem quantificar o erro de amostragem decorrente da utilizao de apenas
uma parte da populao.
A probabilidade um nmero entre 0 e 1 e mostra o grau de certeza da
ocorrncia de um evento associado a um experimento aleatrio. A distribuio
de probabilidades associa uma probabilidade a cada resultado numrico de um
experimento.
Por exemplo: no lanamento de um dado, cada face tem a mesma
probabilidade de ocorrncia, que 1/6. Como os valores das distribuies
de probabilidades so apenas probabilidades e como as variveis aleatrias
devem tomar um de seus valores, temos duas regras, que se aplicam a
qualquer distribuio de probabilidades:
- a somatria das ocorrncias possveis igual a 1.
(1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1)
- a probabilidade da ocorrncia de um evento est entre 0 a 1.
As distribuies de probabilidade podem ser: discreta ou contnua.
Contudo, vamos abordar somente a distribuio de probabilidade contnua
normal, por ser a mais importante para a Epidemiologia, pois representa as
distribuies de frequncia observadas nos fenmenos naturais e fsicos.

A distribuio normal acontece quando uma varivel aleatria contnua


normalmente distribuda e seu aspecto grfico tem a forma de um sino. A curva
representativa dessa distribuio denominada curva normal ou curva de
Gauss.

Epidemiologia | Indicadores de Sade

Os dados se concentram em torno de uma mdia e se dispersam


simetricamente a partir desse ponto central. importante saber que tipo de
distribuio ocorre com os dados, pois isso poder determinar os testes
estatsticos.

Curva de Gauss
Fonte: <http://www.portalaction.com.br/content/62-distribui%C3%A7%C3%A3o-normal>

Como obter uma amostra?


Chamamos o processo de seleo de uma amostra de amostragem.
Amostra um subconjunto de elementos pertencentes a uma populao.
Para que os resultados retirados da amostra possibilitem inferncias vlidas,
ela deve ser representativa da populao.
Os mtodos de amostragem so:
No aleatrios so realizados com a construo da amostra a partir da
informao sobre a populao estudada, tentando fazer com que a amostra
seja um espelho fiel dessa populao. Esses mtodos no permitem calcular
a preciso das estimativas obtidas a partir da amostra; os mais conhecidos

Epidemiologia | Indicadores de Sade 7

so a amostragem orientada, a amostragem por convenincia e a


amostragem por quotas;
Aleatrios podem ser realizados de diversas formas, como colocar, um a
um, todos os nmeros que sero submetidos ao sorteio, retirando alguns s
cegas; ou ainda, usar os nmeros de loteria sorteados nos ltimos anos ou
uma tabela de nmeros aleatrios, ou programas de computador para
selecionar aleatoriamente todos os componentes da amostra. Podem ser
realizados de algumas formas de amostragem: aleatria simples, aleatria-estratificada, sistemtica e por conglomerados.

Assista ao vdeo a seguir, em que vamos complementar os conceitos


sobre amostragem para a Epidemiologia.

Erro amostral
No h dvida de que uma amostra no representa perfeitamente uma
populao. O importante que todas as decises que tomamos questo de
pesquisa, plano de estudo, populao a ser pesquisada tm inerente um
determinado erro, que pode ser quantificado em termos probabilsticos. Ou
seja, quando utilizamos uma amostra, devemos aceitar uma margem de erro
que denominamos erro amostral. Esse erro a diferena entre um resultado
amostral e o verdadeiro resultado populacional. Quando isso ocorre, os
resultados da amostra no refletem a realidade da populao, levando a
inferncias errneas.
Acompanhe os tipos de erros:
I.

Erro tipo I (falso positivo) ocorre quando rejeita uma hiptese nula
que verdadeira na populao;

Epidemiologia | Indicadores de Sade

Erro tipo II (falso negativo) ocorre quando se deixa rejeitar (aceita-

II.

-se) uma hiptese nula que no verdadeira na populao.

O tamanho da amostra pode evitar erros tipo I e II. Os resultados falso negativo
e falso positivo tambm podem ocorrer em funo do vis. Esses erros so mais
difceis de detectar e exigem conhecimentos avanados de estatstica.

Antes de realizar o estudo, o pesquisador determina a probabilidade


mxima tolerada para os erros tipo I e II. A probabilidade de um erro tipo I
(rejeitar a hiptese nula quando ela verdadeira) denominado (alfa),
tambm chamada de nvel de significncia estatstica.
A probabilidade de um erro tipo II (no rejeitar uma hiptese nula quando
ela for falsa) denominado (beta). O valor 1 - beta chamado de poder do
teste e representa a probabilidade de se rejeitar a hiptese nula na amostra
quando o efeito real na populao se iguala magnitude estimada de efeito.
Muitos estudos estabelecem como 0,05 e como 0,20 o poder de 0,80
representa esperar que 80% de probabilidade de encontrar uma associao
dessa magnitude quando encontrar associao.
varia de 0,01 a 0,10. Usar alfa baixo quando a questo de pesquisa torna
importante evitar falso positivo (erro tipo I); ex: eficcia de um medicamento ou
tratamento.
varia de 0,05 a 0,20. Usar beta baixo quando quer evitar o falso negativo (erro
tipo II); ex: opinio pblica quanto a realizar ou no um tratamento novo muito
invasivo.

Os erros amostrais resultam de flutuaes amostrais aleatrias. No


temos a capacidade de evitar a ocorrncia do erro amostral, contudo podemos
limitar seu valor por meio da escolha de uma amostra de tamanho adequado.
Epidemiologia | Indicadores de Sade 9

Assim, podemos deduzir que o erro amostral e o tamanho da amostra seguem


sentidos contrrios: quanto maior o tamanho da amostra, menor o erro
cometido e vice-versa.
Podemos calcular a amostra usando a mdia populacional, a partir de
uma frmula matemtica, visando determinar a amostra com base em
informaes sobre o grau de confiana desejado (valor crtico = Z/2), o
desvio-padro populacional da varivel estudada, a margem de erro (ou erro
mximo de estimativa), que identifica a diferena mxima entre a mdia
amostral e a verdadeira mdia populacional.
Conhea os valores crticos mais utilizados na amostra, associados ao
grau de confiana:
Grau de Confiana

Valor Crtico Z /2

90%

0,10

1,645

95%

0,05

1,96

99%

0,01

2,575

Podemos determinar o tamanho de uma amostra com base na


estimativa da proporo populacional, a qual utilizada quando h
necessidade de determinar a proporo de pessoas de uma populao e que
tambm faz uso de uma frmula matemtica para seu clculo, aplicada
proporo j conhecida e populao-alvo para estimar a amostra.
Por exemplo: 10% da populao geral com diabetes mellitus; ento, para
calcularmos amostra na populao da equipe de sade da famlia composta
por 4000hab, usamos os mesmos 10% (quando no conhecemos essa
proporcionalidade, usamos 50% como proporo).
Em populaes finitas, h a necessidade de outros clculos. As frmulas
anteriores partem do princpio que a populao de onde se retirava a amostra

10

Epidemiologia | Indicadores de Sade

to grande que podemos consider-la infinita. Na maioria dos estudos, as


populaes no so to grande em comparao com as amostras e, caso a
amostra tenha um tamanho maior ou igual a 5% do tamanho da populao,
considera-se que a populao seja finita. Assim, para calcular a amostra para
populaes finitas, h a necessidade de se aplicar um fator de correo aos
clculos que vimos anteriormente.

Anlise Exploratria de Dados


A coleta e a organizao dos dados faz parte do planejamento do
estudo, o qual inclui, por sua vez, a elaborao do instrumento de coleta dos
dados, com a devida organizao das questes de anlise em variveis que
possam ser quantificadas e que sero passveis de anlise exploratria dos
dados.
Quando terminada a etapa da coleta dos dados, estes devem ser
arranjados em forma de tabela, para a maior eficincia na anlise. Essa
disposio deve permitir sua anlise na maioria dos programas estatsticos
disponveis. Usando uma planilha do Excel, podemos empregar cada coluna
representando uma varivel (ex: sexo, idade, tamanho, salrios mnimos, taxa
de mortalidade) e cada linha representa cada unidade de observada (ex:
indivduos, dentes, casas).
A anlise exploratria dos dados tem incio com uma primeira
abordagem do conjunto de dados e com a anlise do perfil de cada varivel
separadamente chamada de anlise univariada. Para explicar algumas
hipteses (quando incluem duas variveis), h a necessidade de realizar a
anlise bivariada e, quando as anlises ficam ainda mais complexas
(introduo de mais variveis), usa-se a anlise multivariada.

Epidemiologia | Indicadores de Sade 11

Quantas variveis so
analisadas
simultaneamente?
Uma

Duas

Mais de
duas

Anlise

Anlise

Anlise

univariada

bivariada

multivariada

Fonte: Corrar et al., 2007

Anlise univariada
A anlise univariada inclui todos os mtodos de estatstica que permitem
a anlise de cada varivel separadamente, com mtodos de estatstica para
cada uma.

A anlise univariada muito utilizada na Epidemiologia porque descreve uma


doena ou um agravo de sade para compor um perfil epidemiolgico.

Aps a coleta e a digitao de dados em um banco de dados apropriado,


o prximo passo a anlise exploratria univariada, etapa fundamental, pois
uma anlise detalhada permite ao pesquisador familiarizar-se com os dados,
organiz-los e sintetiz-los de forma a obter as informaes necessrias do
conjunto de dados para responder as questes que esto sendo investigadas.
Nessa etapa, produzem-se tabelas, grficos, mapas ou ainda resumos em
medidas numricas ou estatsticas.
importante conhecer e saber construir os principais tipos de tabelas e
grficos e calcular as medidas de resumo para realizar uma boa anlise
descritiva dos dados.

12

Epidemiologia | Indicadores de Sade

Vamos tentar entender como os dados se distribuem, onde esto


centrados, quais observaes so mais frequentes, como a variabilidade etc.,
tendo em vista responder as principais questes do estudo. Cada ferramenta
fornece um tipo de informao e o seu uso depende, em geral, do tipo de
varivel que est sendo investigada.
As tabelas de frequncia so elaboradas com os valores da varivel e
suas respectivas contagens, as quais so denominadas frequncias
absolutas ou simplesmente frequncias. No caso de variveis qualitativas ou
quantitativas discretas, a tabela de frequncia consiste em listar os valores
possveis da varivel e fazer a contagem na tabela de dados brutos do nmero
de suas ocorrncias. Temos a frequncia do valor, a frequncia total, a
frequncia relativa e, para variveis qualitativas ordinais e quantitativas em
geral, temos ainda as frequncias acumuladas obtidas pela soma das
frequncias de todos os valores da varivel, menores ou iguais ao valor
considerado.

No caso de variveis quantitativas contnuas, que podem assumir infinitos, temos


que dividir em classes, calculadas por intervalos de classe.

Medidas de resumo
As medidas estatsticas de resumo so formas complementares da
anlise univariada, que podem ser medidas e que informam o centro dos
dados e a variabilidade dos mesmos em relao ao centro.
Apresentaremos os dois tipos fundamentais: medidas de posio, ou
tendncia central, e as medidas de disperso, ou de variabilidade.

Epidemiologia | Indicadores de Sade 13

Medidas de posio
Visam localizar o centro de um conjunto de dados, ou seja, identificar um
valor em torno do qual os dados tendem a se agrupar. As mais utilizadas so:
mdia aritmtica, mediana e moda. possvel calcular direto usando as
funes de estatstica do Excel.
A mdia aritmtica a soma de todas as observaes dividida pelo
nmero de observaes. Sua frmula considera cada observao (x 1, x
...... xn) e

2,

3,

o total de observaes (n).


Mdia aritmtica = . x / n

Suponha o nmero de moradores por residncia da quadra A da Rua das


Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3); calculemos a mdia aritmtica para
descobrir o nmero de moradores por residncia:
4+5+3+2+7+3+4+1+5+2+3+4 /12 = 42/12 = 3,5
A moda o valor mais frequente no conjunto de dados. Continuando
com o mesmo exemplo anterior, nesse caso, a moda 3 o valor que mais se
repete; ou seja, o nmero de residncias por casa que aparece com maior
frequncia 3.
Mediana o valor que ocupa a posio central dos dados ordenados,
deixando metade dos dados abaixo e metade acima dele. Se o nmero de
observaes for mpar, a mediana igual mdia aritmtica; se for par, ser a
mdia aritmtica dos dois valores centrais. Sua frmula considera as
observaes (x 1, x 2, x 3, ...... xn), sendo que n = total de observaes.
Mediana = mdia aritmtica para n impar e para n
par = n + que indica a posio da mediana.

14

Epidemiologia | Indicadores de Sade

No mesmo exemplo anterior, calculando a mediana, devemos colocar em


ordem crescente 1, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 7. Como par, usamos:
12+1/2 = 6,5
As posies seis e sete:
3+3/2 = 3
A mediana de 3 mostra que 50% das residncias tm mais do que 3
moradores e 50% tm menos do que 3 moradores.
Alm das medidas de posio que estudamos, h outras que no so
medidas de tendncia central, mas esto ligadas sua caracterstica de
separar a srie em duas partes que apresentam o mesmo nmero de valores.
Vamos estudar os quantis, o quartis, o decis e os percentis medidas que
so, juntamente com a mediana, conhecidas pelo nome genrico de
separatrizes.
Quartis
Denominamos quartis os valores de uma srie dividida em quatro partes
iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a srie em
quatro partes iguais. O primeiro quartil o valor que deixa um quarto (25%) dos
valores abaixo e trs quartos (75%) acima dele. O terceiro quartil o valor que
deixa trs quartos (75%) dos dados abaixo e um quarto (25%) acima dele. O
segundo quartil (Q2) a mediana (50%).

O primeiro e o terceiro quartis fazem o mesmo que a mediana


para as duas metades demarcadas pela mediana.
Decis
A definio dos decis obedece ao mesmo princpio dos quartis, com a
modificao da porcentagem de valores que ficam aqum e alm do decil que
se pretende calcular. Indicamos os decis (D1, D2, ..., D9), desse modo,
precisamos de 9 decis para dividirmos uma srie em 10 partes iguais.
Epidemiologia | Indicadores de Sade 15

O mais interessante o quinto decil, que divide o conjunto em duas partes


iguais. Assim sendo, o quinto decil igual ao segundo quartil, que, por sua
vez, igual mediana.
Percentis
Denominamos percentis ou centis os 99 valores que separam uma srie
em 100 partes iguais. Indicamos (P1, P2, ..., P99). evidente que:
P50 = Mediana P25 = Q1 P75 = Q3
O clculo de um centil segue a mesma tcnica do clculo da mediana,
do quartil e do decil:
Mediana = Q2 = D5 = P50

As medidas de posio fornecem informaes valiosas, mas, em geral, no so


suficientes para descrever os diferentes conjuntos de dados. As medidas de
disperso ou variabilidade permitem visualizar a maneira como os dados se
espalham (ou se concentram) em torno do valor central.

Para mensurarmos essa variabilidade, podemos utilizar as seguintes


estatsticas: amplitude total, varincia e desvio padro; estas podem ser
calculadas direto do Excel. Existem outras medidas de disperso que no nos
interessam agora; essas so suficientes para a compreenso e a utilizao na
Epidemiologia.

Amplitude total
a diferena entre o maior e o menor valor do conjunto de dados.
Pegando o mesmo exemplo dos moradores por residncia da quadra A da Rua

16

Epidemiologia | Indicadores de Sade

das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), em que o maior valor 7 e o menor


1, a amplitude total ser: 7-1 = 6.

Varincia
uma medida que expressa um desvio quadrtico mdio do conjunto de
dados e sua unidade o quadrado da unidade dos dados representada por
S2.
S2 = (x1 x)2 /n-1 X = mdia

Pegando o mesmo exemplo dos moradores por residncia da quadra A da


Rua das Flores (4, 5, 3, 2, 7, 3, 4, 1, 5, 2, 3, 3), ento:
X = 3,7
S2 = (4-3,7) 2 + (5-3,7) 2 + (3-3,7) 2 + (2-3,7) 2 + (7-3,7) 2 + (3-3,7) 2 + (4-3,7) 2
+ (1-3,7) 2 + (5-3,7) 2 + (2-3,7) 2 + (3-3,7) 2 + (3-3,7) 2 / 12 - 1 = 2,6

Desvio-padro
raiz quadrada da varincia e sua unidade de medida a mesma que a
do conjunto de dados. Sua frmula : S= raiz quadrada de S2. No mesmo
exemplo anterior, S2 = 2,6; ento S = raiz quadrada de 2,6 = 1,6.

Convm organizar o conjunto de dados de maneira prtica e racional, e uma das


formas de representao desse conjunto se faz por meio da apresentao grfica.
Existem vrias representaes grficas: grfico de barras, diagrama
circular ou grfico de pizza, histograma, grfico de linha ou sequncia e o
boxplot. Para facilitar o conhecimento e a utilizao dos grficos e das tabelas,

Epidemiologia | Indicadores de Sade 17

separamos por tipo de varivel as principais possibilidades de anlise


univariada:
Varivel qualitativa*

Varivel quantitativa

Tabela de frequncias

Tabela de frequncias

Grfico de barras

Histograma, boxplot

Diagrama circular (pizza)

Grfico de linha ou sequncia


Polgono de frequncias
Medidas de resumo

*Essa abordagem tambm pode ser interessante para as variveis quantitativas discretas.

A anlise univariada como ponto inicial na explorao de dados


importante para a Epidemiologia. Por isso, aprofunde seu conhecimento,
assistindo ao vdeo a seguir. Confira!

Anlise bivariada
A estatstica bivariada inclui mtodos de anlise de duas variveis,
podendo ser ou no estabelecida uma relao de causa/efeito entre elas.
Lembrando que o principal objetivo da pesquisa em sade o estabelecimento
de uma relao de causa e efeito entre duas variveis, procuramos identificar
uma associao estatisticamente significativa.
Os testes estatsticos visam descartar o acaso nessa associao. Por
isso, devem ser realizados visando avaliar a validade de qualquer associao
estatstica (acaso, vis, confundimento) e julgar se a associao encontrada
representa uma relao de causa/efeito.

18

Epidemiologia | Indicadores de Sade

Todo teste estatstico tem como resultado um nmero representando a


probabilidade desse acaso, chamado de p-valor (ou valor-p). H a
necessidade de uma hiptese nula bem-definida para a interpretao da
probabilidade fornecida pelo p-valor. Quando o valor-p pequeno, indica a
pouca probabilidade da associao ter ocorrido por acaso; assim, podemos
rejeitar a hiptese nula. A associao observada pode ser devida ao acaso ou
no, e essa a nica resposta que obtemos ao se estudar a associao entre
variveis por meio de um teste estatstico adequado, gerando um p-valor.
Muitos testes estatsticos so elaborados com a premissa de que os
valores seguem uma distribuio normal e so chamados de testes
paramtricos, pois se baseiam nos parmetros da distribuio normal, a
mdia e o desvio-padro. Contudo, quando no podemos perceber ou garantir
que os valores tenham uma distribuio normal, devemos usar os testes no
paramtricos. Mesmo se, na ocorrncia de distribuio normal, aplicarmos o
teste no paramtrico, isso no causar erro, somente pode-se perder o poder
do teste em relao ao teste paramtrico.
Assim, torna-se imprescindvel, antes da escolha do teste estatstico
para dados contnuos, examinar a distribuio dos dados. Se dados contnuos
apresentam uma distribuio anormal, necessrio escolher um teste no
paramtrico ou transform-los em uma distribuio normal, aplicando, como
exemplo, uma transformao logartmica. Existem diversos mtodos para a
verificao da condio de normalidade nos dados sob anlise:
Grfico de probabilidade normal;
Mtodo dos momentos;
Aplicao do teste W Shapiro-Wilk;
Aplicao do teste Kolmogorov-Smirnov ou teste de aderncia X.

As amostras podem ser classificadas como pareadas ou no pareadas.


Um desenho de estudo comum, usando amostras pareadas, pode ser

Epidemiologia | Indicadores de Sade 19

constatado quando um grupo de indivduos examinado antes e depois de um


determinado tratamento. Amostras independentes so constitudas por
diferentes indivduos compondo cada grupo.

Quando queremos fazer controle entre os grupos, podemos usar o pareamento,


considerando que dado pareado constitudo por pareamento, garantindo, assim,
uma composio rigorosamente equivalente entre os grupos em termos de
algumas variveis selecionadas.

Vamos diferenciar dados pareados e no pareados, o que bastante


importante para a aplicao dos testes estatsticos:
Caracterstica

Pareado

No pareado

Distribuio

Normal

Qualquer uma

Varincia assumida

Homognea

Qualquer uma

Relao entre dados

Interdependentes

Qualquer uma

Medidas de localizao

Mdia

Mediana

central normalmente
usada

Os procedimentos estatsticos clssicos no estudo da associao


bivariada (duas variveis) seguem o tipo de amostra das variveis e da
dependncia

das

observaes.

No

quadro

seguir,

mostramos

os

procedimentos estatsticos apropriados:


Escala de
mensurao das
duas variveis

20

Procedimento Estatstico
Para dados no

Epidemiologia | Indicadores de Sade

Para dados pareados

envolvidas na

pareados

associao
Duas dicotmicas

Teste X2 (qui-quadrado)

Teste X2 de McNemar

Teste Exato de Fisher


Coeficiente
RR risco relativo

Coeficiente Kappa
(+IC95%)
OR pareado razo de

(+IC95%)
OR razo de chance

chance (+IC95%)

(+IC95%)
Duas nominais (2x3,

Teste X2 (qui-quadrado)

3x3, 4x2 etc.)

Apenas em matrizes
quadrticas (3x3, 4x4 etc.)
Coeficiente Kappa
(+IC95%)
Teste X2 de Start-Maxweel

Uma ordinal e outra

Teste de Mann-Whitney

Teste de Wilcoxon

Teste de Krusskall-Wallis

Teste de Fridman

dicotmica
Uma ordinal e outra
nominal
Duas ordinais

Anlise Ridit
Coeficiente de Correlao

Apenas em matrizes

de Spearman

quadrticas (3x3, 4x4 etc.)


Kappa ponderado

Uma numrica e outra


dicotmica

Teste t de Students

Teste t pareado

Teste X2 para tendncia

Epidemiologia | Indicadores de Sade 21

Uma numrica e outra

ANOVA

ANOVA para dados

nominal

repetidos

Uma numrica e outra

Nenhum procedimento

Nenhum procedimento

ordinal

simples

simples

Duas numricas

Coeficiente de Correlao

Correlao Interclasse

de Pearson
Regresso Linear Simples
Fonte: LUIZ et al., 2005

Para aprofundar o conhecimento sobre os testes estatsticos e suas frmulas,


consulte o captulo 15 do livro Epidemiologia e Bioestatstica na pesquisa
odontolgica, presente nas referncias.

Confira, no vdeo a seguir, a anlise bivariada e a definio de alguns


testes estatsticos mais usados em Epidemiologia. No deixe de assistir!

Regresso linear simples


um dos modelos causais mais conhecidos e utilizados e consiste em
uma varivel dependente relacionada a uma varivel independente por uma
equao linear. Busca-se a correlao entre as variveis quando uma est
relacionada a outra; enfim, quando a variao de valor da varivel
independente provoca uma mudana no valor da varivel dependente.

22

Epidemiologia | Indicadores de Sade

Essa correlao apresentada graficamente pelo diagrama de


disperso, o qual mostra a relao entre duas variveis quantitativas. Os
valores de uma varivel esto no eixo x (horizontal) para a varivel
independente, enquanto da outra esto no eixo y (vertical), para a varivel
dependente; cada ponto representa uma unidade medida. Assim, devemos
analisar o diagrama observando a direo (crescente ou decrescente), a forma
(linear, no linear e aglomerados) e os pontos discrepantes.

Quanto maior for a correlao, mais prximo de 45 (crescente)


ou 135 (decrescente) ser a distribuio.
Anlise multivariada
A anlise multivariada se refere a um conjunto de mtodos estatsticos
que permite a anlise simultnea de mltiplas variveis para cada unidade
estudada. Inclui, ainda, as diversas abordagens analticas que consideram o
comportamento de muitas variveis analisadas em um mesmo momento.

Apenas os mtodos de anlise multivariada permitem que se explore o


desempenho conjunto das variveis e que se determine a influncia ou a
importncia de cada uma, estando as restantes presentes.
Temos

diversas

opes

de

tcnicas

na

anlise

multivariada.

Destacamos as mais discutidas e usadas na literatura cientfica: regresso


linear mltipla, regresso logstica, anlise fatorial e anlise de conglomerados.
Contudo, nesta aula, vamos abordar apenas a regresso linear mltipla e a
regresso logstica.
Regresso linear mltipla
Tcnica estatstica que analisa a dependncia de uma varivel
quantitativa em relao a duas ou mais variveis independentes (quantitativas
ou qualitativas) ou explicativas. Descreve, por meio de um modelo matemtico,
Epidemiologia | Indicadores de Sade 23

a relao entre uma varivel dependente quantitativa e duas ou mais variveis


independentes qualitativas e quantitativas.
Seu ponto principal a dependncia estatstica de uma varivel em
relao a duas ou mais variveis. Tem como objetivos encontrar a relao
causal entre as variveis e estimar os valores da varivel dependente a partir
dos valores conhecidos ou fixados das variveis independentes.
Regresso logstica
Tcnica de anlise multivariada, que permite estimar a probabilidade
associada ocorrncia de determinado evento em face de um conjunto de
variveis.
No modelo logstico, usamos os valores de uma srie de variveis
independentes para predizer a ocorrncia da doena (varivel dependente). Na
regresso logstica, a varivel dependente tem uma varivel qualitativa
binominal, sendo 0 (ausncia) ou 1 (presena). Assim, todas as variveis
consideradas no modelo esto controladas entre si.

Essa tcnica deve ser usada quando a varivel dependente


dicotmica (qualitativa) e as variveis independentes forem
quantitativas ou qualitativas.

Para aprofundar o conhecimento da anlise multivariada, consulte o livro Anlise


multivariada, de Corrar et al., presente nas referncias.

24

Epidemiologia | Indicadores de Sade

Assista ao vdeo a seguir para saber mais sobre os tpicos avanados


em Estatstica. Confira!

SPSS Statistical Package for Social Sciences


Existem vrios pacotes estatsticos gratuitos e pagos que possibilitam a
realizao dos procedimentos estatsticos. O SPSS (Statistical Package for
Social Sciences) uma dessas opes.
O pacote estatstico SPSS uma ferramenta para anlise de dados que
utiliza tcnicas estatsticas bsicas e avanadas.
O

SPSS

um

software

de

estatstica

de

fcil

manuseio,

internacionalmente utilizado h muitas dcadas. Para iniciar a anlise de


dados, necessrio a construo da base de dados, que um conjunto de
dados registrados em uma planilha, em forma de matriz, com n linhas,
correspondentes aos casos em estudo, e p colunas, correspondentes s
variveis em estudo ou itens de um questionrio. O nmero de casos (nmero
de linhas da matriz) , em geral, maior do que o nmero de variveis em
estudo (nmero de colunas).
O SPSS aceita a colagem da planilha do Excel j elaborada, com a
coluna representando as variveis estudadas e cada linha representando cada
unidade observada; depois cabe ao pesquisador nominar as colunas,
classificando o tipo de varivel, o que facilita a anlise dos dados.

Epidemiologia | Indicadores de Sade 25

Para aprofundar o conhecimento sobre o SPSS, consulte o site com o tutorial do


pacote estatstico, na apostila elaborada pela Universidade Federal do Rio Grande
do Sul, de autoria de Mundstock et al., presente nas referncias.
<http://www.mat.ufrgs.br/~camey/SPSS/Introdu%E7%E3o%20%E0%20An%E1lis
e%20Estat%EDstica%20utilizando%20o%20SPSS%2013_0.pdf>

Sntese
Assista ao vdeo a seguir, no qual apresentaremos uma sntese dos
assuntos que foram estudados nesta aula. Confira!

26

Epidemiologia | Indicadores de Sade

1. Sobre a classificao das variveis, podemos afirmar que:


a. Varivel quantitativa contnua presso arterial de idosos do
ambulatrio de geriatria do hospital Y.
b. Varivel quantitativa ordinal nmero de bactrias por litro de leite.
c. Varivel qualitativa discreta taxa de mortalidade infantil.
d. Varivel qualitativa nominal diviso dos estgios da doena
tuberculose em inicial, controle e final.

2. Calcule a mdia (MEDA), a moda (MO), a mediana (MED), o desvio-padro


(DP), a amplitude (AM) e a varincia (VAR) do conjunto de dados e assinale
a alternativa correta:
Dados: taxa de mortalidade infantil do distrito YY (13,4 - 11,7 - 17,1 15,8 - 22,9 - 11,7).
a. MEDA= 14,5; MO= 17,1; MED= 12,5; DP= 3,4; AM= 2,5 e VAR= 11,2
b. MEDA= 15,4; MO= 11,7; MED= 14,6; DP= 4,3; AM= 11,2 e VAR= 18,1
c. MEDA= 15,4; MO= 17,1; MED= 11,7, DP= 4,3; AM= 12,1 e VAR= 12,5
d. MEDA= 14,1; MO= 11,7; MED= 14,6, DP= 3,4; AM= 11,2 e VAR= 11,2

Epidemiologia | Indicadores de Sade 27

Referncias
ALMEIDA FILHO N; ROUQUAYROL M. Z. Introduo Epidemiologia. 4.
ed., rev. e ampliada. Rio de Janeiro: Guanabara Koogan, 2013.
ALMEIDA FILHO, N; BARRETO, M. L.. Epidemiologia & Sade: fundamentos,
mtodos, aplicaes. [Reimpr.]. Rio de Janeiro: Guanabara Koogan, 2012.
BONITA, R. Epidemiologia bsica. 2.ed. So Paulo: Santos, 2010.
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. (coord). Anlise multivarada:
para os cursos de Administrao, Cincias Contbeis e Economia. So Paulo:
Atlas, 2007.
CZERESNIA, D.; ALBUQUERQUE, M. de F. M. de. Modelos de inferncia
causal: anlise crtica da utilizao da estatstica na Epidemiologia. Revista
Sade Pblica, So Paulo, v. 29, n. 5, out. 1995. Disponvel em:
<http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-89101995
000500012&lng=en&nrm=iso>. Acesso em: 30 jun.2013.
HULLEY, S. B. et al.. Delineando a pesquisa clnica: uma abordagem
epidemiolgica. 2. ed. Porto Alegre: Artmed, 2003
LUIZ, R. R., COSTA, A. J. L., NADANOVSKY, P. Epidemiologia e
Bioestatstica na pesquisa odontolgica. So Paulo: Atheneu, 2005.
LUIZ, R. R., STRUCHINER, C. J. Inferncia causal em epidemiologia: o
modelo de respostas potenciais. Rio de Janeiro: Fiocruz, 2002. 112 p.
Disponvel em SciELO Books <http://books.scielo.org>. Acesso em: 29 jun.
2013.
MEDRONHO, R. A. et al.. Epidemiologia. So Paulo: Atheneu, 2009.
MUNDSTOCK, E. et al.. Introduo anlise estatstica: utilizando o SPSS
13.0. Instituto de Matemtica. Universidade Federal do Rio Grande do Sul,
Porto Alegre. Cadernos de Matemtica e Estatstica, srie B, n. XX, trabalho de
apoio didtico, maio 2006. Disponvel em: <http://www.mat.ufrgs.br/~camey/

28

Epidemiologia | Indicadores de Sade

SPSS/Introdu%E7%E3o%20%E0%20An%E1lise%20Estat%EDstica%20utiliza
ndo%20o%20SPSS%2013_0.pdf>. Acesso em: 29 jun. 2013.

Epidemiologia | Indicadores de Sade 29