Вы находитесь на странице: 1из 5

Curso de Introduo Bioestatstica

Aula 1 Introduo a Bioestatstica


Conceitos de Estatstica descritiva e inferencial
A bioestatstica a metodologia estatstica aplicada s cincias
biolgicas, com a finalidade de coletar, organizar, resumir e interpretar os
dados, permitindo tirar concluses sobre populaes a partir do estudo de
amostras.
Compreende o planejamento e a anlise estatstica, que por sua vez
divide-se em duas etapas: estatstica descritiva e inferencial.
Estatstica

Etapa

Metodologia

Objetivo

Obter amostras com poder


Clculo do tamanho da
Planejamento
amostra e definio da forma adequado e sem distores
Estatstico
(vieses).
de coleta de dados.
Anlise
Estatstica
Descritiva

Identificar a natureza dos


dados e o tipo de
distribuio; resumir os
resultados.

Ter uma idia geral dos


resultados obtidos; escolher
o tipo de testes estatsticos
que sero utilizados.

Anlise
Estatstica
Inferencial

Aplicar testes de hipteses


e/ou calcular intervalos de
confiana.

Concluir sobre populaes a


partir de amostras.

Planejamento Estatstico: Na aula 3 veremos a importncia de obter


amostras de tamanho adequado, devido ao teorema do limite central. O
tamanho da amostra pode ser calculado atravs de frmulas, como a apresentada
na aula 6 (quando discutido o conceito de poder estatstico da amostra).
A obteno de amostras aleatrias e a alocao aleatria de pacientes
nos grupos em um ensaio clnico tambm so fundamentais, como veremos na
aula 4. Existem vrias formas de fazer a aleatorizao, como a central (quando
existe uma central telefnica), utilizando uma tabela de nmeros aleatrios (para
selecionar pronturios pelo nmero de registro hospitalar, por exemplo) ou
aleatorizao por blocos (para obter grupos balanceados), dependendo do tipo de
estudo e da estrutura disponvel.
Estatstica Descritiva: Organizao dos dados obtidos atravs de
classificao, contagem ou mensurao. Os dados devem ser apresentados
de forma clara atravs de tabelas e grficos, no permitindo, no entanto,
concluses.
A anlise descritiva inclui medidas resumo (medidas do centro da
distribuio e medidas de variabilidade), tabelas e grficos.
Quando terminamos a coleta de dados, apresentamos os resultados
organizados em tabelas, relatando algumas medidas (estatsticas), como o menor
valor observado, a mdia, o desvio padro ou erro padro e grficos, que
representam visualmente um resumo dos dados.
Estatstica Inferencial: Permite realizar inferncias (tirar concluses) a
respeito de populaes a partir de amostras, alm de verificar se duas amostras

Copyright 1997-2008, UNIFESP Virtual


Departamento de Informtica em Sade - UNIFESP/EPM

provm da mesma populao, atravs de teste de hipteses ou da construo de


intervalos de confiana. Deve ser sempre precedida pela anlise descritiva.
Utilizamos a estatstica inferencial, por exemplo, para verificar pode-se
afirmar que um tratamento que cura 18 pacientes de um grupo de 30 melhor
do que outro que cura 15 pacientes dentre 30. o que se denomina de
significncia estatstica, que como veremos neste curso no significa que o
resultado seja clinicamente significativo.
Devemos ter sempre em mente que habitualmente trabalhamos com
amostras, tentando inferir os dados reais da populao (denominados
parmetros), a partir de estatsticas (dados obtidos de amostras) existindo,
portanto, uma margem de erro.
A exceo o censo, quando toda a populao pesquisada.
Assim, quando fazemos uma pesquisa de inteno de voto para uma
eleio, apresentamos as estatsticas de cada candidato com a respectiva
margem de erro, calculada a partir da variabilidade dos resultados e do tamanho
da amostra. Quando ocorre a apurao dos votos (um censo), conhecemos o
verdadeiro parmetro da populao. Se a metodologia da pesquisa foi correta, o
parmetro estar contido na estatstica calculada com a respectiva margem de
erro (intervalo de confiana). Um problema adicional que os eleitores podem
mudar de opinio entre a pesquisa e a eleio.
Ateno
- O estatstico deve ser consultado pelo pesquisador antes do incio da
coleta de dados, para calcular o tamanho da amostra e orientar sobre
tcnicas de amostragem ou alocao aleatria dos pacientes nos grupos.
- Devemos utilizar a estatstica para apoiar as nossas concluses, atravs
do teste de hipteses formuladas previamente, e no buscar respostas
para as nossas perguntas apenas na estatstica.
- O pesquisador no pode exigir que a anlise estatstica tenha o
resultado que ele deseja.
- Por melhor que seja a anlise estatstica, ela no corrige erros no
planejamento (desenho) ou conduo do estudo.

Tipos de variveis
Variveis so caractersticas que assumem valores diferentes de um
indivduo para outro ou no mesmo indivduo ao longo do tempo.
Por exemplo, a cor dos olhos varia de uma pessoa para outra. O peso pode
ainda variar na mesma pessoa.
Sexo e idade so variveis presentes em quase todos os estudos.
Em relao ao papel de cada uma no estudo, as variveis podem ser
classificadas em:
- Preditora, explicativa ou independente: permite predizer uma
resposta. Exemplos: Fumo e risco de doena coronariana, ndice
de massa corprea e risco de carcinoma de endomtrio.

Copyright 1997-2008, UNIFESP Virtual


Departamento de Informtica em Sade - UNIFESP/EPM

- Resposta ou dependente: Evento que se pretende estudar.


Exemplo: Ocorrncia de cncer.
- Varivel de controle: Deseja-se que esteja homogeneamente
distribuda nos grupos, pois poderia interferir nos resultados
(atuando, por exemplo, como uma varivel de confuso). No pode
ser estudada. Exemplos: sexo, idade.
Dependendo da pergunta do estudo, uma mesma varivel pode ser
preditora, resposta ou de controle.
Exemplo:
- Relao entre idade gestacional (tempo de gravidez) e ocorrncia de
diabetes na gestao. Pergunta do estudo: O risco de desenvolver diabetes se
altera ao longo da gravidez? Idade gestacional = varivel preditora.
- Relao entre o dimetro biparietal do crnio fetal medido pela ultra-sonografia
e a idade gestacional. Pergunta do estudo: possvel predizer o tempo de
gravidez medindo o dimetro biparietal? Idade gestacional = varivel resposta.
- Comparao entre o peso de bebs recm-nascidos, filhos de mes diabticas
e no-diabticas, de mesma idade gestacional. Pergunta do estudo: A diabetes
materna altera o peso dos bebs? Idade gestacional = varivel de controle.
Varivel de confuso: H alguns anos, um pesquisador afirmou que o consumo
de caf aumentava o risco de cncer de pncreas e que a anlise estatstica mostrava uma
associao significante. Quando o trabalho foi re-analisado, concluiu-se que na verdade o
fator de risco era o fumo. O que ocorreu foi que os fumantes tomavam mais caf. Assim, o
caf era uma varivel de confuso, ou seja, estava associada tanto ao fator de risco
verdadeiro (fumantes tomam mais caf) como doena (o consumo de caf entre os
portadores de cncer de pncreas era maior do que na populao geral). No entanto, no
havia relao causa-efeito entre consumo de caf e cncer de pncreas.
Como pode-se perceber por este exemplo, associao estatstica no
significa obrigatoriamente relao causal (causa-efeito).
Existem vrias formas de lidar com as variveis de confuso. No desenho do
estudo, pode-se utilizar, em ensaios clnicos - como veremos na aula 4 - a aleatorizao
(que, desde que a amostra seja suficientemente grande, distribui a varivel igualmente
entre os grupos) ou o pareamento (no exemplo, incluir igual proporo de "tomadores de
caf'" nos grupos, atravs da seleo dos pacientes que entram no estudo). Na anlise,
pode-se fazer um ajuste (ou correo) para a varivel que se acredite ser de confuso,
observando se ocorre alterao nos resultados.
Escolha das variveis: Ser que vale a pena realizar um estudo com uma
varivel preditora cujo papel como fator de risco para uma doena j foi estabelecido?
Normalmente, um trabalho deve basear-se em uma pergunta que ainda no foi
respondida.
Assim, pode-se querer saber se o uso de anticoncepcional hormonal oral (plula)
seria fator de risco para o cncer de colo uterino, sendo que j se sabe que a infeco pelo
papilomavrus humano (HPV) importante fator de risco para a doena (no valeria a
pena fazer um trabalho para confirmar a importncia do HPV e nenhuma revista cientfica
de qualidade iria public-lo).
O que se recomenda seria controlar a varivel infeco pelo HPV (que poderia
atuar como varivel de confuso) e colocar o uso de plula como varivel preditora e a
ocorrncia de cncer como varivel resposta.

Copyright 1997-2008, UNIFESP Virtual


Departamento de Informtica em Sade - UNIFESP/EPM

Um motivo para no estudar duas variveis preditoras simultaneamente que o


modelo de anlise estatstica ficaria mais complexo (ou "pesado", no jargo dos
estatsticos) e seria necessria uma amostra maior.

Ateno
- As variveis preditoras, resposta e de controle devem ser definidas pelo
pesquisador, nunca pelo estatstico.
- Deve-se evitar nmero excessivo de variveis, que dificultam a
anlise estatstica e diminuem o poder da amostra.
- Ao fazer comparaes mltiplas, corre-se o risco de encontrar
diferenas que surgiram puramente ao acaso (erro tipo I, como veremos na
aula 6).
- Uma varivel preditora e uma varivel resposta so suficientes para um
bom trabalho, desde que a pergunta do estudo seja relevante e indita.

Escala de Variveis
Quanto escala utilizada, a varivel pode ser:
Escala de variveis

Categrica

Numrica

Tipo

Exemplo

Nominal

Sexo

Ordinal

Gravidade de doena

Discreta

Nmero de bitos

Contnua

Glicemia

1.
Categrica (qualitativa): dados obtidos atravs de classificao em
categorias, no existindo intervalo fixo entre as classes.
1.1. Nominal: no existe ordem definida.
Exemplos: sexo, raa, grupo sangneo.
Quando existem apenas duas possibilidades (doente ou so, por exemplo),
chamada de dicotmica ou binria.
1.2. Ordinal: grupos ou classes ordenadas.
Exemplos: gravidade da doena (leve/moderada/grave), estdio clnico
do cncer de mama (I a IV), nvel socioeconmico (classes A a E).
Para as variveis categricas, a anlise estatstica limitada. impossvel
calcular, por exemplo, medidas como a mdia (mais informaes na aula 2). Se
as variveis preditoras e resposta forem todas categricas (exemplo: associao
entre a raa e a ocorrncia de cncer), s ser possvel utilizar testes no
paramtricos (como o teste do qui-quadrado), que apresentam menor poder.
2. Numrica (quantitativa) ou intervalar: existe um intervalo fixo entre as
classes.

Copyright 1997-2008, UNIFESP Virtual


Departamento de Informtica em Sade - UNIFESP/EPM

2.1. Discreta: Dados obtidos por contagem, correspondendo somente a


nmeros inteiros (existe um hiato entre as classes).
Exemplos: Nmero de bitos, nmero de crises de asma, nmero de filhos
(ningum pode ter 2,5 filhos).
2.2. Contnua: Dados obtidos por mensurao: nmeros reais, com
quantas casas decimais se deseja (no existe hiato entre as classes).
Exemplos: Glicemia, altura, presso arterial sistlica, peso (o peso pode
ser medido em quilogramas, gramas, miligramas, etc.).
Pode ainda ser resultante de um clculo feito a partir de 2 variveis
numricas contnuas.
Exemplo: ndice de massa corprea (peso dividido pelo quadrado da
estatura).
Pode-se transformar uma varivel numrica em categrica (por exemplo:
classificar as pessoas de acordo com a idade em menos de 50 anos ou mais de 50
anos). Atravs deste processo, denominado categorizao, perdem-se dados e
poder de anlise estatstica. S aceitvel quando vai ser definido um ponto de
corte, como por exemplo um nvel de presso arterial sistlica a partir do qual
seria institudo determinado tratamento.

Ateno
- No confundir variveis categricas ordinais expressas por nmeros
(como o grau de diferenciao de um tumor, por exemplo) com variveis
numricas.
- Lembre-se: Qualquer varivel pode ser codificada por nmeros. (Exemplo:
sexo 0=feminino, 1=masculino).
- Deve-se evitar a transformao de variveis numricas em
categricas, pois ocorre perda de informaes.
- Se as variveis preditoras e resposta forem todas categricas s ser
possvel utilizar testes no paramtricos, que apresentam menor poder.

Copyright 1997-2008, UNIFESP Virtual


Departamento de Informtica em Sade - UNIFESP/EPM

Вам также может понравиться