Академический Документы
Профессиональный Документы
Культура Документы
UFMG
Trabalho de Estatística
01 de julho de 2010
Sumário
1. Introdução
2. Estudos observacionais
3. Estudos experimental
4. Outliers
5. Gráfico de Box-plot
6. Histograma
7. Diagrama de dispersão
8. Referências Bibliográficas
Introdução
Estudos estatísticos podem ser divididos em estudos observacionais, que observa e mede os dados, e
em experimento, que aplica algum tratamento. Os estudos observacionais não tentam modificar os
sujeitos objeto de estudo e podem ser divididos em:
• Estudo Prospectivo(ou longitudinal ou de coorte):os dados são coletados no futuro, de
grupos (chamados coortes) que compartilham fatores comum;
• Estudo Transversal: os dados são observados, medidos e coletados em um ponto no tempo;
• Estudo Retrospectivo (ou de controle de caso): os dados são coletados do passado através de
exames de registro, entrevistas e etc.;
Os experimentos, por sua vez, possuem elementos-chaves em seu planejamento, que são:
• Controle de efeitos de variáveis através de planejamento de experimentos cegos, blocos,
planejamento experimental rigorosamente controlado.
• Replicação
• Aleatorização
O uso de gráficos em estatística é extremamente útil, uma vez que esses dão uma representação
organizada e resumida dos dados trabalhados.Dentre os gráficos mais utilizados estão: diagrama de
dispersão, histograma e box-plot.Um conceito relevante ao se analisar gráficos consiste em outliers
que são valores amostrais que se localizam muito longe da grande maioria dos outros valores
amostrais, e que devem ser identificados e analisados.
Estudos observacionais
Estudos Transversais e de Caso-Controle
Estudos Transversais
Nesse tipo de estudo todas as medições são feitas em um único momento, sem período de
acompanhamento. Esse tipo de delineamento é útil para descrever variáveis e seus padrões de
distribuição, demonstrando, por exemplo, as características demográficas e clínicas de um grupo de
estudo, podendo também ser usado para examinar associações. Um ponto positivo dos estudos
transversais é que não é necessário esperar um desfecho para chegar a conclusões, isso faz com que
esses estudos sejam rápidos e de baixo custo. Além disso, por não haver acompanhamento, não há
perdas. Estudos transversais são os únicos que fornecem a prevalência de uma doença ou um fator
de risco. Porém, nesse tipo de estudo é difícil estabelecer relações causais e estudar doenças raras
em amostra de indivíduos da população geral. O fato de o estudo transversal medir apenas
prevalência, e não incidência limita sua capacidade de estabelecer prognósticos, história natural e
causa da doença.
Estudos de Caso-Controle
Estudos de Coorte
A diferença para o estudo de coorte prospectivo é que a montagem da coorte, as medições basais, o
acompanhamento e os desfechos ocorrem todos no passado.Esse tipo de estudo só é possível se
houver dados adequados de disponíveis sobre fatores de risco e os desfechos em uma coorte de
sujeitos montadas por outros motivos.Nesse tipo de estudo, assim como no coorte prospectivo, as
variáveis preditoras precedem os desfechos.Em comparação aos estudos prospectivos, o
retrospectivos demandam menos tempo e recurso financeiro.Porém, em um estudo de coorte
retrospectivo, o investigador tem controle limitado sobre a estratégia de amostragem da população,a
natureza e a qualidade dos dados analisados, isso porque, a coorte é pré-estabelecida.
Estudo Experimental
Nesse tipo de estudo, investiga-se a relação causa efeito. Os ensaios clínicos apresentam um
desenho experimental semelhante aos dos estudos de coorte, a não ser pela alocação nos grupos,
que consiste em uma seleção em que todos os participantes tem a mesma chance de serem
alocados para cada um dos grupos de estudo.Os sujeitos são colocados “aleatoriamente” para
formar os grupos: o de estudo e o de controle, objetivando formar grupos com características
semelhantes. Procede-se a intervenção em apenas um dos grupos (o de estudo), o outro
(controle) serve para comparação dos resultados. No ensaio clínico randomizado procura-se
verificar a incidência de casos, nos grupos de expostos e não-expostos. A relação entre os
grupos é expressa pelo risco relativo. Esse é um delineamento adequado para responder o efeito
de intervenções (qualquer manejo clínico oferecido aos participantes que podem ter um efeito
nas suas condições de saúde - testes diagnósticos, tratamento, prevenção, rastreamento, modelo
educacional).São vantagens desse tipo de estudo : tem-se alta credibilidade como produtor de
evidências científicas; não existe dificuldade de grupo controle, nem de interpretar resultados e
há determinação da cronologia dos eventos.Contudo,por questões éticas muitas situações não
podem ser estudadas por este método; há possibilidade de perdas e recusas por parte das
pessoas pesquisadas; necessidade de manter uma estrutura administrativa e técnica bem
preparada, tendo custo, em geral,elevado.A randominização reduz o risco de desequilíbrio de
fatores desconhecidos que poderiam influenciar o curso clínico dos participantes.Nenhum outro
delineamento permite um equilíbrio destes fatores não conhecidos.
São critérios de seleção para um ensaio clínico:
Critérios de inclusão
– Restringir a heterogeneidade de pacientes
Critérios de exclusão
– Doença atípica
– Outras doenças
– Prognóstico muito ruim
– Pouca cooperação
São fases de um ensaio clínico:
Outliers
São observações que apresentam um grande afastamento das restantes ou são inconsistentes com
elas. Também chamadas por observações “anormais”, contaminantes, estranhas, extremas ou
aberrantes. Na maioria das vezes, a razão da existência de um outlier determina a forma como
administrá-lo. Assim, as principais causas que levam ao aparecimento de outliers são:
Detecção de fraudes;
Variabilidade inerente dos elementos da população;
Em análises médicas (resultados não esperados de tratamentos);
Erros de medição;
Erros de execução;
São alguns métodos para identificação de outliers:
Gráficos (box-plot, diagrama de dispersão, histograma)
Modelos de discordância
Teste de Dixon
Teste de Grubbs
Z-scores
Z-Scores
Calcula-se os z-scores.Se o conjunto dos dados é pequeno (inferior a 50), valores que tenham
zscores inferiores a -2.5 ou superiores a 2.5 devem ser considerados
outliers.Se o conjunto dos dados é grande, valores que tenham z-socres inferiores a
-3.3 ou superiores a 3.3 são tipicamente considerados outliers. Se o conjunto dos dados é muito
grande (1000 ou mais), também valores mais extremos do que +-3.3 podem ser considerados dados
normais e não outliers.
Gráfico de Box-Plot
Para construir um box-plot, desenhamos uma"caixa" com o nível superior dado pelo terceiro quartil
(Q3) e o nível inferior pelo primeiro quartil(Q1). A mediana (Q2) é representada por um traço no
interior da caixa e segmentos de reta são colocados da caixa até os valores máximo e mínimo, que
não sejam observações discrepantes. Os valores que estiverem no intervalo de Q3+1,5L e Q3+3L e
no intervalo Q1-1,5L e Q1-3L, serão considerados outliers podendo, portanto ser aceitos na
população com alguma suspeita.Os valores que forem maiores que Q3+3L e menores que Q1-3L
devem ser considerados suspeitos de pertencer à população, devendo ser investigada a origem da
dispersão. Estes pontos são chamados de extremos. O box-plot é útil, pois tanto a média como o
desvio padrão podem não ser medidas adequadas para representar um conjunto de valores, uma vez
que são afetados, de forma exagerada, por valores extremos. Além disso, apenas com estas duas
medidas não temos idéia da assimetria da distribuição dos valores. Dessa forma, essa construção
gráfica soluciona tais problemas.
É necessário decidir o que fazer com as observações discordantes. A maneira mais simples de lidar
com essas observações é eliminá-las. Esta abordagem, apesar de ser muito utilizada, não é
aconselhável. Ela só se justifica no caso de os outliers serem devidos a erros cuja correção é
inviável. Não sendo o caso, as observações consideradas como outliers devem ser tratadas
cuidadosamente, pois contêm informação relevante sobre características subjacentes aos dados e
poderão ser decisivas no conhecimento da população à qual pertence à amostra em estudo.
Histograma
De longe o método mais comum de apresentação de dados numéricos é o histograma, relacionado
com o gráfico de barras para dados categóricos. O histograma consiste em retângulos contíguos
com base nas faixas de valores da variável e com área igual à freqüência absoluta ou relativa da
respectiva faixa. Desta forma, a altura de cada retângulo é denominada densidade de freqüência ou
simplesmente densidade definida pelo quociente da área pela amplitude da faixa.Pode ser usado na
verificação de outliers.
Diagrama de Dispersão
É um gráfico de pares de dados (x,y), com um eixo x horizontal e um y vertical.Os dados são
colocados em pares que combinam cada valor de um conjunto de dados em com um valor
correspondente de um segundo conjunto de dados.São úteis para demonstrar correlações entre os
dados, agrupamento ou dispersão de uma das variáveis em relação à outra e a ocorrência de
outliers.
Referências Bibliográficas
http://www.anvisa.gov.br/institucional/snvs/coprh/cursos/met_epid.pdf