Вы находитесь на странице: 1из 47

Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba

A escolha do mtodo estatstico

Profa. Dra. Livia M. A. Tenuta litenuta@fop.unicamp.br

Universidade Estadual de Campinas


Faculdade de Odontologia de Piracicaba

A escolha do mtodo estatstico


- Probabilidades, hipteses e delineamentos -

A notcia boa que a estatstica est se tornando mais fcil e acessvel. A notcia ruim que a estatstica est se tornando mais fcil e acessvel.
Hofacker, 1983

Para muitos, estatstica ...

Figueira CV, 2006

Para outros...

Estatstica a arte de torturar os dados at que eles digam o que se quer ouvir
Mills, 1993, Susin & Rsing, 1999

Jim Borgman, New York Times, 27 April 1997

Testes estatsticos mais comuns


Nmero e tipo de grupos Independentes (no pareados) 2 grupos Dependentes (pareados) Independentes (no pareados) 3 ou mais grupos Dependentes (pareados) Paramtrico Teste t para amostras independentes Teste t para amostras dependentes ANOVA ANOVA medidas repetidas No paramtrico Teste de MannWhitney Teste de Wilcoxon

Teste de KruskalWallis Teste de Friedman

Susin C. Basic statistical analysis for dental research.


In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Mtodos de regresso mais comuns


Tipo de observaes Independentes Dados contnuos Regresso linear Regresso linear com erro padro ajustado para o agrupamento das observaes Dados categricos Regresso logstica dicotmica, multinomial e ordenada Regresso logstica condicional e extenses

Dependentes

Susin C. Basic statistical analysis for dental research.


In: Rode SM, Dias KRHC, Frana CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Estudo cruzado duplo-cego


Controle negativo: H2O Controle positivo: 1.5% Sacarose Controle ativo: 1.5% Lactose Experimental: Zero CalR Controle negativo: sem dentifrcio Controle ativo: MFP/SiO2 Experimental: MFP/CaCO3

Pesquisa cientfica
Pergunta (???) curiosidade cientfica! Delineamento experimental adequado para testar a pergunta Variveis resposta que ajudem a explicar o fenmeno

Estatstica experimental
Desmineralizao dental (% perda de dureza)
Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%

Diferena estimada entre A e B: 8%

Estatstica experimental
Existe uma real diferena entre os tratamentos A e B? Para descobrir, o experimento deveria ser repetido infinitas vezes!

Estatstica experimental
Inferncia estatstica: determina a probabilidade de estimar se uma real diferena entre tratamentos existe
Nvel de significncia (p): probabilidade de erro ao afirmar que h diferena entre os tratamentos

Estatstica experimental
Desmineralizao dental (% perda de dureza)
Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia DP 29,4% 7,3% Mdia DP Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4% 3,9%

Variao do acaso: toda variao devido a fatores no controlveis. Pode ser medida atravs do desvio em relao a mdia

ANOVA Anlise da varincia


Quanto da variabilidade observada devido ao acaso ou a um real efeito do tratamento

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme


(M F, mdia, n=56)

Dentifrcio A 5,5

Dentifrcio B 11,4

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme


(M F, mdia DP, n=56)

Dentifrcio A 5,5 4,5

Dentifrcio B 11,4 21,0

10

Concentrao de F no fluido do biofilme dental exposto a 2 dentifrcios

11

Eliminando o outlier

12

Transformao sugerida pelo pacote estatstico: inversa

13

Delineamento inteiramente aleatorizado

Esquema da anlise de varincia:


Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -

I = nmero de nveis do tratamento J = nmero de repeties

Delineamento inteiramente aleatorizado


Modelo matemtico:
Yij = + ti + eij
Onde: Yij = valor da varivel testada sob o i-simo nvel de tratamento = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento eij = erro aleatrio

14

Controle

70 ppm F

140 ppm F

280 ppm F

Estatstica experimental
Teste de hipteses: regra de deciso para rejeitar ou no uma hiptese estatstica com base nos elementos amostrais
H0 (hiptese nula): hiptese que ser testada estatisticamente Ha (hiptese alternativa): suposio que o pesquisador quer estudar

15

Delineamento inteiramente aleatorizado

Hipteses:
H0 = t1 = t2 = ... = tI = 0 Ha = ti 0

Estatstica experimental

Ao rejeitar H0, com nvel de significncia de 5%, por exemplo, o pesquisador automaticamente aceita sua hiptese alternativa

16

In relation to any experiment we may speak of the null hypothesis, and it should be noted that the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation. Every experiment may be said to exist only in order to give the facts a chance of disproving the null hypothesis.

Fisher RA

Estatstica experimental
Desmineralizao dental (% perda de dureza)
Tratamento A: 21,5% 23,6% 39,7% 29,5% 32,7% Mdia 29,4% Mdia Tratamento B: 18,9% 24,4% 26,7% 19,4% 17,8% 21,4%

Diferem ao nvel de significncia de 5%

Erro tipo I (): probabilidade de erro ao se rejeitar a hiptese de nulidade quando ela verdadeira, ou seja, probabilidade de apontar um falso positivo

17

Trabalhando com probabilidades...


Nvel de significncia de 5% significa que aceitamos errar em 1 a cada 20 casos
Correlao entre variveis: se eu tiver 10 variveis e for estudar a correlao entre elas, tenho 45 comparaes (10*(10-1)/2 = 45) Em 5% delas, posso ver uma correlao significativa por mero acaso! 0,05* 45 = 2,25!
Hofacker CS, 1983

Erro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativo

funo do: a) nmero de repeties b) variabilidade dos dados c) real diferena entre os grupos

18

Repetio

Proporciona uma estimativa do erro experimental (variabilidade), permitindo a estimativa do efeito dos tratamentos.

Repetio
n=3
Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 17 22 24 21

Teste t comparando A e B: p=0,48

19

Repetio
n=30
Tratamento A: 20, 24, 25, 21, 23, 25, 20, 23, 26, 20, 24, 25, 20, 24, 25, 22, 24, 23, 21, 23, 26, 19, 24, 25, 20, 24, 25, 19, 25, 25 Mdia 23 Tratamento B: 15, 22, 26, 16, 23, 24, 15, 24, 24, 17, 22, 24, 17, 22, 24, 17, 16, 22, 24, 23, 24, 17, 22, 24, 17, 22, 24, 14, 24, 25 Mdia 21

Teste t comparando A e B: p=0,0137

Repetio
n=3
Tratamento A: 20 24 25 Mdia 23 Mdia Tratamento B: 10 13 16 13

Diferena entre A e B = 10

Teste t comparando A e B: p=0,0123

20

Repetio
n=3
Tratamento A: 20 24 25 Mdia DP 23 2,6 Mdia DP Tratamento B: 10 13 16 13 3,0

Repetio
n=3
Tratamento A: 13 21 35 Mdia DP 23 11,1 Mdia DP Tratamento B: 5 10 24 13 9,9

Teste t comparando A e B: p=0,31

21

Poder estatstico
Erro tipo II (): probabilidade de erro ao no rejeitar a hiptese de nulidade quando ela de fato falsa, ou seja, probabilidade de apontar um falso negativo
Poder do teste estatstico: Capacidade do teste em apontar diferenas quando elas realmente existem Erro tipo II () = 10% Poder = 1 = 90%

22

Delineamento inteiramente aleatorizado

Esquema da anlise de varincia:


Fonte de variao Tratamento Resduo Total Graus de liberdade I1 I (J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ resduo GL resduo F QM tratamento QM resduo -

I = nmero de nveis do tratamento J = nmero de repeties

Poder estatstico
Reviewer: What were criteria for sample size selection? Was it to reach estimated power (80%)?
The sample size selection was based on a pilot study, made with 3 volunteers, who ingested the 550 g F/g dentifrice, on fasting, after breakfast or after lunch, and we used the AUC of salivary F concentration as the response variable. In fact, we intended to determine the number of volunteers necessary to detect differences between the gastric content situations using the low F dentifrice, with 80% power. From this pilot study, a low standard deviation was observed between volunteers for each gastric content condition. Using the SAS System 8.01, considering the differences obtained from the mean of these treatments, we could reach 80% power if we used nine volunteers. For 11 volunteers, the power would increase to 90%. Considering that volunteers could be lost during the 9-phase study, we opted to select 11 volunteers. Actually, we could significantly reject H0 in the experiment, and therefore we havent worried in mention this in the text, but we added the power information in the text.

23

Princpios bsicos da experimentao


1. Repetio 2. Aleatorizao 3. Cegamento 4. Controle local (blocos estatsticos)

Aleatorizao

Proporciona a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais

24

Aleatorizao = sorteio!

Aleatorizao no Excel

Exemplo: Dividir 16 espcimes em 4 tratamentos (cada um com 4 espcimes)

25

Classificar pela coluna Aleatrio

ATENO: Para que o sorteio seja feito corretamente, apenas as colunas Tratamento e Aleatrio devem ser selecionadas!

26

Ao classificar por um nmero aleatrio, automaticamente o tratamento ficar aleatorizado!

Portanto, os espcimes 1, 6, 7 e 8 devem receber o tratamento 1, e assim sucessivamente...

27

Aleatorizao com restrio


A distribuio dos espcimes entre os tratamentos feita de modo restrito, para evitar que algum tratamento seja favorecido pela aleatorizao.
Exemplo: quando se conhece a dureza inicial de blocos dentais, possvel sorte-los aos tratamentos de acordo com sua dureza

E a mdia de dureza entre os grupos apresenta-se apresentahomognea.

28

RealizandoRealizando-se a aleatorizao sem restrio, as diferenas entre durezas dos espcimes distribudos aos 4 nveis de tratamento so mais evidentes.

Cegamento
Estudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata.

29

Vieira, S. Estatstica experimental. 2.ed. 1999

Cegamento
Estudo cego: o pesquisador no tem acesso identificao de qual nvel de tratamento se trata. Quando voluntrios esto envolvidos, estes tambm no devem saber de qual tratamento esto participando estudo duplo cego

30

Delineamento aleatorizado em blocos


Utiliza os princpios da repetio, aleatorizao e controle local
Exemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, na concentrao de F na saliva, utilizando 14 voluntrios como blocos estatsticos

Delineamento aleatorizado em blocos


Modelo matemtico:
Yij = + ti + bj + eijk
Onde: Yij = valor da varivel testada sob o i-simo nvel de tratamento e no j-simo bloco = mdia geral do experimento para a varivel ti = efeito do i-simo nvel de tratamento bj = efeito do j-simo nvel de voluntrio eij = erro aleatrio

31

Delineamento aleatorizado em blocos

Hipteses:
H0 = t1 = t2 = ... = tI = 0 Ha = ti 0

Delineamento aleatorizado em blocos


Esquema da anlise de varincia:
Fonte de variao Tratamento Blocos Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ 1 Soma de Quadrados Variabilidade devido ao tratamento Variabilidade devido aos blocos Por diferena Variabilidade total Quadrado mdio SQ tratamento GL trat. SQ blocos GL blocos SQ resduo GL resduo F QM tratamento QM resduo QM blocos QM resduo -

I = nmero de nveis do tratamento J = nmero de blocos

32

Delineamento aleatorizado em blocos

A variabilidade devido aos blocos (voluntrios, p.ex.) pode ser estimada, diminuindo a variabilidade devido ao acaso (erro experimental)

33

Delineamento cruzado
Fase 1 Voluntrios grupo 1 Voluntrios grupo 2 Voluntrios grupo 3 Tratamento A Tratamento B Tratamento C Fase 2 Fase 3

Delineamentos de tratamentos
1. Fatorial 2. Parcelas subdivididas

34

Experimentos fatoriais
Derivam do interesse em testar o efeito de dois ou mais tipos de tratamentos no mesmo experimento. Cada tipo de tratamento referido como um fator.

Experimentos fatoriais
Exemplo: avaliar o efeito do dentifrcio fluoretado, em 2 nveis, e da freqncia de exposio do biofilme dental a sacarose, em 4 nveis, na desmineralizao dental.
Fatorial 2 x 4

35

Experimentos fatoriais
A combinao de tratamentos resultantes o resultado da interao dos fatores a serem testados. No exemplo, h 8 combinaes possveis de tratamentos:
500 ppm F, exposio ao acar 2x/dia 500 ppm F, exposio ao acar 4x/dia 500 ppm F, exposio ao acar 6x/dia 500 ppm F, exposio ao acar 8x/dia 1100 ppm F, exposio ao acar 2x/dia 1100 ppm F, exposio ao acar 4x/dia 1100 ppm F, exposio ao acar 6x/dia 1100 ppm F, exposio ao acar 8x/dia

Delineamento fatorial
Modelo matemtico:
Yij = + Ai + Bj + Ai*Bj + eijk
Onde: Yij = valor da varivel testada sob o i-simo nvel do fator A e jsimo nvel do fator B = mdia geral do experimento para a varivel Ai = efeito do i-simo nvel do fator A Bj = efeito do j-simo nvel do fator B Ai*Bj = efeito da interao A e B eij = erro aleatrio

36

Delineamento fatorial
Hipteses:
(1) H0 = A1 = A2 = ... = AI = 0 Ha = Ai 0 (2) H0 = B1 = B2 = ... = BJ = 0 Ha = Bj 0 (3) H0 = (A*B)ij = 0 Ha = (A*B)ij 0

Delineamento fatorial
Esquema da anlise de varincia:
Fonte de variao A B A*B Resduo Total Graus de liberdade I1 J1 (I 1)(J 1) IJ (K 1) IJ 1 Soma de Quadrados Variabilidade devido ao fator A Variabilidade devido ao fator B Variabilidade devido a interao A*B Por diferena Variabilidade total Quadrado mdio SQ trat. A GL trat. A SQ trat. B GL trat. B SQ (A*B) GL (A*B) SQ resduo GL resduo F QM trat. A QM resduo QM trat. B QM resduo QM trat. A*B QM resduo -

I = nmero de nveis do fator A J = nmero de nveis do fator B K = nmero de repeties

37

Varivel resposta

No h efeito significativo B1 B2 de A (A1 = A2) No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2

Varivel resposta

H efeito significativo de A (A2 > A1) B1 B2 No h efeito significativo de B (B1 = B2) No h efeito da interao A1 A2

Varivel resposta

B1

No h efeito significativo de A (A1 = A2)

B2

H efeito significativo de B (B1 > B2) No h efeito da interao A2

A1 Varivel resposta

B1

H efeito significativo de A (A2 > A1) H efeito significativo de B (B1 > B2) No h efeito da interao

B2

A1

A2

38

Varivel resposta

B1

Interao devido a diferena na grandeza da

B2

resposta

A1 Varivel resposta

A2

B1 B2

Interao devido a diferena na direo da resposta

A1

A2

39

Efeito de 2 dentifrcios na concentrao de F no fluido do biofilme em funo da freqncia de exposio a sacarose


(M F, mdia DP, n=14) Frequncia exposio do biofilme sacarose 2x 4x 6x 8x

Dentifrcio A 5,6 4,7 4,4 1,3 5,1 2,3 6,8 7,2

Dentifrcio B 7,2 4,8 10,1 12,8 8,2 6,2 8,0 6,4

Houve efeito significativo do fator dentifrcio na concentrao de F no fluido do biofilme dental (p<0,05)

Experimentos em parcelas subdivididas

Vieira, S. Estatstica experimental. 2.ed. 1999

40

Experimentos em parcelas subdivididas


Ocorrem quando os tratamentos no so distribudos nas unidades experimentais da mesma forma, caracterizando tratamentos primrios (parcelas) e secundrios (subparcelas). Aps o sorteio do tratamento principal s unidades experimentais de forma usual, o tratamento secundrio sorteado dentro de cada tratamento primrio.

Baseline surface microhardness

41

Delineamento em parcelas subdivididas


Modelo matemtico:
Yij = + Ai + bj + Bk + Ai*Bk + eijkl
Onde: Yij = valor da varivel testada sob o i-simo nvel do fator A, jsimo bloco e k-simo nvel do fator B = mdia geral do experimento para a varivel Ai = efeito do i-simo nvel do fator A bj = efeito do j-simo bloco estatstico Bj = efeito do k-simo nvel do fator B Ai*Bk = efeito da interao A e B eij = erro aleatrio

Delineamento fatorial
Hipteses:
(1) H0 = A1 = A2 = ... = AI = 0 Ha = Ai 0 (2) H0 = B1 = B2 = ... = BJ = 0 Ha = Bj 0 (3) H0 = (A*B)ij = 0 Ha = (A*B)ij 0

42

Delineamento fatorial
Esquema da anlise de varincia:
Fonte de variao A Blocos Resduo a (A*bloco) Graus de liberdade I1 J1 (I 1)(J 1) Soma de Quadrados Quadrado mdio Variabilidade devido ao fator A Variabilidade devido aos blocos Variabilidade da parcela SQ trat. A GL trat. A SQ blocos GL blocos SQ resduo a GL resduo a F QM trat. A QM resduo a QM blocos QM resduo a

Delineamento fatorial
Esquema da anlise de varincia:
Fonte de variao A Blocos Resduo a (A*bloco) B A*B Resduo b Total Graus de liberdade I1 J1 (I 1)(J 1) K1 (I 1)(K 1) I(J 1)(K 1) IJK 1 Soma de Quadrados Quadrado mdio Variabilidade devido ao fator A Variabilidade devido aos blocos Variabilidade da parcela Variabilidade devido ao fator B Variabilidade devido a interao A*B Por diferena Variabilidade total SQ trat. A GL trat. A SQ blocos GL blocos SQ resduo a GL resduo a SQ trat. B GL trat. B SQ (A*B) GL (A*B) SQ resduo b GL resduo b QM trat. B QM resduo b QM trat. A*B QM resduo b F QM trat. A QM resduo a QM blocos QM resduo a

43

44

45

We

have

discussed

the

practice

of

using

different

data

transformations within a 2-way ANOVA with our statistical adviser and he stated that this is not valid, since the comparisons are not then between data of the same type. Transformation is performed to deal with 1 or more of 3 problems: non-normality, non-homogeneity of variance and non-additivity. To my understanding, in a 2-way analysis, 'individualized' transformations, while solving the first two problems, would work against the third requirement of ANOVA, that treatment effects are additive. For instance, data in which treatment effect was multiplicative rather than additive are appropriately transformed to logs, since the treatment effects then become additive. But these could not then be compared with data that had not been transformed because they already fulfilled the ANOVA requirements. You would be comparing oranges and bananas.

Sorry about the confusion induced by my last set of comments on the statistics. I think there might be still some sort of problem there, in that your comparison of the 30-min plaque solid data is on a somewhat different basis from the other comparisons. But I will discuss it when I next see our statistical advisor. I suspect that I put the question to him in a misleading way, combined with a misinterpretation of your analysis.

46

Obrigada pela ateno!!!

litenuta@fop.unicamp.br

47