You are on page 1of 32

Teste t

Para Amostras Independentes


Instalando o Ambiente Estatstico R
Googar R e ir ao site
Ir em Download CRAN, Brasil primeira opo(UFPR)
Clicar em Downlod R for Windows
Clicar em Install R for the first time
Clicar em Download R xxx for Windows
Executar R xxx win.exe
Aceitar os termos de uso
Exemplo
Um cientista quer saber se h diferena
entre as temperaturas do ar no cerrado e
na floresta do Parque Estadual da Serra
Azul.
Fechar o Excel
Comandos no R
>dados<-read.table("temperatura.txt",h=T) -enter-
>dados -enter-
rea temp1 temp2 temp3 temp4 temp5
1 Cerrado 37.0 35.0 37.5 33.5 34.5
2 Cerrado 36.0 36.0 35.0 35.0 36.0
3 Cerrado 36.0 36.0 35.0 34.0 34.0
4 Cerrado 38.0 38.0 34.0 33.0 31.0
5 Cerrado 35.0 35.0 34.0 34.0 34.0
6 Cerrado 36.5 36.5 35.5 34.5 34.0
7 Cerrado 36.5 36.0 35.0 34.0 33.0
8 Cerrado 34.0 33.0 33.0 32.5 32.0
9 Cerrado 35.0 35.0 33.5 31.5 32.0
10 Cerrado 34.5 35.0 34.5 34.5 34.5
11 Floresta 31.0 31.0 31.0 30.0 28.0
12 Floresta 35.0 35.0 32.5 31.0 29.0
13 Floresta 33.0 33.0 31.0 30.0 28.5
14 Floresta 34.0 32.5 32.0 31.0 29.5
15 Floresta 34.0 32.0 31.5 30.0 29.0
16 Floresta 34.0 33.5 33.0 30.5 30.0
17 Floresta 33.0 32.0 31.0 30.0 29.5
18 Floresta 34.0 32.0 31.0 29.0 28.0
19 Floresta 30.5 29.5 29.0 28.0 27.5
20 Floresta 33.0 32.0 31.0 30.0 29.0
> dados<-read.table(temperatura.txt", h=T)
O comando read.table vai ler os dados no arquivo temperatura.txt e
encaminh-los para o objeto dados. A opo h=T ou header=TRUE
indica que a primeira linha do arquivo contm os nomes das variveis.
O R procura os arquivos para importao na pasta padro do Windows,
que Meus Documentos. Obs.: todo texto no R vem entre aspas. Por
exemplo, nome de arquivo: temperatura.txt.
> dados
Digite dados na linha de comando para verificar o que o objeto dados
contm.
Roteiro do teste t independente
1 - Pergunta
2 - Estrutura de dados
3 - Estatstica Descritiva
4 - Estabelecer as Hipteses e o nvel de significncia
5 - Estatstica t Calculada e o valor de p associado
5.1 - Pergunta
5.2 - Estrutura de dados
5.3 - Estatstica Descritiva
5.4 - Estabelecer as Hipteses e o nvel de significncia
5.5 - Estatstica F Calculada o valor de p associado
5.6 - Comparar p com e concluir
6 - Comparar p com e concluir
Tese F
T
e
s
t
e

T
1 Pergunta
Ambientes diferentes (cerrado ou floresta)
apresentam diferentes temperaturas do
ar?
2 Estruturas dos Dados
Y=f(x)
Temperatura = f(ambiente)
quantitativa qualitativa (2 categorias)
cerrado ou floresta
2 amostras independentes de temperaturas
Cerrado Floresta
3
2
3
4
3
6
3
8
Ambiente
T
e
m
p
e
t
u
r
a

(

C
)
Figura 1. Temperatura do ar nos ambientes cerrado e floresta s 16:15.
Grfico de Caixa
>boxplot(temp1~rea,data=dados,xlab="Amb
iente",ylab="Tempetura (C)")
O comando boxplot desenha grficos de caixa (ver Snia Vieira, 2006,
Introduo Bioestatstica para interpretao)
tempe1~rea equivale temp1=f(rea), ou seja, a temperatura uma funo
da rea, ambiente. O eixo Y temperatura e o eixo X o ambiente.
data=dados significa que minha varivel est no objeto dados.
xlab: ttulo do eixo X
ylab: ttulo do eixo Y
3 Estatstica Descritiva da Amostra:
Temperatura s 16:15 (temp.1)
Mdia
x
cerrado=
35,9C
x
floresta=
33,2C
Desvio padro
s
cerrado=
1,23C
s
floresta=
1,42C
Varincia
s
2
cerrado=
1,50C
2
s
2
floresta=
2,00C
2
Estatstica Descritiva no R
Temperatura do ar (s 16:15h) coluna temp1
> tapply(dados$temp1,dados$rea,mean)
Cerrado Floresta
35.85 33.15
> tapply(dados$temp1,dados$rea,sd)
Cerrado Floresta
1.225878 1.415195
> tapply(dados$temp1,dados$rea,var)
Cerrado Floresta
1.502778 2.002778
> tapply(dados$temp1,dados$rea,mean)
tapply calcula a mdia das temperaturas (dados$temp1) agrupadas
segundo os ambientes (dados$reas).
dados$temp1: o smbolo $ separa a varivel temp1 do objeto dados.
Esta codificao indica que a varivel temp1 se encontra no objeto
dados.
mean: a estatstica a ser calculada a mdia
Outras estatsticas:
sd: a estatstica a ser calculada o desvio padro
var: a estatstica a ser calculada a varincia
4 Hipteses e :
E
0
:
ccudo
=
]Iocstu

os ambientes apresentam temperaturas mdias do ar
iguais
E
1
:
os ambientes apresentam temperaturas mdias do ar
diferentes
= 0,05 ou 5% (nvel de significncia)
5 Estatstica t calculada
H duas formas de calcular o valor de t a partir
das amostras:
1. Uma para quando as varincias populacionais
so iguais (
2
cerrado
=
2
floresta
)
2. Outra para quando as varincias populacionais
so diferentes (
2
cerrado

2
floresta
)
Ento h a necessidade de se determinar se
as varincias populacionais so iguais ou no
atravs do teste F
Teste F
5.1 - Pergunta
As varincias populacionais so iguais?
5.2 - Estrutura de dados
Y=f(x)
Temperatura= f(ambiente)
5.3 - Estatstica Descritiva:
S
2
cerrado
= 1,50C
S
2
loresta
= 2,00C
5.4 - Hipteses e nvel de significncia:
H
0
:
2
cerrado
=
2
floresta
B
1
:
2
cerrado

2
floresta
= 0,05
Teste F
5.5 F = 0,75
grau de liberdade numerador (n-1) = (10-1)= 9
grau de liberdade denominador (n-1) = (10-1) = 9
O valor de p associado ao F calculado:
p = 0,6757
5.7 Comparar p com :
Se o p for menor que o , rejeito B
0
Se o p for maior que o , aceito B
0
Como p> (p>0,05), ento aceita-se H
0
5.8 Concluso:
Concluo que as varincias do Cerrado (1,50C
2
) e da Floresta
(2,00C
2
) no diferem significativamente (p>0,05). Ento devo utilizar o
teste t para varincias iguais.
Teste F para Comparao de
Varincias no programa R
> var.test(temp1~rea,data=dados)
F test to compare two variances
data: temp1 by rea
F = 0.7503, num df = 9, denom df = 9, p-value = 0.6757
alternative hypothesis: true ratio of variances is not
equal to 1
95 percent confidence interval:
0.1863755 3.0208916
sample estimates:
ratio of variances
0.7503467
> var.test(temp1~rea,data=dados)
var.test: Calcula o valor da estatstica F e o valor p
associado da funo temp1~rea a partir das variveis
contidas no objeto dados (data=dados)
5 Estatstica t Calculada e Valor
de p
t = 4,56
Graus de liberdade = 18
p = 0,0002426
Estatstica t e valor de p no
programa R
> t.test(temp1~rea,data=dados,var.equal=TRUE,
alternative="two.sided")
Two Sample t-test
data: temp1 by rea
t = 4.5602, df = 18, p-value = 0.0002426
alternative hypothesis: true difference in means is
not equal to 0
95 percent confidence interval:
1.456092 3.943908
sample estimates:
mean in group Cerrado mean in group Floresta
35.85 33.15
> t.test(temp1~rea,data=dados,var.equal=TRUE,
alternative="two.sided")
t.test: Calcula o teste t para amostras independentes da funo .
data=dados: As variveis esto contidas no objeto dados.
var.equal=TRUE: as varincias populacionais so iguais.
var.equal=FALSE: as varincias populacionais so diferentes.
alternative="two.sided": na hiptese alternativa h duas forma da
desigualdade ocorrer (
ccudo
<
]Iocstu
ou
ccudo
>
]Iocstu
)
6 Comparar p com e concluir
p=0,0002426 e = 0,05
Se o p for menor que o , rejeito B
0
Se o p for maior que o , aceito B
0
p <
Rejeito B
0
:
ccudo
=
]Iocstu
e Aceito B
1
:
ccudo

]Iocstu
(
ccudo
>
]Iocstu
)
6 Comparar p com e concluir
Rejeito H
0
Concluo que, s 16:15, a mdia da
temperatura do ar no cerrado (35,9
1,23C, mdia desvio padro)
significativamente maior do que a mdia
da temperatura do ar na Floresta (33,2
1,42C) (p<0,05).
Laboratrio de Estatstica Aplicada
LEA Gauss
Professor: Roberto Leung
Alunos:Bruna Fernanda (matemtica)
Edenilson Meurer (biologia)
Hrica Dias (engenharia de alimentos)
Jlio Csar (engenharia de alimentos)
Pablo Henrique (biologia)
Pollyanna Nogueira (engenharia de alimentos)