Вы находитесь на странице: 1из 12

TESTE T STUDENT

A Tabela ao lado mostra os dados de calorias ingeridas por dia SUJEITO KCAL
para um grupo de 15 jovens. 1 1867
Aplique o teste t para averiguar se eles pertencem à população 2 1978
cuja média de calorias ingeridas por dia é 2100 Kcal ao nível de 3 1958
significância (𝛼 = 5%). 4 2004
5 2011
A seguir apresentamos os resultados de duas formas, utilizando cálculos
6 2578
elementares e cálculos automatizados pelo SPSS.
7 2498
Pelo exposto no enunciado, se trata de teste de hipótese para uma media 8 2110
populacional cujo desvio padrão não é conhecido e tamanho de amostra 9 1900
é inferior que 30 (𝑛 = 15). 10 1950
11 2099
Assim a estatística teste a usar é T-Student. 12 2360
13 2311
14 2788
15 2700
PASSO A PASSO
1. Especificação das Hipóteses 2. Cálculo de Estatística de teste (t-student)
𝐻0 : 𝜇 = 2100 𝑥̅ − 𝜇
𝑡𝑛−1 = 𝑠
𝐻1 : 𝜇 ≠ 2100
√𝑛

De acordo com dados podemos calcular a média amostra (𝑥̅ ) e o desvio padrão amostral (s)

SUJEITO 𝒙𝒊 ̅
𝒙𝒊 − 𝒙 ̅ )𝟐
(𝒙𝒊 − 𝒙 ∑𝑛𝑖=1 𝑥𝑖 33112
𝑥̅ = = = 2207.467
1 1867 -340,466 115917,0972 𝑛 13
2 1978 -229,466 52654,64516
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 1328191,733
3 1958 -249,466 62233,28516 𝑠2 = =
𝑛−1 15 − 1
4 2004 -203,466 41398,41316 2
𝑠 = 94870,8381
5 2011 -196,466 38598,88916 𝑠 = √𝑠 2 = √94870,8381 = 308
6 2578 370,534 137295,4452
7 2498 290,534 84410,00516 2207.467 − 2100
𝑡𝑛−1 = = 1.35
8 2110 -97,466 9499,621156 308
9 1900 -307,466 94535,34116 √15
10 1950 -257,466 66288,74116
3. Fixação de nível de significância e
11 2099 -108,466 11764,87316
região crítica
12 2360 152,534 23266,62116
13 2311 103,534 10719,28916 𝛼 = 5% = 0.05
14 2788 580,534 337019,7252 ⟹ 1 − 𝛼 = 95% = 0.95
15 2700 492,534 242589,7412
Na tabela a seguir procurar intersecção de
Total 33112 ≈𝟎 1328191,733
𝑙𝑖𝑛ℎ𝑎 = 𝑛 − 1 = 14𝑔𝑙 e 𝛼 =
α
0.025 uma vez que o teste é bilateral (2 ). Temos 𝑡14,𝛼 = 2.145
2

1
TESTE T STUDENT

2.145

2
TESTE T STUDENT

Graficamente

Confiança
𝛼 𝛼
= 0.025 1 − 𝛼 = 0.95 = 0.025
2 2
Região de Rejeição Região de Rejeição

REGIÃO DE ACEITAÇÃO

4. Regra de Decisão
Aceitar H0 se o valor de teste (t calculado)∈ RA =] − 2.145; 2.145[ caso contrário rejeitar a
H0 .

5. Conclusão
O valor de teste (𝑡 = 1.35 “confira o passo 2”) está na região de aceitação (confira o passo 4)
então aceita-se a hipótese nula ao nível de significância de 5%, ou seja, os 15 jovens
observados fazem parte da população cuja média de caloria ingerida diariamente é 2100 Kcal.
______________________________________________________________________________
PELO SPSS
Usando os mesmos dados, temos seguintes resultados da saída de SPSS.

Nível de Confiança

Estatística de teste (t Hipótese nula (O


calculado) valor a ser testado)

3
TESTE T STUDENT

Para especificar a hipótese nula, basta observar a tabela de teste.


De acordo com esta, as hipóteses são:
𝑯𝟎 : 𝜇 = 2100 (Valor de Teste)
𝑯𝟏 : 𝜇 ≠ 2100 (a amostra não pertence a populção com média 2100)

A mesma tabela mostra o nível de confiança que, através do qual podemos conhecer o nível de
significância na coluna intervalo de confiança.
1 − 𝛼 = 95% = 0.95 ⟹ 𝛼 = 1 − 0.95 = 0.05

A estatística de teste é exibida na tabela de teste na coluna designada “t” e na coluna “gl” é exibido
graus de liberdades (𝑛 − 1), então temos:
𝑡14;0.05 = 1.351

Regra de decisão em SPSS


A decisão é estabelecida ao se fazer a comparação entre o valor de significância “sig.” da tabela
de teste e o nível de significância “𝛼”.
 Aceitar 𝐻0 se 𝑠𝑖𝑔 > 𝛼
 Rejeitar 𝐻0 se 𝑠𝑖𝑔 < 𝛼
No nosso caso temos:

𝑠𝑖𝑔1 = 0.198 > 𝛼 = 0.05, então aceitamos a hipótese nula ao nível de significância de 5%
estabelecendo a conclusão de admitir que a amostra dos 15 jovens pertence a população com
consumo médio diário de 2100 Kcal.

1
Caso o teste seja unilateral, deve-se dividir por dois o sig. Antes de compará-lo ao nível de significância "𝛼"
4
REGRESSAO LINEAR SIMPLES
Exemplo
A Tabela a seguir mostra os dados relativos a duração (em minutos) das erupções do Old Faithful
e os tempos (em minutos) até que as próximas erupções aconteçam. Pretende-se averiguar se a
duração de erupções (X) é um factor determinante do tempo levado ate a próxima erupção (Y).

Obs. Y (Tempo) X (Duração) 𝑿𝒊𝟐 𝒀𝒊𝟐 XY

1 56 1,80 3,24 3136 100,8


2 58 1,82 3,31 3364 105,56
3 62 1,90 3,61 3844 117,8
4 56 1,93 3,72 3136 108,08
5 57 1,98 3,92 3249 112,86
6 57 2,05 4,20 3249 116,85
7 60 2,13 4,54 3600 127,8
8 57 2,30 5,29 3249 131,1
9 61 2,37 5,62 3721 144,57
10 73 2,82 7,95 5329 205,86
11 76 3,13 9,80 5776 237,88
12 77 3,27 10,69 5929 251,79
13 77 3,65 13,32 5929 281,05
14 79 3,78 14,29 6241 298,62
15 85 3,83 14,67 7225 325,55
16 80 3,88 15,05 6400 310,4
17 89 4,10 16,81 7921 364,9
18 90 4,27 18,23 8100 384,3
19 89 4,30 18,49 7921 382,7
20 89 4,43 19,62 7921 394,27
21 86 4,47 19,98 7396 384,42
22 89 4,53 20,52 7921 403,17
23 89 4,55 20,70 7921 404,95
24 92 4,60 21,16 8464 423,2
25 91 4,63 21,44 8281 421,33
Total 1875 82,52 300,1894 145223 6539,81
Média 75 3,3008
Para verificarmos se a duração das erupções é um factor no tempo para próxima erupção,
construímos uma regressão.

5
REGRESSAO LINEAR SIMPLES

1. Primeiro: Construir diagrama de dispersão


(Duração das erupções Vs Tempo para próxima erupção)

Observando o gráfico é
claro que a disposição
dos pontos cria uma
imagem de uma relação
linear.
Com esta informação, já
afirmar que a equação
que descreve melhor este
relacionamento é modelo
linear de regressão.
Passemos a estimar os
parâmetros deste modelo.

2. Estimação de parâmetro da regressão (método dos mínimos quadrados)


n ∑ Xi Yi − ∑ Xi ∑ Yi 25 ∙ 6539,81 − 82,52 ∙ 1875
β̂2 = = = 12,62
n ∑ Xi2 − (∑ Xi )2 25 ∙ 300,1894 − 82,522

β̂1 = Y
̅ − β̂2 X
̅ = 75 − 12,62 ∙ 3,3 = 33,36

2.1. Equação da recta ajustada

Yi = β̂1 − β̂2 Xi ⟹ 𝐘
̂ ̂𝐢 = 𝟑𝟑, 𝟑𝟔 + 𝟏𝟐, 𝟔𝟐𝐗 𝐢

3. Coeficientes de Correlação linear e de Determinação


n ∑ Xi Yi − (∑ Xi )(∑ Yi )
r= =
√n ∑ Xi2 − (∑ Xi )2 ∙ √n ∑ Yi2 − (∑ Yi )2
25 ∙ 6539,81 − 82,52 ∙ 1875
= 0,98 (coeficiente de correlação linear)
√25 ∙ 300,1894 − 82,522 ∙ √25 ∙ 145223 − 18752

6
REGRESSAO LINEAR SIMPLES
̅)2 4426
̂i − Y
∑(Y
r2 = = = 0,96 (coeficiente de determinação)
∑(Yi − ̅
Y)2 4598

4. Gráfico da Equação da recta ajustada

OBSERVAÇÃO2

2 ∑ Xi ; ∑ Yi ; ∑ Xi2 ; ∑ Yi2 ; ∑ Xi Yi ; ∑(Y ̅)2 ; ∑(Yi − Y


̂i − Y ̅)2 Ver tabela da página 8

7
REGRESSAO LINEAR SIMPLES

𝑿𝒊𝟐 𝒀𝒊𝟐 𝑌̂𝑖 (𝑌𝑖 − 𝑌̅)2 𝑌̂𝑖 − 𝑌̅ (𝑌̂𝑖 − 𝑌̅)


2
Obs. Y (Tempo) X (Duração) XY
1 56 1,80 3,24 3136 100,8 56,06634 361 -19 358
2 58 1,82 3,31 3364 105,56 56,31865 289 -19 349
3 62 1,90 3,61 3844 117,8 57,32791 169 -18 312
4 56 1,93 3,72 3136 108,08 57,70638 361 -17 299
5 57 1,98 3,92 3249 112,86 58,33717 324 -17 278
6 57 2,05 4,20 3249 116,85 59,22027 324 -16 249
7 60 2,13 4,54 3600 127,8 60,22952 225 -15 218
8 57 2,30 5,29 3249 131,1 62,37419 324 -13 159
9 61 2,37 5,62 3721 144,57 63,25729 196 -12 138
10 73 2,82 7,95 5329 205,86 68,93436 4 -6 37
11 76 3,13 9,80 5776 237,88 72,84524 1 -2 5
12 77 3,27 10,69 5929 251,79 74,61144 4 0 0
13 77 3,65 13,32 5929 281,05 79,40541 4 4 19
14 79 3,78 14,29 6241 298,62 81,04545 16 6 37
15 85 3,83 14,67 7225 325,55 81,67624 100 7 45
16 80 3,88 15,05 6400 310,4 82,30702 25 7 53
17 89 4,10 16,81 7921 364,9 85,08248 196 10 102
18 90 4,27 18,23 8100 384,3 87,22715 225 12 150
19 89 4,30 18,49 7921 382,7 87,60562 196 13 159
20 89 4,43 19,62 7921 394,27 89,24566 196 14 203
21 86 4,47 19,98 7396 384,42 89,75029 121 15 218
22 89 4,53 20,52 7921 403,17 90,50724 196 16 240
23 89 4,55 20,70 7921 404,95 90,75955 196 16 248
24 92 4,60 21,16 8464 423,2 91,39034 289 16 269
25 91 4,63 21,44 8281 421,33 91,76881 256 17 281
Total 1875 82,52 300,1894 145223 6539,81 4598 0 4426
Média 75 3,3008

8
REGRESSAO LINEAR SIMPLES

5. PELO SPSS
Leitura do resultado da saída de IBM SPSS Statistics 24. Ink

Coeficiente de
correlação linear

Coeficiente de
determinação

Parâmetros do modelo

 β̂1
 β̂2

9
REGRESSAO LINEAR SIMPLES

6. Interpretação dos resultados da regressão


 β̂1 = 33,36 : se a duração da erupção for zero (0) minutos espera-se que a próxima erupção aconteça
em 33,36 minutos;
 β̂2 = 12,62: cada minuto que for a durar implica em acréscimo de 12.62 minutos de tempo até a
próxima erupção;
 r = 0,98: a correlação entre a duração da erupção e tempo até a próxima erupção é muito forte
e positiva;
 r 2 = 0,96 : cerca de 96% do tempo até a proxima erupcao é explicado pela duração da erupcao
e 4% é explicado por outros factores. O modelo se ajusta bem aos dados.

7. Previsão

Com base no modelo ajustado, imaginemos que autoridades pretendem colocar os homens para
socorrer as vítimas. Quanto tempo os socorrista tem antes da outra erupção se a duração da última
erupção foi de:
a) 30 mins
b) 1h e 15min
c) 27 mins

Tempo (Y
̂i = 33,36 + 12,62Xi )
X (Duração)
a) 30,00 411,96
b) 75,00 979,86
c) 27,00 374,1

Teste de significância do coeficiente de correlação


Muitas vezes desejamos saber se um dado valor 𝑟, permite concluir, a um dado nível de
significância 𝛼, que realmente existe correlação linear entre as variáveis. Testamos, então, as
hipóteses
H0 : ρ = 0
H1 : ρ ≠ 0
Esse teste pode ser feito através da estatística

(n − 2)
3t
n−2 = r√
1 − r2

3
Neto, Pedro Luís da Costa (2002, p.184)
10
REGRESSAO LINEAR SIMPLES
Exemplo:
Verificar se podemos, ao nível de 1% de significância, concluir pela existência de correlação
positiva entre duração da erupção e tempo até a próxima erupção na população das erupções onde
esta amostra foi extraída.

Devemos testar
H0 : ρ = 0
H1 : ρ > 0
Seguindo todo roteiro4 de teste de hipótese, temos 𝑛 = 25 e 𝑟 = 0,98 conforme calculado
anteriormente. Segue que a estatística é

(n − 2) (25 − 2)
t n−2 = r√ 2
⇒ t 25−2 = 0.98√ ⇔ t 23 = 24,31
1−r 1 − 0,96

O valor crítico é
t 23:1% = 2.5 (ver tabela na página 2)
Concluímos que rejeitamos a hipótese H0 ficando com H1 ,ou seja, ao nível de 1% de significância,
podemos afirmar que há correlação linear positiva entre o duração e o tempo até a próxima
erupção.

Teste de significância dos parâmetros da recta de regressão


No problema de regressão são considerados os procedimentos de teste de hipótese descritos
anteriormente, as conclusões serão baseadas nos valores de β1 e β2.
 Para β2 as hipóteses de interesse são
H0 : β 2 = 0
H1 : β2 ≠ 0
Neste caso a rejeição da H0 significa as variáveis em estudo tem um relacionamento linear ao nível
de significância adoptado. Este teste é equivalente ao teste do coeficiente de correlação linear ρ.

4
Apresentamos de forma resumida este teste, fica para o leitor/estudante observar todos os procedimentos para teste
de hipótese descritos anteriormente.
11
REGRESSAO LINEAR SIMPLES
 Para β1 as hipóteses de interesse são
H0 : β1 = 0
H1 : β1 ≠ 0
Neste caso a rejeição da H0 significa eliminar a possibilidade da recta de regressão passar pela
origem. Podem também ser realizados outros testes unilaterais.
A estatística de teste é

β1 − β̂1
t=
S 2 ∑ Xi2
√ R
n ∙ Sxx

Onde: β̂1 − β1 33,36 − 0


(∑ Xi )2 (82,52)2 t= = = 18,548
 Sxx = ∑ Xi2 − = 300,1894 − = 7,49 ∙ 300,1894
𝑛 25 S 2 ∑ Xi2 √
27,81 √ R 25 ∙ 27,81
n ∙ Sxx
(∑ Yi )2 (1875)2
 Syy = ∑ Yi2 − = 145223 − =
𝑛 4
4598
𝑆𝑦𝑦 ∙(1−𝑟 2 ) 4598(1−0,96)
 SR2 = = = 7,49
𝑛−2 25−2

α
t 23:0.005 = 2.807 ( "por ser teste bilateral" ver tabela na página 2)
2
Concluímos que rejeitamos a hipótese H0 ficando com H1 ,ou seja, ao nível de 1% de significância,
podemos afirmar que há evidência estatisticamente significante que a recta de regressão não passa
pela origem.

Teste de significância Em SPSS

Para β1: sig = 0,000 < α = 0.001, deste Para β2 : sig = 0,000 < α = 0.001,
modo rejeitar a hipótese nula ao nível de deste modo rejeitar a hipótese nula ao
significância de 1%. Significa que há nível de significância de 1%. Significa
evidencias estatisticamente significantes que há evidencias estatisticamente
para afirmar que a recta de regressão não significantes para afirmar que há
passa pela origem. correlação linear, sendo positiva
conforme é β2 = 12,62.

12

Вам также может понравиться