Вы находитесь на странице: 1из 31

Grado Ciencias Ambientales

Facultad de Ciencias
Departamento Matemáticas
Profesor: Santiago de la Fuente Fernández

CÓMIC APLICACIONES CHI-CUADRADO


TEST DE NORMALIDAD
TEST POISSON
Una empresa de imprimir, alimentada a mano, estaba sujeta a lo que parecía ser un número
irrazonable de obstrucciones causadas por interferencias de las hojas de papel a la prensa.
Se hizo una prueba para ver si diferentes operarios encontraban o no diferentes grados de
dificultad con la máquina. Cada operario alimentó la máquina introduciendo el mismo número
de hojas, contándose luego el número de atascos sufridos por cada uno, lo que dio lugar a la
siguiente tabla:

Operario A B C D Total
Obstrucciones 6 7 9 18 40

¿Existe o no diferencia entre los operarios a un nivel α = 0,05 ?. ¿Y aun nivel α = 0,025 ?.
Analizar los resultados.

2
El valor teórico viene dado por la expresión: χ 0,05 ; 3 = 7,815 χ 02,025 ; 3 = 9,348
En un hospital se ensayó la eficacia de cinco medicamentos en un grupo de pacientes, con el
objeto de determinar si al final del tratamiento un paciente determinado mejoraba o no.
Las observaciones que se encontraron están anotadas en la siguiente tabla:

Tratamientos A B C D E Total
Número de pacientes 51 54 48 49 48 250
Pacientes mejorados 12 8 10 15 5 50

¿Existe diferencia entre los medicamentos a un nivel de 0,05?.

51 250 54 250 48 250 49 250 48 250


= = = = =
a 50 b 50 c 50 d 50 e 50
50 .51 50 .54 50 . 48 50 . 49 50 . 48
a= = 10,2 b= = 10,8 b= = 9,6 b= = 9,8 e= = 9,6
250 250 250 250 250

El estadístico de contraste:
5
O i2 ⎛ 12 2 ⎞ ⎛ 82 ⎞ ⎛ 10 2 ⎞ ⎛ 15 2 ⎞ ⎛ 5 2 ⎞
2
χ 5 −1 =∑i =1
ei
−n=⎜ ⎟+⎜ ⎟+⎜
⎜ 10,2 ⎟ ⎜ 10,8 ⎟ ⎜ 9,6
⎝ ⎠ ⎝ ⎠ ⎝
⎟+⎜ ⎟+⎜
⎟ ⎜ 9,8 ⎟ ⎜ 9,6 ⎟
⎠ ⎝ ⎠ ⎝
⎟ − 50 = 56,03 − 50 = 6,03

2 2
Por tanto, como χ 4 = 6,03 < 9,488 = χ 0,05 ; 4 , aceptamos la hipótesis nula H o , es decir,
no existe diferencia entre los diferentes medicamentos, con un riesgo α = 0,05 , en la
mejora de los pacientes al finalizar el medicamento.
Las leyes de la herencia de Mendel predicen la aparición de tipos de guisantes con
ascendencia específica 9:3:3:1 para las clases lisa y amarilla, lisa y verde, arrugada y
amarilla, arrugada y verde. En cierto experimento se obtuvieron, respectivamente, 315,
108, 101 y 32.
A un nivel de 0,05, ¿coinciden los datos con la teoría?.

4
O i2 ⎛ 315 2 ⎞ ⎛ 108 2 ⎞ ⎛ 1012 ⎞ ⎛ 32 2 ⎞
χ 42 −1 = ∑
i =1
ei
−n=⎜

⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟ − 556 = 556,47 − 556 = 0,47

⎝ 312,75 ⎠ ⎝ 104,25 ⎠ ⎝ 104,25 ⎠ ⎝ 34,75 ⎠

2 2
Se acepta la hipótesis nula H o porque χ 3 = 0,47 < 7,815 = χ 0,05 ; 3 , el valor teórico es
menor que el valor esperado, afirmando que los datos observados coinciden con la teoría.
En un laboratorio se observó el número de partículas α que llegan a una determinada zona
procedentes de una sustancia radiactiva en un corto espacio de tiempo siempre igual,
anotándose los resultados en la siguiente tabla:

Número de partículas 0 1 2 3 4 5
Número de períodos de tiempo 120 200 140 20 10 2

Se pide:

a) Ajustar los datos a una distribución de Poisson.


b) Calcular la probabilidad con que llegan las partículas.
2
c) Verificar si el ajuste es correcto mediante una χ , con un nivel α = 0.05

∑x n i i
590 1,2 k − 1,2
λ = x = i =1 = ( )
= 1,2 . Por tanto, P x = k = .e k = 0, 1, L , 5
n 492 k!
5
O i2 ⎛ 120 2 ⎞ ⎛ 200 2 ⎞ ⎛ 140 2 ⎞ ⎛ 20 2 ⎞ ⎛ 12 2 ⎞
χ 32 = ∑
i =1
ei
−n = ⎜


⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟ − 492 = 32,31
148,2 ⎠ ⎝ 177,8 ⎠ ⎝ 106,7 ⎠ ⎝ 42,7 ⎠ ⎝ 15,8 ⎟⎠

(2 2
Como χ 3 = 32,31 > 7,815 = χ 0,05; 3 ) el valor observado es mayor que el valor teórico,
rechazamos la hipótesis nula. Es decir, la distribución de datos en estudio no se puede
ajustar a una distribución de Poisson a un nivel de confianza del 95%.
En una examen final de estadística, los estudiantes recibieron las siguientes calificaciones:

80 70 75 65 85 90 80 85 75
75 95 50 90 75 55 85 65 90
80 65 80 80 80 75 70 95 100
70 75 70 80 85 60 80

Verificar si las calificaciones obtenidas siguen una distribución normal, con una fiabilidad
del 95%.
Intervalos xi Oi x i . Oi x i2 . Oi
45 - 55 50 1 50 2500
55 - 65 60 2 120 7200
65 - 75 70 7 490 34300
75 - 85 80 13 1040 83200
85 - 95 90 8 720 64800
95 - 105 100 3 300 30000
6 6 6

∑i =1
Oi = 34

i =1
x i . Oi = 2720

i =1
x i2 . Oi = 222000

∑ x .O
i =1
i i
2720
μ = x = = = 80
n 34
6

∑ x .O 2
i i

− (80)2 =
2 i =1 222000
σ = − 6400 = 129,41 σ = 11,4
34 34

xi Oi pi ei = pi . n Oi2 Oi2 ei
Intervalos
45 - 55 50 1 0,0129 0,41 1 2,44
55 - 65 60 2 0,08 2,72 4 1,47
65 - 75 70 7 0,2366 8,04 49 6,09
75 - 85 80 13 0,34 11,56 169 14,62
85 - 95 90 8 0,2366 8,04 64 7,96
95 - 105 100 3 0,08 2,72 9 3,31
6

n = 34 ∑
i =1
Oi2
ei
= 35,87
Como ( χ62−3 )
= 1,87 < 7,815 = χ 02,05 ; 3 , el valor observado es menor que el valor teórico o
esperado, afirmamos que las calificaciones se distribuyen normalmente a un nivel de
confianza del 95%.
Tres métodos de empaquetado de tomates fueron probados durante un período de cuatro
meses; se hizo un recuento del número de kilos por 1000 que llegaron estropeados,
obteniéndose la tabla adjunta:

Meses A B C Total
1 6 10 10 26
2 8 12 12 32
3 8 8 14 30
4 9 14 16 39
Total 31 44 52 127
Se pide:

a) Observando simplemente los datos, ¿qué creeremos que se puede inferir sobre el
experimento?

b) Con un nivel de significación α = 0,05 , comprobar que los tres métodos son igualmente
buenos.
O x 2 . O y1 32 .31 O x 3 . O y1 30 .31
e 21 = = = 7,81 e31 = = = 7,32
n 127 n 127
O x 2 .O y 2 32 . 44 O x 3 .O y 2 30 . 44
e 22 = = = 11,09 e 32 = = = 10,39
n 127 n 127
O x 2 .O y 3 32 .52 O x 3 .O y3 30 . 52
e 23 = = = 13,10 e 33 = = = 12,28
n 127 n 127

39 .31 39 . 44 39 .52
e 41 = = 9,52 e 42 = = 13,51 e 43 = = 15,97
127 127 127

k m
(O ij − eij ) 2 k m O2
2
El estadístico de contraste: χ (
k −1). (m −1)
= ∑∑
i =1 j=1
e ij
= ∑∑e
i =1 j=1
ij
ij
−n

En nuestro caso, (k − 1). (m − 1) = (4 − 1). (3 − 1) = 6

4 3 O2
⎛ 6 2 ⎞ ⎛ 10 2 ⎞ ⎛ 10 2 ⎞ ⎛ 82 ⎞ ⎛ 12 2 ⎞ ⎛ 12 2 ⎞
χ 62 = ∑∑ ij

i =1 j = 1
eij
−n = ⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟+
⎜ 6,35 ⎟ ⎜ 9,01 ⎟ ⎜ 10,65 ⎟ ⎜ 7,81 ⎟ ⎜ 11,09 ⎟ ⎜ 13,10 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
⎛ 8 2 ⎞ ⎛ 8 2 ⎞ ⎛ 14 2 ⎞ ⎛ 9 2 ⎞ ⎛ 14 2 ⎞ ⎛ 16 2 ⎞
+⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟ − 127 = 1,24
⎜ 7,32 ⎟ ⎜ 10,39 ⎟ ⎜ 12,28 ⎟ ⎜ 9,52 ⎟ ⎜ 13,51 ⎟ ⎜ 15,97 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
La siguiente tabla muestra el resultado de un experimento para investigar el efecto de la
vacunación de animales de laboratorio contra una determinada enfermedad:

Enfermos Sufrieron la No sufrieron


Vacuna enfermedad la enfermedad
Vacunados 9 42
No Vacunados 18 28
Se pide:
a) ¿Afecta la vacuna a un nivel α = 0,05 ?
b) ¿Y a un nivel α = 0,01?
c) Responder al apartado (a) utilizando la corrección de Yates.
O x1 . O y1 51. 27 O x1 . O y 2 51. 70
e11 = = = 14,2 e12 = = = 36,8
n 97 n 97
O x 2 . O y1 46 . 27 O x 2 .O y 2 46. 70
e 21 = = = 12,8 e 22 = = = 33,2
n 97 n 97

2 2 O ij2 ⎛ 9 2 ⎞ ⎛ 42 2 ⎞ ⎛ 18 2 ⎞ ⎛ 28 2 ⎞
χ12 = ∑∑
i =1 j = 1
eij
−n = ⎜

⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟+⎜
⎟ ⎜
⎟ − 97 = 5,57

⎝ 14,2 ⎠ ⎝ 36,8 ⎠ ⎝ 12,8 ⎠ ⎝ 33,2 ⎠
Sobre una decisión de importancia nacional los votos de demócratas y republicanos
registraron los datos de la siguiente tabla:

A favor En contra Abstenciones


Demócratas 85 79 40
Republicanos 120 62 26
Se pide:
a) ¿Hay diferencia entre ambos partidos a un nivel α = 0,05 ?
b) ¿Y a un nivel α = 0,01?

O x1 . O y1 204 . 205 O x 2 . O y1 208. 205


e11 = = = 101,5 e 21 = = = 103,5
n 412 n 412
O x1 . O y 2 204 .141 O x 2 . O y 2 208.141
e12 = = = 69,82 e 22 = = = 71,2
n 412 n 412
O x1 . O y 3 204 . 66 O x 2 . O y 3 208. 66
e13 = = = 32,68 e 23 = = = 33,32
n 412 n 412
El estadístico de contraste:
2 3 O2
⎛ 852 ⎞ ⎛ 79 2 ⎞ ⎛ 40 2 ⎞ ⎛ 120 2 ⎞
2
χ2 = ∑∑
i =1 j=1
ij
e ij
−n = ⎜

⎝ 101,5
⎟+⎜
⎟ ⎜
⎠ ⎝ 69,82
⎟+⎜
⎟ ⎜
⎠ ⎝ 32,68
⎟+⎜
⎟ ⎜
⎠ ⎝ 103,5
⎟+


⎛ 62 2 ⎞ ⎛ 26 2 ⎞
+⎜ ⎟+⎜ ⎟ − 412 = 422,94 − 412 = 10,94
⎜ 71,2 ⎟ ⎜ 33,32 ⎟
⎝ ⎠ ⎝ ⎠
2
Se acepta la hipótesis nula H o cuando el estadístico de contraste χ
(k −1). (m −1) es menor o
2
igual que el estadístico teórico χ ( . Atendiendo a que:
α ; k −1). (m −1)
χ 22 = 10,94 > 5,991 = χ 02,05 ; 2 χ 22 = 10,94 > 9,210 = χ 02,01 ; 2

En ambos casos, con un riesgo de α = 0,05 y α = 0,01 , se rechaza la hipótesis nula,


concluyendo que existe diferencia entre los dos partidos cara a la votación.

⎡ n ⎤ ⎡ O2 O122
O132 ⎤ ⎡ n ⎤ ⎡ O2 O 222 O 223 ⎤
χ 22 = ⎢ ⎥ .⎢ 11 + + ⎥ + ⎢ ⎥ .⎢ 21 + + ⎥ − n=
⎢⎣ O x1⎥⎦ ⎢⎣ y1
O O y2 O y 3 ⎥⎦ ⎢⎣ O x 2 ⎥⎦ ⎢⎣ y1
O O y2 O y 3 ⎥⎦

⎡ 412 ⎤ ⎡ 85
2
79 2 40 2 ⎤ ⎡ 412 ⎤ ⎡ 120
2
62 2 26 2 ⎤
= ⎢ .⎢
⎣ 204 ⎥⎦ ⎣⎢ 205
+ + ⎥ + ⎢⎣ 208 ⎥⎦ . ⎢ 205 + 141 + 66 ⎥ − 412 =
141 66 ⎦⎥ ⎣⎢ ⎦⎥
= 209,53 + 213,43 − 412 = 10,96

χ 22 = 10,96 > 5,991 = χ 02,05 ; 2 χ 22 = 10,96 > 9,210 = χ 02,01 ; 2

En ambos casos, con un riesgo de α = 0,05 y α = 0,01 , se rechaza la hipótesis nula,


concluyendo que existe diferencia entre los dos partidos cara a la votación.
Un agricultor desea saber si existe diferencia entre diez abonos en el cultivo del plátano
en una determinada zona. Para ello abona seis matas con cada abono, observa el mismo
número de kilos y obtiene los siguientes resultados:

Abono x i x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
s i2 9 3 4 3 5 4 2 4 5 3
2
( s i ≡ varianza del abono x i ) ( n = 6)

¿Es cierto que hay diferencia entre los abonos a un nivel α = 0,01 ?. ¿Y a un nivel α = 0,05 ?

El estadístico de contraste: ( n i ≡ elementos muestra x i )


⎡ ⎤
( ) ∑ ∑ [ ( n − 1 ) . ( Ln s ) ]
k k
χ 2k −1 = ⎢ Ln s 2 . ( ni − 1 ) ⎥ − i
2
⎢ ⎥ i
⎣ i =1 ⎦ i =1
• Si todas las muestras tuvieran los mismos elementos, esto es, n1 = n 2 = L = n k , se
llega a una expresión más simplificada:
⎛ ⎞
∑( )
k
⎜ 2 ⎟
χ 2k −1 = ( n − 1 ) . ⎜ k . Ln s −
2
Ln s i ⎟
⎜ ⎟
⎝ i =1 ⎠

Se acepta la hipótesis nula H o , para un nivel de significación α , cuando se verifica

χ k2 −1 < χ α
2
; (k −1)
. En caso contrario se rechaza.

Abono x i x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
si2 9 3 4 3 5 4 2 4 5 3 42

Ln s i2 2,20 1,10 1,39 1,10 1,61 1,39 0,69 1,39 1,61 1,10 13,58

10

∑s 2
i
42
s 2 = i =1 = = 4,2
10 10
⎛ ⎞
∑( )
k
⎜ 2 ⎟
χ k −1 = ( n − 1 ) . ⎜ k . Ln s −
2 2
Ln s i ⎟ a χ 92 = ( 6 − 1 ) . ( 10 . Ln 4,2 − 13,58) = 3,85
⎜ ⎟
⎝ i =1 ⎠
El estadístico teórico o esperado: χ 02.05 ; 9 = 16,919 χ 02.01 ; 9 = 21,616

2
En ambos casos el estadístico observado χ 9 = 3,85 es menor que el estadístico teórico

χ 02.05 ; 9 = 16,919 (nivel 0,05) o χ 02.01 ; 9 = 21,616 (nivel 0,01), por lo que aceptamos la
hipótesis nula de que no hay diferencia entre los abonos (las varianzas son iguales).
Se está estudiando la distribución de los grupos sanguíneos O, A, B, AB en dos
comunidades. Los resultados obtenidos son:

O A B AB
Comunidad 1 121 120 79 33
Comunidad 2 118 95 121 30

a) ¿Se puede considerar que son homogéneas ambas comunidades?

b) Considerando ahora sólo los datos de la Comunidad 1, el modelo teórico asigna las
siguientes probabilidades a cada uno de los grupos:

O A B AB
(p + q + r = 1)
2
r p 2 + 2pr q 2 + 2qr 2pq

A partir de los datos de la muestra se han obtenido las siguientes estimaciones de los
parámetros: p̂ = 0, 2465 y q̂ = 0, 1732 . Obtener las frecuencias esperadas según el
modelo teórico y contrastar la hipótesis de que los datos se ajustan a él.

O A B AB

121 120 79 33 O x1 = 353


Comunidad 1
(117,67) (105,85) (98,47) (31,02)

118 95 121 30
Comunidad 2 (121,33) (109,15) (101,53) (31,98) O x 2 = 364

O y1 = 239 O y 2 = 215 O y 3 = 200 O y 4 = 63 717


O x1 . O y1 353 . 239 O x 2 . O y1 364 . 239
e11 = = = 117,67 e 21 = = = 121,33
n 717 n 717

O x1 . O y 2 353 . 215 Ox 2 . Oy2 364 . 215


e12 = = = 105,85 e 22 = = = 109,15
n 717 n 717

O x1 . O y 3 353 . 200 O x 2 . O y3 364 . 200


e13 = = = 98,47 e 23 = = = 101,53
n 717 n 717

O x1 . O y4 353 . 63 Ox 2 . Oy4 364 . 63


e14 = = = 31,02 e 24 = = = 31,98
n 717 n 717
b) Sea la hipótesis nula H o : El modelo genético es correcto

O A B AB
121 120 79 33
Comunidad 1 e 4 = n . ( 2pq )
e1 = n . r 2 2
e 2 = n . (p + 2pr ) 2
e 3 = n . (q + 2qr )

4
O i2
χ 42 − 2 −1 = χ12 = ∑ =
i 1
ei
− 353 = 353,43 − 353 = 0,43

Como χ12 = 0,43 < 3,841 = χ 02,05; 1 se acepta la hipótesis nula, concluyendo que
el modelo genético es correcto, a un nivel de significación de 0,05.
Se ha desarrollado un modelo teórico para las diferentes clases de una variedad de
moscas. El modelo dice que la mosca puede ser de tipo L con probabilidad p2, de tipo M con
probabilidad q2 y de tipo N con probabilidad 2pq.
Para confirmar el modelo experimentalmente se toma una muestra de 100 moscas,
obteniendo 10, 50 y 40, respectivamente.

a) Hallar la estimación de máxima verosimilitud de p con los datos obtenidos.

b) ¿Se ajustan los datos al modelo teórico, al nivel de significación 0,05 ?


3
O i2 ⎡10 2 ⎤ ⎡ 50 2 ⎤ ⎡ 40 2 ⎤
χ 2k − p −1 = χ 32−1−1 = χ12 = ∑
i =1
ei
−n = ⎢
⎢⎣ 9

⎥⎦
+ ⎢
⎢⎣ 49

⎥⎦
+ ⎢
⎢⎣ 42
⎥ − 100 = 0,227
⎥⎦

2
El estadístico teórico χ 0,05; 1 = 3,841

2 2
Como χ = 0,227 < 3,841 = χ 0,05; 1 se acepta la hipótesis nula Ho, y en consecuencia, se
1
acepta el modelo teórico, con una fiabilidad del 95%.

El número de defectos congénitos en una muestra de 100 individuos de una población


estableció la siguiente distribución:

Número de defectos 0 1 2 3 4 5
Frecuencia 84 9 3 2 1 1

¿Se ajustan los datos a una distribución de Poisson?.

Número de defectos 0 1 ≥2
Probabilidad 0,7408 0,2222 0,0368
3
O i2 ⎡ 84 2 ⎤ ⎡ 92 ⎤ ⎡ 72 ⎤
χ12 = ∑
i =1
ei
− n = ⎢
⎣⎢ 74, 08
⎥ + ⎢
⎦⎥ ⎢⎣ 22, 22
⎥ + ⎢
⎦⎥ ⎢⎣ 3, 68
⎥ − 100 = 12,21
⎦⎥

2 2
Siendo χ1 = 12,21 > 6,635 = χ 0,01; 1 se rechaza la hipótesis nula, concluyendo que
el número de defectos congénitos no sigue una distribución de Poisson, con un nivel de
confianza del 99%.

Con el objeto de controlar la producción de una máquina que produce laminas de madera se
inspeccionan 100 láminas al azar. Los resúmenes de los resultados muestrales son:
μˆ = x = 9,7 σˆ = 1,05 .
20 láminas con espesor inferior a 9 mm - 38 láminas con espesor entre 9 y 10 mm - 25
láminas con espesor entre 10 y 11 mm - 17 láminas con espesor superior a 11 mm -.
¿Se ajustan los datos a una distribución normal, con una confianza del 95%?.
2 2
Como χ1 = 5,06 > 3,841 = χ 0,05; 1 se rechaza la hipótesis nula y se concluye que el
espesor de las láminas de madera no se ajusta a una distribución normal, con un nivel de
significación de 0,05.
Se clasificaron 1000 individuos de una población según el sexo y según fueran normales o
daltónicos.

Masculino Femenino
Normal 442 514
Daltónicos 38 6

1 1 2
p p + pq
2 2
Según un modelo genético, las probabilidades son:
1 1 2
q q
2 2

donde q = 1 - p = proporción de genes defectuosos de la población.


A partir de la muestra se ha estimado que q̂ = 0,087 . ¿Concuerdan los datos con el
modelo?.

La tabla de frecuencias observadas y esperadas [ ei = n . pi ] será:


Hombre Normal Hombre Daltónico Mujer Normal Mujer Daltónica
442 38 514 6 1000
(456,5) (43,5) (496,2) (3,8) (1000)

Siendo χ 22 = 3,068 < 5,991 = χ 02,05; 2 se acepta la hipótesis nula Ho y se concluye


que se acepta el modelo genético, con un nivel de confianza del 95%.
Grado Ciencias Ambientales
Facultad de Ciencias
Departamento Matemáticas
Profesor: Santiago de la Fuente Fernández

Вам также может понравиться