Вы находитесь на странице: 1из 19

1-1

PRUEBA DE INDEPENDENCIA DE VARIABLES


CHI CUADRADO

Docente: Mg.Julio Csar Aguilar Incio

PRUEBA DE HIPTESIS PARA LA INDEPENDECIA DE VARIABLES


CUALITATIVAS EN UNA TABLA DE CONTINGENCIA. DISTRIBUCIN
CHI CUADRADO
TABLAS DE CONTINGENCIA:
En los diferentes campos de la investigacin es muy frecuente encontrarse
con variables cualitativas nominales o ordinales: nivel de instruccin, sexo,
calificacin de un servicio, lugar de procedencia, categora laboral, etc. Las
tablas de contingencia resuelven el problema del estudio de la asociacin
existente entre dos variables de tipo cualitativo. O tambin si la proporcin
de casos para cada categora de una de las variables es independiente del
valor que toma la otra variable.
Desde el punto de vista inferencial, la hiptesis nula tratara la
independencia de estas variables.
(Hiptesis nula)
(Hiptesis alternativa)

H1:

H0:

las variables son independientes

las variables no son independientes.

Existen ocasiones en que el inters es determinar las diferencias en la frecuencia de sucesos, como por ejemplo: dada una
muestra de 140 estudiantes de distintas escuelas, la investigacin podra consistir en determinar si hay i no hay asociacin
entre la nota que el alumno obtuvo en estadstica (alta, media, baja) y la que este obtuvo en matemticas (alta, media,
baja). Lo que se busca es determinar si existe una asociacin (contingencia o correlacin) entre lso dos factores de inters.

Nota del
curso de
matemtica
s

Nota del curso de estadstica


Alta
(columna
1)

Media
(columna
2)

Baja
(columna 3)

Total

Alta
(Fila 1)

13

19

11

53

Media
(Fila 2)

18

12

38

Baja
(Fila 3)

30

20

59

40

61

39

140

TOTAL

El cruce entre filas(i) y columnas(j) de una tabla cruzada o de


doble entrada constituyen las celdas, las cuales contienen
informacin referente a las variables consideradas en la tabla y
se pueden constituir las frecuencias o porcentajes.
El razonamiento para constatar si existe o no asociacin entre
dos variables cualitativas se basa en calcular cuales serian los
valores de frecuencia esperados para cada una de las celdas en
el
caso
de
que
efectivamente
las
variables
fuesen
independientes, y compararlos con los valores realmente

El
contraste estadstico ms utilizado para evaluar si las
diferencias entre las frecuencias observadas y las esperadas
pueden atribuirse al azar, bajo al hiptesis de independencia, es
el denominado chi-cuadrado de Pearson () :

x j
2

ij

Eij
Eij

:representa el nmero de filas.

:representa el nmero de columnas.

i
J

:representa la posicin de la fila.


:representa la posicin de la columna.

Eij

:representa la frecuencia esperada para la celda situada en la fila i


columna j.

Oij

:representa la frecuencia efectivamente observada para esa celda.

TIL PARA LA CONCLUSIN


SI

el estadistico de prueba calculado de acuerdo a los


datos es mayor que el valor de la tabla:

Entonces rechazaremos la hiptesis nula y concluimos que ambas


variables son dependientes o estn relacionadas. De lo contrario,
ests serian independientes, es decir no estaran relacionadas.

EJEMPLO 1

Tabla n1: Distribucin de pacientes segn uso de vitaminas y


recuperacin de una enfermedad HOSPITAL HEYSEN
INCHAUSTEGUI CHICLAYO 2013

USO DE
VITAMINAS

RECUPERACIN DE ENFERMEDAD
SE
RECUPERA

NO SE
RECUPERA

TOTAL

SI

36

34

70

NO

24

30

TOTAL

60

40

100

SOLUCIN:
Primero: planteamos nuestras hiptesis de acuerdo al enunciado.
(Hiptesis nula)
son independientes.
(Hiptesis alternativa)
dependientes.

H0:

La recuperacin de una enfermedad

H1: La recuperacin de una enfermedad

Segundo: calculamos las frecuencias esperadas:

y el uso de vitaminas

y el uso de vitaminas son

EJEMPLO 1

Tabla n1: Distribucin de pacientes segn uso de vitaminas y


recuperacin de una enfermedad HOSPITAL HEYSEN
INCHAUSTEGUI CHICLAYO 2013

USO DE
VITAMINAS
SI
NO
TOTAL

RECUPERACIN DE ENFERMEDAD

SE
RECUPERA

NO SE
RECUPERA

TOTAL

O11=36
O21=24

O12=34

70

O22=6

30

60

40

100

De
acuerdo a la tabla n1, se calcula la probabilidad de que el paciente use
vitaminas se puede estimar en la muestra como 70/100.
Ahora se espera que de este 70% de la poblacin de pacientes que toma
vitaminas sean los que se recuperen de la enfermedad:
=(42 pacientes) o de forma directa = (42 pacientes)
Y el 70% de la poblacin de pacientes que no se recupera de la enfermedad
(40 pacientes) usar vitaminas.
=(28 pacientes) o de forma directa = (28 pacientes)

Se repite el mismo procedimiento para los que no usan


vitaminas. Por ultimo, completar la tabla:
USO DE
VITAMINAS
SI
NO

RECUPERACIN DE ENFERMEDAD
SE
RECUPERA

NO SE
RECUPERA

TOTAL

E11=42
E21=

E12=28

70

E22=

30

60

40

100

TOTAL

Tercero: Calculamos el estadstico de prueba, para lo cual


usaremos las frecuencias observadas (nuestro datos observados) y
las
esperadas
(la del
nueva
tabla).de prueba
Utilizando
frecuencias
la formula
del contraste
estadistico

x j
2

ij

Eij
Eij

x j
2

ij Eij
Eij

2
2
2
2

E
O

E
O

E
O

E
11
12
21
22
x 2 ( calculado ) 11
12
21
22

E11

E12

E21

E22

2
2
2
2

36

42
34

28
24

18
6

12
x 2 ( calculado )

42

28

18

12

7.143

Cuarto
: Observamos la cantidad de filas y columnas en nuestra tabla (2
filas y 2 columnas), luego buscamos en la tabla el valor rados de libertad
que se halla as:
(i-1)*(j-1), para este caso corresponde con:
(2-1)*(2-1)= 1 grado de libertad.
Para una significancia =0.05. Encontramos que esta es aproximadamente
3.84.
2
2
x
( calculado ) 7.143 x ( tabla ) 3.84
Quinto : Comparamos los valores de :

Por lo tanto rechazamos la hiptesis nula y concluimos que a un nivel de

PRUEBA CHI CUADRADOFRECUENCIAS


ESPERADAS IGUALES

( f0 fe )
x

fe

PRUEBA DE BONDAD DE AJUSTE DE


FRECUENCIAS ESPERADAS
EJEMPLO: Una empresa de
venta de vehculos desea
comprobar si no hay diferencia
significativa en la venta de
vehculos por sus vendedores,
se espera que las frecuencias
observadas (fo) fueran iguales.
Puede concluirse que existe
diferencia entre la las ventas
de vehculos de cada vendedor

VENDEDOR

Vehculos

13

33

14

36

17

TOTAL

120

Debido a que existen 120 datos, es de esperar que


20 queden en cada una de las 6 categoras
Vendedores

Vehculos
vendidos fo

Nmero vendido esperado


fe

13

20

33

20

14

20

20

36

20

17

20

120

120

TOTAL

PASO 1. Se establece Ho y
H1
Ho= Fo=fe
H1=Fo=fe

PASO 2. Se selecciona el
nivel de significancia 0.05,
que es la probabilidad de
rechazar una hiptesis
nula verdadera

PASO 3. Seleccin del estadstico de


(f f )
x prueba

El estadstico es chi cuadrado, con K-1 grados de libertad, donde:


K=es el numero de categoras
fo=es una frecuencia observada en una categora determinada
fe=es una frecuencia esperada en una categora determinada

PASO 4. Se formula la regla de


Grados de
decisin
libertad

rea de la cola derecha

gl

0.10

0.05

0.02

0.01

2,706

3,841

5,412

6,635

4,605

5,991

7,824

9,21

6,251

7,815

9,837

11,345

7,779

9,488

11,668

13,277

9,236

11,07

13,388

15,086

N= 6-1=5gdl
Se rechaza Ho si el
valor ji cuadrada que
se obtuvo de los
clculos es mayor que
11,070.

Vendedores

fo

fe

(fo-fe)

(fo-fe)2

(fo-fe)2/fe

13

20

-7

49

2,45

33

20

13

169

8,45

14

20

-6

36

1,8

20

-13

169

8,45

36

20

16

256

12,8

17

20

-3

0,45

TOTAL

120

120

688

34.5

PASO 5. DECIDIR.
Como el resultado calculado 34.5 es mayor que el de la tabla
11.070, rechazamos la hiptesis de que las frecuencias son
iguales, las ventas son diferentes.

PRUEBA DE BONDAD DE AJUSTE


FRECUENCIAS ESPERADAS DIFERENTES
Una empresa quiere comparar si el comportamiento de los
datos de ingresos a un hospital obtenidos a nivel local
difieren de los obtenidos a nivel nacional
ESTUDIO NACIONAL

ESTUDIO LOCAL

NMERO DE
VECES
ADMITIDAS

PORCENTAJ
E DEL TOTAL

NMERO
DE VECES
ADMITIDAS

NMERO DE
PERSONAS,
Fo

40

165

20

79

14

50

10

44

32

20

10

100

400

A simple vista, no
podemos comparar
entre porcentajes y
nmero de personas

NMERO DE
VECES
ADMITIDAS

NMERO DE
PERSONAS,
Fo

165

160

40

400

80

20

400

50

56

14

400

44

40

10

400

32

32

400

20

24

400

10

400

400

400

100

NMERO ESPERADO DE ADMISIONES, Fe


(1)
=
(2)
x
(3)

Deben ser iguales

PASO. 1.
Ho: No existe diferencia entre la situacin local y la situacin nacional
H1: Si existe diferencia entre las situaciones local y nacional

PASO 2. Se establece el nivel de significancia de


0.05%
PASO 3.El estadstico de prueba a utilizar es chi cuadrado
PASO 4. Se establece la regla de decisin
NMERO DE
VECES
ADMITIDAS

NMERO DE
PERSONAS,
Fo

Fe

fo-fe

(fo-fe)^2

(fo-fe)^2/fe

165

160

25

0,156

79

80

-1

0,013

50

56

-6

36

0,643

44

40

16

0,400

32

32

0,000

20

24

-4

16

0,667

10

0,500

400

400

Chi =68.96

Observando el valor de la tabla con 7-1 grados de libertad,


obtenemos un valor de 12,59. es decir, si el valor calculado de
chi-cuadrado es mayor al valor de la tabla, entonces
rechazamos Ho caso contrario aceptamos.
PASO 5. DECIDIR.
Como el valor calculado es 68,96 se encuentra en la regin de
Rechazo, es decir Rechazo Ho

FIN

FIN
FIN

cesarspeedy@hotmail.com

Вам также может понравиться