Вы находитесь на странице: 1из 5

Anlisis de datos categricos

Prueba de Independencia: Tablas de contingencia


Al estudiar la diferencia entre los parmetros poblacionales a travs de la diferencia muestral de los estadsticos muestrales correspondientes, lo que hemos hecho es realizar un anlisis comparativo de dos variables: X: Observaciones provenientes de la primera poblacin, e Y: Observaciones provenientes de la segunda poblacin. Y al plantear la Hiptesis Nula de la igualdad de dichos parmetros, lo que hemos hecho es afirmar que dichos parmetros tienen el mismo comportamiento o que no existe suficiente evidencia para afirmar que difieren, versus la Hiptesis Alternativa que la niega. Queremos ahora generalizar este tipo de comparaciones para ms de dos poblaciones. Pero a diferencia de probar el mismo comportamiento entre dos poblaciones, trataremos de probar hiptesis de independencia en el comportamiento de las mismas, versus la hiptesis alternativa que afirma la dependencia entre el comportamiento de las poblaciones. Veamos el siguiente problema:

Ejemplo 1
La empresa Limpia Ya S.A. comercializa tres tipos de detergentes A, B y C. En un anlisis de segmentacin de mercado para los tres productos, el grupo de investigacin encargado ha planteado la duda de si las preferencias para los tres detergentes son diferentes entre los consumidores de los sectores Alto, Medio y Bajo. Si la preferencia de los detergentes fuera independiente del sector consumidor, se iniciara una nica campaa de publicidad para los tres productos; sin embargo, si la preferencia depende del sector de consumo, se ajustarn las promociones para tener en cuenta los distintos mercados de venta. De manera que las hiptesis a plantearse sern: H0: La preferencia de detergente es independiente del sector de consumo Ha: La preferencia de detergente no es independiente del sector de consumo Despus de identificar a la poblacin y sectores consumidores, se puede tomar una muestra y preguntar a cada elemento de la muestra sobre su preferencia entre los tres tipos de detergentes. El conjunto de datos definido como observaciones corresponder a un determinado detergente, consumido por un determinado sector. Esto nos lleva a conformar todas las posibles combinaciones o contingencias a las cuales llamaremos Tabla de Contingencias.

De manera que una prueba de independencia utiliza como formato de trabajo una tabla de contingencias. Por esta razn este tipo de prueba recibe el nombre de Pruebas de Tabla de Contingencias o prueba con tabla de contingencias. El formato de la tabla se muestra a continuacin: Detergente A O11 O21 O31 O1. Detergente B O12 O22 O32 O2. Detergente C O13 O23 O33 O3. Total O.1 O.2 O.3 N

Consumidor

Alto Medio Bajo Total

Supongamos que se tom una muestra de 120 consumidores. Despus de usar los tres tipos de detergentes, se les pide manifestar su preferencia. Los resultados de la muestra se presentan en la siguiente tabla: Producto Detergente B 12 16 12 40

Consumidor

Alto Medio Bajo Total

Detergente A 14 21 15 50

Detergente C 10 8 12 30

Total 36 45 39 n= 120

Anlisis de datos categricos


Si pudiramos obtener las frecuencias esperadas bajo la hiptesis de independencia entre la preferencia de los detergentes y el sector del consumidor, podramos usar la distribucin Chi Cuadrado para determinar si existe una diferencia significativa entre las frecuencias observadas y esperadas, como lo vimos en bondad de ajuste. Para encontrar las frecuencias esperadas haremos uso del siguiente razonamiento: Si es cierto que la preferencia de los detergentes y el consumo por sector son independientes entonces la proporcin de consumo por detergente debe se igual entre los tres sectores.

Por ello, bajo la hiptesis de independencia, esperaramos que el total de los consumidores por sector estuvieran afectados por esta proporcin. En otras palabras, la proporcin de consumo por detergente es 50/120, 40/120 y 30/120. Luego el nmero esperado de consumidores por sector ser 36(50/120), 45(40/120) y 39(30/120). Todo esto se muestra en la siguiente tabla:

Consumidor

Alto Medio Bajo Total

Detergente A 15 18.75 16.25 50

Producto Detergente B 12 15 13 40

Detergente C 9 11.25 9.75 30

Total 36 45 39 n= 120

En consecuencia, hemos usado la siguiente frmula

Lo que falta ahora es repetir lo que hicimos en Bondad de Ajuste por Chi Cuadrado. Es decir obtener la suma de los cuadrados de las diferencias entre las frecuencias observadas y esperadas, dividido por las frecuencias esperadas. Slo que en este caso, la suma es con doble sumatoria, como aqu se indica,

tal que

Donde k es el nmero de categoras (filas) y m es el nmero de contingencias (columnas) existentes en la muestra.

El siguiente cuadro nos muestra la suma de los cuadrados mencionados lneas arriba. Producto Detergente A Detergente B Detergente C Alto Medio Consumidor Bajo Total 0.067 0.270 0.096 50 0.000 0.067 0.077 40 0.111 0.939 0.519 30 Total 36 45 39 120

Luego

= 2.146.

Usando la tabla de Chi-Cuadrado encontramos el valor de

(4) = 9.4877

Puesto que

<

(4)

Entonces, podemos afirmar que existe evidencia para sospechar que la preferencia por los detergentes es independiente del sector al que pertenece el consumidor.

Anlisis de datos categricos


Ejemplo 2
El gerente de un centro comercial quera saber si hay diferencias en la proporcin de mujeres compradoras a diversas horas durante diversos das de la semana. Se seleccionaron muestras aleatorias de 300 clientes en el da, 300 en la noche y 400 compradores en los fines de semana; obtenindose los siguientes resultados: Da Hombres Mujeres 90 210 Noche 125 175 Fin de Semana 185 215

Con un nivel de significacin del 5%, hay una diferencia en la proporcin de clientes en los diversos das y horas de la semana? Solucin De acuerdo a los datos las hiptesis a plantearse son: H0: No hay diferencia de eleccin del momento de compra Ha: S hay diferencia de eleccin del momento de compra

Ejemplo 3
Una compaa deseaba saber si sus obreros, sus empleados de oficina, sus empleados de ventas y sus otros empleados, se diferenciaban en cuanto a su opinin acerca de continuar laborando en la compaa, luego de una obligada reduccin de sueldos y salarios. Se tom una muestra aleatoria de cada uno de los cuatro grupos (poblaciones) y a cada uno se les solicit que diera su opinin sobre si continuara en la compaa o no. Las respuestas que se obtuvieron se encuentran en la siguiente tabla. Empleados De Oficina Vendedores 45 70 30 30 75 100 Total Otros 60 15 75 243 132 375

Opinin Mayor que el promedio Menor que el promedio Total

Obreros 68 57 125

Debemos probar la Hiptesis: H0: La opinin de los trabajadores de la empresa es la misma en todos ellos. Ha: La opinin de los trabajadores de la empresa es diferente. EJERCICIOS ADICIONALES SOBRE PRUEBAS DE INDEPENDENCIA 1. Cien estudiantes seleccionados, al azar de cada una de tres universidades fueron cuestionados de si exista un programa de estudio adecuado en sus universidades y se obtuvieron los siguientes resultados: UNIV. 1 78 22 UNIV.2 85 15 UNIV. 3 69 31

SI NO

Pruebe con un nivel de significacin de 0.01 si son significativos las diferencias de opinin entre los estudiantes de cada universidad con respecto a sus programas de estudio.

2.

En una gran planta industrial, se pidi a una muestra de empleados que indicaran su preferencia por uno de los tres planes de pensiones o retiro. Los resultados aparecen en el cuadro.

Clase de trabajo Supervisor Oficinista Obrero Total

Plan de Retiro Plan A 10 19 81

Plan B 13 80 57

Plan C 29 19 22

Total

Existe alguna relacin entre el plan de pensin seleccionado y la clasificacin del trabajo de los empleados? (Use = 0.01) 3. Para conocer las opiniones del estudiantado, la planta docente y el personal administrativo acerca de las nuevas normas de estacionamiento en una universidad, se realiz una encuesta. De acuerdo con los resultados que aparecen en el cuadro, existe evidencia suficiente para considerar que las opiniones sobre las normas son independientes de las categoras de clasificacin de la poblacin universitaria? Estudiantes Opinin A favor En contra Total 252 139 391 Docentes 107 81 188 Personal Administrativo 43 40 83 Total 402 200 662

Вам также может понравиться