You are on page 1of 27

V.

I NFERENCIA ESTADSTICA .

V.1. Concepto de inferencia estadstica.


Es el procedimiento por medio del cual se llega a conclusiones acerca de una poblacin con base en la informacin que se obtiene a partir de una muestra seleccionada de esa poblacin.

V.2. Estadstica paramtrica y no-paramtrica.


a) Estadstica paramtrica es la que requiere que los elementos que integran las muestras contengan parmetros medibles. La estadstica paramtrica clsica plantea tres tipos de problemas: 1. Estimacin puntual en la que pretendemos dar un valor al parmetro a estimar. 2. Estimacin por intervalos (buscamos un intervalo de confianza) 3. Contrastes de hiptesis donde buscamos contrastar informacin acerca del parmetro. b) La Estadstica no paramtrica es una rama de la Estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin normal o cuando el nivel de medida empleado no sea, como mnimo, de intervalo

V.3. Estadstica univariada y multivariada. Estimacin de parmetros por intervalos de confianza.


a) Concepto de Estadstica univariada Cuando el anlisis presenta caracterstica por caracterstica, aisladamente, estaremos en presencia de un anlisis estadstico univariado. Ejemplo, cuando decimos que una persona pesa 95 kg. independientemente de cualquier otra caracterstica estaremos en presencia de anlisis univariado. El anlisis univariado es el anlisis bsico. Los estadsticos bsicos que conocemos, como la media, la mediana, la moda, la varianza, los porcentajes, entre otros, miden una variable. Es decir, fueron hechos univariados. Este tipo de anlisis ha sido muy criticado ya que en la realidad se presentan interconectados. Por ejemplo existe una relacin entre el peso y la talla de las personas o entre el inters y el rendimiento escolar, etc. b) Concepto de Estadstica multivariada Este anlisis consiste en determinar las relaciones existentes entre dos o ms variables. En general se les clasifica en dos grandes grupos 1. Mtodos explicativos como la regresin lineal, anlisis discriminante, entre otros. 2. Mtodos descriptivos como anlisis de conglomerados, anlisis factorial, etc. Este tipo de anlisis ha avanzado mucho y hoy ocupa el corazn del anlisis estadstico avanzado. 1

c) Estimacin de parmetros por intervalos de confianza. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la poblacin. Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Sin embargo es ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano. Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al parmetro que se est estimando. Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro. Se indica por 1- y habitualmente se da en porcentaje (1-) %. Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el (1-) % de los intervalos as construidos contendra al verdadero valor del parmetro. Los factores que determinan el ancho del intervalo de confianza son: 1. El tamao de la muestra (n) 2. La varianza 3. El nivel deseado de confianza Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parmetros. Para las muestras, estas mismas medidas descriptivas se llaman estadsticas. Es costumbre simbolizar las estadsticas con letras romanas y los parmetros con letras griegas. Estadstica Media aritmtica Varianza Desvo estndar Coeficiente de correlacin S S R Parmetro 2

C.1. Intervalo de confianza para la media

Valor de Z Nivel de confianza

1.15 75%

1.28 80%

1.44 85%

1.65 90%

1.96 95%

2 95.5%

2.58 99%

Ejemplo 1. Supongamos que se estudia en nivel de glucosa en sangre en la poblacin cuyos valores aparecen en el recuadro (N=20). Seleccionamos de forma aleatoria 5 muestras tamao n=5 elaboramos, en cada caso, el intervalo de confianza para el nivel medio de glucemia (nivel de confianza el 95 %) Observemos los resultados.

108 112

118 120

121 136

125 115

118 129

117 110

109 113

127 125

123 124

133 117

120 Media
Muestra 1 123 125 118 125 113

Intervalo muestra 1 = 125.38 116.22

Muestra 2 124 110 115 133 112

Intervalo muestra 2 = 127.19 110.40

Muestra 3

125
Comando en Excel Promedio Var Desvest Intervalo. Confianza

113

117

123

124

Parmetro Media Varianza Desviacin estndar Intervalo de confianza 120.4 26.8 5.17687164 4.53764468 Max 124.937645 Min 115.862355

Muestra 4

133
Comando en Excel Promedio Var Desvest Intervalo. Confianza

110

136

125

110

Parmetro Media Varianza Desviacin estndar Intervalo de confianza 122.8 152.7 12.3571841 12.1098179 Max 134.909818 Min 110.690182

Ejemplo 2. Para una muestra de 81 habitantes de cierta poblacin se obtuvo una estatura media de 167 cm. Por estudios anteriores se sabe que la desviacin tpica de la altura de la poblacin es de 8 cm. Construye un intervalo de confianza para la estatura media de la poblacin al 95%

La media de la estatura de la poblacin est entre 168.74 y 165.26 cm

Ejemplo 3. Para conocer el peso promedio de un grupo de personas se tomo una muestra de 38 personas. La media muestral result ser de 74,3 kg. Construya un intervalo de confianza del 98% para la media de la poblacin, si la desviacin estndar es 14 kg. El valor de tablas que encierra el 98% de la distribucin Z es 2,33

V.4. Tamao de muestra para estimar medias


Un problema tpico es determinar el tamao muestral mnimo para que el intervalo de confianza para la proporcin con un nivel de confianza dado tenga un error (amplitud) menor o igual a una cantidad conocida para encontrar el tamao de la muestra

Donde: E.- es el error admisible Z.- es el valor normal estndar correspondiente al nivel de confianza deseado s.- Es la desviacin estndar de la muestra Valor de Z Nivel de confianza 1.15 75% 1.28 80% 1.44 85% 1.65 90% 1.96 95% 2 95.5% 2.58 99%

Un estudiante de Administracin desea determinar la cantidad media que ganan al mes lo miembros de los consejos ciudadanos de las grandes ciudades. El error a calcular la media debe ser inferior a $100, con un nivel de confianza del 95%. El estudiante encontr un informe del departamento de trabajo en el que la desviacin estndar es de $1000 Cul es el tamao de la muestra que se requiere? n= ? E= $100 Z= Confianza 95% = 1.96 s = Desviacin estndar = $1000

Un grupo consumidor desea estimar la media del cargo de electricidad por familia en Julio con un error de $5 usando un nivel de confianza de 99%. La desviacin estndar es estimada de estudios similares la cual es de $20. Qu tan grande debe ser la muestra?

V.5. Concepto de hiptesis estadstica.


Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera. Esto por su puesto sera imprctico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hiptesis. La evidencia de la muestra que es un constante con la hiptesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hiptesis conduce a su aceptacin. Definicin de prueba de hiptesis estadstica es que cuantifica el proceso de toma de decisiones. Por cada tipo de prueba de hiptesis se puede calcular una prueba estadstica apropiada. Esta prueba estadstica mide el acercamiento del valor de la muestra (como un promedio) a la hiptesis nula. La prueba estadstica, sigue una distribucin estadstica bien conocida (normal, etc.) o se puede desarrollar una distribucin para la prueba estadstica particular. La distribucin apropiada de la prueba estadstica se divide en dos regiones: una regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el proceso funciona correctamente. Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis nula no se puede rechazar). A hora bien el valor crtico depende del tamao de la regin de rechazo.

IDENTIFICACIN Hiptesis nula H0 La que contrastamos Los datos pueden refutarla No debera ser rechazada sin una buena razn H0: p =, ,
Ejemplo 1.-

DE HIPTESIS

Hiptesis alternativa H1 Niega H0 (y creemos que es mejor) Los datos pueden mostrar evidencia a favor No debera ser aceptada sin una gran evidencia a favor H1: p , <, >

Problema La osteoporosis est relacionada con el sexo? Solucin: Traducir a lenguaje estadstico p=50% Establecer su opuesto: p 50%

Seleccionar la hiptesis nula: H0= p=50%

Ejemplo 2.Problema El colesterol medio para la dieta mediterrnea es de 6mmol/l? Solucin: Traducir a lenguaje estadstico =6 Establecer su opuesto: 6

Seleccionar la hiptesis nula: H0= =6

V.6. Tipos de error.


Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I. Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error de tipo II. En ambos casos se ha producido un juicio errneo. Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los errores de decisin, y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo. En la prctica un tipo de error puede ser ms grave que el otro, y debe alcanzarse un compromiso que disminuya el error ms grave, la nica forma de disminuir ambos a la vez es aumentar el tamao de la muestra, que no siempre es posible.

Hiptesis Decisin Aceptar H0

H0 verdadera

H0 falsa Decisin incorrecta Error tipo II Probabilidad

Decisin correcta

Rechazar H0

Decisin incorrecta Error de tipo I Probabilidad

Decisin correcta

Riesgos al tomar decisiones Ejemplo 1: se juzga a un individuo por la presunta comisin de un delito. H0: Hiptesis nula: Es inocente Todos son inocentes hasta que se demuestre lo contrario. Rechazarla por error tiene graves consecuencias

H1: Hiptesis alternativa: Es culpable No debera ser aceptada sin una gran evidencia a favor Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

Realidad Inocente Inocente Veredicto Culpable Ok Error Muy grave Culpable Error Menos grave Ok

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados. H0: Hiptesis nula: No especulativa El nuevo tratamiento no tiene efecto Rechazarla por error tiene graves consecuencias

H1: Hiptesis alternativa: Especulativa El nuevo tratamiento es til. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

Realidad H0 Cierta Acepto H0 Correcto El tratamiento no tiene efecto y as se decide Error de tipo I El tratamiento no tiene efecto pero se decide que si Probabilidad H0 Falsa Error de tipo II El tratamiento si tiene efecto pero no lo percibimos Probabilidad Correcto El tratamiento tiene efecto y el experimento lo confirma

Rechazo H0

NIVEL DE SIGNIFICANCIA Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por , se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra eleccin. En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros valores. Si, por ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla de decisin entonces hay unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hiptesis tiene una probabilidad del 5% de ser falsa.

V.7. Metodologa.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Expresar la hiptesis nula Expresar la hiptesis alternativa Especificar el nivel de significancia Determinar el tamao de la muestra Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Determinar la prueba estadstica. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. Determinar la decisin estadstica. Expresar la decisin estadstica en trminos del problema.

10

V.8. Algunas pruebas de hiptesis. a) Para una media poblacional.


Mientras el tamao de muestra (n) sea mayor que 30, se estima la desviacin estndar poblacional () por medio de la desviacin estndar muestral (s) y se usa los valores de Z

Valor de Z Nivel de confianza

1.15 75%

1.28 80%

1.44 85%

1.65 90%

1.96 95%

2 95.5%

2.58 99%

so = media poblacional

= Desviacin estndar

n= tamao de la muestra

Ejemplo 1. La duracin promedio de las llantas producidas por una fbrica de llantas, segn experiencias registradas es de 46.050 Km. Se desea probar si el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duracin promedio de 45.050 Km. con una desviacin estndar de 3.070 Km, usando un 95% de confianza. Ho= n= 60 = 46.050 = 1-= 0.95= 1.96 s= 3.070 H1= 46.050

Si z es mayor a 1.96 o menor a -1,96 se rechaza H0 Por lo tanto si z= a -2.52 se rechaza H0. Por consiguiente, con una confiabilidad del 95 por ciento se acepta que la duracin promedio de las llantas ha cambiado.

11

Ejemplo 2. Ciertos investigadores pretenden saber si es posible concluir que la media del IMC para la poblacin de la que se extrajo la muestra n es 35 Individuo 1 2 3 4 5 6 7 Media Varianza Desviacin IMC 23 25 21 37 39 21 23 30.5 113.192308 10.6391874 8 9 10 11 12 13 14 24 32 57 23 26 31 45

1. Expresar la hiptesis nula H0: = 35 2. Expresar la hiptesis alternativa H1: 35 3. Especificar el nivel de significancia = 0.05 4. Determinar el tamao de la muestra n=14 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Dado que la muestra es menor de 30 se usan los valores de t en lugar de z Grados de libertad (gl)= n-1 por lo tanto 14-1=13 Dado que se tiene una prueba bilateral se pone /2= 0.5/2= 0.025. Estos valores aparecen en la tabla de t (ane o). Buscaremos el valor que se encuentre entre gl=13 y t= 1- = 10.025 = 0.975 . Lo que corresponde a 2.1604 y -2.1604 6. Determinar la prueba estadstica.

12

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada. A partir de los datos de la muestra se calcula una media igual a 30.5 y una desviacin estndar de 10.6392. Al sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. -1.58 cae en la regin de no rechazo 9. Determinar la decisin estadstica. No se rechaza H0 ya que -1.58 cae en la regin de no rechazo 10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos se puede decir que la media de la poblacin de la cual se extrajo la muestra puede ser 35.

13

Ejemplo 3. Los siguientes datos son la circunferencia craneal (CC)(en centmetros) de 15 nios recin nacidos
Individuo 1 2 3 4 5 Media CC 33.38 34.34 33.46 32.15 33.95 33.798 6 7 8 9 10 11 Varianza 34.13 33.99 33.85 34.45 34.1 34.23 0.39727429 12 13 14 15 34.19 33.97 32.73 34.05

Desviacin

0.63029698

1. Expresar la hiptesis nula H0: = 34.5 2. Expresar la hiptesis alternativa H1: 34.5 3. Especificar el nivel de significancia = 0.05 4. Determinar el tamao de la muestra n=15 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Dado que la muestra es menor de 30 se usan los valores de t en lugar de z Grados de libertad (gl)= n-1 por lo tanto 15-1=14 Dado que se tiene una prueba bilateral se pone /2= 0.5/2= 0.025. Estos valores aparecen en la tabla de t (ane o). Buscaremos el valor que se encuentre entre gl=14 y t= 1- = 10.025 = 0.975. Lo que corresponde a 2.1448 y -2.1448 6. Determinar la prueba estadstica. 7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada. A partir de los datos de la muestra se calcula una media igual a 30.5 y una desviacin estndar de 10.6392. Al sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. -4.31 cae en la regin de rechazo 9. Determinar la decisin estadstica. Se rechaza H0 ya que -4.31 cae en la regin de rechazo 10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos se puede decir que la media de la poblacin de la cual se extrajo la muestra no puede ser 34.5. 14

Ejemplo 4. Ciertos investigadores condujeron un estudio para examinar los datos correspondientes a la farmacocintica de la gentamicina en tres poblaciones mayores de 18 aos: pacientes con leucemia aguda, pacientes con otros padecimientos malignos no leucmicos y pacientes sin enfermedad maligna oculta. Entre las estadsticas reportadas por los investigadores estaba el valor 59.1 como media inicial calculada, con una desviacin estndar de 25.6 para una muestra de 211 pacientes. Se pretende saber si es posible concluir que la media para la poblacin de individuos que presenta el mismo cuadro patolgico es menor que 60. Sea =0.10 1. Expresar la hiptesis nula H0: < 60 2. Expresar la hiptesis alternativa H1: > 60 3. Especificar el nivel de significancia = 0.10 4. Determinar el tamao de la muestra n=211 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Dado que la muestra es mayor de 30 se usan los valores de z. Lo que corresponde a 1.65 y -1.65 6. Determinar la prueba estadstica. 7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada. A partir de los datos de la muestra se calcula una media igual a 59.1 y una desviacin estndar de 25.6. Al sustituir estos datos en la ecuacin se obtiene

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. -0.510 cae en la regin de no rechazo 9. Determinar la decisin estadstica. No se rechaza H0 ya que -0.510 no cae en la regin de rechazo 10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos se puede decir que la media de la poblacin de la cual se extrajo la muestra puede ser menor de 60.

15

ANTES DE CONTINUAR.
Se podrn encontrar pruebas de 1 o 2 colas.
Sabremos que es de 1 cola cuando la hiptesis alterna (H1) establece una direccin, como; H1: El ingreso medio de las mujeres es mayor que el de los hombres. H1: m > h H1: EL ingreso medio de las mujeres ( m) es menor al ingreso medio de los hombres ( h) H1: m < h

Si H1 tiene el signo (menor que) <, la prueba de significancia es de cola izquierda. Si H1 tiene el signo (mayor que) >, la prueba de significancia es de cola derecha. Una prueba es de 2 colas cuando no se establece una direccin especifica de la hiptesis alterna (H1) como; H1: El ingreso medio de las mujeres no es igual al ingreso medio de los hombres H0: m h

H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres H0: m = h

Si H1 es planteada de manera que incluya ambos extremos de la distribucin muestral, la prueba de significancia es de dos colas. Nivel de confianza Valor de Z (Bilateral) 75% 1.15 80% 1.28 85% 1.44 90% 1.65 95% 1.96 95.5% 2 99% 2.58

Nivel de confianza Valor de Z (Unilateral)

90% 1.28

95% 1.645

99% 2.33

99.5% 2.58

Cuando usemos valores menores a n=30


confianza ser el de t y no el de z.

o no conozcamos las varianzas de la poblacin el valor de

El valor de t se calcula Grados de libertad (gl) = n-1 y confianza = 1-

16

b) Para la diferencia de dos medias poblacionales.


La prueba de hiptesis que involucra la diferencia entre las medias de dos poblaciones que se utiliza con ms frecuencia para determinar si es razonable o no concluir que las dos son distintas entre s, se usa la siguiente formula.

Ejemplo 1. Un equipo de investigadores desea saber si los datos que han recolectado proporcionan la evidencia suficiente para indicar una diferencia entre las concentraciones medias de acido rico en el suero de individuos normales e individuos con sndrome de Down. Los datos en la lecturas de acido rico en el suero de 12 individuos con sndrome de Down y 15 individuos sanos. Las medias son = 4.5 mg/100ml y = 3.4 mg/ml. Con varianza igual a 1 para la poblacin con sndrome de Down y de 1.5 para la poblacin sana. 1. Expresar la hiptesis nula H0: 1 - 2 = 0 2. Expresar la hiptesis alternativa H1: 1 - 2 0 3. Especificar el nivel de significancia = 0.05 4. Determinar el tamao de la muestra n1=12 n2= 15 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Lo que corresponde a 1.96 (Bilateral) 6. Determinar la prueba estadstica. 7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. 2.57 cae en la regin de rechazo 9. Determinar la decisin estadstica. Se rechaza H0 ya que 2.57 cae en la regin de rechazo al ser mayor que 1.96 10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos hay indicios de que las medias de las poblaciones son diferentes.

17

Ejemplo 2. Un estudio tiene como objetivo examinar las caractersticas de destruccin pulmonar en personas que fuman cigarros antes de desarrollar un marcado enfisema pulmonar. En la tabla se muestran las calificaciones producidas, para nueve personas que no fuman y 16 fumadores. Se pretende saber si es posible concluir, con base en los datos, que las personas que s fuman, en general, tienen los pulmones ms daados que las persona no fumadoras, como lo indican las mediciones.

No fumadores 18.1 6 10.8 11 7.7 17.9 8.5 13 18.9 16.6 13.9 11.3 26.5 17.4 15.3 15.8 12.3 18.6 Fumadores 12 24.1 16.5 21.8 16.3 23.4 18.8

Varianza Media No fumadores Fumadores 1. Expresar la hiptesis nula H0: 1 = 2 2. Expresar la hiptesis alternativa H1: 1 2
12.4333333 17.5375 23.515 20.0278333

3. Especificar el nivel de significancia = 0.05 4. Determinar el tamao de la muestra n1=9 n2= 16 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Cuando son dos poblaciones se usa n1+n2 -2 = grados de libertad y /2=precisin=2.0687 (bilateral) 6. Determinar la prueba estadstica. t

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. 2.602 cae en la regin de rechazo 9. Determinar la decisin estadstica. Se rechaza H0 ya que 2.602 cae en la regin de rechazo al ser mayor que 2.0687 10. Expresar la decisin estadstica en trminos del problema. Con base en estos datos se puede concluir que las dos medias son diferentes, es decir, se concluye que, las personas que si fuman tienen los pulmones ms daados que las que no lo hacen.

18

Ejemplo 3. Un artculo publicado en una revista describe el desarrollo de una herramienta para medir las barreras para promover la salud entre personas discapacitadas. Los autores afirman que los problemas de barreras sobresalen especialmente de personas discapacitadas que las experimentan en situaciones como: empleo, transporte, educacin entre otros. Para medir esto, los investigadores desarrollaron la escala de barreras en las actividades de promocin de la salud en personas discapacitadas. Se obtuvieron los siguientes resultados al aplicar la escala a una muestra de 132 discapacitados (D) y a 137 personas no discapacitadas (ND) Muestra D ND Calificacin media 31.83 25.07 Desviacin estndar 7.93 4.80

1. Expresar la hiptesis nula H0: 1 - 2 0 2. Expresar la hiptesis alternativa H1: 1 - 2 > 0 3. Especificar el nivel de significancia = 0.01 4. Determinar el tamao de la muestra n1=132 n2= 137 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Sea = 0.01 El valor de z ser 2.33 (Unilateral)

6. Determinar la prueba estadstica.

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. 8.42 cae en la regin de rechazo 9. Determinar la decisin estadstica. Se rechaza H0 ya que 8.42 cae en la regin de rechazo al ser mayor que 2.58. 10. Expresar la decisin estadstica en trminos del problema. Estos datos indican que en promedio las personas con discapacidad califican ms alto en la escala de barreras que las personas sin discapacidad.

19

Para una proporcin poblacional.


El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin con datos cualitativos.

q= 1 p P0= proporcin de xitos de la hiptesis nula. n= tamao de la muestra x= numero de xitos en la muestra

Ejemplo 1. En una investigacin de consumidores de drogas intravenosas en una ciudad grande, se encontraron a 18 de 423 individuos con VIH positivo. Se pretende saber si es posible concluir que al menos de 5% de los consumidores de drogas intravenosas en la poblacin muestreada tienen VIH positivo. Utilizando 95% de confianza. (Uni) H0: p 0.05 H1: p < 0.05

q= 1 p = 1- 0.05 = 0.95

No se rechaza H0 porque -0.70 Mayor que -1.645 Se concluye que la proporcin de la poblacin que tiene VIH positivo posiblemente sea 0.05 o ms. Ejemplo 2. En un artculo publicado se describen los resultados de una encuesta de salud aplicada a 119 convictos varones de 50 aos de edad y mayores residentes de las instalaciones de un centro de readaptacin social del estado. Se encontr que 21.6% de los encuestados dijeron tener antecedentes de enfermedades venreas. Con base en estos hallazgos Es posible concluir que en la poblacin muestreada ms de 15% tiene antecedentes de enfermedades venreas? Sea = 0.05 H0: p 0.15 H1: p 0.15

q= 1 p = 1- 0.15 = 0.85

No se rechaza H0 porque -0.88 es mayor que -1.96 Se concluye que en la poblacin la proporcin de personas posiblemente sea 0.15 o ms tiene antecedentes venreas.

20

Ejemplo 3. Se encontr que el 66% de los nios en una muestra de 670 completaron toda serie de vacunas contra la hepatitis B Es posible concluir que, con base en estos datos, en la poblacin muestreada, ms de 60% tienen la serie completa de vacunas contra la hepatitis B? Sea = 0.05 (Uni) H0: p > 0.60 H1: p < 0.60

q= 1 p = 1- 0.66 = 0.34

Se rechaza H0 porque 3.06 es mayor que 1.645 Se concluye que la poblacin de nios de donde fue tomada la muestra menos del 60% tiene la serie completa de vacunas contra la Hepatitis B.

21

c) Para la diferencia de dos proporciones poblacionales.

Ejemplo 1. En un estudio de cuidados nutricionales en asilos para ancianos se encontraron que entre 55 pacientes con hipertensin, 24 tenan una dieta con restriccin de sodio. De 149 pacientes sin hipertensin, 36 tenan una dieta sin sodio. Es posible concluir que, en las poblaciones muestreadas, la proporcin de pacientes con dieta restringida en sodio es mayor entre pacientes con hipertensin que entre pacientes sin hipertensin? Sea = 0.05. El valor crtico de z es 1.645. (Prueba Unilateral) Se supone que los pacientes estudiados forman una muestral aleatoria independientemente extrada de poblaciones con y sin hipertensin. (Uni) H1: pH > p

H0: pH p

pH es la proporcin de la poblacin de pacientes hipertensos con dietas bajas en sal y p es la proporcin de la poblacin de pacientes sin hipertensin con dietas bajas en sal.

Se rechaza H0 porque 2.7 > 1.645 La proporcin de pacientes con dieta restringida en sodio es mayor entre los pacientes hipertensos que entre los pacientes sin hipertensin.

22

Ejemplo 2. La mayora de las personas que dejan de fumar, se quejan de que al hacerlo suben de peso, se diseo una nueva tcnica para prevenir que la gente suba de peso, la cual compararon contra otras dos condiciones que incluan una condicin control de tratamiento estndar ideada para representar la atencin estndar del sobrepeso inducido por dejar de fumar. Una de las hiptesis de los investigadores era que las tasas de abstinencia de tabaco seran mayores con la nueva tcnica que las registradas en las otras dos condiciones. De 53 individuos asignados a la nueva condicin, 11 dejaron de fumar al final de 52 semanas. 19 de los 54 asignados a la condicin de control se abstuvieron hasta el final del mismo periodo. ofrecen estos datos suficiente evidencia para apoyar, con un nivel de significancia de 0.05, la hiptesis de los investigadores? El valor crtico de z es 1.645. (Prueba Unilateral)

H0: p1 > p2 las tasas de abstinencia de tabaco seran mayores con la nueva tcnica que las registradas en las otras dos condiciones H1: p1 > p2 p1 es la proporcin de la poblacin de pacientes asignados a la nueva condicin y p2 es la proporcin de la poblacin de pacientes control.

Se acepta H0 dado que -1.666 es menor que 1.645 Los datos presentados presentan suficiente evidencia para apoyar a los investigadores. Ejemplo 3. Ciertas investigaciones sugieren que entre pacientes con depresin unipolar primaria se registra una tasa alta de alcoholismo. Una investigacin realizada profundiza en esta posible relacin. Entre 210 familias de mujeres con depresin unipolar primaria grave, los investigadores encontraron que el alcoholismo estaba presente en 89. Entre 299 familias catalogadas como familias de control en la investigacin, el alcoholismo estuvo presente en 94. Ofrecen estos datos suficiente evidencia para concluir que el alcoholismo es ms probable de encontrar en familias con integrantes que tienen depresin unipolar? Sea = 0.05. (Uni)

No se rechaza H0 porque 2.65 es mayor (>) a 1.645

23

d) Para poblaciones pareadas.


En el anlisis referente a la diferencia entre las medias de dos poblaciones, se supone que las muestras son independientes. Un mtodo que se utiliza con frecuencia para averiguar la eficacia de un tratamiento o procedimiento experimental es aquel que hace uso de observaciones relacionadas que resultan de muestras no independientes. Una prueba de hiptesis que se basa en este tipo de datos se conoce como prueba de comparaciones por parejas o de poblaciones pareadas. Con frecuencia sucede que las diferencias reales no existen entre dos poblaciones con respecto al a variable de inters, pero la presencia de fuentes extraas de variacin pueden causar rechazo de la hiptesis nula. Por ejemplo, supongamos que se pretende comparar dos protectores solares para la piel. . Existen al menos dos maneras de llevar a cabo el experimento. Un mtodo sera seleccionar una muestra aleatoria simple e independiente que recibiera el protector solar A y una segunda que muestra aleatoria simple e independiente que recibiera el protector solar B. Se pide a todos los individuos que salgan a broncearse a la luz del sol durante un tiempo especfico, y despus se mide el dao causado por el sol. Suponga que se aplica este mtodo, pero inadvertidamente la mayora de los individuos que recibieron el protector solar A tienen piel oscura y por naturaleza son menos sensibles a los rayos solares. Digamos que al terminar el experimento, se encuentra que los individuos que recibieron el protector solar A tienen menos dao provocado por la luz del sol. So sera posible saber si tuvieron menos dao porque el protector solar A fue ms eficaz que el protector solar B o porque la naturaleza de su piel oscura es menos sensible al sol. Una mejor manera de disear el experimento sera seleccionar slo una muestra aleatoria simple de individuos y que cada uno de ellos se les aplicaran ambos protectores solares. Por ejemplo, se asignaran aleatoriamente los protectores solares al lado derecho o izquierdo de la espalda de cada individuo de manera que recibieran ambos productos. Despus de un tiempo especifico se exposicin se mediran los daos provocados por la luz del sol, en cada mitad de la espalda. Si la mitad de la espalda que recibi protector solar A tiende estar menos daado, puede atribuirse con ms confianza el resultado al protector solar, porque en cada caso ambos protectores fueron aplicados en una misma piel. El objetivo en pruebas de comparacin por parejas es eliminar un mximo nmero de fuentes de variacin extraa haciendo parejas similares con respecto a tantas variables como sea posible.

d= diferencia de media muestral = diferencia de la media muestral propuesta

24

Ejemplo 1. Nancy Stearns condujo un estudio para determinar la prdida de peso, la composicin corporal, la distribucin de grasa corporal, la tasa metablica en reposo en individuos obesos antes y despus de 12 semanas de tratamiento con dieta muy baja en caloras, y comparar la hidrodensitometria con el anlisis de impedancia bioelctrica. Los 17 individuos (nueve mujeres y ocho hombres) que participaron en el estudio eran pacientes externos de un programa de tratamiento con base hospitalaria para la obesidad. Los pesos de las mujeres antes y despus del tratamiento se muestra en la tabla. se pretende saber si estos datos ofrecen suficiente evidencia que permita concluir q el tratamiento es eficaz para reducir el pero en mujeres obesas. Pesos (Kg.) de mujeres obesas antes (A) y despus (D) del tratamiento de 12 semanas 117.3 111.4 98.6 104.3 105.4 100.4 81.7 89.5 83.3 85.9 75.8 82.9 82.3 77.7 62.7 69.0

A D

78.2 63.9

1. Expresar la hiptesis nula H0: d 0 (A D) H0: d 0

3. Especificar el nivel de significancia = 0.05 4. Determinar el tamao de la muestra n1=9

2. Expresar la hiptesis alternativa H1: d < 0 (A D) H1: d < 0 5. Establecer los valores crticos que establecen las regiones de rechazo de las de no rechazo. Sea = 0.05. El valor crtico de t es -1.8595 (uni) -1.8595 6. Determinar la prueba estadstica

7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica apropiada.Lo primero es obtener las diferencias entre los pesos antes y despus. Las diferencias se pueden obtener de dos maneras: Primero, se resta el peso de antes de despus (D - A): segundo se resta el peso de despus al peso de antes (A D).
A D D-A 2 (D - A) 117.3 83.3 -34 1156 Pesos (Kg.) de mujeres obesas antes (A) y despus (D) del tratamiento 111.4 98.6 104.3 105.4 100.4 81.7 85.9 75.8 82.9 82.3 77.7 62.7 -25.5 -22.8 -21.4 -23.1 -22.7 -19 650.25 519.84 457.96 533.61 515.29 361 Totales 89.5 69 -20.5 420.25 78.2 63.9 -14.3 204.49

-203.3 4818.69

8. Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no rechazo. -12.7395 cae en la regin de rechazo, por lo tanto se rechaza H0 9. Determinar la decisin estadstica. Se rechaza H0

10. Expresar la decisin estadstica en trminos del problema. Se puede concluir que el programa de dieta es eficaz 25

Ejemplo 2. Un artculo publicado por Kashima et al. (A-12) describe una investigacin relacionada con los padres de nios con retraso mental, en la cual se presenta informacin sobre la enseanza de autocuidados en un programa apoyado en diferentes medios de comunicacin, principalmente a travs de videotapes y manuales de instruccin. Como parte del estudio, participaron 17 familias en el programa de capacitacin impartido por personal con amplia experiencia en proyectos de capacitacin paterna. Antes y despus del programa de capacitaci6n, se aplico una prueba de comportamiento y descripcin a cada jefe de familia o padre principal. EI examen evala el conocimiento de los principios de modificacin del comportamiento. Una calificacin alta indica mayor conocimiento. Las siguientes calificaciones corresponden a las pruebas de los jefes de familia, antes y despus del programa de capacitacin: Es posible concluir, con base en estos datos, que el programa de capacitacin aumenta el conocimiento respecto a los principios de modificacin del comportamiento? Sea =0.01 H0: Ca < Cd H1: Ca > Cd

Calificaciones antes y despus de la capacitacin Antes Despus D-A (D - A)


2

Total 13 15 2 4 9 14 5 25 10 15 5 25 17 18 1 1 8 15 7 49 5 9 4 16 57 273

7 11 4 16

6 14 8 64

10 16 6 36

16 17 1 1

8 9 1 1

13 15 2 4

8 9 1 1

14 17 3 9

16 20 4 16

11 12 1 1

12 14 2 4

t= gl (n-1) =16; =0.01 (uni) Se rechaza H0 porque 6.111 > 2.583

26

Ejemplo 3. EI propsito de una de las investigaciones realizadas es evaluar la influencia del bloqueo extradural para la operacin cesrea en diversas variables hemodinmicas maternas y fetales, simultneamente, y determinar si el bloqueo modifica la funcin del miocardio fetal. Los individuos estudiados eran ocho parturientas sanas con 38 a 42 semanas de embarazo de un solo feto, sin complicaciones, que serian sometidas a operacin cesrea con anestesia para bloqueo extradural. Los siguientes datos corresponden a los valores inferiores de esta variable en las dos etapas: Ofrecen suficiente evidencia estos datos, con un nivel de significacin de 0.05, para indicar que, bajo condiciones similares y generales, la media de la presin arterial diastlica en las madres es diferente en las dos etapas? H0 = E1 = E2 H1 = E1 E2 (Bilateral) Medidas de la presin arterial diastlica
E1 E2 E2 - E1 (E2 - E1)
2

Total 66 64 -2 4 63 64 1 1 57 60 3 9 26 194

70 79 9 81

87 87 0 0

72 73 1 1

70 77 7 49

73 80 7 49

T= gl=8-1=7; =0.05/2 =0.025 1-0.025= 0.975 No se rechaza H0 porque 2.324 < 2.3646

27