Вы находитесь на странице: 1из 283

PROBABILIDAD y ESTADSTICA

Definicin de probabilidad La probabilidad de un suceso es un nmero, comprendido entre 0 y 1, que indica las posibilidades que tiene de verificarse cuando se realiza un experimento aleatorio. Experimentos deterministas Son los experimentos de los que podemos predecir el resultado antes de que se realicen. Ejemplo Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que la piedra bajar. Si la arrojamos hacia arriba, sabemos que subir durante un determinado intervalo de tiempo; pero despus bajar. Experimentos aleatorios Son aquellos en los que no se puede predecir el resultado, ya que ste depende del azar. Ejemplos Si lanzamos una moneda no sabemos de antemano si saldr cara o cruz. Si lanzamos un dado tampoco podemos determinar el resultado que vamos a obtener. Teora de probabilidades La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro. Con este fin, introduciremos algunas definiciones:

Suceso Es cada uno de los resultados posibles de una experiencia aleatoria. Al lanzar una moneda salga cara. Al lanzar una moneda se obtenga 4. Espacio muestral Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega ). Espacio muestral de una moneda: = {C, X}. Espacio muestral de un dado: = {1, 2, 3, 4, 5, 6}. Suceso aleatorio es cualquier subconjunto del espacio muestral. Por ejemplo al tirar un dado un suceso sera que saliera par, otro, obtener mltiplo de 3, y otro, sacar 5. Ejemplo Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Calcular: 1. El espacio muestral. = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}

2. El suceso A = {extraer tres bolas del mismo color}. A = {(b,b,b); (n, n,n)} 3. El suceso B = {extraer al menos una bola blanca}. B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)} 4. El suceso C = {extraer una sola bola negra}. C = {(b,b,n); (b,n,b); (n,b,b)} Tipos de sucesos Suceso elemental es cada uno de los elementos que forman parte del espacio muestral. Por ejemplo al tirar un dado un suceso elemental es sacar 5. Suceso compuesto es cualquier subconjunto del espacio muestral. Por ejemplo al tirar un dado un suceso sera que saliera par, otro, obtener mltiplo de 3. Suceso seguro, , est formado por todos los posibles r esultados (es decir, por el espacio muestral). Por ejemplo al tirar un dado un dado obtener una puntuacin que sea menor que 7. Suceso imposible, , es el que no tiene ningn elemento.

Por ejemplo al tirar un dado obtener una puntuacin igual a 7. Sucesos compatibles Dos sucesos, A y B, son compatibles cuando tienen algn suceso elemental comn.

Si A es sacar puntuacin par al tirar un dado y B es obtener mltiplo de 3, A y B son compatibles porque el 6 es un suceso elemental comn. Sucesos incompatibles Dos sucesos, A y B, son incompatibles cuando no tienen ningn elemento en comn. Si A es sacar puntuacin par al tirar un dado y B es obtener mltiplo de 5, A y B son incompatibles. Sucesos independientes Dos sucesos, A y B, son independientes cuando la

probabilidad de que suceda A no se ve afectada porque haya sucedido o no B. Al lazar dos dados los resultados son independientes. Sucesos dependientes Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya suce dido o no B. Extraer dos cartas de una baraja, sin reposicin, son sucesos dependientes. Suceso contrario El suceso contrario a A es otro suceso que se realiza cuando no se realiza A. Se denota por . Son sucesos contrarios sacar par e impar al lanzar un dado. Espacio de sucesos Espacio de sucesos, S, es el conjunto de todos los sucesos aleatorios. Si tiramos una moneda el espacio se sucesos est formado por: S= {{}, {C}, {X}, {C, X}}.

Observamos que el primer elemento es el suceso imposible y el ltimo el suceso seguro. Si tiene un nmero finito de elementos, n, de elementos el nmero de sucesos de es 2 n . - Una moneda = {C, X}. - Nmero de sucesos = 2 2 =4 - Dos monedas = {(C,C); (C,X); (X,C); (X,X)}. - Nmero de sucesos = 2 4 =16 - Un dado = {1, 2, 3, 4, 5, 6}. - Nmero de sucesos = 2 6 = 64

Unin de sucesos La unin de sucesos, A B. Es decir, el suceso A A B se verifica cuando ocurre uno de los dos, A o B, o ambos. B, es el suceso formado por todos los elementos de A y de

B se lee como "A o B".

Ejemplo Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar mltiplo de 3". Calcular A A = {2, 4, 6} B = {3, 6} B.

B = {2, 3, 4, 6}

Propiedades de la unin de sucesos Conmutativa

Asociativa

Idempotente

Simplificacin

Distributiva

Elemento neutro

Absorcin

INTERSECCIN DE SUCESOS

La interseccin de sucesos, A son, a la vez, de A y B. Es decir, el suceso A A

B, es el suceso formado por todos los elementos que

B se verifica cuando ocurren simultneamente A y B.

B se lee como "A y B".

Ejemplo Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar mltiplo de 3". Calcular A A = {2, 4, 6} B = {3, 6} A B = {6} B.

Propiedades de la interseccin de sucesos Conmutativa

Asociativa

Idempotente

Simplificacin

Distributiva

Elemento neutro

Absorcin

Diferencia de sucesos La diferencia de sucesos, A B, es el suceso formado por todos los elementos de A que no son de B. Es decir, la diferencia de los sucesos A y B se verifica cuando lo hace A y no B.

A B se lee como "A menos B". Ejemplo Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par" y B = "sacar mltiplo de 3". Calcular A B. A = {2, 4, 6} B = {3, 6} A B = {2, 4}

Propiedad

Sucesos contrarios El suceso = E - A se llama suceso contrario o complementario de A. Es decir, se verifica siempre y cuando no se verifique A. Ejemplo Consideramos el experimento que consiste en lanzar un dado, si A = "sacar par". Calcular .

A = {2, 4, 6} = {1, 3, 5}

Propiedades

Leyes de Morgan

Propiedades de la probabilidad

1. La probabilidad es positiva y menor o igual que 1. 0 p(A) 1 2. La probabilidad del suceso seguro es 1. p(E) = 1 3. Si A y B son incompatibles, es decir A p(A B) = p(A) + p(B) B = entonces:

Propiedades de la probabilidad 1. La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso contrario es:

2. Probabilidad del suceso imposible es cero.

3. La probabilidad de la unin de dos sucesos es la suma de sus probabilidades restndole la probabilidad de su interseccin.

4. Si un suceso est incluido en otro, su probabilidad es menor o igual a la de st e.

5. Si A 1 , A 2 ,..., A k son incompatibles dos a dos entonces:

6. Si el espacio muestral es finito y un suceso es S = {x 1 , x 2 ,..., x n } entonces:

Por ejemplo la probabilidad de sacar par, al tirar un dado, es: P (par) = P(2) + P(4) + P(6)

Regla de laplace

Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente probables, equiprobables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:

Ejemplos Hallar la probabilidad de que al lanzar dos monedas al aire salgan dos caras. Casos posibles: {cc, cx, xc, xx}. Casos favorables: 1.

En una baraja de 40 cartas, hallar la P (as) y P (copas). Casos posibles: 40. Casos favorables de ases: 4.

Casos favorables de copas: 10.

Calcular la probabilidad de que al echar un dado al aire, salga:

1 Un nmero par. Casos posibles: {1, 2, 3, 4, 5, 6}. Casos favorables: {2, 4, 6}.

2 Un mltiplo de tres. Casos favorables: {3, 6}.

3 Mayor que 4. Casos favorables: {5, 6}.

Combinatoria y probabilidad

La combinatoria nos

puede

ser

muy

til

para

calcular

los sucesos

posibles

favorables, al aplicar la regla de Laplace. Especialmente si hay un gran nmero de sucesos. Ejemplos

1 Un grupo de 10 personas se sienta en un banco. Cul es la probabilidad de que dos personas fijadas de antemano se sienten juntas? Casos posibles:

Casos favorables: Si consideramos las dos personas que se sientan juntas como una sola persona habr 9!; pero pueden estar de dos formas posibles a la izquierda uno d e otro o a la derecha, por tanto se tiene 2 9!

2. Se extraen cinco cartas de una baraja de 52. Hallar la probabilidad de extraer:

4 ases.

4 ases y un rey.

3 cincos y 2 sotas.

Un 9, 10, sota, caballo y rey en cualquier orden.

3 de un palo cualquiera y 2 de otro. Hay cuatro formas de elegir el primer palo y tres formas de elegir al segundo palo.

Al menos un as.

Probabilidad de la unin de sucesos


Probabilidad de la unin de sucesos incompatibles A p(A B = B) = p(A) + p(B)

Calcular la probabilidad de obtener un 2 un 5 al lanzar un dado.

Probabilidad de la unin de sucesos compatibles A p(A p(A p(A B B) = p(A) + p(B) p(A B B B) B) p(A C) p(B C) +

C) = p(A) + p(B) + p(C) p(A C)

Calcular la probabilidad de obtener un mltiplo de 2 un 6 al lanzar un dado.

Probabilidad condicionada Sean A y B dos sucesos de un mismo espacio muestral . Se llama probabilidad del suceso A condicionada al B y se representa por P(A/B) a la probabilidad del suceso A una vez ha ocurrido el B.

Ejemplo Calcular la probabilidad de obtener un 6 al tirar un dado sabiendo que ha salido par.

Sucesos independientes Dos sucesos A y B son independientes si p(A/B) = p(A) Sucesos dependientes Dos sucesos A y B son dependientes si p(A/B) p(A)

Probabilidad compuesta o de la interseccion de sucesos


Probabilidad de la interseccin de sucesos independientes

p(A Ejemplo

B) = p(A) p(B)

Se tiene una baraja de 40 cartas, se saca una y se vuelve a meter. Cul es la probabilidad de extraer dos ases?

Probabilidad de la interseccin de sucesos dependientes p(A Ejemplo Se tiene una baraja de 40 cartas, se extraen dos cartas. Cul es la probabilidad de extraer dos ases? B) = p(A) p(B/A)

Probabilidad de la diferencia de sucesos

Tablas de contingencia

Un mtodo til para clasificar los datos obtenidos en un recuento es mediante las tablas de contingencia. Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual podemos determinar unas probabilidades conociendo otras de la tabla. Ejemplo Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de automviles. De ellos, 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide: 1. Cul ser la probabilidad de que le toque el viaje a un hombre soltero? 2. Si del afortunado se sabe que es casado, cul ser la probabilidad de que sea una mujer?

Diagramas de rbol

Para la construccin de un diagrama en rbol se partir poniendo una rama para cada una de las posibilidades, acompaada de su probabilidad. En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas, segn las posibilidades del siguiente paso, salvo si el nudo representa un posible final del experimento ( nudo final). Hay que tener en cuenta: que la suma de probabilidades de las ramas de

cada nudo ha de dar 1. Ejemplos Una clase consta de seis nias y 10 nios. Si se escoge un comit de tres al azar, hallar la probabilidad de: 1. Seleccionar tres nios.

2. Seleccionar exactamente dos nios y una nia.

3. Seleccionar exactamente dos nias y un nio.

4. Seleccionar tres nias.

Calcular la probabilidad de que al arrojar al aire tres monedas, salgan: Tres caras.

Experimentos compuestos Un experimento compuesto es aquel que consta de dos o ms experimentos aleatorios simples. Es decir, si tiramos un dado, o una moneda, son experimentos aleatorios simples, pero si realizamos el experimento de tirar un dado y posteriormente una moneda, estamos realizando un experimento compuesto. En los experimentos compuestos es conveniente usar el llamado diagrama en

rbol para hacerse una idea global de todos ellos.

Teorema de la probabilidad total

Si A 1 , A 2 ,... , A n son: Sucesos incompatibles 2 a 2. Y cuya unin es el espacio muestral (A Y B es otro suceso. Resulta que: A ... A n = ).

p(B) = p(A 1 ) p(B/A 1 ) + p(A 2 ) p(B/A 2 ) + ... + p(A n ) p(B/A n ) Ejemplo Se dispone de tres cajas con bombillas. La primera contiene 10 bombillas, de las cuales hay cuatro fundidas; en la segunda hay seis bombillas, estando una de ellas fundida, y la tercera caja hay tres bombillas fundidas de un total de ocho. Cul es la probabilidad de que al tomar una bombilla al azar de una cualquiera de las cajas, est fundida?

Teorema de bayes

Si A 1 , A 2 ,... , A n son: Sucesos incompatibles 2 a 2. Y cuya unin es el espacio muestral (A Y B es otro suceso. Resulta que: A ... A n = ).

Las probabilidades p(A 1 ) se denominan probabilidades a priori.

Las probabilidades p(A i /B) se denominan probabilidades a posteriori. Las probabilidades p(B/A i ) se denominan verosimilitudes. Ejemplos El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas tambin, mientras que los no ingenieros y los no economistas solamente el 20% ocupa un puesto directivo. Cul es la probabilidad de que un empleado directivo elegido al azar sea ingeniero?

La probabilidad de que haya un accidente en una fbrica que dispone de alarma es 0.1. La probabilidad de que suene esta s se ha producido algn incidente es de 0.97 y la probabilidad de que suene si no ha sucedido ningn incidente es 0.02. En el supuesto de que haya funcionado la alarma, cul es la probabilidad de que no haya habido ningn incidente?

Sean los sucesos: I = Producirse incidente. A = Sonar la alarma.

RESUMEN DE ESTE CAPITULO

Teora de probabilidades

La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro. Suceso Es cada uno de los resultados posibles de una experiencia aleatoria. Espacio muestral Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega ). Tipos de sucesos Suceso elemental es cada uno de los elementos que forman parte del espacio muestral. Suceso compuesto es cualquier subconjunto del espacio muestral. Suceso seguro, , est formado por todos los posibles resultados (es decir, por el espacio muestral). Suceso imposible,, es el que no tiene ningn elemento. Por ejemplo al tirar un dado obtener una puntuacin igual a 7. Sucesos compatibles Dos sucesos, A y B, son compatibles cuando tienen algn suceso elemental comn.

Sucesos incompatibles Dos sucesos, A y B, son incompatibles cuando no tienen ningn elemento en comn. Sucesos independientes Dos sucesos, A y B, son independientes cuando la probabilidad de que suceda A no se ve afectada porque haya sucedido o no B. Sucesos dependientes Dos sucesos, A y B, son dependientes cuando la probabilidad de que suceda A se ve afectada porque haya sucedido o no B. Suceso contrario El suceso contrario a A es otro suceso que se realiza cuando no se realiza A., Se denota por . Unin de sucesos La unin de sucesos, A B. Interseccin de sucesos La interseccin de sucesos, A son, a la vez, de A y B. Diferencia de sucesos La diferencia de sucesos, A B, es el suceso formado por todos los elementos de A que no son de B. B, es el suceso formado por todos los elementos que B, es el suceso formado por todos los elementos de A y de

Sucesos contrarios El suceso = - A se llama suceso contrario o complementario de A.

Axiomas de la probabilidad 1. 0 p(A) 1 2. p(E) = 1 3. p(A B) = p(A) + p(B)

Propiedades de la probabilidad 1

4 5 Si A 1 , A 2 , ..., A k son incompatibles dos a dos entonces:

6 Si el espacio muestral E es finito y un suceso es S = {x 1 , x 2 , ..., x n } entonces:

Ley de Laplace

Probabilidad de la unin de sucesos incompatibles A p(A B = B) = p(A) + p(B)

Probabilidad de la unin de sucesos compatibles A p(A B B) = p(A) + p(B) p(A B)

Probabilidad condicionada

Probabilidad de la interseccin de sucesos independientes p(A B) = p(A) p(B)

Probabilidad de la interseccin de sucesos dependientes p(A B) = p(A) p(B/A)

Teorema de la probabilidad total Si A 1 , A 2 ,... , A n son sucesos incompatibles 2 a 2, cuya unin es el espacio muestral (A
1

...

A n = E) y B es otro suceso, resulta que:

p(B) = p(A 1 ) p(B/A 1 ) + p(A 2 ) p(B/A 2 ) + ... + p(A n ) p(B/A n )

Teorema de Bayes Si A 1 , A 2 ,... , A n son sucesos incompatibles 2 a 2, cuya unin es el espacio muestral (A
1

...

A n = E) y B es otro suceso, resulta que:

EJERCICIOS

1. Sean A y B dos sucesos aleatorios con:

Hallar: 1.

2.

3.

4.

5.

6.

7.

2. Sean A y B dos sucesos aleatorios con:

Hallar: 1

3. Se sacan dos bolas de una urna que se compone de una bola blanca, otra roja, otra verde y otra negra. Escribir el espacio muestral cuando: 1 La primera bola se devuelve a la urna antes de sacar la segunda. E = {BB, BR, BV, BN, RB, RR, RV, RN, VB, VR, VV, VN, NB, NR, NV, NN} 2 La primera bola no se devuelve. E = {BR, BV, BN, RB, RV, RN, VB, VR, VN, NB, NR, NV}

4. Una urna tiene ocho bolas rojas, 5 amarilla y siete verdes. Si se extrae una bola al azar calcular la probabilidad de: 1Sea roja.

2Sea verde.

3Sea amarilla.

4No sea roja.

5No sea amarilla.

5. Una urna contiene tres bolas rojas y siete blancas. Se extraen dos bolas al azar. Escribir el espacio muestral y hallar la probabilidad de los sucesos: 1 Con remplazamiento.

2 Sin remplazamiento.

6. Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras, cul es la probabilidad de que la bola sea roja o blanca? Cul es la probabilidad de que no sea blanca?

7. En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un da asisten 45 alumnos, encontrar la probabilidad de que un alumno: 1Sea hombre.

2Sea mujer morena.

3Sea hombre o mujer.

8. Un dado est trucado, de forma que las probabilidades de obtener las distintas caras son proporcionales a los nmeros de estas. Hallar: 1La probabilidad de obtener el 6 en un lanzamiento.

2La probabilidad de conseguir un nmero impar en un lanzamiento.

9. Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: 1La probabilidad de que salga el 7.

2 La probabilidad de que el nmero obtenido sea par.

3 La probabilidad de que el nmero obtenido sea mltiplo de tres.

10. Se lanzan tres dados. Encontrar la probabilidad de que: 1 Salga 6 en todos.

2 Los puntos obtenidos sumen 7.

11. Hallar la probabilidad de que al levantar unas fichas de domin se obtenga un nmero de puntos mayor que 9 o que sea mltiplo de 4.

12. Busca la probabilidad de que al echar un dado al aire, salga: 1 Un nmero par.

2 Un mltiplo de tres.

3 Mayor que cuatro.

13. Hallar la probabilidad de que al lanzar al aire dos monedas, salgan: 1 Dos caras.

2 Dos cruces.

3 Una cara y una cruz.

14. En un sobre hay 20 papeletas, ocho llevan dibujado un coche las restantes son blancas. Hallar la probabilidad de extraer al menos una papeleta con el dibujo de un coche: 1 Si se saca una papeleta.

2 Si se extraen dos papeletas.

3 Si se extraen tres papeletas.

15. Los estudiantes A y B tienen respectivamente probabilidades 1/2 y 1/5 de suspender un examen. La probabilidad de que suspendan el examen simultneamente es de 1/10. Determinar la probabilidad de que al menos uno de los dos estudiantes suspenda el examen.

16. Dos hermanos salen de caza. El primero mata un promedio de 2 piezas cada 5 disparos y el segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a una misma pieza, cul es la probabilidad de que la maten?

17. Una clase consta de 10 hombres y 20 mujeres, la mitad de los hombres y la mitad de las mujeres tienen los ojos castaos. Determinar la probabilidad de que una persona elegida al azar sea un hombre o tenga los ojos castaos.

18. La probabilidad de que un hombre viva 20 aos es y la de que su mujer viva 20 aos es 1/3. Se pide calcular la probabilidad: 1 De que ambos vivan 20 aos.

2 De que el hombre viva 20 aos y su mujer no.

3 De que ambos mueran antes de los 20 aos.

Ejercicios y problemas resueltos de probabilidad condicionada 1 Sean A y B dos sucesos aleatorios con p(A) = 1/2, p(B) = 1/3, p(A Determinar: 1 B)= 1/4.

2 Sean A y B dos sucesos aleatorios con p(A) = 1/3, p(B) = 1/4, p(A Determinar: 1

B) = 1/5.

3 En un centro escolar los alumnos pueden optar por cursar como lengua extranjera ingls o francs. En un determinado curso, el 90% de los alumnos estudia ingls y el resto francs. El 30% de los que estudian ingls son chicos y de los que estudian francs son chicos el 40%. El elegido un alumno al azar, cul es la probabilidad de que sea chica?

p (chica) = 0.9 0.7 + 0.1 0.6 = 0.69

4 De una baraja de 48 cartas se extrae simultneamente dos de ellas. Calcular la probabilidad de que: 1 Las dos sean copas.

2 Al menos una sea copas.

3 Una sea copa y la otra espada.

5 Ante un examen, un alumno slo ha estudiado 15 de los 25 temas correspondientes a la materia del mismo. ste se realiza extrayendo al azar dos temas y dejando que el alumno escoja uno de los dos para ser examinado del mismo. Hallar la probabilidad de que el alumno pueda elegir en el examen uno de los temas estudiados.

6 Una clase est formada por 10 chicos y 10 chicas; la mitad de las chicas y la mitad de los chicos han elegido francs como asignatura optativa. 1 Cul es la probabilidad de que una persona elegida al azar sea chico o estudie francs?

2 Y la probabilidad de que sea chica y no estudie francs?

7 Un taller sabe que por trmino medio acuden: por la maana tres automviles con problemas elctricos, ocho con problemas mecnicos y tres con problemas de chapa, y por la tarde dos con problemas elctricos, tres con problemas mecnicos y uno con problemas de chapa. 1 Hacer una tabla ordenando los datos anteriores.

2 Calcular el porcentaje de los que acuden por la tarde.

3 Calcular el porcentaje de los que acuden por problemas mecnicos.

4 Calcular la probabilidad de que un automvil con problemas elctricos acuda por la maana.

8 Una clase consta de seis nias y 10 nios. Si se escoge un comit de tres al azar, hallar la probabilidad de: 1 Seleccionar tres nios.

2 Seleccionar exactamente dos nios y una nia.

3 Seleccionar por lo menos un nio.

4 Seleccionar exactamente dos nias y un nio.

9 Una caja contiene tres monedas. Una moneda es corriente, otra tiene dos caras y la otra est cargada de modo que la probabilidad de obtener cara es de 1/3. Se selecciona una moneda lanzar y se lanza al aire. Hallar la probabilidad de que salga cara.

10 Una urna contiene 5 bolas rojas y 8 verdes. Se extrae una bola y se reemplaza por dos del otro color. A continuacin, se extrae una segunda bola. Se pide:

1 Probabilidad de que la segunda bola sea verde.

2 Probabilidad de que las dos bolas extradas sean del mismo color.

11 En una clase en la que todos practican algn deporte, el 60% de los alumnos juega al ftbol o al baloncesto y el 10% practica ambos deportes. Si adems hay un 60% que no juega al ftbol, cul ser la probabilidad de que escogido al azar un alumno de la clase: 1 Juegue slo al ftbol.

2 Juegue slo al baloncesto.

3 Practique uno solo de los deportes.

4 No juegue ni al ftbol ni al baloncesto.

12 En una ciudad, el 40% de la poblacin tiene cabellos castaos, el 25% tiene ojos castaos y el 15% tiene cabellos y ojos castaos. Se escoge una persona al azar: 1 Si tiene los cabellos castaos, cul es la probabilidad de que tenga tambin ojos castaos?

2 Si tiene ojos castaos, cul es la probabilidad de que no tenga cabellos castaos?

3 Cul es la probabilidad de que no tenga cabellos ni ojos castaos?

13 En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan gafas, y 15 son varones y usan gafas. Si seleccionamos al azar un alumno de dicho curso: 1 Cul es la probabilidad de que sea mujer y no use gafas?

2 Si sabemos que el alumno seleccionado no usa gafas, qu probabilidad hay de que sea hombre?

14 Disponemos de dos urnas: la urna A contiene 6 bolas rojas y 4 bolas blancas, la urna B contiene 4 bolas rojas y 8 bolas blancas. Se lanza un dado, si aparece un nmero menor que 3; nos vamos a la urna A; si el resultado es 3 ms, nos vamos a la urna B. A continuacin extraemos una bola. Se pide:

1 Probabilidad de que la bola sea roja y de la urna B.

2 Probabilidad de que la bola sea blanca.

15 Un estudiante cuenta, para un examen con la ayuda de un despertador, el cual consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabilidad de que realiza el examen es 0.9 y, en caso contrario, de 0.5. 1 Si va a realizar el examen, cul es la probabilidad de que haya odo el despertador?

2 Si no realiza el examen, cul es la probabilidad de que no haya odo el despertador?

16 En una estantera hay 60 novelas y 20 libros de poesa. Una persona A elige un libro al azar de la estantera y se lo lleva. A continuacin otra persona B elige otro libro al azar. 1 Cul es la probabilidad de que el libro seleccionado por B sea una novela?

2 Si se sabe que B eligi una novela, cul es la probabilidad de que el libro seleccionado por A sea de poesa?

17 Se supone que 25 de cada 100 hombres y 600 de cada 1000 mujeres usan gafas. Si el nmero de mujeres es cuatro veces superior al de hombres, se pide la probabilidad de encontrarnos: 1 Con una persona sin gafas.

2 Con una mujer con gafas.

18 En una casa hay tres llaveros A, B y C; el primero con cinco llaves, el segundo con siete y el tercero con ocho, de las que slo una de cada llavero abre la puerta del trastero. Se escoge al azar un llavero y, de l una llave para abrir el trastero. Se pide: 1 Cul ser la probabilidad de que se acierte con la llave?

2 Cul ser la probabilidad de que el llavero escogido sea el tercero y la llave no abra?

3 Y si la llave escogida es la correcta, cul ser la probabilidad de que pertenezca al primer llavero A?

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD VARIABLE ALEATORIA Se llama variable aleatoria a toda funcin que asocia a cada elemento del espacio muestral un nmero real. Se utilizan letras maysculas X, Y, ... para designar variables aleatorias, y las respectivas minsculas (x, y, ...) para designar valores concretos de las mismas. Variable aleatoria discreta Una variable aleatoria discreta es aquella que slo puede tomar valores enteros . Ejemplos El nmero de hijos de una familia, la puntuacin obtenida al lanzar un dado. Variable aleatoria continua Una variable aleatoria continua es aquella que puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real. Ejemplos La altura de los alumnos de una clase, las horas de duracin de una pila. Funcin de probabilidad Se llama funcin de probabilidad de una variable aleatoria discreta X a la aplicacin que asocia a cada valor de x i de la variable su probabilidad p i . 0 pi 1 p1 + p2 + p3 + + pn = pi = 1

Ejemplo Calcular la distribucin de probabilidad de las puntuaciones obtenidas al lanzar un dado.

pi

1/6

1/6

1/6

1/6

1/6

1/6

P=1

Representacin La representacin de una distribucin discreta de probabilidad es un diagrama de barras.

FUNCION DE DISTRIBUCION

Sea X una variable aleatoria discreta cuyos valores suponemos ordenados de menor a mayor. Llamaremos funcin de distribucin de la variable X, y escribiremos F(x) a la funcin: F(x) = p(X x)

La funcin de distribucin asocia a cada valor de la variable aleatoria la probabilidad acumulada hasta ese valor. Ejemplo Calcular la funcin de distribucin de probabilidad de las puntuaciones obtenidas al lanzar un dado. x x <1 1 x < 2 2 x < 3 3 x < 4 4 x < 5 5 x < 6 6 x p 0 1/6 2/6 3/6 4/6 5/6 1

Representacin La representacin de una funcin de distribucin de probabilidad es una grfica escalonada.

MEDIA Y VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA Esperanza matemtica o media

Varianza

Desviacin tpica

Ejemplo Calcular la esperanza matemtica, la varianza, y la desviacin tpica , de la distribucin de probabilidad de las puntuaciones obtenidas al lanzar un dado. X 1 2 3 4 5 6 p 1 1 1 1 1 1 x p 1 2 3 4 5 1 21/6 x 2 pi 1 4 9 16 25 6 91/6

Ejercicios resueltos de distribuciones discretas

1 Se lanza un par de dados. Se define la variable aleatoria X como la suma de las puntuaciones obtenidas. Hallar la funcin de probabilidad, la esperanza matemtica y la varianza.

x p

x 2 pi

1/36

2/36

4/36

2/36

6/36

18/36

3/36

12/36

48/36

4 /36

20/3 6

100/36

5/36

30/36

180/36

6/36

42/36

294/36

5/36

40/36

320/36

4 /36

36/36

324/36

10

3/36

30/36

300/36

11

2/36

22/36

242/36

12

1/36

12/36

144/36

54.83

2 Un jugador lanza un dado corriente. Si sale nmero primo, gana tantos cientos de euros como marca el dado, pero si no sale nmero primo, pierde tantos cientos de euros como marca el dado. Determinar la funcin de probabilidad y la esperanza matemtica del juego. X +100 + 200 + 300 - 400 + 500 -600 p
i

x p

1/6 1/6 1/6 1/6 1/6 1/6

100/6 200/6 =16.667 300/6 -400/6 500/6 - 600/6 100/6

3 Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 un segundo premio de 2000 con probabilidades de: 0.001 y 0.003. Cul sera el precio justo a pagar por la papeleta?

= 5000 0.001 + 2000 0.003 = 11 4 Sea X una variable aleatoria discreta cuya funcin de probabilidad es: X 0 1 2 3 4 5 p
i

0,1 0,2 0,1 0,4 0,1 0,1

1. Calcular, representar grficamente la funcin de distribucin.

2. Calcular las siguientes probabilidades: p (X < 4.5)

p (X < 4.5) = F (4.5) = 0.9 p (X 3) p (X 3) = 1 - p(X < 3) = 1 - 0.4 = 0.6 p (3 X < 4.5) p (3 X < 4.5) = p (X < 4.5) - p(X < 3) = 0.9 - 0.4 = 0.5 Ejercicios de distribuciones discretas 1 Un jugador lanza dos monedas. Gana 1 2 si aparecen una o dos caras. Por otra parte pierde 5 si no aparece cara. Determinar la esperanza matemtica del juego y si ste es favorable. = {(c,c);(c,x);(x,c);(x,x)} p(+1) = 2/4 p(+2) = 1/4 p(5) = 1/4 = 1 2/4 + 2 1/4 - 5 1/4 = 1/4. Es desfavorable 2 Sabiendo que p(X 2) = 0.7 y p(X 2) = 0.75. Hallar: La esperanza matemtica, la varianza y la desviacin tpica.

x p

x 2 pi

0.1

0.15

0.15

0.15

0.45

0.9

1.8

0.1

0.3

0.9

0.2

0.8

3.2

2.15

6.05

=2.15 = 6.05 - 2.15 = 1.4275 = 1.19

DISTRIBUCION BINOMIAL O DE BERNOULLI


Un experimento sigue el modelo de la distribucin binomial o de Bernoulli si: 1. En cada prueba del experimento slo son posibles dos resultados: el suceso A (xito) y su contrario .

2. La probabilidad del suceso A es constante , es decir, que no vara de una prueba a otra. Se representa por p. 3. El resultado obtenido en cada prueba es independiente de los resultados

obtenidos anteriormente.

Variable aleatoria binomial La variable aleatoria binomial, X, expresa el nmero de xitos obtenidos en cada prueba del experimento. La variable binomial es una variable aleatoria discreta, slo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Ejemplo k = 6, al lanzar una moneda 10 veces y obtener 6 caras. Distribucin binomial La distribucin binomial se suele representar por B(n, p). n es el nmero de pruebas de que consta el experimento. p es la probabilidad de xito.

La probabilidad de

es 1 p, y la representamos por q.

FUNCION DE PROBABILIDAD DE LA DISTRIBUCION BINOMIAL

La funcin

de

probabilidad

de

la

distribucin

binomial ,

tambin

denominada funcin de la distribucin de Bernoulli , es:

n es el nmero de pruebas. p es la probabilidad de xito. El nmero combinatorio

k es el nmero de xitos. q es la probabilidad de fracaso.

Ejemplo La ltima novela de un autor ha tenido un gran xito, hasta el punto de que el 80% de los lectores ya la han leido. Un grupo de 4 amigos son afici onados a la lectura: 1. Cul es la probabilidad de que el grupo hayan leido la novela 2 personas? n = 4 p = 0.8 q = 0.2 B(4, 0.8)

2. Y cmo mximo 2?

MEDIA Y VARIANZA DE LA DISTRIBUCION BINOMIAL Media

Varianza

Desviacin tpica

Ejemplo La probabilidad de que un artculo producido por una fabrica sea defectuoso es 0.02. Se envi un cargamento de 10.000 artculos a unos almacenes. Hallar el nmero esperado de artculos defectuosos, la varianza y la desviacin tpica.

Ejercicios de distribucin binomial 1 Se lanza una moneda cuatro veces. Calcular la probabilidad de que salgan ms caras que cruces. B(4, 0.5) p = 0.5q = 0.5

2 Un agente de seguros vende plizas a cinco personas de la misma edad y que disfrutan de buena salud. Segn las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 aos o ms es 2/3. Hllese la probabilidad de que, transcurridos 30 aos, vivan: 1. Las cinco personas. B(5, 2/3) p = 2/3 q = 1/3

2. Al menos tres personas.

3. Exactamente dos personas.

3 Si de seis a siete de la tarde se admite que un nmero de telfono de cada cinco est comunicando, cul es la probabilidad de que, cuando se marquen 10 nmeros de telfono elegidos al azar, slo comuniquen dos? B(10, 1/5)p = 1/5q = 4/5

4 La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10 veces cul es la probabilidad de que acierte exactamente en tres ocasiones? Cul es la probabilidad de que acierte por lo menos en una ocasin? B(10, 1/4) p = 1/4q =

5 En una urna hay 30 bolas, 10 rojas y el resto blancas. Se elige una bola al azar y se anota si es roja; el proceso se repite, devolviendo la bola, 10 veces. Calcular la media y la desviacin tpica. B(10, 1/3) p = 1/3q = 2/3

Ejercicios de la distribucin binomial 1 En unas pruebas de alcoholemia se ha observado que el 5% de los conductores controlados dan positivo en la prueba y que el 10% de los conductores controlados no llevan puesto el cinturn de seguridad. Tambin se ha observado que las dos infracciones son independientes. Un guardia de trfico para cinco conductores al azar. Si tenemos en cuenta que el nmero de conductores es suficientemente importante como para estimar que la proporcin de infractores no vara al hacer la seleccin.

1. Determinar la probabilidad de que exactamente tres conductores hayan cometido alguna de las dos infracciones.

2. Determine la probabilidad de que al menos uno de los conductores controlados haya cometido alguna de las dos infracciones.

2 Un laboratorio afirma que una droga causa efectos secundarios en una proporcin de 3 de cada 100 pacientes. Para contrastar esta afirmacin, otro laboratorio elige al azar a 5 pacientes a los que aplica la droga. Cul es la probabilidad de los siguientes sucesos? 1. Ningn paciente tenga efectos secundarios. B(100, 0.03) p = 0.03 q = 0.97

2. Al menos dos tengan efectos secundarios.

3. Cul es el nmero medio de pacientes que espera laboratorio que sufran efectos secundarios si elige 100 pacientes al azar?

DISTRIBUCION NORMAL Variable aleatoria de la distribucin normal Una variable aleatoria continua, X, sigue una distribucin normal de media

y desviacin tpica , y se designa por N(, ), si se cumplen las siguientes condiciones: 1. La variable puede tomar cualquier valor: ( -, +) 2. La funcin de densidad, es la expresin en trminos de ecuacin matemtica de la curva de Gauss:

Curva de la distribucin normal

El campo de existencia es cualquier valor real, es decir, (-, +). Es simtrica respecto a la media . Tiene un mximo en la media .

Crece hasta la media y decrece a partir de ella. En los puntos y + presenta puntos de inflexin. El eje de abscisas es una asntota de la curva.

El rea del recinto determinado por la funcin y el eje de abscisas es igual a la unidad. Al ser simtrica respecto al eje que pasa por x = , deja un rea igual a 0.5 a la izquierda y otra igual a 0.5 a la derecha. La probabilidad equivale al rea encerrada bajo la curva. p( - < X + ) = 0.6826 = 68.26 % p( - 2 < X + 2) = 0.954 = 95.4 % p( - 3 < X + 3) = 0.997 = 99.7 %

DISTRIBUCION NORMAL ESTANDAR N (0, 1) La distribucin normal estndar, o tipificada o reducida, es aquella que tiene por media el valor cero, = 0, y por desviacin tpica la unidad, =1. Su funcin de densidad es:

Su grfica es:

La probabilidad de la variable X depender del rea del recinto sombreado en la figura. Y para calcularla utilizaremos una tabla. Tipificacin de la variable Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribucin N(, ) en otra variable Z que siga una distribucin N(0, 1).

Tabla de la distribucin normal

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0

0.5000

0.5040

0.5080

0.5120

0.5160

0.5199

0.5239

0.5279

0.5319

0.5359

0.1

0.5398

0.5438

0.5478

0.5517

0.5557

0.5596

0.5636

0.5675

0.5714

0.5753

0.2

0.5793

0.5832

0.5871

0.5910

0.5948

0.5987

0.6026

0.6064

0.6103

0.6141

0.3

0.6179

0.6217

0.6255

0.6293

0.6331

0.6368

0.6406

0.6443

0.6480

0.6517

0.4

0.6554

0.6591

0.6628

0.6664

0.6700

0.6736

0.6772

0.6808

0.6844

0.6879

0.5

0.6915

0.6950

0.6985

0.7019

0.7054

0.7088

0.7123

0.7157

0.7190

0.7224

0.6

0.7257

0.7291

0.7324

0.7357

0.7389

0.7422

0.7454

0.7486

0.7517

0.7549

0.7

0.7580

0.7611

0.7642

0.7673

0.7704

0.7734

0.7764

0.7794

0.7823

0.7852

0.8

0.7881

0.7910

0.7939

0.7967

0.7995

0.8023

0.8051

0.8078

0.8106

0.8133

0.9

0.8159

0.8186

0.8212

0.8238

0.8264

0.8289

0.8315

0.8340

0.8365

0.8389

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

1.0

0.8413

0.8438

0.8461

0.8485

0.8508

0.8531

0.8554

0.8577

0.8599

0.8621

1.1

0.8643

0.8665

0.8686

0.8708

0.8729

0.8749

0.8770

0.8790

0.8810

0.8830

1.2

0.8849

0.8869

0.8888

0.8907

0.8925

0.8944

0.8962

0.8980

0.8997

0.9015

1.3

0.9032

0.9049

0.9066

0.9082

0.9099

0.9115

0.9131

0.9147

0.9162

0.9177

1.4

0.9192

0.9207

0.9222

0.9236

0.9251

0.9265

0.9279

0.9292

0.9306

0.9319

1.5

0.9332

0.9345

0.9357

0.9370

0.9382

0.9394

0.9406

0.9418

0.9429

0.9441

1.6

0.9452

0.9463

0.9474

0.9484

0.9495

0.9505

0.9515

0.9525

0.9535

0.9545

1.7

0.9554

0.9564

0.9573

0.9582

0.9591

0.9599

0.9608

0.9616

0.9625

0.9633

1.8

0.9641

0.9649

0.9656

0.9664

0.9671

0.9678

0.9686

0.9693

0.9699

0.9706

1.9

0.9713

0.9719

0.9726

0.9732

0.9738

0.9744

0.9750

0.9756

0.9761

0.9767

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

2.0

0.9772

0.9778

0.9783

0.9788

0.9793

0.9798

0.9803

0.9808

0.9812

0.9817

2.1

0.9821

0.9826

0.9830

0.9834

0.9838

0.9842

0.9846

0.9850

0.9854

0.9857

2.2

0.9861

0.9864

0.9868

0.9871

0.9875

0.9878

0.9881

0.9884

0.9887

0.9890

2.3

0.9893

0.9896

0.9898

0.9901

0.9904

0.9906

0.9909

0.9911

0.9913

0.9916

2.4

0.9918

0.9920

0.9922

0.9925

0.9927

0.9929

0.9931

0.9932

0.9934

0.9936

2.5

0.9938

0.9940

0.9941

0.9943

0.9945

0.9946

0.9948

0.9949

0.9951

0.9952

2.6

0.9953

0.9955

0.9956

0.9957

0.9959

0.9960

0.9961

0.9962

0.9963

0.9964

2.7

0.9965

0.9966

0.9967

0.9968

0.9969

0.9970

0.9971

0.9972

0.9973

0.9974

2.8

0.9974

0.9975

0.9976

0.9977

0.9977

0.9978

0.9979

0.9979

0.9980

0.9981

2.9

0.9981

0.9982

0.9982

0.9983

0.9984

0.9984

0.9985

0.9985

0.9986

0.9986

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.9987

0.9987

0.9987

0.9988

0.9988

0.9989

0.9989

0.9989

0.9990

0.9990

3.1

0.9990

0.9991

0.9991

0.9991

0.9992

0.9992

0.9992

0.9992

0.9993

0.9993

3.2

0.9993

0.9993

0.9994

0.9994

0.9994

0.9994

0.9994

0.9995

0.9995

0.9995

3.3

0.9995

0.9995

0.9995

0.9996

0.9996

0.9996

0.9996

0.9996

0.9996

0.9997

3.4

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9997

0.9998

3.5

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

0.9998

3.6

0.9998

0.9998

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3.7

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3.8

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

0.9999

3.9

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

1.0000

EMPLEO DE LA TABLA DE DISTRIBUCION NORMAL Tabla de la curva normal (0, 1) La tabla nos da las probabilidades de P(z k), siendo z la variable tipificada. Estas probabilidades nos dan la funcin de distribucin (k). (k) = P(z k)

Bsqueda en la tabla de valor de k

Unidades y dcimas en la columna de la izquierda.

Centsimas en la fila de arriba. P(Z a)

P(Z 1.47) = 0.9292 P(Z > a) = 1 - P(Z a)

P(Z > 1.47) = 1 P(Z 1.47) = 1 0.9292 = 0.0708 P(Z a) = 1 P(Z a)

P(Z 1.47) = 1 P(Z 1.47) = 1 0.9292 = 0.0708 P(Z > a) = P(Z a)

p(Z > 1.47) = p(Z 1.47) = 0.9292

P(a < Z b ) = P(Z b) P(Z a)

P( 0.45 <Z 1.47) = P(Z 1.47) P(Z 0.45) = = 0.9292 0.6736 = 0.2556 P(b < Z a ) = P(a < Z b )

P(1.47 <Z 0.45) = P( 0.45 <Z 1.47) = = P(Z 1.47) P(Z 0.45) = 0.9292 0.6736 = 0.2556 P(a < Z b ) = P(Z b) [ 1 P(Z a)]

P(-1.47 < Z 0.45) = P(Z 0.45) [ 1 P(Z 1.47)]= = 0.6736 (1 0.9292) = 0.6028 p = K

Nos encontramos con el caso inverso a los anteriores, conocemos el valor de la probabilidad y se trata de hallar el valor de la abscisa. Ahora tenemos que buscar en la tabla el valor que ms se aproxime a K. p = 0.75Z 0.68 Para calcular la variable X nos vamos a la frmula de la tipificacin. (X - )/ = 0.68X = + 0.68

DISTRIBUCION NORMAL Y BINOMIAL Aproximacin de la binomial por la normal Teorema de Moivre Si: np 0 y nq 0. La distribucin binomial B(n, p) se puede aproximar mediante una distribucin normal:

Ejemplo En una ciudad una de cada tres familias posee telfono. Si se eligen al azar 90 familias, calcular la probabilidad de que entre ellas haya por lo menos 30 tengan telfono.

Ejercicios y problemas de la distribucin normal 1. Si X es una variable aleatoria de una distribucin N(, ), hallar: p(3 X +3)

Es decir, que aproximadamente el 99.74% de los valores de X estn a menos de tres desviaciones tpicas de la media.

2 En una distribucin normal de media 4 y desviacin tpica 2, calcular el valor de a para que: P(4a x 4+a) = 0.5934

3 En una ciudad se estima que la temperatura mxima en el mes de junio sigue una distribucin normal, con media 23 y desviacin tpica 5. Calcular el nmero de das del mes en los que se espera alcanzar mximas entre 21 y 27.

4 La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviacin tpica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuntos estudiantes pesan:

1. Entre 60 kg y 75 kg.

2. Ms de 90 kg.

3. Menos de 64 kg.

4. 64 kg.

5. 64 kg o menos.

5 Se supone que los resultados de un examen siguen una distribucin normal con media 78 y desviacin tpica 36. Se pide: 1. Cul es la probabilidad de que una persona que se presenta el examen obtenga una calificacin superior a 72?

2. Calcular la proporcin de estudiantes que tienen puntuaciones que exceden por lo menos en cinco puntos de la puntuacin que marca la frontera entre el Apto y el No Apto (son declarados No-Aptos el 25% de los estudiantes que obtuvieron las puntuaciones ms bajas).

3. Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de que su calificacin sea, de hecho, superior a 84?

6 Tras un test de cultura general se observa que las puntuaciones obtenidas siguen una distribucin una distribucin N(65, 18). Se desea clasificar a los examinados en tres grupos (de baja cultura general, de cultura general aceptable, de excelente cultura general) de modo que hay en el primero un 20% la poblacin, un 65% el segundo y un 15% en el tercero. Cules han de ser las puntuaciones que marcan el paso de un grupo al otro?

Baja cultura hasta 49 puntos. Cultura aceptable entre 50 y 83.

Excelente cultura a partir de 84 puntos. 7 Varios test de inteligencia dieron una puntuacin que sigue una ley normal con media 100 y desviacin tpica 15. 1. Determinar el porcentaje de poblacin que obtendra un coeficiente entre 95 y 110.

2. Qu intervalo centrado en 100 contiene al 50% de la poblacin?

3 En una poblacin de 2500 individuos cuntos individuos se esperan que tengan un coeficiente superior a 125?

8 En una ciudad una de cada tres familias posee telfono. Si se eligen al azar 90 familias, calcular la probabilidad de que entre ellas haya por lo menos 30 tengan telfono.

9 En un examen tipo test de 200 preguntas de eleccin mltiple, cada pregunta tiene una respuesta correcta y una incorrecta. Se aprueba s i se contesta a ms de 110 respuestas correctas. Suponiendo que se contesta al azar, calcular la probabilidad de aprobar el examen.

10 Un estudio ha mostrado que, en un cierto barrio, el 60% de los hogares tienen al menos dos televisores Se elige al azar una muestra de 50 hogares en el citado barrio. Se pide: 1. Cul es la probabilidad de que al menos 20 de los citados hogares tengan cuando menos dos televisores?

2. Cul es la probabilidad de que entre 35 y 40 hogares tengan cuando menos dos televisores?

DISTRIBUCIONES DIBIDIMENSIONALES Relacin funcional Dos variables x e y estn relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplo Si se deja caer una piedra, existe una frmula que nos permite calcular exactamente, la altura a la que se encuentra en funcin del tiempo transcurrido. h = g t.

Relacin estadstica

Dos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. Ejemplos Ingresos y gastos de una familia. Produccin y ventas de una fbrica. Gastos en publicidad y beneficios de una empresa.

Variable estadstica bidimensional

Una variable bidimensional es una variable en la que cada individuo est definido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Distribuciones bidimensionales Son aquellas en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par (x i , y i ). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:

Matemticas Fsica

2 1

3 3

4 2

4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

COVARIANZA

La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza se representa por s x y o x y .

La covarianza indica el sentido de la correlacin entre las variables Si x y > 0 la correlacin es directa. Si x y < 0 la correlacin es inversa. La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes. Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares. Ejemplos Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:

Matemticas Fsica

2 1

3 3

4 2

4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

Hallar la covarianza de la distribucin.

xi 2

yi 1

xi yi 2

16

20

24

36

28

42

56

10

90

10

10

100

72

60

431

Despus de tabular los datos hallamos las medias aritmticas:

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente: Y/X 1 2 3 0 2 1 2 2 1 4 5 4 3 2 0

Hallar la covarianza de la distribucin. En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias aritmticas.

xi 0

yi 1

fi 2

xi fi 0

yi f i 2

xi yi fi 0

16

10

15

30

12

12

16

20

40

41

76

CORRELACION La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas. Tipos de correlacin 1 Correlacin directa La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula

COEFICIENTE DE CORRELACION LINEAL

El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de las desviaciones tpicas de ambas variables.

El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlacin 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.

Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin. 3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables haydependencia funcional.

Ejemplos

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas Fsica 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10

Hallar el coeficiente de correlacin de la distribucin e interpretarlo. xi2 4 yi 2 1

xi 2

yi 1

x i y i 2

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10

90

100

81

10

10

100

100

100

72

60

431

504

380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte. Los valores de dos variables X e Y se distribuyen segn la tabla siguiente: Y/X 1 2 3 0 2 1 2 2 1 4 5 4 3 2 0

Determinar el coeficiente de correlacin. Convertimos la tabla de doble entrada en tabla simple. xi2 fi 0 yi 2 f i 2

xi 0

yi 1

fi 2

xi fi 0

yi f i 2

xi yi fi 0

18

16

16

16

10

20

15

45

30

12

48

12

32

16

20

40

120

41

97

76

Al ser el coeficiente de correlacin negativo, la correlacin es inversa. Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.

REGLA DE REGRESION La recta de regresin es la que mejor se ajusta a la nube de puntos.

La recta de regresin pasa por el punto Recta de regresin de Y sobre X

llamado centro de gravedad.

La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X. La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre Y La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y. La pendiente de la recta es el cociente entre la covarian za y la varianza de la variable Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus ecuaciones son: y= x=

Ejemplo

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas Fsica 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10

Hallar las rectas de regresin y representarlas. xi2 4 yi 2 1

xi 2

yi 1

x i y i 2

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10

90

100

81

10

10

100

100

100

72

60

431

504

380

1 Hallamos las medias arimticas.

2 Calculamos la covarianza.

3 Calculamos las varianzas.

4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.

EJERCICIOS DE REGRESION Y CORRELACION

Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. 1 Hallar la ecuacin de la recta de regresin de la edad sobre el peso. 2 Cul sera el peso aproximado de un nio de seis aos? xi2 196 400 1 024 1 764 1 936 5 320 yi 2 28 60 160 294 352 894

xi 2 3 5 7 8 25

yi 14 20 32 42 44 152

x i y i 4 9 25 49 64 151

N de clientes (X) Distancia (Y)

8 15

7 19

6 25

4 23

2 34

1 40

1 Calcular el coeficiente de correlacin lineal. 2 Si el centro comercial se sita a 2 km, cuntos clientes puede esperar? 3 Si desea recibir a 500 clientes, a qu distancia del ncleo de poblacin debe situarse? xi2 64 49 36 16 4 yi 2 225 361 625 529 1 156 1 600 4 496

xi 8 7 6 4 2

yi 15 19 25 23 34

x i y i 120 133 150 92 68

40

40

28

156

603

170

3. Las notas obtenidas por cinco alumnos en Matemticas y Qumica son: Matemticas Qumica 6 6. 5 4 4. 5 8 7 5 5 3. 5 4

Determinar las rectas de regresin y calcular la nota esperada en Qumica para un alumno que tiene 7.5 en Matemticas. xi2 42. 25 20. 25 49 25 16 152. 5 yi 2 39

xi 6

yi 6. 5 4. 5 7 5 4 27

x i y i 36

4 8 5 3. 5 26. 5

16 64 25 12. 25 153. 25

18 56 25 14 152

4. Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlacin r = -0.9, siendo las medias de las distribuciones marginales que una de las cuatro ecuaciones siguientes = 1, a = 2. Se sabe la recta de

corresponde

regresin de Y sobre X: y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1 Seleccionar razonadamente esta recta. Como el coeficiente de correlacin lineal es negativo, la recta tambin ser negativa, por tanto descartamos la 2 y 4. Un punto de la recta ha de ser ( 2 - 1+ 2 2 . 1 + 2 = 4 La recta pedida es: 2x + y = 4. , ), es decir, (1, 2). la pendiente de

5. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son: Estatura (X) Pesos (Y) 186 85 189 85 190 86 192 90 193 87 193 91 198 93 201 103 203 100 205 101

Calcular: 1 La recta de regresin de Y sobre X. 2 El coeficiente de correlacin. 3 El peso estimado de un jugador que mide 208 cm.

xi 186

yi 85

xi2 34 596 35 721 36 100 36 864 37 249 37 249 39 204 40

yi 2 7 225 7 225 7 396 8 100 7 569 8 281 8 649 10

x i y i 15 810 16 065 16 340 17 280 16 791 17563 18 414 20

189

85

190

86

192

90

193

87

193

91

198 201

93 103

401 203 100 41 209 42 025 380 618

609 10 000 10 201 85 255

703 20 300 20 705 179 971

205 1 950

101

921

Correlacin positiva muy fuerte.

6. A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades producidas (Y), determinar la recta de regresin de Y sobre X, el coeficiente de correlacin lineal e interpretarlo.

Horas (X) Produccin (Y)

80

79

83

84

78

60

82

85

79

84

80

62

300 302 315 330 300 250 300 340 315 330 310 240

xi 80 79 83 84 78 60 82 85 79 84 80 62 936

yi 300 302 315 330 300 250 300 340 315 330 310 240 3 632

x i y i 6 400 6 241 6 889 7 056 6 084 3 600 6 724 7 225 6 241 7 056 6 400 3 844 73 760

xi2 90 000 91 204 99 225 108 900 90 000 62 500 90 000 115 600 99 225 108 900 96 100 57 600 1 254 109

yi 2 24 000 23 858 26 145 27 720 23 400 15 000 24 600 28 900 24 885 27 720 24 800 14 880 285 908

Correlacin positiva muy fuerte}

7. Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que dedican diariamente a dormir y ver la televisin. La clasificacin de las respuestas ha permitido elaborar la siente tabla: N de horas dormidas (X) N de horas de televisin (Y) Frecuencias absolutas (f i ) 6 4 3 7 3 16 8 3 20 9 2 10 10 1 1

Se pide: 1 Calcular el coeficiente de correlacin. 2 Determinar la ecuacin de la recta de regresin de Y sobre X. 3 Si una persona duerme ocho horas y media, cunto cabe esperar que vea la televisin?

xi 6 7 8 9 10

yi 4 3 3 2 1

fi 3 16 20 10 1 50

xi fi 18 112 160 90 10 390

xi2 fi 108 784 1280 810 100 3082

yi f i 12 48 60 20 1 141

yi 2 f i 48 144 180 40 1 413

xi yi fi 72 336 480 180 10 1078

Es una correlacin negativa y fuerte.

8. La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba y ventas del primer mes de prueba (Y) en cientos de euros. X Y 25 42 42 72 33 50 54 90 29 45 36 48

1 Hallar el coeficiente de correlacin e interpretar el resultado obtenido. 2 Calcular la recta de regresin de Y sobre X. Predecir las ventas de un vendedor que obtenga 47 en el test.

xi 25 42 33 54

yi 42 72 50 90

x i y i 625 1 764 1 089 2 916

xi2 1 764 5 184 2 500 8 100

yi 2 1 050 3 024 1 650 4 860

29 36 209

45 48 347

841 1 296 8 531

2 025 2 304 21 877

1 305 1 728 13 617

EJERCICIOS 2 1. Una compaa desea hacer predicciones del valor anual de sus ventas totales en cierto pas a partir de la relacin de stas y la renta nacional. Para investigar la relacin cuenta con los siguientes datos: X Y 189 402 190 404 208 412 227 425 239 429 252 436 257 440 274 447 293 458 308 469 316 469

X representa la renta nacional en millones de euros e Y representa las ventas de la compaa en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive). Calcular:

1 La recta de regresin de Y sobre X. 2 El coeficiente de correlacin lineal e interpretarlo. 3 Si en 2001 la renta nacional del pas fue de 325 millones de euros. Cul ser la prediccin para las ventas de la compaa en este ao?

xi 189 190 208 227 239 252 257 274 293 308 316 2 753

yi 402 404 412 425 429 436 440 447 458 469 469 4 791

x i y i 35 721 36 100 43 264 51 529 57 121 63 504 66 049 75 076 85 849 94 864 99 856 708 933

xi2 161 604 163 216 169 744 180 625 184 041 190 096 193 600 199 809 209 764 219 961 219 961 2 421 092

yi 2 75 978 76 760 85 696 96 475 102 531 109 872 113 080 122 478 134 194 144 452 148 204 1 720 209

2. La informacin estadstica obtenida de una muestra de tamao 12 sobre la relacin existente entre la inversin realizada y el rendimiento obtenido en cientos de miles de euros para explotaciones agrcolas, se muestra en el siguiente cuadro: Inversin (X) Rendimiento (Y) 11 14 16 15 16 18 20 21 14 20 19 11 2 3 5 6 5 3 7 10 6 10 5 6

Calcular: 1 La recta de regresin del rendimiento respecto de la inversin. 2 La previsin de inversin que se obtendr con un rendimiento de 1 250 000 .

xi 11 14 16 15

yi 2 3 5 6

x i y i 121 196 256 225

xi2 4 9 25 36

yi 2 22 42 80 90

16 18 20 21 14 20 19 11 195

5 3 7 10 6 10 5 6 68

256 324 400 441 196 400 361 121 3 297

25 9 49 100 36 100 25 36 454

80 54 140 210 84 200 95 66 1 163

3. El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida en el examen correspondiente, de ocho personas es: Horas (X) Calificacin (Y) 20 6.5 16 6 34 8.5 23 7 27 9 32 9.5 18 7.5 22 8

Se pide: 1 Recta de regresin de Y sobre X. 2 Calificacin estimada para una persona que hubiese estudiado 28 horas.

xi 16 18 20 22 23 27 32 34 192

yi 6 7.5 6.5 8 7 9 9.5 8.5 62

x i y i 256 324 400 484 529 729 1 024 1156 4 902

xi2 36 56.25 42.25 64 49 81 90.25 72.25 491

yi 2 96 135 130 176 161 243 304 289 1 534

4. En la tabla siguiente se indica la edad (en aos) y la conducta agresiva (medida en una escala de cero a 10) de 10 nios. Edad Conducta agresiva 6 6 6.7 9 6 7 7 7.4 8 7 7.9 4 8 8.2 2 3 8.5 3 8.9 1

1 Obtener la recta de regresin de la conducta agresiva en funcin de la edad. 2 A partir de dicha recta, obtener el valor de la conducta agresiva que correspondera a un nio de 7.2 aos.

xi 6 6.4 6.7 7 7.4 7.9 8 8.2 8.5 8.9 75

yi 9 6 7 8 7 4 2 3 2 1 49

x i y i 36 40.96 44.89 49 54.76 62.41 64 67.24 72.25 79.21 570.72

xi2 81 36 49 64 49 16 4 9 4 1 313

yi 2 54 38.4 46.9 56 51.8 31.6 16 24.6 17 8.9 345.2

5. Los valores de dos variables X e Y se distribuyen segn la tabla siguiente: Y/X 14 18 22 100 1 2 0 50 1 3 1 25 0 0 2

Se pide: 1 Calcular la covarianza. 2 Obtener e interpretar el coeficiente de correlacin lineal. 3 Ecuacin de la recta de regresin de Y sobre X.

Convertimos la tabla de doble entrada en una tabla simple. xi yi fi xi fi 100 xi fi 10 000 20 000 2 500
2

yi fi 14

yi 2 fi 196

xi fi 1 400

yi

100

14

100 50

18 14

2 1

200 50

36 14

648 196

3 600 700

50 50 25

18 22 22

3 1 2 10

150 50 50 600

7 500 2 500 1 250 43 750

54 22 44 184

972 484 968 3 464

2 700 1 100 1 100 10 600

Es una correlacin negativa dbil.

6. Las puntuaciones obtenidas por un grupo de alumnos en una batera de test que mide la habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes: Y/X (25-35) (35-45) (45-55) (55-65) 20 6 3 0 0 30 4 6 2 1 40 0 1 5 2 50 0 0 3 7

Se pide: 1 Existe correlacin entre ambas variables? 2 Segn los datos de la tabla, si uno de estos alumnos obtiene una puntuacin de 70 puntos en razonamiento abstracto, en cunto se estimar su habilidad verbal?

Convertimos la tabla de doble entrada en tabla simple. xi 20 20 30 30 30 30 40 40 40 50 50 yi 30 40 30 40 50 60 40 50 60 50 60 fi 6 3 4 6 2 1 1 5 2 3 7 xi fi 120 60 120 180 60 30 40 200 80 150 350 1 390 xi2 fi 2 400 1 200 3 600 5 400 1 800 900 1 600 8 000 3 200 7 500 17 500 53 100 yi f i 180 120 120 240 100 60 40 250 120 150 420 1 080 yi 2 f i 5 400 4 800 3 600 9 600 5 000 3 600 1 600 12 500 7 200 7 500 25 200 86 000 xi fi 3 600 2 400 3 600 7 200 3 000 1 800 1 600 10 000 4 800 7 500 21 000 yi

40

66 500

7. Se sabe que entre el consumo de papel y el nmero de litros de agua por metro cuadrado que se recogen en una ciudad no existe relacin. 1 Cul es el valor de la covarianza de estas variables? = 0 2 Cunto vale el coeficiente de correlacin lineal? r = 0 3 Qu ecuaciones tienen las dos rectas de regresin y cul es su posicin en el plano? = k1 , = k2 k1, k2 .

Las rectas son paralelas a los ejes y perpendiculares entre s. 8. En una empresa de transportes trabajan cuatro conductores. Los aos de antigedad de permisos de conducir y el nmero de infracciones cometidas en el ltimo ao por cada uno de ellos son los siguientes :

Aos (X) Infracciones (Y)

3 4

4 3

5 2

6 1

Calcular el coeficiente de correlacin lineal e interpretarlo.

xi 3 4 5 6 18

yi 4 3 2 1 10

x i y i 12 12 10 6 40

xi2 9 16 25 36 86

yi 2 16 9 4 1 30

La correlacin es perfecta e inversa. 9. Una persona rellena semanalmente una quiniela y un boleto de lotera primitiva anotando el nmero de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron: Quiniela (X) Primitiva (Y) 6 1 8 2 6 2 8 1

Obtener el coeficiente de correlacin lineal e interpretarlo. Ofreceran confianza las previsiones hechas con las rectas de regresin?

xi 6 8 6 8 28

yi 1 2 2 1 6

x i y i 6 16 12 8 42

xi2 36 64 36 64 200

yi 2 1 4 4 1 10

No existe correlacin entre ambas variables, por tanto las estimaciones hechas con las rectas de regresin no ofrece ninguna confianza .

ESTADISTICA DESCRIPTIVA

La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: Recogida de datos. Organizacin y representacin de datos. Anlisis de datos. Obtencin de conclusiones.

Conceptos de Estadstica Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo Un individuo o unidad componen la poblacin. Muestra Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo estadstica es cada uno de los elementos que

El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. VARIABLE ESTADISTICA

Definicin de variable Una variable estadstica es cada una de las caractersticas o

cualidades que poseen los individuos de una poblacin. Tipos de variable estadsticas

Variable cualitativa Las variables cualitativas se refieren a caractersticas o

cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal

Una variable

cualitativa

nominal presenta modalidades

no

numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticascon ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es

decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales. TABLAS DE ESTADISTICA

Distribucin de frecuencias La distribucin una ordenacin en de forma frecuencias o tabla de tabla de los datos de frecuencias es asignando a

estadsticos,

cada dato su frecuencia correspondiente. Tipos de frecuencias Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un

determinado valor en un estudio estadstico. Se representa por f i . La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por n i .

La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valorconsiderado. Se representa por F i . Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia

acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.

Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi 27

Recuento

fi 1

Fi 1

ni 0.032

Ni 0.032

28

II

0.065

0.097

29

0.194

0.290

30

16

0.226

0.516

31

24

0.258

0.774

32

III

27

0.097

0.871

33

III

30

0.097

0.968

34

31

0.032

31

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribucin de frecuencias agrupadas

La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que amplitud denominados clases. correspondiente. Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el lmite superior e A cada clase se le tengan asigna la misma sufrecuencia

inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

Construccin de una tabla de datos agrupados 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer.

Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

ci [0, 5) 2.5

fi 1

Fi 1

ni 0.025

Ni 0.025

[5, 10)

7.5

0.025

0.050

[10, 15)

12.5

0.075

0.125

[15, 20)

17.5

0.075

0.200

[20, 25)

22.5

11

0.075

0.2775

[25, 30)

27.5

17

0.150

0.425

[30, 35)

32.5

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

[40, 45)

42.5

38

0.100

0.950

[45, 50)

47.5

40

0.050

40

DIAGRAMA DE BARRAL Y POLIGONOS DE FRECUENCIAS Diagrama de barras Un diagrama de barras se utiliza para de presentar datos

cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se la frecuencia. Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado: representan mediante barras de una altura proporcional a

Grupo sanguneo A B AB 0

fi 6 4 1 9 20

Polgonos de frecuencia Un polgono de frecuencias se forma uniendo los extremos de

las barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan

las frecuencias y unindolos mediante segmentos. Ejemplo Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:

Hora 6 9 12 15 18 21

Temperatura 7 12 14 11 12 10

24

DIAGRAMA DE SECTORES Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de

cada sector es proporcional a la frecuencia absolutacorrespondiente.

El diagrama circular se construye con la ayuda de un transportador de ngulos.

Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 juegan al ftbol y el resto no practica ningn deporte.

Alumnos Baloncesto Natacin Ftbol Sin deporte Total 12 3 9 6 30

ngulo 144 36 108 72 360

HISTOGRAMA Un histograma es de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado enclases. una representacin grfica de una variable en forma

En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, lafrecuencia absoluta de cada intervalo. La superficie de los valores representados. Polgono de frecuencia Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo. cada barra es proporcional a la frecuencia de

Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla:

ci [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 110 115

fi 8 10 16 14 10 5 2 65

Fi 8 18 34 48 58 63 65

Histograma y polgono de frecuencias acumuladas Si se representan obtiene las frecuencias el histograma acumuladas de de frecuencias una tabla de datos su

agrupados se

acumuladas o

correspondiente polgono.

Histogramas con intervalos de amplitud diferente Para construir un histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de los rectngulos del histograma.

h i es la altura del intervalo. f i es la frecuencia del intervalo. a i es la amplitud del intervalo.

Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos.

fi

hi

[0, 5) [5, 7) [7, 9) [9, 10)

15 20 12 3 50

3 10 6 3

PARAMETROS ESTADISTICOS

Definicin de parmetro estadstico Un parmetro estadstico es un nmero que se obtiene a partir de

los datos de una distribucin estadstica. Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica. Tipos de parmetros estadsticos Hay tres tipos parmetros estadsticos:

De centralizacin. De posicin De dispersin.

Medidas de centralizacin Nos indican en torno a qu valor (centro) se distribuyen los datos. La medidas de centralizacin son: Media aritmtica La media es el valor promedio de la distribucin. Mediana La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que ms se repite en una distribucin.

Medidas de posicin Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos.

Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. La medidas de posicin son: Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersin Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media.

Varianza La varianza es la media aritmtica del cuadrado de las

desviaciones respecto a la media. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. MODA

Definicin de moda La moda es el valor que tiene mayor frecuencia absoluta. Se representa por M o . Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 M o = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin esbimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9M o = 1, 5, 9

Cuando

todas

las puntuaciones de

un

grupo

tienen

la misma

frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Clculo de la moda para datos agrupados 1 Todos los intervalos tienen la misma amplitud.

L i es el lmite inferior de la clase modal. f i es la frecuencia absoluta de la clase modal. f i - -1 es la frecuencia absoluta inmediatamente inferior a la clase modal. f i -+ 1 es la frecuencia absoluta inmediatamente posterior a la clase modal. a i es la amplitud de la clase. Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

fi

[60, 63) [63, 66) [66, 69) [69, 72) [72, 75)

5 18 42 27 8 100

2 Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.

fi [0, 5) [5, 7) [7, 9) [9, 10) 15 20 12 3 50

hi 3 10 6 3

MEDIANA

Definicin de mediana Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por M e. La mediana se puede hallar slo para variables cuantitativas. Clculo de la mediana 1 Ordenamos los datos de menor a mayor.

2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un nmero par de puntuaciones la mediana es

la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 Clculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia

acumulada llega hasta la mitad de la suma de las frecuencias absolutas .

Es decir tenemos que buscar el intervalo en el que se encuentre

L i es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

fi [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) 5 18 42 27 8 100

Fi 5 23 65 92 100

100/2 = 50 Clase de la mediana: [66, 69)

MEDIA ARITMETICA

Definicin de media aritmtica La media aritmtica es el valor obtenido al sumar todos

los datos y dividir el resultado entre el nmero total de datos. es el smbolo de la media aritmtica.

Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmtica para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

Ejercicio de media aritmtica En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media.

xi [10, 20) [20, 30) [30,40) 15 25 35

fi 1 8 10

xi fi 15 200 350

[40, 50) [50, 60 [60,70) [70, 80)

45 55 65 75

9 8 4 2 42

405 440 260 150 1 820

Propiedades de la media aritmtica 1. La suma de las desviaciones de todas las puntuaciones de una

distribucin respecto a la media de la misma igual acero.

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0: 8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 = = 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0 2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un nmero cualquiera se hace mnima cuando

dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la media aritmtica queda aumentada en dichonmero.

4. Si

todos

los

valores

de

la

variable

se multiplican por

un

mismo nmero la media aritmtica queda multiplicada por dicho nmero.

Observaciones sobre la media aritmtica 1. La media se puede hallar slo para variables cuantitativas. 2. La media es independiente de las amplitudes de los intervalos. 3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribucin con los siguientes pesos: 65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la distribucin. 4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

xi [60, 63) [63, 66) [66, 69) [69, 72) [72, ) 61.5 64.5 67.5 70.5

fi 5 18 42 27 8 100

En este caso no es posible hallar la media porque no podemos calcular la marca de clase de ltimo intervalo. CUARTILES Los cuartiles son los tres valores de la variable que dividen a

un conjunto de datos ordenados en cuatro partes iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana.

Clculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos expresin el . lugar que ocupa cada cuartil mediante la

Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra la tabla de las frecuencias acumuladas.

, en

L i es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase del cuartil. a i es la amplitud de la clase.

Ejercicio de cuartiles Calcular los cuartiles de la distribucin de la tabla:

fi [50, 60) [60, 70) 8 10

Fi 8 18

[70, 80) [80, 90) [90, 100) [100, 110) [110, 120)

16 14 10 5 2 65

34 48 58 63 65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

DECILES

Los deciles son partes iguales.

los nueve

valores que dividen la

serie

de datos en diez

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D 5 coincide con la mediana.

Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra la tabla de las frecuencias acumuladas.

, en

L i es el lmite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase el decil.. a i es la amplitud de la clase.

Ejercicio de deciles Calcular los deciles de la distribucin de la tabla:

fi

Fi

[50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120)

8 10 16 14 10 5 2 65

8 18 34 48 58 63 65

Clculo del primer decil

Clculo del segundo decil

Clculo del tercer decil

Clculo del cuarto decil

Clculo del quinto decil

Clculo del sexto decil

Clculo del sptimo decil

Clculo del octavo decil

Clculo del noveno decil

PERCENTILES Los percentiles son partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P 5 0 coincide con la mediana. Clculo de los percentiles los 99 valores que dividen la serie de datos en 100

En primer lugar buscamos la clase donde se encuentra en la tabla de las frecuencias acumuladas.

L i es el lmite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase del percentil. a i es la amplitud de la clase.

Ejercicio de percentiles Calcular el percentil 35 y 60 de la distribucin de la tabla:

fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65

Fi 8 18 34 48 58 63 65

Percentil 35

Percentil 60

DESVIACION MEDIA

Desviacin respecto a la media La desviacin respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadstica y la media aritmtica. D i = |x - x| Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Ejemplo Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo Calcular la desviacin media de la distribucin:

xi [10, 15) 12.5

fi 3

xi fi 37.5

|x - x|

|x - x| f i 27.858

9.286

[15, 20)

17.5

87.5

4.286

21.43

[20, 25)

22.5

157.5

0.714

4.998

[25, 30)

27.5

110

5.714

22.856

[30, 35)

32.5

65

10.174

21.428

21

457.5

98.57

VARIANZA

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla: xi2 fi 225

xi [10, 20) 15

fi 1

xi fi 15

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

Propiedades de la varianza 1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la varianza no vara. 3 Si todos los valores de la variable se multiplican por

un nmero la varianza queda multiplicada por el cuadrado de dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular lavarianza total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza 1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza.

3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado. DESVIACION TIPICA La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica

Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla: xi2 fi 225

xi [10, 20) 15

fi 1

xi fi 15

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

Propiedades de la desviacin tpica 1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por

un nmero la desviacin tpica queda multiplicada por dichonmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica 1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. 3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media. COEFICIENTE DE VARIACION Y PUNTUACIONES TIPICAS Coeficiente de variacin El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.

El coeficiente de variacin se suele expresar en porcentajes:

El coeficiente

de

variacin permite

comparar

las dispersiones de

dos

distribuciones distintas, siempre que sus medias seanpositivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s. La mayor dispersin corresponder al valor del coeficiente de variacin mayor.

Ejercicio Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin?

La primera distribucin presenta mayor dispersin.

Puntuaciones tpicas Puntuaciones diferenciales Las puntuaciones diferenciales resultan de restarles a las puntuaciones

directas la media aritmtica. xi = X i X Puntuaciones tpicas Las puntuaciones tpicas son el resultado de dividir las puntuaciones

diferenciales entre la desviacin tpica. Este proceso se llama tipificacin. Las puntuaciones tpicas se representan por z.

Observaciones sobre puntuaciones tpicas La media aritmtica de las puntuaciones tpicas es 0. La desviacin tpica de las puntuaciones tpicas es 1. Las puntuaciones tpicas son adimensionales, es decir, son independientes de las unidades utilizadas.

Las puntuaciones

tpicas se

utilizan

para comparar las puntuaciones obtenidas en distintas distribuciones.

Ejemplo En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70 kg y el de Ana es 65 kg. Cul de ellos puede, dentro del grupo de alumnos de su sexo, considerarse ms grueso?

Jos es ms grueso respecto de su grupo que Ana respecto al suyo. REPASO DE LA UNIDAD

Definicin de Estadstica La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.

Conceptos de Estadstica Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo

Un individuo o unidad componen la poblacin. Muestra

estadstica es

cada

uno

de

los

elementos

que

Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Variables estadsticas Variable cualitativa Las variables cualitativas se refieren a caractersticas o

cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal

Una variable

cualitativa

nominal presenta modalidades

no

numricas que no admiten un criterio de orden. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden.

Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticascon ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es

decir no admite valores intermedios entre dos valores especficos. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros.

Distribucin de frecuencias La distribucin una ordenacin en de forma frecuencias o tabla de tabla de los datos de frecuencias es asignando a

estadsticos,

cada dato su frecuencia correspondiente. Diagrama de barras

Un diagrama

de

barras se

utiliza

para

de

presentar datos

cualitativos o datos cuantitativos de tipo discreto. Los datos se la frecuencia. Polgonos de frecuencias Un polgono de frecuencias se forma uniendo los extremos de representan mediante barras de una altura proporcional a

las barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan

las frecuencias y unindolos mediante segmentos. Diagrama de sectores Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de

cada sector es proporcional a la frecuencia absolutacorrespondiente.

Histograma Un histograma es de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado enclases. En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, lafrecuencia absoluta de cada intervalo. una representacin grfica de una variable en forma

Medidas de centralizacin Moda La moda es el valor que tiene mayor frecuencia absoluta. Se representa por M o . Se puede hallar la moda para variables cualitativas y cuantitativas. Clculo de la moda para datos agrupados 1 Todos los intervalos tienen la misma amplitud.

2 Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

Mediana Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por M e. La mediana se puede hallar slo para variables cuantitativas. Clculo de la mediana

1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 3 Si la serie tiene un nmero par de puntuaciones la mediana es

la media entre las dos puntuaciones centrales. Clculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia

acumulada llega hasta la mitad de la suma de las frecuencias absolutas .

Es decir tenemos que buscar el intervalo en el que se encuentre

Media aritmtica La media aritmtica es el valor obtenido al sumar todos

los datos y dividir el resultado entre el nmero total de datos. es el smbolo de la media aritmtica.

Media aritmtica para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la media es:

Medidas de posicin

Cuartiles Los cuartiles son los tres valores de la variable dividen a

un conjunto de datos ordenados en cuatro partes iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Deciles Los deciles son partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. los nueve valores que dividen la serie de datos en diez

Percentiles Los percentiles son partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. los 99 valores que dividen la serie de datos en 100

Medidas de dispersin Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Varianza La desviacin tpica es la raz cuadrada de la varianza. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Coeficiente de variacin El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.

Puntuaciones tpicas

Las puntuaciones

tpicas son

el

resultado

de dividir las puntuaciones

diferenciales entre la desviacin tpica. Este proceso se llama tipificacin.

Ejercicios y problemas resueltos de Estadstica I 1. Indica que variables son cualitativas y cuales cuantitativas: 2. 1 Comida Favorita. 3. Cualitativa. 4. 2 Profesin que te gusta. 5. Cualitativa. 6. 3 Nmero de goles marcados por tu equipo favorito en la ltima temporada. 7. Cuantitativa. 8. 4 Nmero de alumnos de tu Instituto. 9. Cuantitativa. 10. 5 El color de los ojos de tus compaeros de clase. 11. Cualitativa. 12. 6 Coeficiente intelectual de tus compaeros de clase. 13. Cuantitativa

2. De las siguientes variables indica cules son discretas y cuales continuas. 1 Nmero de acciones vendidas cada da en la Bolsa. Discreta 2Temperaturas registradas cada hora en un observatorio. Continua 3 Perodo de duracin de un automvil. Continua 4 El dimetro de las ruedas de varios coc hes. Continua 5 Nmero de hijos de 50 familias. Discreta 6 Censo anual de los espaoles. Discreta 3. Clasificar las

siguientes variables en cualitativas y cuantitativas discretas o continuas. 1 La nacionalidad de una persona. Cualitativa 2 Nmero de litros de agua contenidos en un depsito.

Cuantitativa continua. 3 Nmero de libro en un estante de librera. Cuantitativa discreta. 4 Suma de puntos tenidos en el lanzamiento de un par de dados. Cuantitativa discreta. 5 La profesin de una persona. Cualitativa. 6 El rea de las distintas baldosas de un edificio. Cuantitativa continua. 4. Las puntuaciones obtenidas por un grupo de en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribucin de frecuencias y dibuja el polgono de frecuencias.

xi 13 14 15 16 18

Recuento III I

fi 3 1 5

Fi 3 4 9 13 16

ni 0.15 0.05 0.25 0.20 0.15

Ni 0.15 0.20 0.45 0.65 0.80

IIII III

4 3

19 20 22

I II I

1 2 1 20

17 19 20

0.05 0.10 0.05

0.85 0.95 1

Polgono de frecuencias

5. El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.

xi 1 2

Recuento

xi 6 12

Fi 6 18

ni 0.158 0.316

Ni 0.158 0.474

3 4 IIII

16 4 38

34 38

0.421 0.105 1

0.895 1

Diagrama de barras

6. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.

xi 0

fi 1

Fi 1

ni 0.02

Ni 0.02

1 2 3 4 5 6 7 8 9 10

1 2 3 6 11 12 7 4 2 1 50

2 4 7 13 24 36 43 47 49 50

0.02 0.04 0.06 0.12 0.22 0.24 0.14 0.08 0.04 0.02 1.00

0.04 0.08 0.14 0.26 0.48 0.72 0.86 0.94 0.98 1.00

Diagrama de barras

7. Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:

Peso fi

[50, 60) 8

[60, 70) 10

[70, 80) 16

[80,90) 14

[90, 100) 10

[100, 110) 5

[110, 120) 2

1 Construir la tabla de frecuencias. 2 Representar el histograma y el polgono de frecuencias.

xi [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 105 115

fi 8 10 16 14 10 5 2 65

Fi 8 18 34 48 58 63 65

ni 0.12 0.15 0.24 0.22 0.15 0.08 0.03

Ni 0.12 0.27 0.51 0.73 0.88 0.96 0.99

Histograma

8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias. 2 Dibujar el histograma y el polgono de frecuencias.

xi [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) 2.5 7.5 12.5 17.5 22.5

fi 1 1 3 3 3

Fi 1 2 5 8 11

ni 0.025 0.025 0.075 0.075 0.075

Ni 0.025 0.050 0.125 0.200 0.275

[25, 30) [30, 35) [35, 40) [40, 45) [45, 50)

27.5 32.5 37.5 47.5 47.5

6 7 10 4 2 40

17 24 34 38 40

0.150 0.175 0.250 0.100 0.050 1

0.425 0.600 0.850 0.950 1.000

Histograma

9. Sea una distribucin estadstica que viene dada por la siguiente tabla:

xi fi

61 5

64 18

67 42

70 27

73 8

Calcular:

1 La moda, mediana y media. 2 El rango, desviacin media, varianza y desviacin tpica .

xi 61 64 67 71 73

fi 5 18 42 27 8 100

Fi 5 23 65 92 100

xi fi 305 1152 2184 1890 584 6745

|x x | 6.45 3.45 0.45 2.55 5.55

|x x | f i 32.25 62.10 18.90 68.85 44.40 226.50

xi2 fi 18 065 73 728 188 538 132 300 42 632 455 803

Moda Mo = 67 Mediana 102/2 = 50 Me = 67 Media

Desviacin media

Rango

r = 73 61 = 12 Varianza

Desviacin tpica

10. Calcular la media, la mediana y la moda de la siguiente serie de nmeros: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.

xi 2 3 4 5 6 8

fi 2 2 5 6 2 3 20

Fi 2 4 9 15 17 20

xi fi 4 6 20 30 12 24 96

Moda Mo = 5 Mediana 20/2 = 10 Me = 5

Media

11. Hallar la varianza y la desviacin tpica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5.

12. Hallar la media, mediana y moda de la siguiente serie de nmeros: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6.

2, 2, 3, 5, 5, 5, 6, 6, 8, 9. Moda Mo = 5 Mediana

10/2 = 5 Media

14. Hallar la desviacin media, la varianza y la desviacin tpica de la series de nmeros siguientes: 15. 2, 3, 6, 8, 11. 16. 12, 6, 7, 3, 15, 10, 18, 5. 17. 18. 2, 3, 6, 8, 11. 19. Media 20. 21. Desviacin media 22. 23. Varianza 24. 25. Desviacin tpica 26. 27. 28. 12, 6, 7, 3, 15, 10, 18, 5. 29. Media 30. 31. Desviacin media 32. 33. Varianza 34. 35. Desviacin tpica 36. 37.

14. Se ha aplicado test a los empleados de una fbrica, obtenindose las siete tabla:

fi [38, 44) [44, 50) [50, 56) [56, 62) [62, 68) [68, 74) [74, 80) 7 8 15 25 18 9 6

Dibujar el histograma y el polgono de frecuencias acumuladas .

fi [38, 44) [44, 50) [50, 56) [56, 62) [62, 68) [68, 74) [74, 80) 7 8 15 25 18 9 6

Fi 7 15 30 55 73 82 88

15. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: La moda, la mediana y la media. La desviacin media, la varianza y la desviacin tpica. Los cuartiles 1 y 3. Los deciles 2 y 7. Los percentiles 32 y 85.

3, 5, 2, 7, 6, 4, 9.

Moda No existe moda porque todas las puntuaciones tienen la misma frecuencia. Mediana 2, 3, 4, 5, 6, 7, 9. Me = 5 Media

Varianza

Desviacin tpica

Desviacin media

Rango r = 9 2 = 7 Cuartiles

Deciles 7 (2/10) = 1.4 D 2 = 3 7 (7/10) = 4.9 D 7 = 6 Percentiles 7 (32/100) = 2,2 P 32 = 4 7 (85/100) = 5.9 P 85 = 7

3, 5, 2, 7, 6, 4, 9, 1.

Moda No existe moda porque todas las puntuaciones tienen la misma frecuencia. Mediana

Media

Varianza

Desviacin tpica

Desviacin media

Rango r = 9 - 1 = 8 Cuartiles

Deciles 8 (2/10) = 1.6 D 2 = 2 8 (7/10) = 5.6 D 7 = 6 Percentiles 8 (32/100) = 2.56 P 32 = 3 8 (85/100) = 6.8 P 85 = 7 16. Una distribucin estadstica viene dada por la siguiente tabla:

[10, 15) fi 3

[15, 20) 5

[20, 25) 7

[25, 30) 4

[30, 35) 2

Hallar: La moda, mediana y media. El rango, desviacin media y varianza. Los cuartiles 1 y 3. Los deciles 3 y 6. Los percentiles 30 y 70.

xi [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 12.5 17.5 22.5 27.5 32.5

fi 3 5 7 4 2 21

Fi 3 8 15 19 21

xi fi 37.5 87.5 157.5 110 65 457.5

|x x | f i 27.857 21.429 5 22.857 21.429 98.571

xi2 fi 468.75 1537.3 3543.8 3025 2112.5 10681.25

Moda

Mediana

Media

Desviacin media

Varianza

Desviacin tpica

Cuartiles

Deciles

Percentiles

17. Dada la distribucin estadstica: [25, ) 6

[0, 5) fi 3

[5, 10) 5

[10, 15) 7

[15, 20) 8

[20, 25) 2

Calcular: La mediana y moda. Cuartil 2 y 3. Media.

xi [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, ) 2.5 7.5 12.5 17.5 22.5

fi 3 5 7 8 2 6 31

Fi 3 8 15 23 25 31

Moda

Mediana

Cuartiles

Media No se puede calcular la media, porque no se puede hallar la marca de clase del ltimo intervalo. Ejercicios y problemas resueltos de Estadstica II 1. A un conjunto de 5 nmeros cuya media es 7.31 se le aaden los nmeros 4.47 y 10.15. Cul es la media del nuevo conjunto de nmeros?

2.

2.. Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto colegio. La informacin obtenida aparece resumida en la siguiente tabla:

N de caries 0

fi 25

ni 0.25

1 2 3 4

20 x 15 y

0.2 z 0.15 0.05

1. Completar la tabla obteniendo los valores x, y, z. 2. Hacer un diagrama de sectores. 3. Calcular el nmero medio de caries.

1. Tabla La suma de las frecuencias relativas ha de ser igual a 1: 0.25 + 0.2 + z + 0.15 + 0.05 = 1 0.65 + z = 1 z = 0.35 La frecuencia relativa de un dato es igual su frecuencia absoluta dividida entre 100, que es la suma de las frecuencias absolutas.

N de caries 0 1

fi 25 20

ni 0.25 0.2

fi ni 0 20

2 3 4

35 15 5

0.35 0.15 0.05

70 45 20 155

2. Diagrama de sectores Calculamos los grados que corresponden a cara frecuencia absoluta.

25 3.6 = 90 20 3.6 = 72 35 3.6 = 126 15 3.6 = 54 5 3.6 = 18

3. Media aritmtica

3. Se tiene el siguiente conjunto de 26 datos: 4. 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 5. Obtener su mediana y cuartiles. 6. 7. En primer lugar ordenamos los datos de menor a mayor: 8. 3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20 9. Mediana 10. 26/2 = 13. 11. Como el nmero de datos es par la mediana es la media de las dos puntuaciones centrales: 12. 13. Cuartiles 14. 26/4 = 6.5 Q 1 = 7 15. Q 2 = Me = 10 16. (26 3)/4 = 19.5 Q 3 = 14

4. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 nios de su consulta en el momento de andar por primera vez:

Meses 9 10 11 12 13

Nios 1 4 9 16 11

14 15

8 1

1. Dibujar el polgono de frecuencias. 2. Calcular la moda, la mediana, la media y la varianza.

Polgono de frecuencias

xi 9 10 11 12 13

fi 1 4 9 16 11

Ni 1 5 14 30 41

xi fi 9 40 99 192 143

x i f i 81 400 1089 2304 1859

14 15

8 1 50

49 50

112 15 610

1568 225 7526

Moda Mo = 12 Mediana 50/2 = 25 Me = 12 Media aritmtica

Varianza

5. Completar los datos que faltan en la siguiente tabla estadstica:

xi 1 2 3 4 5 6

fi 4 4

Fi

ni 0.08

16 7 5 28 38

0.16 0.14

7 8

45

Calcular la media, mediana y moda de esta distribucin.

Tabla Primera fila:

F1 = 4 Segunda fila:

F2 = 4 + 4 = 8 Tercera fila:

Cuarta fila: N 4 = 16 + 7 = 23 Quinta fila:

Sexta fila:

28 + n 8 = 38

n 8 = 10

Sptima fila:

Octava fila:

N 8 = N = 50 n 8 = 50 45 = 5

xi 1 2 3 4 5 6 7 8

fi 4 4 8 7 5 10 7 5 50

Fi 4 8 16 23 28 38 45 50

ni 0.08 0.08 0.16 0.14 0.1 0.2 0.14 0.1

xi fi 4 8 24 28 25 60 49 40 238

Media artmtica

Mediana 50/2 = 25 Me = 5

Moda Mo = 6 6. Considrense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media y su varianza. 2. Si los todos los datos anteriores los multiplicamos por 3, cal ser la nueva media y varianza.

xi 2 3 4 6 8 10 33

xi2 4 9 16 36 64 100 229

7. El resultado de lanzar dos dados 120 veces viene dado por la tabla:

Sumas Veces

2 3

3 8

4 9

5 11

6 20

7 19

8 16

9 13

10 11

11 6

12 4

1. Calcular la media y la desviacin tpica. 2. Hallar el porcentaje de valores comprendidos en el intervalo (x , x + ).

xi 2 3 4 5 6 7 8 9 10 11 12

fi 3 8 9 11 20 19 16 13 11 6 4 120

xi fi 6 24 36 55 120 133 128 117 110 66 48 843

xi2 fi 12 72 144 275 720 931 1024 1053 1100 726 576 6633

2 x = 4.591 x + = 9.459 Los valores comprendidos en el intervalo (4.591, 9.459) son los

correspondientes a las sumas de 5, 6, 7, 8 y 9. 11 + 20 + 19 + 16 + 13 = 79

8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:

Altura N jugadores de

[170, 175) 1

[175, 180) 3

[180, 185) 4

[185, 190) 8

[190, 195) 5

[195, 2.00) 2

Calcular: 1. La media. 2. La mediana. 3. La desviacin tpica. 4. Cuntos jugadores se encuentran por encima de la media ms una desviacin tpica?

xi [1.70, 1.75) 1.725

fi 1

Fi 1

xi fi 1.725

xi2 fi 2.976

[1.75, 1.80) [1.80, 1.85) [1.85, 1.90) [1.90, 1.95) [1.95, 2.00)

1.775 1.825 1.875 1.925 1.975

3 4 8 5 2 23

4 8 16 21 23

5.325 7.3 15 9.625 3.95 42.925

9.453 13.324 28.128 18.53 7.802 80.213

Media

Mediana

Desviacin tpica

4 x + = 1.866+ 0.077 = 1.943 Este valor pertenece a un percentil que se encuentra en el penltimo intervalo.

Slo hay 3 jugadores por encima de x + . 9. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla:

1 fi a

2 32

3 35

4 33

5 b

6 35

Determinar a y b sabiendo que la puntuacin media es 3.6.

xi 1 2 3 4 5 6

fi a 32 35 33 b 35 135 + a + b

xi fi a 64 125 132 5b 210 511 + a + 5b

a = 29 b = 36

10. El histograma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

1. Formar la tabla de la distribucin. 2. Si Andrs pesa 72 kg, cuntos alumnos hay menos pesados que l? 3. Calcular la moda. 4. Hallar la mediana. 5. A partir de que valores se encuentran el 25% de los alumnos ms pesados?

1 xi [60,63 ) [63, 66) [66, 69) [69, 72) 61.5 64.5 67.5 70.5 fi 5 18 42 27 Fi 5 23 65 92

[72, 75)

73.5

8 100

100

2 5 + 18 + 42 + 27 = 92 alumnos ms ligeros que Andrs. Moda

Mediana

5 El valor a partir del cual se encuentra el 25% de los alumnos ms pesados es el cuartil tercero.

11. De esta distribucin de frecuencias absolutas acumuladas , calcular:

Edad [0, 2) [2, 4) [4, 6) [6, 8) [8, 10)

Fi 4 11 24 34 40

1. Media aritmtica y desviacin tpica. 2. Entre qu valores se encuentran las 10 edades centrales? 3. Representar el polgono de frecuencias absolutas acumuladas .

xi [0, 2) [2, 4) [4, 6) [6, 8) [8, 10) 1 3 5 7 9

fi 4 7 13 10 6 40

Fi 4 11 24 34 40

xi fi 4 21 65 70 54 214

xi2 fi 4 63 325 490 486 1368

Media y desviacin tpica

Los 10 alumnos representan el 25% central de la distribucin.

Debemos hallar P 3 7 .5 y P 6 2. 5 .

Las 10 edades centrales estn en el intervalo: [4.61, 6.2] . Polgono de frecuencias

12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de 1.60 m y la desviacin tpica es de 20 cm. Otra persona B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviacin tpica es de 15 cm. Cul de las dos ser ms alta respecto a sus conciudadanos?

La persona A es ms alta respecto a sus conciudadanos que la persona B. 13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguientes resultados: para el primer test la media es 6 y la desviacin tpica 1.5.

Para el segundo test la media es 4 y la desviacin tpica 0.5. Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relac in con el grupo, en cul de los dos tests obtuvo mejor puntuacin?

En el segundo test consigue mayor puntuacin. 14. La asistencia de espectadores a las 4 salas de un cine un determinado da fue de 200, 500, 300 y 1000 personas. 1. Calcular la dispersin del nmero de asistentes. 2. Calcular el coeficiente de variacin. 3. Si el da del espectador acuden 50 personas ms a cada sala, qu efecto tendra sobre la dispersin?

Desviacin tpica

Coeficiente de variacin

3 Si todas las salas tienen un incremento de 50 personas, la media

aritmtica tambin se ve incrementada en 50 personas. La desviacin tpica no vara, ya que sumamos la misma cantidad a cada dato de la serie.

La dispersin relativa es menor en el segundo caso.

INFERENCIA ESTADISTICA Inferencia estadstica Estudia como sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

TIPOS DE MUESTREO Muestreo probabilstico Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo: Muestreo aleatorio simple Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemtico

Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra. Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,..., 98 Muestreo aleatorio estratificado Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato.

En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin. Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos calcular unestadstico (media, desviacin tpica, proporcin, ...) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral

INTERVALOS CARACTERISTICOS P[ - K < X < + K ] = P Hallar el intervalo caracterstico de una distribucin normal N(0, 1)

correspondiente a la probabilidad p = 0.9.

El nivel de confianza (p) se designa mediante 1 - . El nivel de significacin se designa mediante . El valor crtico (k) como z P(Z>z
/2)

/2

.
/2]

= /2

P[-z

/2

< z < z

= 1-

Valores crticos 1 - /2 z
/2

0.90

0.05

1.645

0.95

0.025

1.96

0.99

0.005

2.575

En una distribucin N(, ) el intervalo caracterstico correspondiente a una probabilidad p = 1 - es: ( - z , + z )

/2

/2

1 -

/2

/2

Intervalos caractersticos

0.90

0.05

1.645

( - 1.645 , + 1.645 )

0.95

0.025

1.96

( - 1.96 , + 1.96 )

0.99

0.005

2.575

( - 2.575 , + 2.575 )

TEOREMA CENTRAL DEL LIMITE Si una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30, cualquier tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la distribucin:

Consecuencias: 1.Permite averiguar la probabilidad de que la media de una muestra concreta est en un cierto intervalo. 2.Permite calcular la probabilidad de que la suma de los elementos de una muestra est, a priori, en un cierto intervalo.

3.Inferir la media de la poblacin a partir de una muestra.

Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades. 1.Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g.

2.Calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg.

Estimacin de parmetros

Es el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra. Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero tambin necesitamos precisar un: Intervalo de confianza

Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico. Nivel de confianza Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. Error de estimacin admisible Que estar relacionado con el radio del intervalo de confianza. ESTIMACION DE LA MEDIA DE UNA POBLACION Intervalo de confianza para la media El intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1- , siendo x la media de una muestra de tamao n y la desviacin tpica de la poblacin, es:

El error mximo de estimacin es:

Cuanto mayor sea el tamao de la muestra, n, menor es el error. Cuanto mayor sea el nivel de confianza, 1-, mayor es el error. Tamao de la muestra

Si aumentamos el nivel de confianza, aumenta el tamao de la muestra. Si disminuimos el error, tenemos que aumentar el tamao de la muestra.

El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviacin tpica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obt uvo un tiempo medio de 5,2 minutos. 1.Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.

2.Indica el tamao muestral necesario para estimar dicho tiempo medio con un el error de 0,5 minutos y un nivel de confianza del 95%.

n 4 ESTIMACION DE UNA PROPORCION

Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la proporcin p' , de individuos con dicha caracterstica en

las muestras de tamao n, se distribuirn segn:

Intervalo de confianza para una proporcin

El error mximo de estimacin es:

En una fbrica de componentes electrnicos, la proporcin de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analiz una muestra aleatoria de 500 componentes, encontrndose que 90 de ellos eran defectuosos. Qu nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido

variaciones? p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02

P (1 - z / 2 <1.12) = 0.86861 - 0.8686 = 0.1314 0.8686 - 0.1314 = 0.737 Nivel de confianza: 73.72% Contrastes de hiptesis

Hiptesis estadsticas Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor de un parmetro desconocido de una poblacin. La hiptesis emitida se designa por H 0 y se llama HIPTESIS NULA . La hiptesis contraria se designa por H 1 y se llama HIPTESIS ALTERNATIVA . Contrastes de hiptesis 1. Enunciar la hiptesis nula H 0 y la alternativa H 1 . H1 k H1 < k H1> k

Bilateral

H 0 =k H0 k

Unilateral H 0 k

2. A partir de un nivel de confianza 1 - o el de significacin . Determinar: El valor z /2 (bilaterales), o bien z (unilaterales) La zona de aceptacin del parmetro muestral (x o p'). 3. Calcular: x o p', a partir de la muestra. 4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un nivel de significacin . Si no, se rechaza. CONTRASTE BILATERAL Se presenta cuando la hiptesis nula es del tipo H 0 : = k (o bien H 0 : p = k) y la hiptesis alternativa, por tanto, es del tipo H 1 : k (o bien H 1 : p k).

El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media. La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o p', es decir:

o bien:

Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%? 1. Enunciamos las hiptesis nula y alternativa: H0 : = 6 H1 : 6 La nota media no ha variado. La nota media ha variado.

2. Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z / 2 = 1.96. Determinamos el intervalo de confianza para la media: (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 3. Verificacin. Valor obtenido de la media de la muestra: 5,6 . 4. Decisin

Aceptamos la hiptesis nula H 0 , con un nivel de significacin del 5%. CONTRASTE UNILATERAL

Caso 1 La hiptesis nula es del tipo H 0 : k (o bien H 0 : p k). La hiptesis alternativa, por tanto, es del tipo H 1 : < k (o bien H 1 : p < k). Valores crticos 1 - 0.90 0.95 0.99 0.10 0.05 0.01 z

1.28 1.645 2.33

El nivel de significacin se concentra en una parte o cola. La regin de aceptacin en este caso ser:

o bien:

Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con un nivel de significacin del 1%, si se puede admitir el pronstico. 1. Enunciamos las hiptesis nula y alternativa: H 0 : p 0.40 H 1 : p < 0.40 La abstencin ser como mnimo del 40%. La abstencin ser como mximo del 40%;

2. Zona de aceptacin Para = 0.01, le corresponde un valor crtico: z = 2.33. Determinamos el intervalo de confianza para la media:

3.Verificacin.

4.Decisin

Aceptamos

la

hiptesis

nula H 0 .

Podemos

afirmar,

con

un

nivel

de

significacin del 1%, que la La abstencin ser como mnimo del 40%.

Caso 2 La hiptesis nula es del tipo H 0 : k (o bien H 0 : p k). La hiptesis alternativa, por tanto, es del tipo H 1 : > k (o bien H 1 : p > k).

El nivel de significacin se concentra en la otra parte o cola. La regin de aceptacin en este caso ser:

o bien:

Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 . Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida? 1. Enunciamos las hiptesis nula y alternativa: H 0 : 120 H 1 : > 120 2.Zona de aceptacin Para = 0.1, le corresponde un valor crtico: z = 1.28 . Determinamos el intervalo de confianza:

3. Verificacin. Valor obtenido de la media de la muestra: 128 . 4. Decisin No aceptamos la hiptesis nula H 0 . Con un nivel de significacin del 10%. Errores de tipo I y tipo II

Error de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza. Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta.

H0

Verdadera Decisn correcta

Falsa Decisin ERROR DE TIPO II TIPO I Decisin correcta

Aceptar Probabilidad = 1 - ERROR Rechazar Probabilidad = DE

La probabilidad de cometer Error de tipo I es el nivel de significacin . La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n. RESUMEN DEL CAPITULO Inferencia estadstica Estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos. Muestreo probabilstico Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos:

Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos que contiene la muestra. Muestreo aleatorio sistemtico: Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra. Muestreo aleatorio estratificado: Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato. Intervalos caractersticos El nivel de confianza (p) se designa mediante 1 - . El nivel de significacin se designa mediante . El valor crtico (k) como z P(Z>z
/2)

/2

.
/2]

= /2

P[-z

/2

< z < z

= 1-

En una distribucin N(, ) el intervalo caracterstico correspondiente a una probabilidad p = 1 - es: ( - z , + z )

/2

/2

1 -

/2

/2

Intervalos caractersticos

0.90

0.05

1.645

( - 1.645 , + 1.645 )

0.95

0.025

1.96

( - 1.96 , + 1.96 )

0.99

0.005

2.575

( - 2.575 , + 2.575 )

Distribucin de las medias muestrales Teorema central del lmite Si una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30, cualquier tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la distribucin:

Consecuencias: 1.Permite averiguar la probabilidad de que la media de una muestra concreta est en un cierto intervalo. 2.Permite calcular la probabilidad de que la suma de los elementos de una muestra est, a priori, en un cierto intervalo.

3.Inferir la media de la poblacin a partir de una muestra.

Estimacin

Intervalo

de

confianza

Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico.

Nivel de confianza.

de

confianza

Probabilidad de que el parmetro a estimar se encuentre en el intervalo

Error

de

estimacin

admisible

Que estar relacionado con el radio del intervalo de confianza. Estimacin de la media de una poblacin Intervalo de confianza para la media El intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1- , siendo x la media de una muestra de tamao n y la desviacin tpica de la poblacin, es:

El error mximo de estimacin es:

Tamao de la muestra

Estimacin de una proporcin

Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la proporcin p' , de individuos con dicha caracterstica en las muestras de tamao n, se distribuirn segn:

Intervalo de confianza para una proporcin

El error mximo de estimacin es:

Hiptesis estadsticas Un TEST ESTADSTICO es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o

rechazar una hiptesis previamente emitida sobre el valor de un parmetro desconocido de una poblacin. La hiptesis emitida se designa por H 0 y se llama HIPTESIS NULA . La hiptesis contraria se designa por H 1 y se llama HIPTESIS

ALTERNATIVA .

Contrastes de hiptesis 1. Enunciar la hiptesis nula H 0 y la alternativa H 1 . Bilateral H 0 =k H0 k H1 k H1 < k

Unilateral

H 0 k

H1> k

2. A partir de un nivel de confianza 1 - o el de significacin . Determinar: El valor z /2 (bilaterales), o bien z (unilaterales) La zona de aceptacin del parmetro muestral (x o p'). 3. Calcular: x o p', a partir de la muestra. 4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un nivel de significacin . Si no, se rechaza. Contraste Bilateral Se presenta cuando la hiptesis nula es del tipo H 0 : = k (o bien H 0 : p = k) y la hiptesis alternativa, por tanto, es del tipo H 1 : k (o bien H 1 : p k). El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media. La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o p', es decir:

o bien:

Contraste unilateral Caso 1 La hiptesis nula es del tipo H 0 : k (o bien H 0 : p k). La hiptesis alternativa, por tanto, es del tipo H 1 : < k (o bien H 1 : p < k). Valores crticos 1 - 0.90 0.95 0.99 0.10 0.05 0.01 z

1.28 1.645 2.33

La regin de aceptacin en este caso ser:

o bien:

Caso 2 La hiptesis nula es del tipo H 0 : k (o bien H 0 : p k).

La hiptesis alternativa, por tanto, es del tipo H 1 : > k (o bien H 1 : p > k). La regin de aceptacin en este caso ser:

o bien:

Errores Error de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza. Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta.

H0

Verdadera

Falsa

Decisn Aceptar Probabilidad = 1 -

correcta

Decisin ERROR DE TIPO II

ERROR Rechazar

DE

TIPO

I Decisin correcta

Probabilidad =

La probabilidad de significacin .

cometer Error

de

tipo

I es

el nivel

de

La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n. Inferencia estadstica. Ejercicios y problemas 1 En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan ms a sus habitante s. Para ello van a ser encuestados 100 individuos elegidos al azar. 1.Explicar qu procedimiento de seleccin sera ms adecuado utilizar: muestreo con o sin reposicin. Por qu? Todas las frmulas que hemos estudiado de teora del muestreo y de inferencia estadstica presuponen que las poblaciones son infinitas o que, si no lo son, el muestreo aleatorio se realiza con reposicin.

2.Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 nios, 7.000 adultos y 500 ancianos, post eriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. Determinar el tamao muestral correspondiente a cada estrato. Para efectuar un muestreo aleatorio estratificado, ser necesario que la muestra refleje fielmente los estratos existentes en la poblacin; deben

considerarse los estratos formados por: nios, adultos y ancianos. El tamao muestral de cada estrato deber ser proporcional a la presencia del mismo en la poblacin original: Poblacin total: 2500 + 7000 + 500 = 10 000.

2 Sea la poblacin de elementos: {22,24, 26}.

1.Escriba todas las muestras posibles de tamao dos, escogidas mediante muestreo aleatorio simple. M 1 = {22, 24}, M 1 = {22, 26}, M 1 = {24, 26}

2.Calcule la varianza de la poblacin.

3.Calcule la varianza de las medias muestrales.

3 La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m. Cul

es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

4 Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida:

1.Cul es la distribucin de la media muestral?

2.Determine el intervalo de confianza, al 95%, para la media poblacional.

95%

z /2 =1.96

(104 - 1.96 1. 25, 104 + 1.9 1.25) = (101.55; 106.45) 5 La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m 2 .

1.Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la poblacin. n=400 1- =0.95 (1.75 1.96 0.4/20 ) x =1.75 =0.4 z
/2 =1.96

(1.7108,1.7892)

2.Cul sera el mnimo tamao muestral necesario para que pueda decirse que la verdadera media de las estaturas est a menos de 2 cm de la media muestral, con un nivel de confianza del 90%?

La muestra debe tener al menos 1083 personas. 6 Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley normal, con desviacin tpica 900 . En un estudio estadstico de las

ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 .

1. Cul ha sido la media de las ventas en estos nueve meses? n = 9 x = (4663 + 5839) / 2; x =5251

2. Cul es el nivel de confianza para este intervalo? E= ( 5839 - 4663) / 2 = 588 588 = z / 2 900 / 3 1- = 0.95 7 Se desea estimar la proporcin, p, de individuos daltnicos de una poblacin a travs del porcentaje observado en una muestra aleatoria de individuos, de tamao n. 95% z / 2 = 1.96

1. Si el porcentaje de individuos daltnicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimacin sea inferior al 3,1%. 1- =0.95 z / 2 =1.96

Al menos 840 individuos.

2.Si el tamao de la muestra es de 64 individuos, y el porcentaje de individuos daltnicos en la muestra es del 35%, determina, usando un nivel de significacin del 1%, el correspondiente intervalo de confianza para la proporcin de daltnicos de la poblacin. =0.01 1- =0.99 z / 2 =2.575

8 En una poblacin una variable aleatoria sigue una ley normal de media desconocida y desviacin tpica 2.

1.Observada una muestra de tamao 400, tomada al azar, se ha obtenido una media muestra al igual a 50. Calcule un intervalo, con el 97 % de confianza, para la media de la poblacin.

2.Con el mismo nivel de confianza, qu tamao mnimo debe tener la muestra para qu la amplitud del intervalo que se obtenga sea, como mximo, 1?

n 76 9 Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se eligieron 300 nueces al azar y se detectaron 21 vacas. 1.Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca?

Enunciamos las hiptesis nula y alternativa:

H 0 : p 0.06 H 1 : p >0.06

2Zona de aceptacin = 0.01 z = 2.33.

Determinamos el intervalo de confianza:

3Verificacin.

4Decisin Aceptamos la hiptesis nula H 0 . Con un nivel de significacin del 1%.

2.Si se mantiene el porcentaje muestral de nueces que estn vacas y 1 - = 0.95, qu tamao muestral se necesitara para estimar la proporcin de nueces con un error menor del 1% por ciento? 1 - = 0, 9 5 z = 1, 96

/2

10 La duracin de la bombillas de 100 W que fabrica una empresa sigue una distribucin normal con una desviacin tpica de 120 horas de duracin. Su vida media est garantizada durante un mnimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, despus de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significacin de 0,01, habra que rechazar el lote por no cumplir la garanta? 1 Enunciamos las hiptesis nula y alternativa:

H 0 : 800 H 1 : <800

2Zona de aceptacin = 0.01; z = 2.33

Determinamos el intervalo de confianza:

3Verificacin. x = 750

4Decisin Rechazamos la hiptesis nula H 0 . Con un nivel de significacin del 1%. Inferencia. Ejercicios 1 En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 departamento de atencin al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. 1.Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados? Utilizaremos un muestreo aleatorio estratifica do, ya que queremos que haya representantes de cada uno de los departamentos.

2.Qu

nmero

de

trabajadores

tendramos

que

seleccionar

en

cada

departamento atendiendo a un criterio de proporcionalidad?

2 La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de 2g/dl. Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.

3 Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una

desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta muestra tendr una duracin media de 2320 horas. Se puede aceptarr la hiptesis de validez del nuevo proceso de fabricacin con un riesgo igual o menor al 5%? 1 Enunciamos las hiptesis nula y alternativa:

H 0 : = 2400 H 1 : 2400 2Zona de aceptacin = 0.05 z = 1.96.

Determinamos el intervalo de confianza para la media:

3Verificacin. Valor obtenido de la media de la muestra: 2320 . 4Decisin Rechazamos la hiptesis nula H 0 , con un nivel de significacin del 5%. 4 El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin. Hasta ahora el tiemp o de duracin en conversacin segua una distribucin normal con media 300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote producido, antes de enviarlo al mercado,

se obtuvo que de una muestra de 60 bateras el tiempo medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica: Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significacin del 1%? 1 Enunciamos las hiptesis nula y alternativa:

H 0 : 300 H 1 : < 300 2Zona de aceptacin = 0.01 z = 2.33.

Determinamos el intervalo de confianza:

3Verificacin. = 290 4Decisin Rechazamos la hiptesis nula H 0 . Con un nivel de significacin del 1%. 5 Se cree que el nivel medio de protombina en una poblacin normal es de 20 mg/100 ml de plasma con una desviacin tpica de 4 miligramos/100 ml. Para

comprobarlo, se toma una muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la hiptesis, con un nivel de significacin del 5%? 1 Enunciamos las hiptesis nula y alternativa:

H 0 : =20 mg/100 ml H 1 : 20 mg/100 ml 2Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z / 2 = 1.96. Determinamos el intervalo de confianza para la media:

3Verificacin. Valor obtenido de la media de la muestra: 18.5. 4Decisin Rechazamos la hiptesis nula H 0 , con un nivel de significacin del 5%.

COMBINATORIA Conceptos de combinatoria En todo problema combinatorio hay varios conceptos claves que debemos distinguir: 1. Poblacin

Es el conjunto de elementos que estamos estudiando. Denominaremos con m al nmero de elementos de este conjunto. 2. Muestra Es un subconjunto de la poblacin. Denominaremos con n al nmero de elementos que componen la muestra. Los diferentes tipos de muestra vienen determinados por dos aspectos: Orden Es decir, si es importante que los elementos de la muestra aparezcan ordenados o no. Repeticin La posibilidad de repeticin o no de los elementos. Factorial de un nmero natural Es el producto de los n factores consecutivos desde n hasta 1. El factorial de un nmero se denota por n!.

Ejemplo Calcular factorial de 5.

VARIACIONES

Se llama variaciones ordinarias de m elementos tomados de n en n (m n) a los distintos grupos formados por n elementos de forma que: No entran todos los elementos. S importa el orden. No se repiten los elementos.

Tambin podemos calcular las variaciones mediante factoriales:

Las variaciones se denotan por Ejemplos 1. Calcular las variaciones de 6 elementos tomados de tres en tres.

2.Cuntos nmeros de tres cifras diferentes se puede formar con los dgitos: 1, 2, 3, 4, 5 ? m = 5n = 3 m n No entran todos los elementos. De 5 dgitos entran slo 3.

S importa el orden. Son nmeros distintos el 123, 231, 321. No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.

3.Cuntos nmeros de tres cifras diferentes se puede formar con los dgitos: 0, 1, 2, 3, 4, 5 ? m = 6n = 3 m n Tenemos que separar el nmero en dos bloques:

El primer bloque, de un nmero, lo puede ocupar slo uno de 5 dgitos porque un nmero no comienza por cero (excepto los de las matriculas, los de la lotera y otros casos particulares), m = 5 n= 1

El segundo bloque, de dos nmeros, lo puede ocupar cualquier dgito menos el inicial. m = 5 n= 2

4. A un concurso literario se han presentado 10 candidatos con sus novelas. El cuadro de honor lo forman el ganador, el finalista y un accsit. Cuntos cuadros de honor se pueden formar? m = 10n = 3 No entran todos los elementos. De 10 candidatos entran slo 3. S importa el orden. No es lo mismo quedar ganador que finalista. No se repiten los elementos. Suponemos que cada candidato presenta una sola obra.

VARIACIONES CON REPETICION Se llaman variaciones con repeticin de m elementos tomados de n en n a los distintos grupos formados por n elementos de manera que: No entran todos los elementos si m > n. S pueden entrar todos los elementos si m n S importa el orden. S se repiten los elementos.

Ejemplos 1. Cuntos nmeros de tres cifras se puede formar con los dgitos: 1, 2, 3, 4, 5 ?

m = 5

n= 3

No entran todos los elementos. De 5 dgitos entran slo 3. S importa el orden. Son nmeros distintos el 123, 231, 321. S se repiten los elementos.

2. Cuntos nmeros de tres cifras se puede formar con los dgitos: 0, 1, 2, 3, 4, 5? m = 6 n= 3

Tenemos que separar el nmero en dos bloques:

El primer bloque, de un nmero, lo puede ocupar slo uno de 5 dgitos porque un nmero no comienza por cero (excepto los de las matriculas, los de la lotera y otros casos particulares). m = 5 n= 1

El segundo bloque, de dos nmeros, lo puede ocupar cualquier dgito. m = 6 n= 2

3. Cuntas quinielas de una columna han de rellenarse para asegurarse el acierto de los 15 resultados? m = 3 n = 15 m < n

S entran todos los elementos. En este caso el nmero de orden es mayor que el nmero de elementos. S importa el orden. S se repiten los elementos.

PERMUTACIONES Se llama permutaciones de m elementos (m = n) a las diferentes

agrupaciones de esos m elementos de forma que: S entran todos los elementos. S importa el orden. No se repiten los elementos.

Ejemplos 1. Calcular las permutaciones de 6 elementos. P 6 = 6! = 6 5 4 3 2 1 = 720

2. Cuntos nmeros de 5 cifras diferentes se puede formar con los dgitos: 1, 2, 3, 4, 5? m = 5 n= 5

S entran todos los elementos. S importa el orden. No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes.

3. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas? S entran todos los elementos. Tienen que sentarse las 8 personas. S importa el orden. No se repiten los elementos. Una persona no se puede repetir.

PERMUTACIONES CIRCULARES Es un caso particular de las permutaciones. Se utilizan cuando los elementos se han de ordenar "en crculo", (por ejemplo, los comensales en una mesa), de modo que el primer elemento que "se site" en la muestra determina el principio y el final de muestra.

Ejemplos 1. Calcular las permutaciones circulares de 7 elementos. PC 7 = (7 1)! = 6! = 6 5 4 3 2 1 = 720

2. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa redonda?

PERMUTACIONES CON REPETICION Permutaciones con repeticin de n elementos donde el primer elemento se repite a veces , el segundo b veces , el tercero c veces, ... n = a + b + c + ... Son los distintos grupos que pueden formarse con esos n elementos de forma que : S entran todos los elementos. S importa el orden. S se repiten los elementos.

Ejemplos

Calcular las permutaciones con repeticin de:

2. Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; cuntos nmeros de nueve cifras se pueden formar? m = 9 a= 3 b =4 c= 2 a + b + c= 9

S entran todos los elementos. S importa el orden. S se repiten los elementos.

3. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve banderas? S entran todos los elementos. S importa el orden. S se repiten los elementos.

COMBINACIONES Se llama combinaciones de m elementos tomados de n en n (m n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. No importa el orden. No se repiten los elementos.

Tambin podemos calcular las combinaciones mediante factoriales:

Las combinaciones se denotan por Ejemplos 1. Calcular el nmero de combinaciones de 10 elementos tomados de 4 en 4.

2. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos. Cuntos comits diferentes se pueden formar? No entran todos los elementos. No importa el orden: Juan, Ana. No se repiten los elementos.

COMBINACIONES CON REPETICION Las combinaciones con repeticin de m elementos tomados de n en n (m n), son los distintos grupos formados por n elementos de manera que: No entran todos los elementos. No importa el orden. S se repiten los elementos.

Ejemplo En una bodega hay en un cinco tipos diferentes de botellas. De cuntas formas se pueden elegir cuatro botellas? No entran todos los elementos. Slo elije 4.. No importa el orden. Da igual que elija 2 botellas de ans y 2 de ron, que 2 de ron y 2 de ans.

S se repiten los elementos. Puede elegir ms de una botella del mismo tipo.

NUMEROS COMBINMATORIOS

El nmero

se llama tambin nmero combinatorio. Se representa

por

y se lee "m sobre n".

Ejemplo

Propiedades de los nmeros combinatorios

1.

2. Los nmeros de este tipo se llaman complementarios.

3.

Ejemplo Hallar el nmero de combinaciones de 75 elementos de orden 72.

TRIANGULO DE PASCAL O DE TARTAGLIA El tringulo de nmeros combinatorios de Tartaglia o de Pascal (debido a que fue este matemtico quien lo populariz) es un tringulo de nmeros enteros, infinito y simtrico, del que podemos ver sus primeras lneas:

Propiedades del Tringulo de Pascal o de Tartaglia 1. El nmero superior es un 1, la segunda fila corresponde a los nmeros combinatorios de 1, la tercera de 2, la cuarta de 3 y as sucesivamente. 2.Todas la filas empiezan y acaban en 1.

3.Todas las filas son simtricas.

4.Cada nmero se obtiene sumando los dos que estn situados sobre l. Aplicando estas propiedades podemos escribir el tringulo de Pascal:

El tringulo de Pascal o de Tartaglia nos ser muy til para calcular los coefecientes del binomio de Newton. BINOMIO DE NEWTON La frmula que nos permite hallar las potencias de un binomio se conoce como binomio de Newton.

Podemos observar que:

El nmero de trminos es n+1.

Los coeficientes son nmeros combinatorios que corresponden a la fila ensima del tringulo de Tartaglia.

En el desarrollo del binomio los exponentes de a van disminuyendo, de uno en uno, de n a cero; y los exponentes de b vanaumentando, de uno en uno, de cero a n, de tal manera que la suma de los exponentes de a y de b en cada trmino es igual a n. En el caso que uno de los trminos del binomio sea negativo, se alternan los signos positivos y negativos.

Ejercicios del binomio de Newton

1.

2.

Clculo del trmino que ocupa el lugar k

Ejemplos 1.El trmino quinto del desarrollo de es:

2.El trmino cuarto del desarrollo de

es:

3.Hallar el trmino octavo del desarrollo de

RESUMEN CAPITULO Factorial de un nmero natural Es el producto de los n factores consecutivos desde n hasta 1. El factorial de un nmero se denota por n!.

Variaciones Se llama variaciones ordinarias de m elementos tomados de n en n (m n) a los distintos grupos formados por n elementos de forma que: No entran todos los elementos. S importa el orden. No se repiten los elementos.

Tambin podemos calcular las variaciones mediante factoriales:

Las variaciones se denotan por Variaciones con repeticin Se llama variaciones con repeticin de m elementos tomados de n en n a los distintos grupos formados por n elementos de manera que: No entran todos los elementos si m > n. S pueden entrar todos los elementos si m n S importa el orden. S se repiten los elementos.

Permutaciones S entran todos los elementos. S importa el orden. No se repiten los elementos.

Permutaciones circulares Se utilizan cuando los elementos se han de ordenar "en crculo", (por ejemplo, los comensales en una mesa), de modo que el primer elemento que "se site" en la muestra determina el principio y el final de muestra.

Permutaciones con repeticin Permutaciones con repeticin de m elementos donde el primer

elemento se repite a veces , el segundo b veces , el tercero c veces, ...(m = a + b + c + ... = n) son los distintos grupos que pueden formarse con esos m elementos de forma que : S entran todos los elementos. S importa el orden. S se repiten los elementos.

Combinaciones Se llama combinaciones de m elementos tomados de n en n (m n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. No importa el orden. No se repiten los elementos.

Tambin podemos calcular las combinaciones mediante factoriales:

Combinaciones con repeticin Las combinaciones con repeticin de m elementos tomados de n en n (m n), son los distintos grupos formados por n elementos de manera que: No entran todos los elementos. No importa el orden. S se repiten los elementos.

Nmeros combinatorios

El nmero

se llama tambin nmero combinatorio. Se representa

por

y se lee "m sobre n".

Propiedades de los nmeros combinatorios

1.

2.

3. Binomio de Newton La frmula que nos permite hallar las potencias de un binomio se conoce como binomio de Newton.

Ejercicios de combinatoria 1 De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y tesorero de un club de ftbol sabiendo qu e hay 12 posibles candidatos? No entran todos los elementos. S importa el orden. No se repiten los elementos.

2 Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que empiecen por vocal? La palabra empieza por i u o seguida de las 4 letras restantes tomadas de 4 en 4. S entran todos los elementos. S importa el orden. No se repiten los elementos.

3 De cuntas formas pueden mezclarse los siete colores del arco iris tomndolos de tres en tres? No entran todos los elementos. No importa el orden. No se repiten los elementos.

4 Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares? Cuntos de ellos son mayores de 70.000? S entran todos los elementos. S importa el orden. No se repiten los elementos.

Si es impar slo puede empezar por 7 u 9.

5 De cuntos partidos consta una liguilla formada por cuatro equipos? No entran todos los elementos. S importa el orden. No se repiten los elementos.

6 A una reunin asisten 10 personas y se intercambian saludos entre todos. Cuntos saludos se han intercambiado? No entran todos los elementos. No importa el orden. No se repiten los elementos.

7 Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son pares? S entran todos los elementos: 3 < 5 S importa el orden. S se repiten los elementos.

Si el nmero es par tan slo puede terminar en 2.

9 De cuntas formas pueden colocarse los 11 jugadores de un equipo de ftbol teniendo en cuenta que el portero no puede ocupar otra posicin distinta de la portera? Disponemos de 10 jugadores que pueden ocupar 10 posiciones distintas. S entran todos los elementos. S importa el orden. No se repiten los elementos.

10 Con el punto y raya del sistema Morse, cuntas seales distintas se pueden enviar, usando como mximo cuatro pulsaciones? No entran todos los elementos en un caso y s entran en lo otros S importa el orden. S se repiten los elementos.

11 Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se pueden sentar, si el presidente y el secretario siempre van juntos? Se forman dos grupos el primero de 2 personas y el segundo de 7 personas, en los dos se cumple que: S entran todos los elementos. S importa el orden. No se repiten los elementos.

12 Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus vrtices? Vamos a determinar en primer lugar las rectas que se pueden trazar entre 2 vrtices. No entran todos los elementos. No importa el orden. No se repiten los elementos.

Son

, a las que tenemos que restar los lados que determinan 5 rectas que

no son diagonales.

13 Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y 3 mujeres. De cuntas formas puede formarse, si: 1. Puede pertenecer a l cualquier hombre o mujer.

2. Una mujer determinada debe pertenecer al comit.

3. Dos hombres determinados no pueden estar en el comit.

Combinatoria. Ejercicios 1 Halla el nmero de capicas de ocho cifras. Cuntos capicas hay de nueve cifras?

2 Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de qumica se colocan en un estante. De cuntas formas distintas es posible ordenarlos si: 1. Los libros de cada asignatura deben estar todos juntos.

2.Solamente los libros de matemticas deben estar juntos.

3 Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de dinero puede formar con las cinco monedas?

4 Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?

6 Resolver las ecuaciones combinatorias:

1.

2.

3.

4.

7 Resolver las ecuaciones: 1.

2.

3.

8 Resolver las ecuaciones combinatorias:

1.

2.

3.

27 no es solucin porque el nmero de orden en las combinaciones es menor que el nmero de elementos. 9 Resolver las ecuaciones combinatorias:

1. Por la 2 propiedad de los nmeros combinatorios, se tiene:

2. Por la 3 propiedad de los nmeros combinatorios, se tiene: x = 4

3.

4.