Вы находитесь на странице: 1из 41

Tema 1. Probabilidad. 1

Problemas Resueltos del Tema 1

1- Un estudiante responde al azar a dos preguntas de verdadero o falso. Escriba el espacio muestral de este experimento aleatorio.

Solución.

El espacio muestral es el conjunto de todos los sucesos elementales. Los sucesos elementales son cada uno de los resultados posibles del experimento aleatorio, indescomponibles en otros más simples. Como el experimento consiste en responder al azar a dos preguntas, cada uno de los posibles patrones de respuesta constituirá un suceso elemental. Un patrón de respuesta sería contestar verdadero a la primera pregunta y verdadero a la segunda, lo representamos (V, V). Con esta representación podemos escribir el espacio muestral como:

E = {(V, V) (V, F) (F, V) (F, F)}

2- Otro estudiante responde al azar a 4 preguntas del mismo tipo anterior.

a) Escriba el espacio muestral.

b) Escriba el suceso responder “falso” a una sola pregunta.

c) Escriba el suceso responder “verdadero” al menos a 3 preguntas.

d) Escriba la unión de estos dos sucesos, la intersección y la diferencia del 2º y el 1º.

e) La colección formada por estos 5 sucesos, más el suceso seguro y el suceso imposible ¿Constituyen un sigma-álgebra?

Solución

a) Con la misma convención del problema anterior, los sucesos elementales serían:

(V, V, V, V) (F, V, V, V) (F, V, V, F) (F, V, F, F)

(V, V, V, F) (V, V, F, F) (F, V, F, V) (F, F, V, F)

(V, V, F, V) (V, F, V, F) (F, F, V, V) (F, F, F, V)

(V, F, V, V) (V, F, F, V) (V, F, F, F) (F, F, F, F)

b) El Suceso responder falso a una sola pregunta será el subconjunto del espacio muestral formado por todos los sucesos elementales en que solo hay una respuesta falso, lo llamaremos A y será:

A = {(V, V, V, F) » (V, V, F, V) » (V, F, V, V) » (F, V, V, V)}

c) El suceso responder verdadero al menos a 3 preguntas, lo llamaremos B y será:

B = {(V, V, V, F) » (V, V, F, V) » (V, F, V, V) » (F, V, V, V) » (V, V, V, V)}

d) Observando los sucesos elementales que los componen se deducen inmediatamente los siguientes resultados:

A » B = B

A « B = A

B- A = {(V, V, V, V)}

2 Problemas de Análisis de Datos. José M. Salinas

e) La colección formada por el suceso A, el B, la unión de ambos, su intersección, y su diferencia, más el suceso seguro y el suceso imposible, no constituye un sigma-álgebra. Para demostrarlo basta comprobar que se incumple una de las dos condiciones. Por ejemplo, el suceso A incumple la segunda porque su contrario no pertenece a la colección.

3- Una rata es colocada en una caja con tres pulsadores de colores rojo, azul y blanco. Si pulsa dos veces las palancas al azar:

a) ¿Cuál es la probabilidad de que las dos veces pulse la roja?

b) ¿Cuál es la probabilidad de que pulse la primera vez o la segunda o ambas la tecla azul?

Solución

a) Para que las dos veces pulse la roja tiene que ocurrir que la primera vez pulse la roja y la segunda también pulse la roja, es decir que se verifique el suceso (R1 « R2). Ahora bien , como ambos sucesos son independientes, la probabilidad de la intersección es igual al producto de las probabilidades de ambos sucesos. La probabilidad de estos sucesos se determina mediante la regla de Laplace de casos favorables (uno), partido por casos posibles (tres)

P(R1 « R2) = P(R1) · P(R2) = 1/3 · 1/3 = 1/9

b) En este apartado, claramente, nos piden la probabilidad de la unión de los sucesos pulsar azul la primera vez y pulsar azul la segunda. Ahora bien, estos dos sucesos no son incompatibles, luego la probabilidad de la unión será igual a la suma de las probabilidades menos la probabilidad de la intersección. La probabilidad de la intersección, al igual que en el apartado anterior, se calcula basándonos en el hecho de que son independientes.

P(A1 » A2) = P(A1) + P(A2) – P(A1 « A2) = 1/3 + 1/3 – 1/9 = 5/9

4- Como todo el mundo sabe, la probabilidad de que en una ruleta salga 10 veces seguidas el color rojo es muy pequeña. Habiendo salido 9 veces seguidas el rojo, un jugador apuesta al negro ¿Qué probabilidad tiene de ganar?

Solución

Para que el jugador gane tiene que ocurrir la secuencia R1, R2,

sabemos ya se ha producido R1, R2,

probabilidad de que salga negro en el décimo lanzamiento, condicionada por que haya salido rojo en las nueve anteriores. Por la definición de probabilidad condicionada:

, R9, N10. Como

, R9. La probabilidad que buscamos será la

(

P N

10 /

R

1

I

R

2

I

I

R 9

)

=

(

P N

10

I

R

1

I

R

2

I

I

R

9

)

(

P R

1

I

R

2

I

I

R

9

)

=

0,5

10

0,5

9

=

0,5

Como vemos el hecho de que previamente haya salido nueve veces rojo no cambia la probabilidad de que salga la décima vez. Esto es así porque cada lanzamiento es

independiente de los restantes. (Nota. En realidad la probabilidad de que salga rojo o negro en una ruleta no es exactamente 0,5, sino 18/37 ya que además de los 18 números rojos y los 18 negros, existe el

Tema 1. Probabilidad. 3

cero que no tiene asignado color, pero este dato no cambia el razonamiento hecho y el resultado sería

18/37)

5- En una asignatura se ha decidido aprobar a aquellos que superen uno de los dos

parciales. Con este criterio aprobó el 80%, sabiendo que el primer parcial lo superó el

60% y el segundo el 50% ¿Cuál hubiese sido el porcentaje de aprobados, si se hubiese exigido superar ambos parciales?

Solución

Sea A1 el suceso aprobar el primer parcial y A2 aprobar el segundo. Los datos del problema nos dicen que:

P(A1 » A2) = 0,8

P(A1) = 0,6

P(A2) = 0,5

Y se pide la probabilidad de la intersección de ambos sucesos. Como A1 y A2 no son

incompatibles, la probabilidad de la unión será:

P(A1 » A2) = P(A1) + P(A2) – P(A1 « A2)

Despejando tenemos:

P(A1 « A2) = P(A1) + P(A2) – P(A1 » A2)

Sustituyendo los valores numéricos:

P(A1 « A2) = 0,6 + 0,5 – 0,8 = 0,3

La conclusión es que si se hubiese exigido aprobar los dos parciales el porcentaje de aprobados hubiese sido del 30%.

6- La probabilidad de resolver correctamente alguna de las dos versiones de la tarea de

Martens es 0,45. La de resolver la 1ª es 0,40 y la de la 2ª 0,30 ¿La resolución de las dos

versiones es independiente?

Solución

Sea V1 el suceso de resolver la primera versión y V2 resolver la segunda. Los datos del problema nos indican que:

P(V1 » V2) = 0,45

P(V1) = 0,4

P(V2) = 0,3

Para determinar si los sucesos son independiente, calcularemos la probabilidad se su intersección, de forma análoga al problema anterior, y comprobaremos si el valor obtenido es igual al producto de las probabilidades de estos dos sucesos.

P(V1 « V2) = P(V1) + P(V2) – P(V1 » V2)

Sustituyendo

4 Problemas de Análisis de Datos. José M. Salinas

P(V1 « V2) = 0,4 + 0,3 – 0,45 = 0,25

Por otra parte

P(V1) · P(V2) Luego, no son independientes.

=

0,4 · 0,3

= 0,12

0,25

=

P(V1 « V2)

7- La prevalencia de la diabetes es del 4%. La glucemia basal diagnóstica correctamente el 95% de los diabéticos, pero da un 2% de falsos positivos. Diagnosticada una persona ¿Cuál es la probabilidad de que realmente sea diabética?

Solución

Sea D el suceso de tener diabetes, ~D el suceso de no tenerla y Gl+ el suceso de dar positivo en la prueba de la glucemia basal. Los datos del problema nos dicen que:

P(D) = 0,04

P(~D) = 0,96

P(Gl+ / D) = 0,95

P(Gl+ / ~D) = 0,02

Entonces el teorema de Bayes, escrito en los términos de este problema nos dice que:

 

P Gl

(

+

/

D

)

P

(

D

)

 

~

~

P Gl

(

+

/

D

)

(

P D

)

+

P Gl

(

+

/

D

0,038

)

P

(

D )

 

=

 

=

+

0,02 0,96

0,038

+

0,0192

P

(

D

/

Gl +

)

=

sustituyendo por los valores numéricos

P

(

D

/

Gl+

)

=

0,95 0,04

0,95 0,04

0,664

Tema 2. Variables aleatorias. 5

Problemas resueltos del Tema 2

2.1- Calcule y escriba en una tabla la distribución de la variable aleatoria suma de los números que aparecen al lanzar dos dados.

Solución.

A continuación presentamos todos los sucesos que pueden ocurrir al lanzar dos dados y el valor que para cada uno de estos sucesos tiene la variable suma:

(1,1) 2

(2,1) 3

(3,1) 4

(4,1) 5

(5,1) 6

(6,1) 7

(1,2) 3

(2,2) 4

(3,2) 5

(4,2) 6

(5,2) 7

(6,2) 8

(1,3) 4

(2,3) 5

(3,3) 6

(4,3) 7

(5,3) 8

(6,3) 9

(1,4) 5

(2,4) 6

(3,4) 7

(4,4) 8

(5,4) 9

(6,4) 10

(1,5) 6

(2,5) 7

(3,5) 8

(4,5) 9

(5,5) 10

(6,5) 11

(1,6)) 7

(2,6) 8

(3,6) 9

(4,6) 10

(5,6) 11

(6,6) 12

Como todos estos sucesos tienen la misma probabilidad 1/36, la distribución de la suma será:

X

2

3

4

5

6

7

8

9

10

11

12

P

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

2.2- Un jugador afirma que al lanzar dos dados es igual de probable obtener un seis que un siete, ya que hay el mismo número de resultados a favor de un resultado que de otro. Cinco y uno, cuatro y dos, tres y tres, para el seis y seis y uno, cinco y dos, cuatro y tres, para el siete. ¿Es cierta esta afirmación? Razone la respuesta.

Solución.

No, en realidad los sucesos que dan origen a que la suma valga 6 son: (1,5) (2,4) (3,3) (4,2) (5,1) por tanto la probabilidad será 5/36, mientras que los sucesos que hacen que la suma sea 7 son (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) y en consecuencia esta probabilidad será 6/36.

2.3- Para estudiar si las ratas tienen visión cromática, en una caja que cuenta con tres palancas se marca en rojo aquella que al pulsarla proporciona alimento. En cada prueba la posición de este pulsador se cambia aleatoriamente. Se somete una rata a cuatro pruebas. ¿Cual sería la distribución de la variable aleatoria número de pulsaciones que consiguen alimento, si la rata no distinguiera el rojo y pulsase al azar?

Solución.

La variable aleatoria número de pulsaciones puede tomar los valores 0, 1, 2, 3 y 4. El suceso que da origen a que la variable valga 0 sería:

6 Problemas de Análisis de Datos. José M. Salinas

(R , R , R , R)

cuya probabilidad sería 2/3 · 2/3 · 2/3 · 2/3 = 16/81

El suceso que da origen a que la variable valga 1 sería:

(R,R, R, R)U(R, R, R, R)U(R, R,R, R)U(R, R,R, R)

y

su probabilidad sería 4 · 1/3 · 2/3 · 2/3 · 2/3 = 32/81

El suceso que es la imagen inversa de 2 es:

(R,R,R,R)U(R, R,R,R)U(R, R,R,R)U(R, R, R, R)U(R, R, R, R)U(R, R, R, R)

y

su probabilidad

6 · 1/3 · 1/3 · 2/3 · 2/3

= 24/81

La imagen inversa de 3 es:

 

(R,R, R, R)U(R, R,R, R)U(R, R, R, R)U(R,R,R,R)

y

su probabilidad

4 · 1/3 · 1/3 · 1/3 · 2/3

= 8/81

La imagen inversa de 4 es el suceso:

(R, R, R, R)

y su probabilidad es

1/3 · 1/3 · 1/3 · 1/3

= 1/81

Resumiendo la distribución del número de aciertos es:

X

0

1

2

3

4

P

16/81

32/81

24/81

8/81

1/81

2.4- Un jugador de Rol, en una partida de Dungeons and Dragons, para salvarse de un

conjuro de Raistlin, necesita sacar un 18 en el lanzamiento de los dados. El Dungeon Master

le ofrece lanzar tres dados de seis caras o uno de diez junto con uno de ocho. ¿En cual de

estas dos alternativas es más probable obtener un 18 y salvarse del conjuro? Explique su respuesta ¿Sería la respuesta la misma si hubiese que sacar 17 o más para evitar el conjuro?

Solución.

Para sacar 18 con tres dados de seis caras tiene que ocurrir el suceso (6, 6, 6) que tiene una probabilidad 1/6 · 1/6 · 1/6 = 1/216.

Para obtener 18 con un dado de diez caras y otro de ocho tiene que ocurrir el suceso

(10, 8) cuya probabilidad es 1/10 · 1/8 = 1/80. Obviamente esta probabilidad es mayor que

la anterior.

Para obtener 17 o más con los tres dados tiene que ocurrir el suceso:

Tema 2. Variables aleatorias. 7

(5, 6, 6) » (6, 5, 6) » (6, 6, 5) » (6, 6, 6) cuya probabilidad es

4/216.

Para conseguir el mismo resultado con los dos dados tiene que ocurrir:

(10, 7) » (9, 8) » (10, 8) que tiene una probabilidad de 3/80 que también sería mayor que con los tres dados.

2.5- Tenemos una urna con dos bolas blancas, tres verdes y cinco rojas. Extraemos al azar dos bolas simultáneamente. Recibimos 200 pesetas si las dos bolas son blancas, 100 si las dos son verdes y 10 si una es roja y la otra verde, en los demás casos no recibimos nada. ¿Cual es el valor esperado de los premios?

Solución.

P(B1 « B2)

= P(B1) · P(B2 / B1) =

2/10 · 1/9

=

2/90 =

1/45

P(V1 « V2)

= P(V1) · P(V2 / V1) =

3/10 · 2/9

=

6/90 = 1/15

P((R1 « V2) » (V1 « R2)) 15/90 + 15/90 = 1/3

=

P(R1 « V2) + P(V1 « R2)

=

5/10 · 3/9 + 3/10 · 5/9

Por consiguiente el premio esperado sería:

E[premio] =

200 · 1/45 + 100 · 1/15 + 10 · 1/3 + 0 · 26/45

= 14,4

=

2.6- En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si la rata elige A vuelve al punto de partida después de recorrer dos metros. Si elige B recorre cinco metros y vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. ¿Por término medio que distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los seleccionados en veces anteriores?

Solución.

Los itinerarios que pueden darse con las distancias recorridas en cada caso, son (A,

B, C) 8,

(B, A, C) 8,

(A, C) 3,

(B, C) 6,

(C) 1, y sus probabilidades serían:

P(A, B, C)

=

P(A) · P(B/A) · P(C/A«B) =

1/3 · 1/2 · 1

=

1/6

P(B, A, C)

= P(B) · P(A/B) · P(C/B«A)

=

1/3 · 1/2 · 1

=

1/6

P(A, C)

=

P(A) · P(C/A) = 1/3 · 1/2

=

1/6

P(B, C) = P(B) · P(C/B) = 1/3 · 1/2 P(C) = 1/3

=

1/6

En consecuencia la distancia media recorrida será:

E[D]

=

8 · 1/3 + 6 · 1/6 + 3 · 1/6 + 1 · 1/3

= 4,5

Terma 3. Distribuciones. 9

Problemas resueltos del Tema 3.

3.1- Si un estudiante responde al azar a un examen de 8 preguntas de verdadero o falso ¿Cual es la probabilidad de que acierte 4? ¿Cual es la probabilidad de que acierte dos o menos? ¿Cual es la probabilidad de que acierte cinco o más? ¿Cuanto valen la media y la varianza del número de preguntas acertadas?

Solución.

La distribución del número de aciertos será una distribución Binomial de parámetros n = 8 y p = 1/2, en consecuencia:

Pr(x = 4

)

=

Ê

Á

Ë

8 ˆ 4 ¯ ˜

0 5

,

4

0 5

,

4

=

70

256

= 0 273

,

Para resolver los dos apartados siguientes calculamos previamente

en consecuencia

Pr(x = 0

Pr(x = 1

Pr(x = 2

Pr(x = 3

)

)

)

)

=

=

=

=

Ê

Á

Ë

Ê

Á

Ë

Ê

Á

Ë

Ê

Á

Ë

8 ˆ 0 ¯ ˜

8 ˆ 1 ¯ ˜

0

0

,

5

,

5

0

1

8 ˆ 2 ¯ ˜

0

,

5

2

8

3 ¯ ˜

ˆ

0

,

5

3

0 5

,

0 5

,

8

7

0 5

,

6

0 5

,

5

=

1

256

=

8

256

=

28

256

=

56

256

= 0 004

,

= 0 031

,

= 0 109

,

= 0 219

,

Pr(x £ 2) = Pr(x = 0) + Pr(x = 1) + Pr(x = 2) = 0,004 + 0,031 + 0,109 = 0,144

Pr(x 5) = 1 - Pr(x £ 4) = 1 - (0,004 + 0,031 + 0,109 + 0,219 + 0,273) = 0,364

La media y la varianza se obtienen aplicando la expresión obtenida de forma general para la media y la varianza de una distribución Binomial:

E[x ]

=

n · p

=

8 · 0,5

=

4

y

Var[x ]

=

n · p · q

=

8 · 0,5 · 0,5

=

2

3.2- En una población en la que hay un 40% de hombres y un 60% de mujeres seleccionamos 4 individuos ¿Cual es la probabilidad de que haya 2 hombres y 2 mujeres? ¿Cual es la probabilidad de que haya más mujeres que hombres?

10 Problemas de Análisis de Datos. José M. Salinas

Solución.

El número de hombres en la muestra sigue una distribución Binomial de parámetros n

= 4 y p = 0,4. Entonces para calcular la probabilidad de que haya 2 hombres y 2 mujeres en la muestra, basta calcular la probabilidad de que haya dos hombres en la misma.

Pr(x = 2

)

=

4

Á

Ë 2 ¯

Ê

ˆ

˜

0 4

,

2

0 6

,

2

=

6

0 16

,

0 36

,

=

0 3456

,

Para que haya más mujeres que hombres en la muestra, el número de estos tiene que ser menor que 2, luego la probabilidad será:

Pr(x < 2

)

= Pr(x =

0

)

+ Pr(x =

1

) =

4

Ê

Á

Ë 0 ¯

ˆ

˜

0 4

,

0

0 6

,

4

Ê

4

ˆ

+ Ë Á 1 ¯ ˜

0 4

,

1

0 6

,

3

=

0 4752

,

3.3- Sabiendo que la variable Z sigue una distribución Normal cero, uno, calcule las siguientes Probabilidades:

P(Z £ 0,93) P(Z > 0,62)

P(0,56 < Z £ 2,80)

P(Z £ 1,68) P(Z > 2,05)

P(Z £ -2,27) P(Z > -1,07)

P(Z £ -0,27) P(Z > -3,39) P(-0,85 < Z £ 0,72)

P(-2,81 < Z £ -0,33)

Solución.

Los ejercicios de la primera fila se resuelven buscando directamente en las tablas de la distribución Normal, donde se obtienen los siguientes valores:

P(Z £ 0,93) = 0,8238 P(Z £ -0,27) = 0,3936

P(Z £ 1,68) = 0,9535

P(Z £ -2,27) = 0,0116

Para resolver los ejercicios de la segunda fila se recurre a calcular la probabilidad del suceso contrario:

P(Z > 0,62) = 1 - P(Z £ 0,62) = 1 - 0,7324 = 0,2676

y de forma análoga se obtiene:

P(Z > 2,05) = 0,0202

P(Z > -1,07) = 0,8577

P(Z > -3,39) = 0,9996

En la tercera fila se pide calcular la probabilidad de una serie de intervalos, para ello debe recordarse que la probabilidad de un intervalo es igual al valor de la Función de Distribución para el extremo superior menos el valor de la Función de Distribución para el extremo inferior, es decir:

Terma 3. Distribuciones. 11

y para los otros dos intervalos sería:

P(-2,81 < Z £ -0,33) = 0,3707 - 0,0025 = 0,3682

P(-0,85 < Z £ 0,72) = 0,5665

3.4- Siendo Z una N(0,1), calcule los valores de la variable que verifican las siguientes condiciones:

P(Z £ z) = 0,70 P(Z > z) = 0,25

P(Z

£ z) = 0,90

P(Z

£ z) = 0,35

P(Z £ z) = 0,05 P(Z > z) = 0,69

P(Z > z) = 0,05

P(Z > z) = 0,85

P(-z < Z

£ z) = 0,90

P(-z < Z £ z) = 0,60

Solución.

Los ejercicios de la primera fila se resuelven buscando en las tablas de la Normal el valor más próximo a la probabilidad pedida y viendo a que valor de la variable corresponde:

P(Z £ z) = 0,70

z ª 0,52

P(Z £ z) = 0,90

z ª 1,28

P(Z £ z) = 0,35

z ª -0,39

P(Z £ z) = 0,05

z ª -1,64

La resolución de los ejercicios de la segunda fila utiliza las propiedades de la probabilidad del suceso contrario:

análogamente:

P(Z > z) = 0,25

P(Z £ z) = 1- 0,25 = 0,75

z ª 0,67

P(Z > z) = 0,05 z ª 1,64

P(Z > z) = 0,85 z ª -1,04

P(Z > z) = 0,69 z ª -0,5

Para resolver los ejercicios de la tercera fila se aplica la simetría de la Normal

P(-z < Z £ z) = 0,90

P(Z £ -z) = 0,05 y P(Z

£ z) = 0,95

z ª 1,64

P(-z < Z £ z) = 0,60

z ª

0,84

3.5- Partiendo de que X es una variable que sigue una distribución Normal de media 50 y desviación típica 4, calcule las siguientes probabilidades:

P(X £ 55)

P(X £ 59)

P(X £ 47,5)

P(X > 60,4)

P(X £ 45,6) P(X > 46,26)

P(47,25 < X £ 53,48)

P(X > 58,64)

P(X > 48,2)

P(44,5 < X £ 49)

P(52 < X £ 54)

Solución.

Estos ejercicios se resuelven merced a la propiedad de que al tipificar una variable Normal la variable resultante sigue una distribución Normal cero, uno.

análogamente:

P(X £

55

)

= P

Ê

Á

Ë

Z £

55

-

50

ˆ

˜ =

¯

4

P(Z

£

1,25

)

=

0,8944

12 Problemas de Análisis de Datos. José M. Salinas

P(X £ 59) = 0,9878

P(X £ 47,5) = 0,2676

P(X £ 45,6) = 0,1357

Para los ejercicios de la segunda fila vuelve a utilizarse las propiedades del suceso contrario:

P(X >

60 4

,

) = P

Ê

Á

Ë

Z >

de forma semejante:

P(X > 58,64) = 0,0154

60 4

,

-

50

ˆ

˜ =

¯

4

P(Z

>

2 6

,

)

P(X > 48,2) = 0,6736

=

1

-

P(Z

£

2 6

,

)

=

0 0047

,

P(X > 46,26) = 0,8264

Los intervalos de la tercera fila se resuelven en la forma siguiente:

P(52

<

X

£

54)

=

P( X

£

54)

-

P( X

£

52)

=

P

Ê

Á

Ë

Z

£

54

-

50

ˆ

˜ -

¯

4

P

Ê

Á

Ë

Z

£

52

-

50

ˆ

˜

4

¯

= P(Z £ 1) - P(Z £ 0,5) = 0,8413 - 0,6915 = 0,1498

similarmente

P(44,5 < X £ 49) = 0,3175

P(47,25 < X £ 53,48) = 0,5627

3.6- La variable aleatoria Y sigue una distribución Normal de media 2,55 y desviación típica 0,36. Halle los valores de la variable que cumplen las siguientes condiciones:

P(Y £ y) = 0,54 P(Y > y) = 0,38 P(a < Y £ b) = 0,80

P(Y

£ y) = 0,95

P(Y £ y) = 0,42 P(Y > y) = 0,54

P(Y £ y) = 0,1 P(Y > y) = 0,01

P(Y > y) = 0,05

P(a < Y £ b) = 0,95

Solución.

P(Y

£

y)

=

0 54

,

P

Ê

Á

Ë

Z

£

buscando en las tablas de la Normal:

P(Z £

0 1

,

)

ª

0 54

,

de manera semejante:

y -

2 55

,

0 36

,

=

0 1

,

y

-

2 55 ˆ

 
 

,

˜ ¯ 0 54

=

,

 
 
 

0 36

,

 

y

=

2 55

,

+

0 36

,

0 1

,

= 2 586

,

Terma 3. Distribuciones. 13

P(Y

>

y)

=

0 38

,

P(Y

£

y)

=

0 62

,

P

Ê

Á

Ë

Z

£

y

-

2

,

55 ˆ

˜

0 36

,

¯

=

0 62

,

buscando en las tablas de la Normal cero, uno:

P(Z £

análogamente:

0 31

,

)

ª

0 62

,

y -

2 55

,

0 36

,

=

0 31

,

y

=

2 55

,

+

0 36

,

0 31

,

P(Y > y) = 0,05 y =3,1404 P(Y > y) = 0,01 y = 3,3888

P(Y > y) = 0,54 y = 2,514

P(a < Y £ b) = 0,80 P(Y £ a) = 0,1

P(Y £ b) = 0,9

P

Ê

Á

Ë

Z £

a

-

2 55 ˆ

,

0 36

,

˜ =

¯

0 1

,

(

P Z

£

-

1 28

,

)

=

0 1

,

a -

2 55

,

0 36

,

= -

1 28

,

=

a

2 6616

,

=

2 0892

,

P

Ê

Á

Ë

Z

£

2 55 ˆ ˜ =

b

-

,

0 36

,

¯

0 9

,

(

P Z

£

1 28

,

y para el otro intervalo:

P(a < Y £ b) = 0,95

)

=

0 9

,

b -

2 55

,

0 36

,

=

1 28

,

a = 1,8444 y b = 3,2556

b

=

3 0108

,

3.7- Las calificaciones en un examen siguen una distribución Normal de media 5,6 y desviación típica 0,8.

a) ¿Qué proporción de alumnos tendrá puntuaciones inferiores o iguales a 4?

b) ¿Qué proporción de alumnos aprobará?

c) ¿Qué proporción de alumnos obtendrá Notable o Sobresaliente?

Solución.

a)

Pr( X £

4

)

b) Pr( X

>

5 )

=

c) Pr( X >

7

)

=

=

Pr

Pr

Ê

Á

Ë

Ê

Á

Ë

Pr Á Ê

Ë

4

-

5 6 ˆ ˜

,

Z £

5

-

0 8

,

5 6 ˆ ˜

,

=

¯

1

Z >

Z >

7

0

-

,

8

,

¯

5 6 ˆ ˜

0

,

8

¯

=

1

-

-

=

(

Pr Z

£

-

2

)

(

Pr Z

(

Pr Z

£

£

-

0 75

,

1 75

,

)

)

=

=

1

1

-

=

0 0228

,

-

0 2266

,

=

0 7734

,

0 9599

,

=

0 0401

,

3.8- Las puntuaciones en un test de ansiedad-rasgo siguen, en una población de mujeres, una distribución Normal de media 25 y desviación Típica 10. Si queremos clasificar la población en cuatro grupos de igual tamaño ¿Cuales serán las puntuaciones que delimiten estos grupos?

Solución.

14 Problemas de Análisis de Datos. José M. Salinas

Las puntuaciones que delimitan estos cuatro grupos serán el primer, segundo y tercer cuartil de la distribución

Pr(X

£

Q )

1

=

0

,

25

Pr

Ê

Á

Ë

Z

£

Q

1

-

25

10

ˆ

˜ = 0 25

¯

,

buscando en las tablas de la Normal cero, uno el valor de la variable que deja por debajo de

si

una probabilidad de 0,25 tenemos:

Pr(Z £ -0,67)

=

0,25

luego

Q 1

- 25

10

=

-

0 67

,

y despejando

Q 1

=

25 -10 0,67

=

18,3

Como en la distribución Normal Media y Mediana son iguales tendremos que:

Q 2

=

25

Pr(X

£

Q )

3

=

0

,

75

buscando en las tablas

Pr(Z £ 0,67) = 0,75

Pr

Ê

Á

Ë

Z

luego

despejando

Q 3

=

25 +10 0,67

£

Q

3

-

25

10

Q 3

- 25

10

=

31,7

ˆ

˜ = 0 75

¯

,

=

0 67

,

Por consiguiente el primer grupo serían los individuos con puntuaciones inferiores o iguales a 18,3, el segundo aquellos con puntuaciones entre 18,3 y 25, el tercero los sujetos con puntuaciones entre 25 y 31,7 y el cuarto aquellos que tengan puntuaciones superiores a

31,7.

3.9- Una prueba consta de 200 preguntas de verdadero o falso, para un sujeto que respondiese al azar ¿Cual sería la probabilidad de que acertase?

a) 50 preguntas o menos.

b) Más de 50 y menos de 100.

c) Más de 120 preguntas.

Solución.

El número de preguntas acertadas seguirá una distribución Binomial con n = 200 y p

= 0,5. Ahora bien, como el número de pruebas es elevado esta distribución se puede

aproximar por una Normal de media 200·0,5 = 100 y de varianza 200·0,5·0,5 = 50 o lo que es lo mismo con desviación típica 7,07, luego:

Terma 3. Distribuciones. 15

Pr( 50

<

x

Pr( x £

< 100

)

50

)

ª

Pr(

X

=

Pr( )

x

£

99

£

-

50 5

,

)

Pr(

x

=

£

Ê

Pr Á

Ë

51

)

Z

=

£

50

,

5

-

100 ˆ

˜

7 07

,

¯

=

Pr

(

Z

Pr Á Ê

Ë

Z

£

99 5

,

-

100 ˆ

˜ -

¯

7 07

,

£

-

7

)

Pr Á Ê

Ë

Z

ª

£

0

50

,

5

-

100 ˆ

˜

7 07

,

¯

= Pr(Z £ -0,07) - Pr(Z £ -7) = 0,4721- 0 = 0,4721

Pr( x >

120

)

ª

Ê

Pr Á Z

Ë

>

120

,

5

-

100 ˆ

˜

7 07

,

¯

=

1

-

Pr

(

Z

£

2 9

,

)

=

1

-

0 9981

,

=

0 0019

,

3.10- En una distribución Binomial con n = 10 y P = 0,8 ¿Qué error se comete al calcular la probabilidad de que la variable sea igual a 6, mediante la aproximación Normal?

Solución.

Pr(x =

6

)

=

Ê

Á

Ë

10 ˆ

˜

6 ¯

0 8

,

6

0 2

,

4

=

0 0881

,

Esta distribución Binomial se aproxima por una Normal de media 8 y desviación típica 1,265, luego:

=

Pr(x = 6)

ª

Ê

Pr Á Z

Ë

£

8 ˆ

6

,

5

-

˜ -

1 265 ¯

,

Pr(5,5 < X £ 6,5)

Pr Á Ê Z

Ë

£

55

,

-

8 ˆ

˜

1 265 ¯

,

=

=

Pr( X £ 6,5) - Pr( X £ 5,5)

(

Pr Z

£

-

1 18

,

)

-

(

Pr Z

£

-

1 98

,

= 0,1190 - 0,0238 = 0,0952

y el error que cometeríamos sería:

0,0952 - 0,0881 = 0,0071

)

Tema 6. Descripción de la distribución de frecuencias

Problemas resueltos del Tema 6

1.- Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos, medidos en centésimas de segundo:

55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62, 59, 64, 57, 63, 52, 67.

Calcule la media, mediana, el primer y el tercer cuartil, directamente a partir de los datos.

Solución:

a) Para calcular la media simplemente sumamos todos los valores, lo cual da como resultado 1963, y dividimos entre el número de observaciones que es 33, con lo cual obtenemos:

x

=

1963

33

=

59,48

b) Para calcular la mediana, el primer paso es escribir los valores en orden creciente:

45, 48, 49, 50, 51, 52, 53, 54, 55, 56, 56, 57, 57, 58, 58, 59, 60, 61, 61, 62, 62, 63, 63, 63, 64, 64, 65, 66, 67, 68, 70, 72, 74

Como el número de observaciones es impar el valor central, es decir el decimosexto, es la mediana, por consiguiente la Mediana de esta distribución es 60.

El cálculo del primer cuartil es análogo, es la observación que deja una cuarta parte de las observaciones por debajo y tres cuartas partes por encima, luego en este caso es la novena observación y por consiguiente el valor del primer cuartil es 55.

Análogamente el tercer cuartil es el valor que ocupa en la anterior ordenación la posición vigesimoquinta y es 64.

2.- Con los datos del problema anterior, construya una tabla estadística de estos datos, agrupados en 5 intervalos de igual amplitud, calcule la media, y la mediana, compare estos resultados con los obtenidos en el problema anterior.

Solución:

Tiempos

Nº sujetos

45

a 51

4

51

a 57

6

57

a 63

11

63

a 69

9

69

a 75

3

Para llegar a la anterior tabla se ha calculado en primer lugar el rango de la distribución que es el mayor valor 74 menos el menor 45, lo que nos da 29. Como 29 no es divisible entre 5 redondeamos hasta el valor más próximo por exceso que es 30, dividiendo este rango entre el número de intervalos que deseamos, cinco, obtenemos la amplitud que deben tener los intervalos, seis. A partir del primer valor, 45 se han calculado los

Problemas de Análisis de Datos. José M. Salinas

restantes extremos sumando 6, sucesivas veces. Posteriormente se ha contado el número de observaciones comprendidas dentro de cada intervalo, recuérdese que los intervalos se toman abiertos a la derecha, y de esta forma se han obtenido las frecuencias que aparecen en la tabla.

Tiempos

n i

c

i

c i ·n i

N i

45

a 51

4

48

192

4

51

a 57

6

54

324

10

57

a 63

11

60

660

21

63

a 69

9

66

594

30

69

a 75

3

72

216

33

 

33

1986

La media es: 1986/33 = 60,18

Mediana:

Comenzamos calculando la mitad del tamaño de la muestra 33/2 = 16,5. A continuación observamos cuál es la primera frecuencia acumulada que es mayor que 16,5 que resulta ser 21. Esto nos indica que la Mediana se encuentra en el intervalo de 57 a 63, aplicando entonces la fórmula que determina la mediana, obtenemos:

Me

=

57

+

(16,5

-

10)

6

11

=

60,5

Las diferencias existentes entre los valores anteriores (exactos) y los valores actuales (aproximados) son debidas al efecto del agrupamiento de los valores en clases. En este último caso los cálculos hacen la suposición de que las observaciones están uniformemente distribuidas dentro de los intervalos, si este supuesto se cumple exactamente ambos valores coincidirán. Conforme los datos reales se aparten de este supuesto mayor será la discrepancia entre ambos procedimientos. Como en este caso los datos se distribuyen de forma bastante uniforme, las discrepancias entre los valores obtenidos por ambos procedimientos son pequeñas.

3.- La distribución de las puntuaciones en una escala de hostilidad, de 160 sujetos de una muestra, ha sido la siguiente:

 

X i

n i

0 a 10

8

10

a 20

22

20

a 30

32

30

a 40

44

40

a 50

28

50

a 60

20

60

a 70

6

a) ¿Entre que valores se encuentra el 50% central de los individuos?

b) Calcule el percentil 27.

c) ¿A partir de que puntuación se encuentra el 12% de los sujetos más hostiles?

Tema 6. Descripción de la distribución de frecuencias

Solución:

Antes de comenzar a responder los distintos apartados, debemos en primer lugar calcular las frecuencias acumuladas

 

X i

n i

N i

0 a 10

8

8

10

a 20

22

30

20

a 30

32

62

30

a 40

44

106

40

a 50

28

134

50

a 60

20

154

60

a 70

6

160

a) Se trata de calcular el primer cuartil que dejará por debajo el 25% inferior, y el tercer cuartil que dejará por encima el 25% superior. De esta forma entre ambos valores se encontrará el 50% central. Para calcular el primer cuartil determinamos la cuata parte del tamaño de la muestra 160/4 = 40. La primera frecuencia acumulada que supera este valor es 62, por consiguiente el primer cuartil se encuentra en el intervalo de 20 a 30, aplicamos la fórmula para su determinación:

Q

1

=

20

+

(40

-

30) 10

32

=

23,125

Las tres cuartas partes del tamaño de la muestra son 120, por tanto el tercer cuartil se encuentra en el intervalo de 40 a 50 y su valor es:

Q

3

=

40

+

(120

-

106) 10

28

=

45

b) El 27% del tamaño de la muestra es 43,2, luego el percentil 27 está en el intervalo de 20 a 30 y su valor es:

P

27

=

20

+

(43,2

-

30) 10

32

=

24,125

c) El valor que deja por encima el 12% de los sujetos más hostiles, es el mismo que deja por debajo el 88% con menores puntuaciones, por tanto debemos calcular el percentil 88. El 88% del tamaño de la muestra vale 140,8. Aplicando la formula tenemos:

P

88

=

50

+

(140,8

-

134) 10

20

=

53,4

d) Se trata de calcular el percentil 15 y el percentil 85. El 15% del tamaño de la muestra es 24. El 85% del tamaño es 136 y por tanto:

P

15

P

85

=

=

10

50

+

+

(24

-

8)

10

22

= 17,27

(136

-

134) 10

20

=

51

Problemas de Análisis de Datos. José M. Salinas

4.- Hemos medido la variable neuroticismo en un grupo de sujetos obteniendo los siguientes resultados:

3, 5, 3, 6, 4, 2, 8, 3, 7, 5, 8, 9, 4, 5, 5, 3

Calcule la desviación media y la desviación típica.

Solución:

Comenzamos calculando la media de la muestra, para ello sumamos los valores de las

observaciones obteniendo 80. Dividiendo por el número de observaciones, 16, tenemos

el valor de la media, 5.

A continuación calculamos las desviaciones a la media:

2, 0, 2, 1, 1, 3, 3, 2, 2, 0, 3, 4, 1, 0, 0, 2

Sumando estas desviaciones, obtenemos 26 y dividiendo por el tamaño de la muestra, 16, obtenemos la Desviación media:

Dm

=

26

=

1,625

 

16

Para calcular la desviación típica, empezamos calculando los cuadrados de los valores:

9, 25, 9, 36, 16, 4, 64, 9, 49, 25, 64, 81, 16, 25, 25, 9

Sumando obtenemos 466, por consiguiente la varianza valdrá:

S

2

=

466

16

-

5

2

=

4,125

calculando su raíz cuadrada obtenemos el valor de la desviación típica:

S = 2,03

Temas 7 y8. Estimadores y sus distribuciones. 1

Problemas resueltos Temas 7 y 8.

1- En una población se presenta una alteración leve en una cierta proporción P de los

individuos que la componen. Definimos una variable aleatoria X que vale 1 para los individuos alterados y 0 para los no alterados.

a) Escriba la distribución poblacional de esta variable aleatoria

b) Si p es la proporción de veces que aparece el valor 1 en muestras aleatorias simples de

tamaño 3. Calcule la distribución en el muestreo de p, suponiendo que P es igual a 0,2.

c) Demuestre que en este caso p es un estimador insesgado de P.

d) Repita los pasos b) y c) de forma general para un valor cualquiera de P.

Solución:

La solución del apartado a) aparece en la siguiente tabla:

x i

p i

0

0,8

1

0,2

Para resolver el apartado b) comenzamos con una tabla donde aparecen todas las posibles muestras de tamaño 3, la probabilidad de estas muestras y el valor de la proporción muestral en cada una de ellas

Muestra

Prob.

p

(0,0,0)

0,512

0

(1,0,0)

0,128

1/3

(0,1,0)

0,128

1/3

(0,0,1)

0,128

1/3

(1,1,0)

0,032

2/3

(1,0,1)

0,032

2/3

(0,1,1)

0,032

2/3

(1,1,1)

0,008

1

Distribución de p:

p

Prob.

0

0,512

1/3

0,384

2/3

0,096

1

0,008

por consiguiente la esperanza matemática será:

E[p] = 0 · 0,512 + 1/3 · 0,384 + 2/3 · 0,096 + 1 · 0,008 = 0,2

y queda resuelto el apartado c). Para el apartado d) escribimos la distribución de p en el caso genérico que será:

p

Prob.

0

Q 3

1/3

3PQ 2

2/3

3P 2 Q

1 P 3

y la esperanza matemática de p será:

2 Problemas de Análisis de Datos. José M. Salinas

E[p] = PQ

2

+

2

P

2

Q + P

3

= P(Q

2

+

2

PQ + P

2

) = P(Q + P)

2

= P

2- Una variable aleatoria puede tomar los valores 1, 2 y 3 con probabilidades 0,25 0,5 y 0,25 respectivamente. Si para estimar la media de esta variable aleatoria extraemos muestras aleatorias simples de tamaño 3 y utilizamos como estimadores la media muestral y la semisuma de los valores extremos. Queremos confirmar que:

a) Los dos estimadores son insesgados y b) La media muestral es más eficiente Realice los cálculos necesarios para verificar estos dos puntos.

Solución:

En la siguiente tabla damos todas las muestras posibles de tamaño 3, sus probabilidades y los valores que tomarían ambos estimadores en esas muestras:

Muestra

Prob.

Media

Semisum.

(1,1,1)

0,015625

1

1

(2,1,1)

0,03125

4/3

1,5

(1,2,1)

0,03125

4/3

1,5

(1,1,2)

0,03125

4/3

1,5

(3,1,1)

0,015625

5/3

2

(1,3,1)

0,015625

5/3

2

(1,1,3)

0,015625

5/3

2

(2,2,2)

0,125

2

2

(3,2,2)

0,0625

7/3

2,5

(2,3,2)

0,0625

7/3

2,5

(2,2,3)

0,0625

7/3

2,5

(1,2,2)

0,0625

5/3

1,5

(2,1,2)

0,0625

5/3

1,5

(2,2,1)

0,0625

5/3

1,5

(3,3,3)

0,015625

3

3

(2,3,3)

0,03125

8/3

2,5

(3,2,3)

0,03125

8/3

2,5

(3,3,2)

0,03125

8/3

2,5

(1,3,3)

0,015625

7/3

2

(3,1,3)

0,015625

7/3

2

(3,3,1)

0,015625

7/3

2

(1,2,3)

0,03125

2

2

(1,3,2)

0,03125

2

2

(2,3,1)

0,03125

2

2

(2,1,3)

0,03125

2

2

(3,1,2)

0,03125

2

2

(3,2,1)

0,03125

2

2

Por consiguiente la distribución de la media muestral será:

Temas 7 y8. Estimadores y sus distribuciones. 3

Media

1

4/3

5/3

2

7/3

8/3

3

Prob.

0,015625

0,09375

0,234375

0,3125

0,234375

0,09375

0,015625

y la distribución de la semisuma de los valores extremos será:

Semisuma

1

1,5

2

2,5

3

Prob.

0,015625

0,28125

0,40625

0,28125

0,015625

por consiguiente las esperanzas de estos dos estimadores serían:

E[Media] = 1 · 0,015625 + 4/3 · 0,09375 + 5/3 · 0,234375 + 2 · 0,3125 + 7/3 · 0,234375 + 8/3 · 0,09375 + 3 · 0,015625 = 2

E[Semisuma] = 1 · 0,015625 + 1,5 · 0,28125 + 2 · 0,40625 + 2,5 · 0,28125 +

3 · 0,015625

=

2

luego ambos estimadores son insesgados. Las varianzas respectivas serían:

Var[Media] = 1 · 0,015625 + 16/9 · 0,09375 + 25/9 · 0,234375 + 4 · 0,3125 + 49/9 · 0,234375 + 64/9 · 0,09375 + 9 · 0,015625 - 4 = 0,167

Var[Semisuma] = 1 · 0,015625 + 2,25 · 0,28125 + 4 · 0,40625 + 6,25 · 0,28125 + 9 · 0,015625 - 4 = 0,172

por consiguiente la media es en este caso un estimador más eficiente que la semisuma de los valores extremos.

3- Las puntuaciones en la Escala de Inteligencia para Adultos de Wechsler (WAIS) siguen en

una población una distribución Normal de media 100 y desviación típica 16. Si extraemos de esa población una muestra aleatoria simple de 25 individuos

a) ¿Cual es la probabilidad de que la media de esos 25 individuos sea inferior a 95?

b) ¿Cual es la probabilidad de que esa misma media esté comprendida entre 98 y 102?

Solución:

De acuerdo con el teorema de Fisher:

Por lo que en nuestro caso:

x

Æ

N

Ê

x Æ N Á m , Ë Ê 16 ˆ Ë ,, Á 100 ˜
x
Æ N Á m ,
Ë
Ê
16
ˆ
Ë ,,
Á 100
˜
25
¯
s ˆ ˜ n ¯ N( =
s
ˆ
˜
n
¯
N(
=

100,, 3,2

)

4 Problemas de Análisis de Datos. José M. Salinas

Entonces el apartado a) se resuelve en la forma siguiente:

Pr( x £

95

)

=

Pr

Ê

Á

Ë

Z £

95

-

100 ˆ

˜

=

   

,

3 2

¯

(

Pr Z

£

-

1 56

,

)

=

0 0594

,

y el apartado b) quedará resuelto de la siguiente forma:

Pr( 98

<

x

£

102

)

=

Pr(

x

£

102

)

-

Pr(

x