Вы находитесь на странице: 1из 139

REVISAR SOLUCION LIBRO IPINA

INTRODUCCIÓN
En una sociedad en continuo cambio, como la que nos ha tocado vivir, cada vez nos asómbranos del
avance de la ciencia y la tecnología. En este contexto la Ciencia de la Estadística ha tomado auge
ripiadamente ayudado con los paquetes estadísticos, que agilizan el procesamiento y análisis de
datos.
También es preciso destacar que en este desarrollo, La estadística nos proporciona herramientas
metodológicas generales para analizar la variabilidad, determinar relaciones o asociaciones entre
variables, diseñar de forma óptima experimentos, mejorar las predicciones y la toma de decisiones en
situaciones de incertidumbre.
La presente obra está diseñada alrededor de varios temas conceptuales de la Estadística
descriptiva: Conceptos básicos con sus respectivas fórmulas , ejemplos , trabajos prácticos y casos de
aplicación a las ciencias humanas.
Se presentan ejercicios de tal manera que el estudiante los complete usando propiedades y
conceptos desarrollados en clase.
Se pretende en todo momento la acción de motivar, incentivar y estimular a los estudiantes en la
realización de ejercicios, prácticas de aula o casos de investigaciones usando el software estadístico
SPSS.

OBJETIVOS
- Conocer los conceptos vastos de la Estadística Descriptiva.
- Conocer e interpretar las medidas de posición central y de posición relativa
- Conocer e interpretar las medidas de dispersión
- Adquirir conocimientos generales sobre la técnica de asociación entre dos características
cuantitativas o dos cualitativas para la generación de conocimiento predictivo en el campo
afín.
( Correlación y regresión lineal simple ).

https://www.danielsoper.com/statcalc/calculator.aspx?id=10
VARIABLES
Nominal Sólo categorías
(Religión, lugar de nacimiento, ……etc. .)
Ordinal Categorías ordenadas ( de lo menos a lo más o inversamente )
Escala de Likert
Ejemplo: HORNO MICRO-ONDAS : Satisfacc. de consumidores
Muy insatisfecho , Algo insatisf. , Algo satisf. , Muy Satisf.
Convirtiendo las descripciones verbales en números: 1; 2 ; 3 ; 4
Entre 1 y 2 , diferencia = 1
Entre 2 y 3 , diferencia = 1
¿ reflejan igualdad ?
Grados de un sismo
Niveles de daño, dolor
Fases de una enfermedad.
Rangos laborales
Escala de dureza
Niveles educativos
Calidad de vivienda …...etc )…Mediana, correlación de Spearman,..pruebas
no paramétricas
Intervalo tiene cero arbitrario, sólo las diferencias tienen sentido, pero no tiene
sentido decir que una T° de 60° es el doble que una T° de 30°
( temperatura : el cero indica frio )
Razón Tiene cero absoluto, los cocientes ( razones) entre valores tienen sentido.
(Peso, longitud, volumen….etc.), aquí si 10 es el doble 5.

Indique el tipo de variable en los siguientes casos:

VARIABLES 1
a) Número de libros en un estante de una biblioteca.
b) Lugar en que viven los alumnos del curso.
c) Color de los ojos de tus compañeros de clase.
d) Monto de pago por consumo de energía eléctrica.
e) Nivel de educación.
f) Sumas posibles de los números obtenidos al lanzar dos dados.
g) Peso del contenido de una caja de cereal.
h) AFP a que pertenece un individuo.
i) Número de litros de agua contenidos en un depósito.
j) Período de duración de un automóvil.
k) Número de maestros de tu Universidad.
l) Nivel de atención en el Banco.
m) Clasificación de la edad : niño, joven, adulto y adulto mayor

VARIABLES 2
a) Tasa preferencial de interés
b) Número de pasajeros en un vuelo de Los Ángeles a Nueva York
c) Peso de un paquete listo para ser enviado
d) Volumen de jugo de naranja en un vaso
e) Población en una región particular de un país
f) Peso de periódicos recuperados para reciclar en un solo día
g) Tiempo para completar un examen de sociología
h) Número de consumidores en una encuesta
i) Número de accidentes en botes en un tramo de 50 millas del río Ucayali.
j) Tiempo para completar un cuestionario
k) Costo de una lechuga
l) Número de hermanos y hermanas que tenga el lector
m) Rendimiento en kilogramos de trigo para un terreno de 1 hectárea de un trigal
n) Tiempo para ensamblar un rompecabezas sencillo
o) Número de estudiantes en un salón de clases.
p) Calificación de un político recién electo (excelente, bueno, regular, malo)
q) Estado en que vive una persona
r) Género de un estudiante
s) Número de errores en un examen de medio semestre
t) Edad de un paciente con cáncer
u) Número de flores en una planta de girasol
v) Color de un auto que entra a un estacionamiento

Creación de un índice para transformar diversas variables nominales en una


variable de razón.
Definición operacional Nivel de Código ( como se
Variable
( cómo se mide la variable ) medición registra )
FUMA ¿Es fumador habitual? Nominal 1 = Si 2 = No

ALCOHOLICO Ha consumido cinco o más bebidas Nominal 1 = Si 2 = No


alcohólicas en el último mes
EJERCICIO Hace ejercicios regularmente Nominal 1 = Si 2 = No

DROGAS Ha usado una droga ilícita en el Nominal 1 = Si 2 = No


último mes
CONDUC_EB Ha conducido en estado de Nominal 1 = Si 2 = No
R ebriedad.
RIESGO Número de conductas de riesgo Razón Suma de
que reportó respuestas “Si”
para las variables 1
a5

TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS ( TDF )


Matriz de datos, se ordenan los datos de acuerdo a un criterio teniendo en cuenta: rango, variable,
intervalos y amplitud de intervalo
Rango ( R )
R = Xmax – X min
N° de intervalos ( m )
m = 1 + 3.3*Log (n)
Amplitud de intervalo ( C )
C=R/m
Formato: tabla de distribución de frecuencias (variable cuantitativa continua)
Intervalo Xi Cómputo f F hi Hi %
s
[a , b) X1 f1 F1 h1 H1
[b , c ) X2 f2 F2 h2 H2
. . . . . . . .
. . . . . . . .
Total n 1 100
Símbolos :
Xi : Puntos medios / marca de clase
n: Muestra ( Total de observaciones )
fi : Frecuencia absoluta simple
Fi : Frecuencia absoluta acumulada
hi : Frecuencia relativa simple
Hi : Frecuencia relativa acumulada
Relaciones:

Limite inf .+ Limite.


Xi=
2

f
hi=
n
F
Hi=
n
Formato: tabla de distribución de frecuencias (variable cualitativa)
Variable Cómputo fi Fi hi Hi %
Categoría 1 f1 F1 h1 H1
Categoría 2 f2 F2 h2 H2
. . . . . . .
. . . . . . .
Total n 1 100

PROPIEDADES EN UNA TABLA DE DISTRIBUCION DE FRECUENCIAS ( TDF ) :


 Σfi = n
 Σhi = 1
 Última F = n
 Última Hi = 1
EJERCICIOS PROPUESTOS
IMPRESORA
La siguiente tabla representa el número de archivos que se mandaron a una impresora en 50
días consecutivos. Completar la tabla.
N° de Frecuencia Frecuencia Frecuencia relativa
archivos simple ( fi ) acumulada ( F ) simple ( hi )
20 – 30 4 - -
30 – 40 - 11 -
40 – 50 10 - -
50 – 60 - - 0.18
60 – 70 - 38 -
70 – 80 - - 0.14
80 – 90 - 50 -
Total

INTERVALOS
En una distribución de frecuencias con seis intervalos de clase de la misma amplitud, se cumple: hi =
h7-i , además la mediana es 18 y el ancho de clase es 4, también:
H5 = 84% y en el intervalo [ 18 ; 28 ) se presenta 42 observaciones. Calcular f1 Rpta 16

TABLA DE FRECUENCIAS 1
Realizada una distribución de frecuencias con 5 intervalos de ancho común, se conoce que: X1,
f1, X2, f5 , son números consecutivos ascendentes, además :
X4 + X5 = f4+ f5 - 5 y X 1 es la semidiferencia entre el mayor y el menor de los datos.
¿Qué porcentaje se presenta en el intervalo [ f1 , 10 > si son 50 datos en total? Rpta. 30%

EDADES
Dada la siguiente distribución según las edades de 250 personas.
Edad [18 , 20> [20, 22> [22 , 24> [24 , 26> [26 , 28>

fi 7a 6b 8a 9b 5b
Se conoce que hay más personas que tienen entre 24 y 26 años, además 15 personas acaban de
cumplir este mes su mayoría de edad. ¿Cuántas personas tienen de 20 a 24 años de edad?
Rpta. 96
PORCENTAJE
En una distribución de frecuencias, con 5 intervalos de clase con ancho común, se conoce :
X2 = 17 ; X5 = 41 y H5 = 20h1.
¿ Qué % del total de datos se encuentran en el intervalo [ 13 ; 37 ) , si la distribución es
simétrica ? Rpta.
90%
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS 2
Se debe elaborar un cuadro de distribución de frecuencias con las edades de un grupo de personas.
Considere lo siguiente:
Edad mínima = 10 años
Edad máxima = 30 años
N° de intervalos = 5
Además: h2 = h4 = h5 ;
h1 = 4/5h2 ; 5h3 = 6h4
Si el promedio de las edades es ab ´. cd
Calcule a + b + c +´d Rpta. 7

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS 3


Si se tiene la siguiente distribución de frecuencias sobre las estaturas ( en metros ) de un grupo de 50
jóvenes. Calcule M + 0.´ba.
INTERVALOS Xi fi hi Hi
1.55 – 1.60
1.60 – 1.65
1.65 – 1.70 0.´ab
1.70 – 1.75 5 0.96
1.75 – 1.80
Total
h1 = h5
h2 = h4
M : tanto por ciento de jóvenes que poseen una estatura no menor de 1.70 m. Rpta . 41%

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS 4


Se presenta una tabla de distribución de frecuencias con 5 intervalos de ancho de clase común y se
sabe que los límites inferiores de los intervalos 2 y 5 son 16 y 52, respectivamente, además, se tiene lo
siguiente:
f5 = 60 = 2f2 = 3f1
h3 = 0.20
H4 = 0.70
Calcule: X3 + f4 + F3 Rpta. 174
MEDIDAS DE TENDENCIA CENTRAL
1. MEDIA ARITMÉTICA
“ Media “ ; “ Promedio “

“ De acuerdo a Aristóteles, en toda situación moral hay tres formas de


actuar: por defecto, por exceso y según el término medio equidistante entre
esos dos extremos opuestos “

Símbolos: X́ ; M ( x ) ; μ
Fórmulas:

X́ =
∑ Xi
n

X́ =
∑ Xi . fi
n
X́ =Xi . hi

X́ =
∑ X́ i . fi
n
Media global o general
Propiedades de la media
 Es muy sensible a los valores extremos de la variable ( todas las observaciones intervienen en
su cálculo ). En consecuencia, no es recomendable usar en distribuciones muy asimétricas.
 Sólo puede calcularse para variables cuantitativas.
 M( k ) = k ; k  
 La suma de las desviaciones de todas las puntuaciones respecto a la media es 0, es decir:
Σ( Xi− X́)=0
 La suma de las desviaciones de todas las puntuaciones cuadráticas respecto a la media es
mayor o igual que 0, es decir:
Σ( Xi− X́)2 ≥0
 La suma de las desviaciones al cuadrado respecto a la media es menor que respecto a otro
valor cualquiera, es decir:
Σ( Xi− X́)2 ≤ Σ( Xi−c)2 c : constante
 Si definimos Yi = Xi + K, entonces M (Y) = M(X) + k , para k  
 Si definimos Yi = k.Xi, entonces M (Y) = kM(X), para k ∈ 

Ejemplo
Las calificaciones de Carolina de la especialidad de inglés en cuatro asignaturas fueron 14, 13,
12 y 16. Si los respectivos créditos otorgados a estos cursos son 3, 6, 4, 2. Determinar el
promedio ponderado de Carolina.
Solución
X : 14 , 13 , 12 , 16 y sus pesos ( w ) = 3 , 6 , 4 , 2
Σxw
X́ =
Σw

14 x 3+13 x 6+ 12 x 4+ 16 x 2
X́ = =13.33
3+6+ 4+2

Ejercicio
Supongamos X: Calificaciones en un examen final.
Grupo 1 : Calificación media = 87 puntos ; n1 = 13 estudiantes
Grupo 2 : Calificación media = 79 puntos ; n2 = 16 estudiantes.
Determinar la calificación media para los dos grupos combinados.
Rpta : 82.59
EJERCICIO:
Verifique si son iguales o no las siguientes expresiones.
a ¿ Σ X 2i y (Σ Xi)2

b ¿ Σ 2Yi y 2 Σ Yi

c ¿ Σ Xi .Yi y Σ Xi . Σ Yi

Ejemplo
En un restaurante de la zona centro de Cajamarca, se obtuvieron las siguientes cifras de precios por el
consumo de 15 personas de diversos platos a la carta.
Pollo frito 10 Cau cau 12 Caldo verde 5
Cuy frito 14 Chancho al palo 20 Shambar 10
Cecinas 15 Frito con papa 5 Pato 18
Ceviche 10 Sudado 20 Gallina guisada 15
Pollo a la 10 Parihuela 18 Lomito saltado 20
brasa
Determine la media , mediana y moda , para los precios de cada uno de los platos.

SOLUCION
a) La media aritmética (x )
M(x) =
b) La mediana
Ordenando de menor a mayor:

Me =
c) La moda . Es el dato que más veces se repite: 10
Mo =
2. MEDIANA
Valor central que divide a un conjunto de datos ordenados en dos partes iguales.
Coincide con : D5, Q2 y P50
Importante:
 Un intervalo de interés es [P25 - P75], que contiene al 50% de los datos centrales.
 Por debajo del P25 quedan el 25% de los datos más pequeños.
 Por encima del P75 quedan el 25% de los datos más grandes
USOS
 Cuando los datos no se ajustan a una distribución normal
 Cuando hay valores muy extremos
 Usada en intervalos indefinidos
CARACTERISTICAS:
 No es afectada por valores extremos o atípicos
 Es calculable para datos de nivel ordinal o más altos
 Es más representativa en distribuciones asimétricas.
 En el caso de una variable agrupada, hemos de buscar el intervalo central (en el que se
encuentre el o los valores centrales), es decir, aquel en el que Ni supera por primera vez a
n/ 2 , y aplicar la fórmula :
Fórmula :
n
Me=Limite inferior+
2
−F
fi ( )
∗c

F : Frecuencia acumulada anterior al intervalo mediano


fi : Frecuencia simple del intervalo mediano
C = Amplitud del intervalo mediano
Me = Valor mediano
n = muestra
3. MODA
Valor / intervalo / atributo / categoría: más frecuente.

Mo=Limite inferior+ ( d 1+d 1d 2 )∗c


Mo = Valor modal
d1 = > Frecuencia simple – Frecuencia anterior
d2 = > Frecuencia simple - Frecuencia posterior
C = Amplitud del intervalo modal

PROPIEDADES
 Puede existir más de una moda: distribución es bimodal, trimodal, etc.
 La moda es menos representativa que la media, a excepción de distribuciones con datos
cualitativos.
 Si sus intervalos no tienen la misma amplitud, se busca el intervalo de mayor densidad de
frecuencia ( que es el cociente entre la frecuencia absoluta y la amplitud del intervalo: ni /
Ci )

4. MEDIA ARMÓNICA
Es la inversa de la media aritmética de las inversas de los datos:

n
H=
1 1 1
+ +. ..+
X1 X2 Xn

∀ Xi> 0
Se utiliza para calcular el valor medio de magnitudes expresadas en términos relativos como
velocidades, tiempos, rendimiento, tipo de cambio monetario, etc. Su principal contrariedad es que
cuando algún valor de la variable es cero o próximo a cero no se puede calcular.
Ejemplo:
X1 = 6 , X2 = 12
H=?
Rpta. H = 8
Ejemplo:
X1 = 20 X2 = 30
H= ? Rpta. H = 24

Ejercicios propuestos
Si:
Media de { 1/x , 1/y } = 1/4
Media de { 1/x , 1/z } = 5/24
Media de { 1/y , 1/z } = 7/24
Calcular la media armónica de: x , y , z Rpta. 4

Un ciclista se dirige de Trujillo a Pacasmayo con una velocidad de 90m/s. Si en su viaje de regreso la
velocidad que aplica es de 60 m/s, calcule su velocidad promedio en todo el recorrido.
Rpta. 72 m/s

Un automovilista recorre un circuito de forma cuadrada aplicando en cada lado respectivamente una
velocidad de 20 m/s ; 30 m/s ; 40 m/s y v m/s. Si la velocidad promedio es 32 m/s, calcular v.
Rpta. 60 m/s
5. MEDIA GEOMÉTRICA
Raíz enésima de un producto de n variables. La fórmula de la media geométrica se escribe de la
siguiente manera:

G= √n X 1 . X 2 .. . .. . Xn
∀ xi> 0
USOS
 Para determinar el cambio promedio de porcentajes, razones, índices o tasas de crecimiento.
 También en economía y negocios para determinar los cambios porcentuales de ventas,
salarios o cifras económicas, como el Producto Bruto Interno ( PBI ) , los cuales se combinan
o se basan unos en otros.
Otra Aplicación
Valor periodo final
G=
√ n

Valor periodoinicial
−1

Ejemplo : Crecimiento de la poblacion de una ciudad X


Año Población
1990 258 295 habitantes
2005 534 847 habitantes
¿ Incremento anual promedio ?
Solución
n = 2005 – 1990 = 15 años
Reemplazando en la fórmula :
534 847
G=
15

√ 258295
−1

G = 0.0497 ( 4.97% )
El valor de 0.0497 indica que el crecimiento anual promedio durante el periodo de 15 años fue de
4.97%. Expresado en otros términos, la población de la ciudad X creció a una tasa de 4.97% por año
de 1990 a 2005.
El % de incremento anual promedio es de 4.97%

Ejemplo :
Se desea determinar la tasa de crecimiento promedio en base a los datos que se dan en la
siguiente tabla :
Año Ingresos % del año anterior
2010 50 000 ------
2011 55 000 55 / 50 = 1.1
2012 66 000 66 / 55 = 1.2
2013 60 000 60 / 66 = 0.91
2014 78 000 78 / 60 = 1.3

Solución

G= 4√ 1.1 x 1.2 x 0.91 x 1.3


G = 1.1179
Restando 1, para convertirlo a un incremento anual promedio resulta 11.79 % para el periodo
indicado.
Ejemplo:
Recuperaciones de inversiones
30 %
20 %
-40 %
200 %
¿ Cuál es la media geométrica de la recuperación de la inversión ?
Solución
Convirtiendo a incrementos, se tiene :
1.3
1.2
0.6
3
G= 4√ 1.3 x 1.2 x 0.6 x 3
G = 1.294
Restando 1, resulta 0.294 ( 29.4 % )
El % promedio de recuperación de la inversión es 29.4 %

Ejemplo
Calcule la media geométrica de la tasa de rendimiento . El porcentaje de cambio del índice compuesto
NASDAQ fue del −31.53% en 2002 y del +50.01% en 2003. Calcule la tasa geométrica de
rendimiento.
Solución
0.6847
1.5
G= √ 0.6847 x 1.5
G = 1.0134
La media geométrica de la tasa de rendimiento del índice NASDAQ para los dos años es del 1.34%.

Ejemplo
Considere el crecimiento de una cuenta de ahorros. Supongase que se depositan 100 soles
inicialmente y se dejan acumular intereses a diferentes tasas durante cinco años. El crecimiento se
resume en la siguiente tabla.Calcular el factor de crecimiento promedio.
Año Tasa de interes Factor de Ahorros al
(%) crecimiento final del año
1 7 1.07 107
2 8 1.08 115.56
3 10 1.10 127.12
4 12 1.12 142.37
5 18 1.18 168
Factor de crecimiento = 1 + ( tasa de interes /100 )
El ahorro al final del año = Cantidad al final del año x factor de crecimiento
MG = ( 1.07 x 1.08 x 1.10 x 1.12 x 1.18 ) 1/5
MG = 1.11

Relación entre Media , Mediana y Moda


Acumulación de puntuaciones:
En la parte central de la En la parte inferior En la parte superior
distribución de la distribución de la distribución

Ejercicio
Con los siguientes datos , que describen las probables formas de distribución para cada una de las
variables citadas. Trace la curva indicando las ubicaciones relativas de la media, mediana y moda.
Variable Forma de Trazo de
Media Mediana Moda
curva curva

Edad ( años ) 30 35 39

Tamaño de la familia 4 4 4

Años empleado 11 8 7

Peso ( Kg. ) 80 66 67
Ejercicio
Con los siguientes datos , que describen las probables formas de distribución para cada una de las
variables citadas. Trace la curva indicando las ubicaciones relativas de la media, mediana y moda.
Variable Forma de Trazo de
Media Mediana Moda
curva curva

Estatura ( cm. ) 180 90 173

Exámenes 10 13 15

Presupuesto 130 109 104

Edad ( años ) 60 60 60

Ejercicio
Supongamos que las siguientes son las edades medias de pacientes adictos a sustancias, en un hospital
local para su tratamiento, separadas por tipo de adicción. Calcular la edad media de todos los
pacientes adictos a sustancias del hospital. Los datos X: edad.

Adicción primaria
Cocaína Cocaína crack Heroína Alcohol
( n = 44 ) ( n = 29 ) ( n = 24 ) ( n = 69 )
Edad media ( años ) 29.8 23.4 34.6 42.9
Diagrama de caja.
Para describir un conjunto de datos es muy eficaz un resumen de cinco puntos.
El resumen de cinco puntos está compuesto por:
 Xmin
 Q1
 Q2 ( mediana )
 Q3
 Xmáx
MEDIDAS DE POSICIÓN RELATIVA

Cuartiles, Deciles y Percentiles


Son medidas basadas en la ordenación de los datos. Dividen al conjunto ordenado de datos en partes
iguales. Según el número de partes, hablamos de:

Cuartiles:
Dividen al conjunto de datos en 4 partes iguales, cada una de las cuales engloba un 25% de datos. Son
tres cortes , o sea 3 cuartiles: Q1, Q2, Q3.
Deciles:
Se forman 10 partes iguales, cada una representa un 10% de datos. Son 9 cortes, es decir 9 deciles: D1,
..., D9.
Percentiles:
Dividen al conjunto de datos en 100 partes iguales, cada una de las cuales engloba un 1% de datos.
Son 99 cortes, por lo que hay 99 percentiles: P1, P2, . . . , P99.
La forma de cálculo de los cuantiles es similar a la de la mediana.
Ejemplo :
X : Peso de niños recién nacidos
P10 = 2700 gramos
El 10% de los niños recién nacidos tienen un peso inferior a 2 700 gramos.

Factor de
FÓRMULAS : MEDIDAS DE POSICIÓN RELATIVA
inicio
CUARTILES
k n/ 4−F i−1
(k=1,2,3)
Qk =Limite inf .+ ( fi ) ∗c
kn/4

DECILES
(k=1,2,3,...9)
Dk = Limiteinf .+ ( k n/10−F
fi )∗c
i−1 kn/10

PERCENTILES
( k = 1 , 2 , 3 , . . . . 99 )
Pk =Limite inf .+ ( kn/100−F
fi )∗c
i−1 kn/ 100

Fi-1 = Frecuencia absoluta simple anterior al Qk ; Dk ; Pk deseado


MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y KURTOSIS

Precios
Rentabilidad
Gastos
Ingresos
Ventas, etc.
Y deseamos calcular medidas de posición central, de dispersión y de correlación con el objeto de
resumir las propiedades básicas de dichos datos.
¿ Conoce más datos ? : Dato mínimo, dato máximo, riesgo , variabilidad.
¿ Es suficiente la media ?
Las medidas de dispersión, como la varianza o la desviación estándar miden la dispersión de los
valores observados con respecto a la media. La diferencia entre ellas es que mientras la primera está
dada en unidades al cuadrado : cm2 , m2 , Kg2 , . . . , la desviación estándar está expresada en
unidades lineales: cm, m , Kg , . .
1. Rango
Rango = valor máximo – valor mínimo
2. Rango Intercuartílico
RI = Q3 – Q1
3. Desviación media
Media aritmética de los valores absolutos de las desviaciones con respecto a la media
aritmética.
4. Varianza
Media aritmética de las desviaciones cuadráticas respecto de la media.
Símbolos: 2 , S2 , V(x)

2 Σ ( X −μ )2
σ =
N
2Σ ( X −μ )2∗f i
σ =
N

2
σ 2=E ( X 2 ) −[ E ( X ) ]

2
Σ ( X− X́ )
2
S=
n−1

2
Σ ( X− X́ ) ∗f i
2
S=
n−1

2
( Σ Xi)
2
[
S = ΣX −
2
i
n ] /( n−1)

PROPIEDADES
1) V( c ) = 0 ; c = constante
2) V( x ± c ) = V( X )
3) V( cx ) = c2.V( x )

5. Desviación estándar
Es la raíz cuadrada positiva de la varianza.
S=+ √Varianza
Símbolo : 𝞼 , S

6. Coeficiente de variación
Es una medida que sirve para comparar la variabilidad en un conjunto de datos con la de otro.

Por ejemplo:
Consumo de leche por
Medidas estadísticas familia y por semana
País “ A “ País “ B “
Media muestral 8 galones 12 litros
Desviación estándar muestral 3 4
Coeficiente de variación 37.5% 33.3%

No tiene sentido comparar estas desviaciones estándar directamente porque están dadas en unidades
diferentes.
Una forma rápida de comparar la variabilidad es con el coeficiente de variación (CV), que está dado
por:

σ S
CV = ∗100 ; CV = ∗100
μ X́
Los datos del país A presentan más variabilidad que los del país B
También podemos decir: Mide la concentración relativa de los datos entorno a la media. Cuanto más
próximo a cero esté, menor dispersión habrá, y por lo tanto más representativa será la media.
Toma y Rubio (2008), indican que es una medida de dispersión relativa que se define como el cociente
entre la desviación estándar y la media aritmética de un conjunto de observaciones. Si se desea expresar en
porcentaje el coeficiente mencionado se multiplica por 100.

CV Grado de Variabilidad
0 ≤ CV < 10 Datos muy homogéneos
10 ≤ CV < 15 Datos regularmente homogéneos
15 ≤ CV < 20 Datos regularmente variables
20 ≤ CV < 25 Datos variables
CV ≥ 25 Datos muy variables

ASIMETRÍA
MEDIDAS DE ASIMETRIA
Esta referida a un eje que pasa por su media. El coeficiente se basa en el hecho de que cuanto mayor
sea la asimetria, mayor será la diferencia entre la media y la mediana.
Permite establecer el grado de simetría (o asimetría) que presenta una distribución sin hacer su
gráfica.
COEFICIENTE DE SESGO DE PEARSON
3( X́−Me)
AS=
S
3
∑ ( X − X́ )
AS=
n . S3
Si AS < 0 “ Asimétrica negativa “
Si AS > 0 “ Asimétrica positiva “
Si AS = 0 “ Simétrica “

PANELES DE LA GRÁFICA CAJA Y BIGOTES


 Proporcionan una visión general de la simetría de la distribución de los datos, si la media no
está en el centro del rectángulo, la distribución no es simétrica.
 Son útiles para ver la presencia de valores atípicos.
 Muy útiles para comparar distribuciones.
MEDIDAS DE KURTOSIS O APUNTAMIENTO
Nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la
distribución normal o gaussiana. Es una medida adimensional.

4
Σ ( X− X́ ) ∗f i
K=
n . S4

Si K < 3  “ Platicúrtica “ ( Aplanada )


Si K = 3  “ Mesocúrtica “ ( Como la normal )
Si K > 3  “ Leptocúrtica “ ( Apuntada )

También :
P 75 −P25
K=
2(P90 −P 10)
Si k = 0.263, “ Mesocúrtica “
Si k < 0.263 “ Platicúrtica “
Si k > 0.263 “ Leptocúrtica
TRABAJO PRÁCTICO
Según un test que evalúa la variable Depresión, los pacientes que obtienen una puntuación superior a
40 presentan riesgo suicida. La siguiente es la distribución de frecuencias de los puntajes obtenidos en
el test por 45 mujeres y 60 varones diagnosticados como depresivos, que concurren al Centro de salud
“ Simón Bolívar “.
Puntaje Mujeres Varones
15.5 - 22.5 10 18
22.5 - 29.5 7 24
29.5 - 36.5 14 11
36.5 - 43.5 10 2
43.5 - 50.5 4 5
¿Cuál de los dos grupos presenta el mayor porcentaje de pacientes con riesgo suicida?

SOLUCIÓN
Queremos calcular el porcentaje de observaciones que supera la puntuación 40. El intervalo crítico
será aquél que incluye dicha puntuación.
Grupo de Mujeres:
El intervalo critico es ?: ……………………
Puntaje Mujeres
15.5 - 22.5 10
22.5 - 29.5 7
29.5 - 36.5 14
36.5 - 43.5 10
43.5 - 50.5 4
Total 45

7  10 mujeres
3.5  x
X=5
Luego : 5 + 4 = 9 mujeres ( 20% ) [ % de muj. que superan puntuación suicida ]
Grupo de Varones:
El intervalo crítico es ?: ……………………
Puntaje Varones
15.5 - 22.5 18
22.5 - 29.5 24
29.5 - 36.5 11
36.5 - 43.5 2
43.5 - 50.5 5
Total 60
Hacer el mismo procedimiento que en mujeres

CONCLUSIÓN:
Las ………………………. presentan > % de riesgo suicida ………………………………………………………………………………….
Mujeres =
Varones =

CALIFICACIONES
A continuación presentamos una tabla con la distribución de frecuencias de las calificaciones finales en
Lenguaje de niños del 6° grado del turno mañana y también algunos resúmenes estadísticos
correspondientes al turno tarde.
Turno mañana Turno tarde
Calificación fi Calificaciones
4- 7 2
7 - 10 7 M( X) = 14
10 - 13 8 Moda = 15
13 - 16 2 S=2
16 - 19 1 n = 25
Total
a) ¿Qué grupo parece haber tenido mejor rendimiento? ¿Por qué?
b) ¿En qué grupo hay mayor variabilidad relativa a la media?

SOLUCIÓN ( completar las celdas en blanco )

TURNO MAÑANA
Calificación Xi fi F Xi . fi ( Xi – media)2 .fi
4- 7 2
7 - 10 7
10 - 13 8
13 - 16 2
16 - 19 1
Total n=
a)
Media = ………… = y Mediana =
20
El turno …………………..tiene mejor rendimiento ya que, resumiendo sus puntajes con las medidas de
tendencia central, vemos que son mayores que en el turno ………….:……….
b)
Debemos calcular el coeficiente de variación en ambos grupos. Recordemos que el coeficiente de
variación nos informa sobre la representatividad de la media aritmética del conjunto de
observaciones. A mayor coeficiente de variación, menor representatividad de la media, y, a menor
coeficiente de variación, mayor representatividad de la misma.

TURNO : MAÑANA
Media =
Mediana =
Moda =
Desviación estándar =
Coeficiente de variación
CV = / x 100 =
TURNO TARDE
CV = / x 100

La mayor variabilidad relativa a la media se da en el turno ………………………., pues su CV =


…………………………… mientras que en el turno …………………………… el CV es de ……………………….

TELEVISIÓN
Un investigador ha relevado la cantidad de horas que miran televisión los fines de semana los niños del
colegio Santa Teresita, para lo cual tomó una muestra aleatoria de 16 niños del quinto grado “A”.
Otro investigador realizó el mismo relevamiento pero sobre una muestra de niños de la sección “B”. A
continuación se presentan los datos de ambos investigadores:

Quinto grado “ A “ Quinto grado “ B ”


Calificación fi Calificaciones
0- 4 2
4 -8 4 M( X) = 11
8 - 12 5 Moda = 13
12 - 16 3 Me = 12
16 - 20 2 S = 2.2
Total n= n = 20

a ) ¿Qué grupo mira en general mayor cantidad de horas de televisión? ¿Por qué?
b) Si se comparan las dos muestras ¿cuál presenta mayor variabilidad relativa a la media?

SOLUCIÓN ( Primero completar las celdas en blanco )


QUINTO GRADO “ A “
Calificación Xi fi F Xi . fi ( Xi – media)2 .fi
0- 4 2
4- 8 4
8 - 12 5
12 - 16 3
16 - 20 2
Total n=

ESTUDIANTES
La siguiente tabla muestra la distribución, por género, de estudiantes de una Universidad que se
gradúan según áreas de especialización:
Hombres Mujeres
Administración 400 100
Educación 50 150
Humanidades 150 200
Biológicas 250 100
Ciencias Sociales 200 200
Total
En relación a lo anterior responde:
a) De todos los estudiantes que se gradúan. ¿Cuál es el porcentaje de mujeres?
b) De todos los estudiantes que se gradúan. ¿Cuál es el porcentaje de graduados en el área de las
Ciencias Sociales?
c) De todos los estudiantes que se gradúan. ¿Cuál es el porcentaje de graduados de sexo masculino?
d) De todas las mujeres que se gradúan. ¿Qué porcentaje de ellas se gradúan en el área de
Humanidades?
e) De todos los hombres que se gradúan. ¿Qué porcentaje de ellos se gradúan en las áreas de
Administración de Empresas y Biológicas?

TRABAJO PRÁCTICO
Un educador Social está trabajando en un equipo para colaborar en la reinserción social. Uno de los
problemas observados en la reinserción es la aparición de depresiones. El Psiquiatra del equipo ha
dividido a los pacientes en tres grupos y les está aplicando tres terapias diferentes. Ha enviado al
centro de cálculo los resultados de una prueba que mide el grado de depresión y le han devuelto la
gráfica siguiente:

1. ¿Qué terapia ha resultado más eficaz? Es decir, como la prueba mide el rasgo “depresión “,
¿Con que terapia se obtuvo una media más baja en depresión?
a) Con la A b) Con la B c) Con la C
2. ¿ En qué grupo encontramos la mediana más alta ?
a) En la A b) En la B c) En la C
3. ¿ A qué distribución podríamos calificar como leptocúrtica ?
a) A la A b) A la B c) A la C
4. Si sus modas son 20, 30, y 40 ¿ A cuál corresponde la moda de 40?
a) A la A b) A la B c) A la C
5. ¿ Qué distribución muestra una clara asimetría positiva
a) La A b) La B c) Ninguna

TRABAJO PRÁCTICO
Un grupo de educadores sociales está realizando un programa de atención y orientación a familias.
En un proceso de observación sistemática toman nota de un conjunto de aspectos que pueden
influir sobre el éxito del programa medido mediante una encuesta realizada a los participantes y
convertido a una escala continua de valoración de 0 a 10. El resultado de la encuesta, de una muestra
de 10 familias sobre un total de 180 participantes, se presentan en la tabla siguiente:
Cohesió Nivel Nivel
Participante Empatía Violencia económico sociocultural éxito
n
1 28 18 22 Medio alto Muy alto 2
2 44 4 3 Alto Intermedio 4
3 33 38 21 Medio alto Alto 3
4 16 8 11 Bajo Muy bajo 2
5 16 9 16 Alto Bajo 9
6 12 28 44 Medio alto Bajo 10
7 39 11 5 Medio bajo Intermedio 4
8 31 41 8 Alto Bajo 6
9 48 4 1 Alto Alto 1
10 8 13 23 Medio alto Muy alto 5
a) ¿ Se pueden calcular la media y la moda sobre las variables empatía y nivel económico ?
a) Solo la media sobre la variable empatía
b) La media y la moda sobre la variable empatía
c) La media y la moda sobre las dos variables
b) La media de la variable empatía es 27.5 ¿ Cómo serán la distribución de los datos si Q1 = 16 ,
Q2 = 29.5 y Q3 = 37.5
a) Simétrica
b) Asimétrica positiva
c) Asimétrica negativa
c) Calcular los grados de libertad de la tabla de contingencia entre nivel económico y nivel
sociocultural.
d) Gl. = 12
e) Gl = 10
f) Gl = 8
d) Con que prueba estadística podemos contrastar si existe diferencia significativa en la
cohesión familiar en función del nivel económico ?. Se supone normalidad e igualdad de
varianzas.
a) La prueba Chi – cuadrado
b) El análisis de varianza unifactorial
c) La prueba U de Mann Whitney
e) Si planteamos que la cohesión es mayor en las familias que tienen un nivel sociocultural alto o
muy alto frente a aquellos de nivel bajo o muy bajo ? Estamos planteando :
a) Una hipótesis nula
b) Una hipótesis bilateral
c) Una hipótesis unilateral
f) Con los datos presentados, cual es la relación entre empatía y cohesión ?
a) – 0.82
b) – 0.71
c) – 0.65
g) Determinar la media y la mediana de la variable éxito
d) Media = 4.6 ; Mediana = 4
e) Media = 4.6 ; Mediana = 4.6
f) Media = 4.6 ; Mediana = 3.8

h) Si el valor del estadístico Chi cuadrado es 17.91. A nivel de confianza del 95% con 12 gl. ¿Cuál
es la probabilidad de rechazar la hipótesis de independencia entre las variables categóricas,
nivel económico y nivel sociocultural?
g) 0.11
h) 0.13
i) 0.14
i) Si no sabemos determinar la normalidad de la distribución poblacional del variable éxito.
¿Qué prueba estadística utilizaremos para saber si existe diferencia significativa entre las
familias de nivel sociocultural muy alto o alto frente a aquellas de nivel muy bajo o bajo?
j) La prueba T de Students para grupos pequeños
k) La prueba U de Mann Whitney para grupos independientes
l) La prueba U de Mann Whitney para grupos relacionados

PUNTAJES
Los puntajes obtenidos en dos secciones A y B , del quinto año de secundaria del colegio Urrelo en el
curso de Redacción fueron los siguientes :
Sección A Sección B
14 16 12 15 11 12 10 11
12 14 14 11 14 11 12 10
13 14 12 13 14 16 10 11
16 14 11 12
a) ¿Cuáles son la media y desviación estándar para la sección A ?
b) ¿Cuáles son la media y desviación estándar para la sección B ?
c) Compare los centros y variabilidades de las dos secciones usando resultados de los incisos a) y b).
PLANES DE LECCIÓN
En un estudio para evaluar la relación entre planes de lección escritos y su implementación en el salón
de clases, se calificaron 25 planes de lección en una escala de 0 a 34 de acuerdo a una Lista de
verificación de Plan de lección. Las 25 calificaciones se muestran a continuación:
26.1 26.0 14.5 29.3 19.7
22.1 21.2 26.6 31.9 25.0
15.9 20.8 20.2 17.8 13.3
25.6 26.5 15.7 22.1 13.8
29.0 21.3 23.5 22.1 10.2
a) Hacer la distribución de frecuencias
b) Calcule la media aritmética, mediana y moda
c) Calcular la varianza y desviación estándar
d) Calcular la varianza usando la regla empírica.
COMPLETAR
Completar los espacios en blanco en la siguiente tabla:
Suma de Desviación
n Varianza
cuadrados estándar
38.76 7
347 295 .92 1041 18.27
91 40.89
5865.04 17.56
EXAMEN
Si el examen final de Inglés, vale tres veces más que una evaluación parcial y un estudiante tiene
calificación 85 en el examen final y, 70 y 90 en los dos parciales, calcular su calificación media.
Solución

M(x) = ?

AMBIVALENCIA SOCIAL
Los siguientes datos representan las puntuaciones de ambivalencia social para 15 personas, medidas
por un examen psicológico. (Cuanta más alta la calificación, más fuerte es la ambivalencia.)
9 13 12 14 15 11 10 4 10 8 19 13 11 17 9
a) Calcule M(X) y S , para las 15 calificaciones de ambivalencia social.
b) Encuentre dos valores, a y b, tales que al menos 75% de las mediciones caen entre a y b.

ATLETISMO
Un club de atletismo organiza una carrera para seleccionar a niños que representarán al club en una
competencia. En la siguiente tabla se muestran los tiempos que tardaron los niños del grupo en
completar el recorrido de la carrera.
Tiempo t
10 – 12 12 – 14 14 – 20 20 – 26 26 – 28 28 - 30
en minutos
fi 50 20 P 40 20 20
Fi 50 70 120 Q 180 200
a) Calcular el valor de p y q.
Se seleccionan para la competencia a los niños que hayan tardado menos de x minutos en
completar el recorrido de la carrera.
b) Sabiendo que un 40% de los niños no son seleccionados.
i) Halle el número de niños que no son seleccionados
ii) Hallar x.

SUEÑO Y EL ESTUDIANTE UNIVERSITARIO


¿Cuánto tiempo duerme en una noche típica? A un grupo de 10 estudiantes universitarios se le pidió
informaran del número de horas que durmió en la noche previa, con los siguientes resultados:
7 ; 6 ; 7.25 ; 7 ; 8.5 ; 5 ; 8 ; 7 ; 6.75 ; 6
a) Encuentre la media y la desviación estándar del número de horas de sueño para estos 10
estudiantes.
b) Construya una gráfica de caja para los datos. Interprete.

PUNTAJES
En base al siguiente cuadro:
Puntajes
Medidas Estadísticas
Sección “ A “ Sección “ B “ Sección “ C “
Media aritmética 14 13 18
Mediana 16 13 16
Moda 17 13 14
Desviación estándar 3 0.4 3.9
Desviación Intercuartil 1 2 4
a) Calcular la simetría de la sección B
b) Cuál de las tres secciones tiene mayor variabilidad
c) Cuál de las secciones tiene forma SIMÉTRICA
d) Cuál de las secciones tiene asimetría positiva
e) Determine el coeficiente de variación de la sección C
f) Determine la varianza de la sección B
g) Determine la asimetría de la sección A
h) Aproxime el primer y tercer cuartil de la sección B
i) Qué dato(s) falta para hacer la gráfica de cajas de la sección B
GRUPOS
Indicar dos grupos, de 5 datos cada uno, que presenten :
a) La misma media pero distinta desviación estándar.
b) La misma desviación estándar pero distinta media.
c) La misma mediana y distinta media.
d) La misma media y distinta mediana.

IMPUESTOS
Una muestra de cinco capturistas de datos que laboran en la oficina de impuestos de “ Harry el Sucio”
revisó los siguientes números de expedientes fiscales durante la última hora: 73, 98, 60, 92 y 84.
a) Calcular la media, la mediana y la desviación estándar.
b) Calcular el coeficiente de asimetría de Pearson.
c) ¿Qué conclusión obtiene respecto del sesgo de los datos?

LLUVIA
SENAMHI ha registrado datos sobre la cantidad mensual de lluvia caída en 3 estaciones de una
ciudad en mm3 Un ingeniero ambiental resumió estos datos en el siguiente gráfico:
Otoño Invierno Primavera
a) En que estación se tiene la mayor mediana
b) Es posible afirmar que las tres estaciones presentan una misma dispersión respecto al 50%
central.
EL MENOR
La media aritmética de 3 números es 7, la media geométrica es igual a uno de ellos y su media
armónica es igual a 36/7. Hallar el menor de los números. Rpta. 3

SUMA
Considerar 3 números. Si se añade el promedio de dos de ellos al número restante, se obtienen los
números: 17, 16 y 15. Calcular la suma de los tres números originales. Rpta. 24
EJERCICIO
En el tablero siguiente, determine la diferencia entre la moda y la media aritmética.

Intervalos fi
n+1
[ 2n – 4 , 2n – 2 > 2
[ 2n – 2 , 2n > 2n+2
[ 2n , 2n + 2 > 2n+4
[ 2n + 2 , 2n + 4 ] 2n+3
Considere: n = 210 - 2
EJERCICIO
El número más pequeño en una lista se cambia de 12.9 a 1.29.
a) ¿Es posible determinar cuánto cambia la media? Si es así, ¿en cuánto cambia?
b) ¿Es posible determinar cuánto cambia la mediana? Si es así, ¿en cuánto cambia? ¿Qué pasa si la
lista consta de solamente dos números?
c) ¿Es posible determinar cuánto cambia la desviación estándar? Si es así, ¿cuánto cambia?

CALCULAR
Dada la siguiente tabla de frecuencias, de ancho de clase constante, calcule la diferencia entre la
moda y la mediana ( a < b < d < c ).
Intervalos fi Fi hi
[ 15 , 25 > a
[ 25 , 35 > b 55
[ , > c 0.25
[ , > b
[ , > d 160
Total
Rpta: 1.25

NÚMEROS
La media aritmética de 50 números es “n” y la media aritmética de otros 30 números es ( n
– 8). Si la media de los 80 números es 12. Hallar “n”. Rpta. 15
MEDIA ARITMÉTICA
La media armónica de las inversas de las medias aritméticas y geométrica de dos números es
1/25. Hallar la media aritmética de las raíces cuadradas de los dos números. Rpta. 5

CALCULAR n
La media aritmética de “ n “ números es 50. Si se suprimen todos los 20 que son en total “ x
” , la media aritmética aumenta en x unidades. Encuentre “ n ” si este número es a x como 8
es a 3. Rpta. 48
CALCULAR SUMA
La media armónica de dos números pares consecutivos es 8. 8^ . Calcule la suma de los números.
Rpta.
18
APROBADOS
Un profesor considera que deben promocionar la asignatura los alumnos que obtuvieron un promedio
de notas superior a 35 puntos. La siguiente es la distribución de frecuencias de los promedios de las
notas de dicho profesor:
X fi
0 – 20 5
20 – 40 16
40 – 60 38
60 - 80 25
80 – 100 6
Calcule el % de alumnos que desaprobaron el curso

ESTATURA
Para realizar un estudio sobre la estatura de los estudiantes universitarios, seleccionamos, mediante
un proceso de muestreo aleatorio, una muestra de 30 estudiantes, obteniendo los siguientes
resultados (medidos en centímetros) :
179 ; 173 ; 181 ; 170 ; 158 ; 174 ; 172 ; 166 ; 194 ; 185
162 ; 187 ; 198 ; 177 ; 178 ; 165 ; 154 ; 188 ; 166 ; 171
175 ; 182 ; 167 ; 169 ; 172 ; 186 ; 172 ; 176 ; 168 ; 187
Se pide:
a) Construir una tabla de distribución de frecuencias.
b) Dibujar el diagrama de cajas. Interprete.

TRABAJO PRÁCTICO
Un grupo de educadores sociales está realizando un programa de atención y orientación con
emigrantes. En un proceso de observación sistemática toman nota de un conjunto de aspectos que
influyen sobre el éxito del programa medido mediante una encuesta realizada a los participantes y
convertido a una escala continua de valoración de 0 a 10.
Los aspectos medidos son:
Nivel académico ( 1: Sin estudios , 2: Primaria , 3: Secundaria , 4: Superior , 5: Técnica )
Nivel de lenguaje ( 1: bajo , 2: alto )
Nivel socioeconómico ( 1: bajo, 2: medio, 3: alto )
Edad
Sexo
Éxito
Los datos de las variables de clasificación y el resultado de una muestra de 10 emigrantes sobre un
total de 120 participantes, están recogidos en la tabla siguiente:
Participante Sexo Edad Nivel_aca Nivel_leng Nivel_socioec Éxito
d .
1 1 30 1 1 2 3
2 1 42 1 1 2 3
3 1 36 2 1 2 4
4 1 38 2 1 2 2
5 2 42 2 1 3 7
6 1 36 2 2 3 2
7 2 33 3 2 3 9
8 1 30 4 2 3 8
9 2 28 4 2 1 8
10 1 30 3 2 1 6
a) Verificar la normalidad de la distribución poblacional del variable éxito.
b) Existe diferencia significativa entre los emigrantes de nivel socioeconómico alto frente a
aquellos de nivel bajo
c) En la tabla adjunta, calcular la media de las edades
d) Establecer la relación que existe entre nivel socioeconómico y éxito.
e) Calcular la moda del nivel socioeconómico
f) Calcular el promedio del nivel de lenguaje.
g) Determinar la media y mediana del éxito

CALCULAR
En base a los datos de la siguiente tabla:
Lugar Población en N° de alumnos N° alumnos no N° de
edad escolar matriculados matriculados profesores
A 3 00 000 248 000 7 000
B 150 000 106 000 4 000
C 25 000 24 000 1 200
D 160 000 142 000 4 750
Fuente : datos ficticios
Calcular para cada lugar:
a) Proporción de alumnos matriculados
b) Proporción de alumnos por maestro
c) Tasa de escolaridad
d) N° de alumnos no matriculados
e) Porcentaje de alumnos no matriculados

DIAGRAMA DE CAJAS y BIGOTES


El diagrama siguiente es un diagrama de caja y de bigotes para un conjunto de datos.

El rango intercuartil es 20 y el rango es 40.


a) Escriba el valor de la mediana.
b) Encuentre el valor de (i) a ; (ii) b.

ENCUESTA
A diez alumnos se les hizo una encuesta preguntándoles cuántas horas, x , habían estado
navegando en Internet durante la semana 1 del año escolar. Los resultados de la encuesta se
muestran a continuación.

10

∑ Xi=252; σ =5 y mediana=27
i=1
a) Halle la media del número de horas que estuvieron navegando en Internet
b) Durante la semana 2, los alumnos estuvieron trabajando en un proyecto importante y cada
uno de ellos estuvo cinco horas adicionales navegando en Internet. Para esta semana 2,
escriba
i) La media (ii) la desviación estándar.
c) Durante la semana 3, cada alumno estuvo navegando en Internet un 5 % menos de tiempo
que durante la semana 1. Para esta semana 3, halle
i) La mediana ii) la varianza.
d) Durante la semana 4, la encuesta se amplió a los 200 alumnos del colegio. Los resultados se
muestran en el gráfico de frecuencias acumuladas que aparece en la siguiente página.
i) Halle el número de alumnos que estuvieron entre 25 y 30 horas navegando en
Internet.
ii) Sabiendo que el 10 % de los alumnos estuvo más de k horas navegando en
Internet, halle el valor máximo de k.

PROBABILIDAD
Motivación
Este año 2018 , son casi 365 años desde que Pierre Fermat y Blaise Pascal conversaron sobre un
famoso problema : “los repartos”. Hoy en día las probabilidades se aplican a diferentes áreas del
quehacer humano: genética, proyectos, negocios etc.
Muchas personas lo relacionan con : el diablo, la providencia, el azar, la brujería, chamanes, suerte,
etc
Habrá algunos que no creen en las probabilidades?
Profecias de Nostradamus.
Lo que vemos en la práctica es solo la punta del iceberg, porque es mucho más denso, complejo
y a veces podríamos decir inaccesible para el ser humano, entonces hablamos de robots,
máquinas artificiales que nos resuelven los problemas en segundos.

Introducción
¿Qué es probabilidad?
Pronósticos climáticos
Juegos
Proyectos de inversión
Genética, salud
Pronósticos meteorológicos ( senamhi )
Eventos de la naturaleza etc. )
Investigación científica.
Economía ( bolsa de valores, inflación, etc. )
Eventualidades (incendios, plagas , cortocicuitos , accidentes laborales, fugas de gas, fuga de material
radiactivo, negocios, epidemias, derrame de residuos sólidos, salud, La propagación de un incendio
etc.

|
¿ Las comunidades rurales e indígenas creen en las probabilidades ?
Los incendios muestran un comportamiento aleatorio
El azar favorece a los que están preparados.
Cuál es la probabilidad de llegar a la cima del Himalaya
Cuál es la probabilidad que se complique una cirugía
Cuál es la probabilidad que se complique la herida en pacientes con diabetes.
Cuál es la probabilidad que un político mienta.
Cuál es la probabilidad de remolcar un iceberg gigante desde la Antártida hasta el golfo Pérsico.

Conceptos Básicos
Experimento aleatorio:
Proceso mediante el cual da lugar a eventos no predecibles.
Ejemplos :
EXPERIMENTOS PROBABILISTICOS
EXPERIMENTO / ACONTECIMIENTO POSIBLES RESULTADOS
Sismo Grado 1, grado 2, ……….grado 10
Lanzamiento de un dado 1,2,3,4,5,6
Aparición de remolinos a diferentes escalas.
Las turbulencias aéreas o marinas
La trayectoria que seguirá el agua en una inundación
Tormenta

Espacio muestral :
Conjunto total de resultados posibles de un experimento aleatorio
Eventos:
Subconjunto del espacio muestral, generalmente se simbolizan con letras mayúsculas: A,B, . . . Z

Tipos de eventos
 Evento Unitario: Posee un solo resultado
 Evento compuesto: Posee dos o más resultados
 Evento nulo o vacío: Sin resultados
Ejemplos de aplicación
Previa : Eventos nulos, elementales, compuestos
Decidir si los siguientes conjuntos son vacíos, unitarios o compuestos
a) X = { x / x2 = 36 y 2 x = 8}
b) X = { x / x ≠ x }
c) X = { ∀ x/ x + 23 = 23 }
X
d) X = { ∀ x / ( √ X ) =X √ X }
5 x−3
e) X ={∀ x / ( x +0.6 ) =16 }

√x 1 3

f) X ={∀ x / X = 3 }
√x
1
g) 8 4

X ={∀ x / X =( √ 2 ) √ 8 }
X
4

i) Determinar cuáles de los siguientes conjuntos son iguales: ∅ ; {∅} ; {0} Rpta. Ninguno.
Fenómenos aleatorios
 La propagación de la llamas de un incendio
 La trayectoria que seguirá el agua en una inundación.
 Dónde se habrá generado la filtración que ha provocado una gotera en el techo.
 Las turbulencias aéreas o marinas que provocan desastres
 movimiento de los insectos.
 Dirección de vuelo de las aves migratorias.
 Trayectoria de los huaycos
 Comportamiento de algunos fluidos. ( Ecuación sin resolver. Navier Stockes ).

Fórmula operativa de Probabilidad :


A: evento no vacío, asociado a su espacio muestral ( Ω ).

Total de casos favorables de A n( A )


P(A) = ---------------------------------------------- = -----------------
Total de casos posibles n( Ω )
Algunas propiedades de la probabilidad:
Sean A , B y C eventos no vacíos :
1 ) 0 ≤ P(A) ≤ 1
2) P(A U B ) = P(A) + P(B) – P(A ∩ B )
3) P(A U B U C) = P(A) + P(B ) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C)
4) P(A)c = 1 - P(A)
5) Si A  B , entonces P(A) ≤ P(B)
6) Si A  B , entonces P(B - A) = P(B) - P(A)
7) P( φ ) = 0
8) P(Ac/B) = 1 – P(A/B)

Leyes de Morgan
(A ∩ B )c = Ac U Bc
(A U B )c = Ac ∩ Bc
Al menos uno de dos eventos ≡ A U B

EJEMPLO :
Se prueban tres componentes electrónicos. Calcular su espacio muestral.
F = Funciona el componente electrónico y
N = No funciona el componente electrónico, se escribe como:
Solución
Ω = { NNN , NNF , NFN , FNN , FNN , NFF, FNF , FFN , FFF }
SONDEO DE OPINIÓN
A un grupo de estudiantes universitarios de distintas facultades se le aplica un cuestionario para
conocer su opinión sobre las pruebas de selectividad. Los resultados fueron los siguientes.

Derecho Matemáticas Medicina Química Total


A favor 320 250 510 45
En contra 500 150 520 200
No contesta 200 50 210 35
Total
Si se selecciona un alumno al azar, cuál es la probabilidad de que:
a) Esté a favor de la selectividad
b) Sea de Matemáticas y esté a favor de la selectividad
c) Estando en contra de la selectividad, sea de Matemáticas.
d) Siendo de Química, este en contra de la selectividad.

ENCUESTA
Se llevó a cabo una encuesta para conocer los hábitos de lectura. Las preguntas hechas y sus
respuestas son las siguientes:
Pregunta Porcentaje de afirmativas
¿Lee usted el periódico “Panorama “ ? 45%
¿Lee usted el periódico “Ojo “ ? 36%
¿Lee usted el periódico “Popular “ ? 25%
Continuando con el análisis de los resultados se observó lo siguiente:
9% leen Panorama y el Ojo
5% leen Panorama y El Popular
6% leen Ojo y El Popular
En base a estos resultados, ¿qué probabilidad hay de que una persona elegida al azar lea:
a) “ Panorama o el Ojo “
b) “ El Popular o el Ojo “
c) “ El Popular o Panorama “

PERIÓDICO:
Supongamos que el 60% de todos los hogares de una determinada comunidad se suscriben al
periódico A, el 80% se suscriben al periódico B y el 50% se suscriben a ambos periódicos. Si un
hogar es elegido al azar encontrar la probabilidad que se suscribe:
a) A al menos uno de los dos
b) exactamente a uno de los dos.

FRUTAS
Un refrigerador contiene 6 manzanas, 5 naranjas, 10 plátanos, 3 peras, 7 melocotones, 11 ciruelas y 2
mangos.
a. Imagina que metes la mano en este refrigerador y sacas una fruta al azar. ¿Cuál es la
probabilidad de que saques una pera?.
b. Imagínate ahora que metes la mano en el refrigerador y sacas una fruta. Decides que no
quieres comer esa fruta, así que la pones de nuevo en el refrigerador y sacas otra pieza de
fruta.
¿Cuál es la probabilidad de que la primera pieza de fruta que saques sea una banana y la
segunda pieza que saques sea una manzana?
c. ¿Cuál es la probabilidad de que metas la mano en el refrigerador una vez y saques un mango
o una naranja?

PROBLEMA
Se propone un mismo problema a dos alumnos incomunicados. La probabilidad de que lo resuelva el
primero es ½, la probabilidad de que lo resuelva el segundo es ¼ y la probabilidad de que lo resuelvan ambos
es 1/8. Calcule la probabilidad de que el problema no sea resuelto y la probabilidad de que lo resuelva un
solo alumno.

MEDIOS DE COMUNICACIÓN
En una ciudad el 70% de los adultos escucha radio, el 40% lee el periódico y el 10% ve televisión.
Entre los que escuchan radio, el 30% lee periódicos y el 4% ve televisión. El 70% de los que ven
televisión lee el periódico y sólo el 2% de la población total adulta lee el periódico, ve televisión y
escucha radio. Si se elige una persona al azar se pide la probabilidad:
a) De que lea el periódico, escuche radio o vea televisión
b) Sabiendo que lee el periódico, la de que vea televisión.
PROBABILIDAD CONDICIONAL
P( Obtener beca / puntaje 17 o más )
P( Diabetes / obesidad )
P( Deslizamiento / falla geológica )
Sean A y B dos eventos no vacíos, donde A ⋂ B ≠ ∅. Luego La probabilidad condicional del evento A
dado el evento B, denotada por P(A / B), se define como sigue:
P(A ∩ B)
P(A / B) = -------------
P(B)
P(A1 U A2 / B ) = P(A1 / B ) + P(A2 / B )

Eventos independientes
Sean A y B dos sucesos del espacio muestral . El suceso A se dice independiente del suceso B si el
conocimiento de la ocurrencia de B no modifica la probabilidad de aparición de A , es decir:
P[A ∩ B] = P[A] · P[B]
CIUDAD FRIA
En una ciudad fría. Cuatro personas se visten para sentirse calientes:
La persona A tiene un sombrero, bufanda y guantes
La persona B tiene sólo un sombrero,
La persona C tiene sólo una bufanda y
La persona D tiene guantes y sombrero.
Se selecciona una persona al azar y se define los siguientes eventos:
S : “ La persona seleccionada tiene sombrero “
B : “ La persona seleccionada tiene bufanda “
G : “ La persona seleccionada tiene guantes “
a) Muestre que cada par de los eventos definidos son independientes o no .
b) Muestre que los tres eventos son independientes o no .
Solución
Tres personas tienen un sombrero, dos personas tienen una bufanda y dos personas tienen guantes,
así que:
P(S) = 3/4
P(B) = 2/4
P( G ) = 2/4
P(S ∩ B ) = 1/4
P(S ∩ G ) = 1/4
P(B ∩ G ) = ¼
De estos resultados, podemos verificar :
P(S ∩ B ) ≠ P(S) * P(B)……… S y B no son eventos independientes
P(S ∩ G ) ≠ P(S) * P(G) …….. S y B no son eventos independientes
P(B ∩ G ) = P(B) * P(G) ……. B y G son eventos independientes
Pero hay una persona que tiene sombrero, bufanda y guantes asi :
P(S ∩ B ∩ G ) = ¼ ≠ P(S) * P( B ) *P(G) ……….. S , B y G no son eventos independientes
HIPERTENSIÓN
Supongamos que la probabilidad de hipertensión de una madre es 0.1 y el de un padre es 0.2.
Calcular la probabilidad que tanto la madre como el padre sean hipertensos?
Solución
Sean los eventos :
A: “ Padre hipertenso “
B: “ Madre hipertensa “
P( A y B ) = 0.1 x 0.2 = 0.02

HOGAR HIPERTENSO
Suponer a "Hogar hipertenso" como aquel en el que la madre o el padre son hipertensos, con
hipertensión definida para la madre de 0.2 y del padre en 0.1. ¿Cuál es la probabilidad que un hogar
sea hipertenso?. Asumir eventos independientes.
Solución
A : “ Hipertensión de la madre “  P( A ) = 0.2
B : “ Hipertensión del padre “  P( B ) = 0.1
P( hogar hipertenso ) = ?
P(A U B) = P(A) + P(B) - P(A y B )
= 0.2 + 0.1 – 0.2 x 0.1 = 0.28
Entonces el 28% de todos los hogares serán hipertensos.

AVIÓN
Un avión a reacción tiene 3 motores que funcionan independientemente el uno del otro. La
probabilidad de que un motor falle en vuelo es 0.0001. Además, el avión puede volar si al menos un
motor está funcionando. Determine la probabilidad de que el avión tenga un vuelo exitoso.
Solución
Considerar A : “ Al menos un motor funciona durante todo el vuelo “
Y Ac : “ Fallan los tres motores “
1. Sea B1 : “ Motor uno falla “
2. Sea B2 : “ Motor dos falle “
3. Sea B3 : “ Motor tres falla “
Por lo tanto, Ac es el evento B1 y B2 y B3 se produce. Así
P (A) = 1- P (Ac) = 1- P (B1 y B2 y B3)
= 1 – P(B1) . P(B2) . P(B3)
= 1 - 0.0001 x 0.0001 x 0.0001
= 0.99

EXPLOTACIÓN PETROLERA
Una compañía de explotacion petrolera planea perforar dos pozos de exploracion. Se emplea
evidencia del pasado para tener acceso a los posibles resulatdos de la tabla adjunta:
Resultados para el experimento de perforación petrolifera
Evento Descripción Probabilidad
A Ningun pozo produce petróleo ni gas 0.80
B Exactamente un pozo produce petroleo o 0.18
C gas 0.02
Ambos pozos producen petroleo o gas
Encuentre:
a) P( A U B )  A los sumo un pozo produce petróleo o gas
b) P( B U C )  Al menos un pozo produce gas o petróleo
SOLUCIÓN
a) P( A U B ) = P( A ) + P( B )
= 0.80 + 0.18 = 0.98
b) P( B U C ) = P( B ) + P( C )
= 0.18 + 0.02 = 0.20
EJERCICIOS PROPUESTOS
CÁLCULOS
Sean A y B dos sucesos tales que P(A) = 0.2 y P(A∪B) = 0.5.
a) Sabiendo que A y B son mutuamente excluyentes, calcule P(B).
b) Sabiendo que A y B son independientes, calcule P(B).
DOS COMPONENTES: A y B, OPERAN EN SERIE.
(Dos componentes A y B están en serie si ambos deben trabajar para que el sistema funcione.)
Suponga que los dos componentes son independientes. ¿Cuál es la probabilidad de que el sistema
funcione en estas condiciones? La probabilidad de que A funcione es de 0.90, igual que la de B.
VIAJE AEREO
Usted hace un viaje aéreo que involucra tomar tres vuelos independientes. Si existe 80% de
probabilidades de que cada etapa específica del viaje se realice a tiempo, ¿cuál es la probabilidad de
que los tres vuelos lleguen a tiempo?
RED HP
La probabilidad de que un servidor de red HP se caiga es de 0.05. Si usted tiene tres servidores
independientes, ¿cuál es la probabilidad de que al menos uno de ellos sea funcional?
SAMSUNG
Veintidós por ciento de todas las pantallas de cristal líquido (LCD) es fabricado por Samsung. ¿Cuál es
la probabilidad de que en un conjunto de tres compras independientes de LCD, cuando menos una sea
Samsung?
EJERCICIOS
a) Supongamos que lanzamos una moneda normal 4 veces. ¿Cuál es la probabilidad que se
obtengan 4 caras?
b) El porcentaje de tiros libres de un jugador de baloncesto es 0.70. Si tira 6 tiros libres,
encuentra la probabilidad de que haga todos los 6. ¿Qué estamos asumiendo aquí que puede
no ser cierto?
c) Supongamos que en el ejemplo de un avión a reacción, se rompe un motor antes del
despegue, pero el avión despega de todos modos. Determine la probabilidad de que el avión
llegue con seguridad.
d) Supongamos que A y B no pueden ocurrir al mismo tiempo. ¿Son independientes?
e) En una llamada en una encuesta, ¿son las llamadas independientes entre sí?
f) Supongamos que los sujetos en una encuesta son seleccionados por llamadas telefónicas al
azar. Son las llamadas independientes unas de otras.
g) Un reportero de un periódico sale al centro comercial y le hace a la gente una pregunta de
interés local. Son estas respuestas independientes unas de otras.

CÁLCULOS
Sean A y B dos sucesos tales que P(A) = 0,2 y P(A∪B) = 0,5.
a) Sabiendo que A y B son mutuamente excluyentes, halle P(B).
b) Sabiendo que A y B son independientes, halle P(B).

JUGUETES
En un experimento de preferencia de color, ocho juguetes se ponen en un recipiente. Los juguetes
son idénticos excepto por el color, dos son rojos y seis son verdes. Se pide a un niño que escoja dos
juguetes al azar. ¿ Cuál es la probabilidad de que el niño escoja los dos juguetes rojos ?
Rpta. 1 / 28
FRANCÉS
De 120 estudiantes del colegio San Andrés, 60 estudian francés, 50 estudian español y 20 estudian
francés y español. Si se elige un estudiante al azar, hallar la probabilidad de que el estudiante:
a) Estudie francés y español
b) No estudie francés ni español
c) Estudie Francés o español
EJERCICIO
En una investigación con familias, se definen los siguientes sucesos:
H = La familia tiene hijos
R = La familia vive en sectores rurales.
M = El jefe de familia es mujer.
Escriba en forma algebraica los siguientes sucesos:
a) La familia no vive en sectores rurales.
b) La familia tiene hijos y vive en sectores rurales.
c) El jefe de familia es mujer, pero no tiene hijos.
d) La familia vive en sectores rurales o no tiene hijos.
e) La familia no tiene hijos y vive en sectores rurales.
f) El jefe de familia es mujer, dado que vive en sectores rurales.

OMEGA
El almacén X desea realizar las elección de tres televisores de un pedido y desea observar si son o no
defectuosos. Lista los posibles resultados que obtendrá el gerente del almacén.
CURSOS
Se analizan los registros de clase de 120 estudiantes.
30 de los estudiantes no toman ninguno de los tres cursos: Mecánica Aplicada, Química o
Computadoras.
15 de ellos toman sólo Mecánica Aplicada, 25 de ellos toman Química y Computadoras pero no
Mecánica Aplicada, 20 de ellos toman Mecánica Aplicada y Computadoras pero no Química, 10 de
ellos toman los tres cursos.
Un total de 45 de ellos toman Química y 5 de ellos sólo Química.
a) ¿Cuántos de los estudiantes toman Mecánica Aplicada y Química pero no Computadoras?
b) ¿Cuántos estudiantes toman solamente computadoras?
c) ¿Cuál es el número total de estudiantes que toman Computadoras?
d) Si un estudiante es elegido al azar de aquellos que no toman Química ni Computadoras, ¿cuál
es la probabilidad de que él o ella no tome Mecánica Aplicada?
Si uno de los estudiantes que toman por lo menos dos de los tres cursos es elegido al azar,
¿cuál es la probabilidad de que él o ella tomen los tres cursos?

COMPRAS
Podemos comprar una lavadora o una secadora.
Supongamos que el 30% de las lavadoras tienen servicio de garantía
El 10% de las secadoras lo tienen.
¿Cuál es la probabilidad de que ambas máquinas posean servicio de garantía?

INGRESOS
En la siguiente tabla se presenta la distribución de 125 hogares de acuerdo con los ingresos de sus
jefes de familia y con el hecho de ser propietarios de teléfonos y de aparatos de televisión. A partir de
la informacion, elaborar las probabilidades conjuntas y contestar las siguientes preguntas :
Hogares con ingresos de S/ Hogares con ingresos de
Total
1000 o menos más de S/ 1000
Con teléfono Sin teléfono Con teléfono Sin teléfono
Con Tv 27 20 18 10
Sin Tv 18 10 12 10
Total
a) ¿ Cuál es la probabilidad de elegir un hogar con Tv ?
b) Si una familia con ingresos de más S/ 1000 tiene teléfono, ¿ cuál es la probabilidad de que tenga Tv
c) ¿ Cuál es la probabilidad de elegir a una familia que tenga Tv, dado el hecho de que tiene teléfono
d) ¿ Son independientes los eventos “ Tener Tv “ y “ Tener teléfono “?
e) ¿ Son independientes los eventos “ Ingresos de menos de S/ 1000 “ y “ Ser propietario de Tv “ ?
EL VALOR DE “ a “
Dada la siguiente distribución conjunta obtenida en muestras de dos poblaciones distintas :
Población 1 Población 2
Y1 Y2 Y1 Y2
X1 20 36 X1 13 15
X2 45 “a“ X2 25 10
¿ Cuál debe ser el valor mínimo de “ a “ para que P( X2/Y2 ) sea mayor en la primera población que
en la segunda ? Rpta. 25

BALNEARIO
En un balneario se entrevistó a 600 turistas, Peruanos o extranjeros, en su estancia. Todos
respondieron estar en hotel, en alquiler o de campamento.
10% de todos los turistas se alojan en hotel.
40% de los turistas extranjeros se encuentran en un campamento
40% de los turistas extranjeros eligieron un alquiler.
Hay el doble de turistas peruanos de campamento respecto a los de alquiler
a) Sabiendo que 48 turistas extranjeros se hospedaron en hotel, complete la siguiente tabla:
Campamento Alquiler Hotel Total
Peruanos
Extranjeros 48
Total 600
b) Seleccionar al azar una persona entre los 600 encuestados. Se supone que todas las personas
tienen la misma probabilidad de ser seleccionado.
Considere :
A: "El entrevistado es un turista extranjero"
B: "El entrevistado se quedó de campamento"
Calcular las probabilidades P (A) y P (B)
c) Calcule P( C ) , si C: “ La persona entrevistada es turista extranjero y está de campamento “
d) Calcular P (A U B)
e) Calcular la probabilidad del evento Bc. Describa el conjunto Bc con una frase.
a) Si se sabe que el entrevistado alquila. Calcular la probabilidad que es un turista Peruano.

PROVEEDORES
Dos proveedores suministraron cada uno 2000 piezas y éstas fueron evaluadas para su conformidad
con las especificaciones. Un tipo de piezas era de mayor complejidad que el otro. La proporción de
piezas no conformes de cada tipo se muestra en la tabla.
Componente Componente
Proveedor simple complejo Total
No conforme 2 10 12
1 Conforme
Total 1000 1000 2000
No conforme 4 6 10
2 Conforme
Total 1600 400 2000
Una pieza se selecciona al azar de cada proveedor. Para cada proveedor, en cada uno de las preguntas
siguientes, calcule por separado las siguientes probabilidades:
a) La probabilidad de que una pieza cumpla con las especificaciones?
b) La probabilidad de que una pieza se ajuste a las especificaciones dado que es un componente
complejo?
c) La probabilidad de que una pieza se ajuste a las especificaciones dado que es un componente
simple?
Rptas. a) 0.994 0.995 b) 0.99 0.985 c) 0.998 0.9975
CONGRESO
De 100 personas que asisten a un congreso, 40 hablan Francés, 40 Inglés, 51 Castellano, 11 Francés e
Inglés, 12 Francés y Castellano y 13 Inglés y Castellano. Se eligen al azar dos asistentes y se desea
saber:
a) ¿Cuál es la probabilidad de que ninguno hable francés?
b) ¿Cuál es la probabilidad de que hablen castellano?
c) ¿Cuál es la probabilidad de que sólo hablen castellano?
d) ¿Cuál es la probabilidad de que sólo hablen un idioma?
e) ¿Cuál es la probabilidad de que Hablen los tres idiomas?

TELEVISIÓN
Si el 80% de la población adulta ve televisión y el 70% lee algún periódico, demuestre que por lo
menos el 50% acude a ambos medios de comunicación.
EQUIPO
En cualquier temporada, un equipo de fútbol juega el 65% de sus partidos en casa.
Cuando el equipo juega en casa, ganan el 83% de sus juegos.
Cuando juegan fuera de casa, ganan el 26% de sus juegos.
El equipo juega un juego.
a) Encuentre la probabilidad de que el equipo gane el juego.
b) Si el equipo no gana el juego, encuentre la probabilidad de que el juego haya sido jugado en casa.
IDIOMAS
En una escuela grande, los estudiantes deben aprender al menos un idioma, español o francés. Se sabe
que el 75% de los estudiantes aprenden español y el 40% aprenden francés.
a) Encuentre el porcentaje de estudiantes que aprenden tanto español como francés.
b) Encuentre el porcentaje de estudiantes que aprenden español, pero no el francés.
En esta escuela, el 52% de los estudiantes son niñas, y el 85% de las niñas aprenden español.
c) Un estudiante es elegido al azar. Sea G el evento en que la estudiante es una niña, y sea S el evento
que el estudiante aprenda español.
i) Hallar P (G∩S).
ii) Demuestre que G y S no son independientes.
d) Un niño es elegido al azar. Encuentra la probabilidad de que aprenda español.
SUCESOS
Sean C y D sucesos independientes, con 𝑃(𝐶) = 2𝑘 y 𝑃(𝐷) = 3𝑘2 , donde 0 < k < 0.5 .
a) Escriba una expresión para P (C ∩D) en función de k .
b) Sabiendo que 𝑃(𝐶c ∩ 𝐷) = 0.162, halle k.

HELADOS
Según un estudio, se prueban tres sabores de helados A, B y C, entre hombres (H) y mujeres (M). El
estudio permitió construir la siguiente tabla de probabilidades de preferencias:
HELADOS
Sexo
A B C
Hombre ( H ) 0.20 0.15 0.10
Mujer ( M ) 0.25 0.20
De acuerdo a estos datos, Calcule:
a) P(B ó C) =
b) P(H – A’) =
c) P(B / H) =

CLIENTES
Los clientes de una tienda departamental compran en el primer piso con una probabilidad de P (A) =
0.15, en el segundo piso con P (B) = 0.2 y tanto en el primer piso como en el segundo con P (A ∩ B ) =
0.03. ¿Cuál es la probabilidad P (A ∪ B) que un cliente compra en el primer o segundo piso?
COCINERO
Un cocinero prepara pasteles para una recepción de 300 personas. Ofrece tortas, Charlotas y
macarrones, cada uno de los cuales puede ser de chocolate o frambuesa
De los 300 pasteles :
100 son Charlotas: una cuarta parte de éstas son de chocolate.
El 40% son tortas: dos quintas partes de éstas son de chocolate.
Tres octavos de macarrones son de frambuesa.
Completa la siguiente tabla:
Chocolat
Frambuesa Total
e
Tortas
Charlotas
Macarrones
Total 300
Si un invitado elige un pastel al azar. Y sean los eventos:
A : “ La torta es de frambuesa"
B: “ La torta es de macarrón "
a) Calcular P(A) y P(B)
b) Expresar en una frase los eventos A ⋂ B ; AUB y calcular sus probabilidades.
Los Eventos A y B son incompatibles?
c) El invitado en cuestión no le gusta el chocolate. Sabiendo que va a elegir un pastel con
frambuesa, ¿cuál es la probabilidad de que se trata de una torta ?

CADENA DE TELEVISIÓN
En una cadena de televisión se hizo una encuesta a 2 500 personas para saber la audiencia de un
debate y de una película que se emitieron en horas distintas: 2 100 vieron la película, 1 500 vieron el
debate y 350 no vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados:
a) ¿Cuál es la probabilidad de que viera la película y el debate?
b) ¿Cuál es la probabilidad de que viera la película, sabiendo que vio el debate?
c) Sabiendo que vio la película, ¿cuál es la probabilidad de que viera el debate?
TEOREMA DE BAYES
Fue publicado por primera vez en 1763, dos años después de la muerte de su creador, el matemático y
teólogo inglés Thomas Bayes nacido en Londres en 1702.

La receta para un análisis Bayesiano es (Lindley 1983):


- ¿Qué es lo que no sabes y te interesa? Llámalo P(A/B) .
- ¿Qué sabes? Probabilidades previas
- Ahora has los cálculos
- ¿Cómo? Usando las reglas de probabilidad.

En términos estadísticos, las pruebas diagnósticas se explican según EL TEOREMA DE BAYES.

COLEGIO
En una sección de un colegio, se presenta la siguiente situación: 15 estudiantes de 25 trabajan, de los
que trabajan, el 40% aprueban el curso de computación además se sabe que la probabilidad de
aprobar el curso de computación es 0.60. Si se selecciona un alumno al azar:
a) ¿Cuál es la probabilidad de que un alumno trabaje y apruebe la materia?
b) ¿Cuál es la probabilidad de que un alumno apruebe, considerando que no trabaja?
c) ¿Cuál es la probabilidad de que sea un estudiante que trabaja, si aprobó el examen final ?
Solución
Datos:
P(A) = 0.60
P(A/T) = 0.40
P(T) = 15/25 = 0.6
a) P(T y A ) = 0.24 ; b) P(A/T´) = 0.9 ; c) P( T/A ) = 0.4

ENCUESTA
Se observa que hombres y mujeres reaccionan de modo diferente a un conjunto determinado de
circunstancias; se sabe que 70% de las mujeres reaccionan positivamente a estas circunstancias
mientras que de este mismo modo reaccionan sólo 40% de los hombres. Un grupo de 20 personas, 15
mujeres y 5 hombres, se sometió a estas circunstancias y a los sujetos se les pidió describieran sus
reacciones en un cuestionario escrito. Una respuesta escogida al azar de las 20 fue negativa. ¿Cuál es
la probabilidad de que haya sido un hombre?
SOLUCIÓN

P¿
DESPERTADOR
El despertador de Carlos no funciona muy bien, pues el 20% de las veces no suena. Cuando
suena, Carlos llega tarde a clase con probabilidad 0.2, pero si no suena, la probabilidad de que
llegue tarde es 0.9.
a) Determina la probabilidad de que llegue tarde a clase y haya sonado el despertador.
b) Determina la probabilidad de que llegue tarde.
c) Determina la probabilidad de que llegue temprano.
d) Carlos ha llegado tarde a clase, ¿cuál es la probabilidad de que haya sonado el despertador?
Solución
Sean los sucesos:
S = “ El despertador de Javier suena “ y
T = “ Carlos llega tarde a clase “.
Entonces :
a) P(S∩T) = P(S) · P(S/T) = 0.2 x 0.8 = 0.16
b) P( Llegue tarde) = 0.34
c) P( Llegue temprano ) = 1 - P( Llegue tarde ) = 1 – 0.34 = 0.66
d) P(S / T) = P(S ⋂ T ) / P( T ) = 0.16 / 0.34 = 0.47

MÁQUINAS 1
Tres máquinas A,B y C producen respectivamente 50%, 30% y 20% del número total de refrescos de
una fábrica embotelladora. Los porcentajes de desperfectos de producción de estas máquinas son 4%,
5% y 6%, si se selecciona al azar un artículo, hallar la probabilidad de que el artículo sea defectuoso.
MÁQUINAS 2
Si del ejemplo anterior, se selecciona un refresco y es defectuoso, hallar la probabilidad de que el
artículo fue producido por la máquina A.
COLEGIO 1
En un colegio de secundaria el 40% del alumnado va en primero, el 35% en segundo y el resto en tercero. En
primero la mitad del alumnado son mujeres, en segundo, la tercera parte son mujeres y en tercero, 4/5
partes son mujeres. Si se elige un alumno al azar y es mujer, ¿ Cuál es la probabilidad de que vaya en tercer
año?
COLEGIO 2
En un colegio hay dos grupos de alumnos: 25 alumnos de quinto y 20 de sexto grado. El 50% de los
alumnos de quinto no tienen faltas de ortografía, porcentaje que sube a 70% en los alumnos de sexto.
En un concurso de redacción entre alumnos de quinto y sexto se elige una redacción al azar.
a) ¿Qué probabilidad hay de que sea de un alumno de quinto?
b) Si tiene faltas de ortografía, ¿Qué probabilidad hay de que sea de un alumno de quinto?
ACCIDENTE
En enero se ha producido un accidente al aterrizar un avión en un aeropuerto. Se sabe que en
enero ha habido 19 días con niebla y que en estas circunstancias la probabilidad de accidente es
20 veces mayor que la probabilidad de accidente en un día sin niebla. ¿Cuál es la probabilidad
de que haya niebla si hubo accidente?
LECTORES
En una ciudad se venden 1000 diarios A, 2000 B y 5000 C. Si de los lectores de A el 25% fuman, el 50%
de B fuman y el 10% de los de C fuman. Si suponemos que cada persona lee un solo diario.
a) ¿Qué porcentaje de los lectores fuman?
b) Si una persona no fuma. ¿Cuál es la probabilidad que lea B?
c) De los lectores de B, el 25% bebe alcohol y el 15% bebe y fuma. ¿Cuál es la probabilidad que
un lector de B no beba ni fume?
ESTADÍSTICA
La doctora Sánchez ha enseñado Estadística Básica por varios años. Ella sabe que 80% de los
estudiantes terminarán los ejercicios asignados. También que entre quienes hacen sus tareas, 90%
pasará el curso. Entre los que no hacen su tarea, 10% pasarán el curso. Julio cursó Estadística el
semestre pasado con la doctora Sánchez y pasó. ¿Cuál es la probabilidad de que haya terminado sus
tareas?
CRÉDITOS
El departamento de crédito de Tiendas EFE, Cajamarca, informó que 30% de las ventas se paga con
efectivo o con cheque; 30% con tarjeta de crédito, y 40% con tarjeta de débito. Veinte por ciento de
las compras con efectivo o cheque, 90% de las compras con tarjeta de crédito y 60% de las compras
con tarjeta de débito son por más de $50. La señora Tina acaba de comprar un vestido nuevo que le
costó S/. 120. ¿Cuál es la probabilidad de que haya pagado en efectivo o con cheque?

TELEVISIÓN
Computronic, compra tubos de televisión a cuatro proveedores: LG proporciona 20% de los tubos;
SAMSUNG, 30%; SONIC 25% y JVC, 25%. LG normalmente tiene la mejor calidad, ya que sólo 3% de
sus tubos llegan defectuosos. Cuatro por ciento de los tubos de SAMSUNG están defectuosos; 7% de
los tubos de SONIC y 6.5% de los tubos de JVC, tienen defectos.
a) ¿Cuál es el porcentaje total de tubos defectuosos?
b) Un tubo de televisión defectuoso fue descubierto en el último envío. ¿Cuál es la probabilidad de que
proviniera de LG?

SEGURO
PERU AUTOS, clasifica a los conductores en buenos, de riesgo medio o malo. Los conductores que
solicitan un seguro caen dentro de estos tres grupos en porcentajes de 30, 50 y 20%, respectivamente.
La probabilidad de que un buen conductor tenga un accidente es de 0.01; la probabilidad de un
conductor de riesgo medio es de 0.03 y la probabilidad de que un mal conductor tenga un accidente es
de 0.10. La compañía le vende al señor Pérez una póliza de seguro y él tiene un accidente. ¿Cuál es la
probabilidad de que el señor Pérez sea:
a) Un buen conductor?
b) Un conductor de riesgo medio?
c) Un mal conductor?
EMPRESA
Una empresa tiene 50 empleados: cinco son ejecutivos, 20 son trabajadores de cuello blanco y 25 son
trabajadores de cuello azul. Algunos tienen salarios anuales que superan las 30 000 soles y otros no:
cuatro de los cinco ejecutivos, seis de los 20 trabajadores de cuello blanco y ninguno de los 25 obreros
tienen esa condición.
Si se selecciona un trabajador al azar y resultó ganar más de 30 000 soles, calcular las siguientes
probabilidades:
a) Qué gane más de 30 000 soles.
b) Qué sea ejecutivo dado que gana más de 30 000.
c) Qué sea cuello blanco dado que gana más de 30 000.
d) Qué sea cuello azul dado que gana más de 30 000.
ADAPTACION ESCOLAR
En una población escolar de estudiantes de 6° de primaria, el 10% tiene problemas de lectura. Entre
los que tienen problemas de lectura, el 60% tiene dificultades de adaptación escolar. Si se extrae una
muestra de 250 estudiantes de 6° de Primaria:
a) ¿Cuál es el número más probable de estudiantes con problemas de adaptación escolar?
b) De los que tienen problemas de lectura. ¿Cuál es el número más probable de estudiantes con
problemas de adaptación escolar? Rpta: a) 15 b) 150
UNIVERSIDAD
En la UNC, si se seleccionara un expediente académico al azar, la probabilidad de que se trate de un
varón es de 0.6. Del mismo modo, seleccionado un expediente académico al azar, la probabilidad de
que se trate de un/a alumno/a de la Facultad de Educación es de 0.01. La probabilidad de que sea
varón y de la facultad de Educación es 0.002.
a) ¿ Cuál es la probabilidad de que si se elige un expediente al azar de la UNC:
a1 ) Se trate de la facultad de educación, si se sabe que es varón ? Rpta. p = 0.0033
a2 ) Sea un varón o de Educación? Rpta. P = 0.608
b) ¿ Son sucesos independientes el ser varón y pertenecer a la Facultad de Educación ? Rpta. No

EXAMEN
La probabilidad de que Diana estudie para el examen de ingreso es 0.3. Si estudia, la probabilidad de
que ingrese es 0.7, pero si no estudia, la probabilidad es sólo de 0.4. Si Diana ingresó ¿Cuál es la
probabilidad de que haya estudiado? Rpta. 3/7

PELICULAS
Tengo mis películas clasificadas en tres estantes, A, B, y C. El estante A contiene 10 películas, de las
cuales aún no he visto 4 de ellas; El B contiene 8 películas y no he visto 3 de ellas y el C contiene 6
películas de las cuales sólo me falta por ver una de ellas. Si selecciona al azar un estante y cojo una
película.
a) ¿Cuál es la probabilidad de que no la haya visto? Rpta : 0.31
b) Si estoy viendo una película por primera vez, pero no recuerdo el estante del que procede,
¿Cuál es la probabilidad de que provenga del estante A? Rpta: 0.43

FUTBOL
En cualquier temporada, un equipo de fútbol juega el 65% de sus partidos en casa.
Cuando el equipo juega en casa, ganan el 83% de sus juegos.
Cuando juegan fuera de casa, ganan el 26% de sus juegos.
El equipo juega un juego.
a) Encuentre la probabilidad de que el equipo gane el juego.
b) Si el equipo no gana el juego, encuentre la probabilidad de que el juego haya sido jugado en casa.

HOTELES
Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres hoteles de la
ciudad; Palacio del Sol, Sonesta o Marriot Hotel, en una proporción de 18.5%, 32% y 49.5%
respectivamente, de los cuales se ha tenido información de que se les ha dado un mal servicio en un
2.8%, 1% y 4% respectivamente.
a) ¿Si se selecciona a un visitante al azar, cuál es la probabilidad de que no se le haya dado un mal
servicio?
b) Si se selecciona a un visitante al azar y se encuentra que él no se quejó del servicio prestado, ¿cuál
es la probabilidad de que se haya hospedado en el hotel: Palacio del Sol?
c) Si el visitante seleccionado se quejó del servicio prestado, ¿cuál es la probabilidad de que se haya
hospedado en el Marriot Hotel ?. Rpta. a) 0.9718 b) 0.1850 c) 0.7026

BANCO
Un cliente fue a un Banco para pedir un préstamo . Sin información adicional , el banco
opina que hay una probabilidad de 4% de que el cliente no cumpla con sus compromisos . El
Banco puede investigar la solvencia del cliente. La verificación producirá un informe favorable
o desfavorable. A partir de la experiencia pasada , el banco opina que P( recibir un informe
favorable/ el cliente no cumple con sus compromisos ) = 1/40. Y que P( informe favorable /
cliente cumple con sus compromisos ) = 99/100. Si se recibe un informe favorable, ¿ cuál es la
probabilidad de que el cliente falte a sus compromisos ?
Rpta: 0.001
PROBABILIDAD BINOMIAL
Un experimento binomial posee las siguientes características:
1. Consta de n ensayos o pruebas idénticas.
2. Cada prueba puede tener uno de dos resultados posibles ( Éxito o fracaso )
Eventos Dicotómicos
Positivo Negativo
Presencia Ausencia
Aprobado Desaprobado
On Off
Vida Muerte
3. La probabilidad de un éxito en una sola prueba es igual a p, y permanece constante de una a
otra prueba. En tanto la probabilidad de fracaso es igual a ( 1 – p) y se denota con la letra q
4. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
Simbólicamente:
X  B(n,p) siendo n y p , parámetros de la Distribución Binomial
La probabilidad de obtener x éxitos está dada por la siguiente función de probabilidad:
Función de probabilidad.
P ( x ) =Cnx . px . qn− x
X: 0,1, . . . n
p : Probabilidad de ocurrencia ( éxito )
q : Probabilidad de no ocurrencia
X : N° de elementos que se desea observar o calcular en n experimentos( pruebas, ensayos,
muestra )
P(X) : Probabilidad de ocurrencia de x éxitos

SIMBOLO : X B(n,p)

MEDIA : μ = n.p
VARIANZA : σ2 = n.p.q

TEST
Supongamos que a un estudiante se le presenta un test compuesto de 10 preguntas, de forma que
por pregunta se le ofrecen dos respuestas, una verdadera y otra falsa. Si el estudiante no ha
estudiado ¿cuál es la probabilidad de que acierte el 80% de las preguntas?
SOLUCIÓN
X = 8 ( 80% de 10 )
p = 0.5 ( probabilidad de no acertar )
P ( x=8 )= 10 x 0.58 x 0.52
( )
8
P ( x=8 )=0.044
ESTUDIANTES INGRESANTES
En cierta Universidad, se ha demostrado que sólo el 50% de los estudiantes que terminan la
secundaria y poseen la capacidad para ir a la universidad, realmente se inscriben en ella. Determine
la probabilidad de que entre nueve estudiantes que terminaron la secundaria en esa universidad,
cada uno de los siguientes números se inscribirán a la universidad.
a) Exactamente 4
b) De 4 a 6
c) Ninguno
d) Los 9
REPITENTES
El porcentaje de estudiantes repitentes entre los matriculados en cierta asignatura es del 60%. Si en
una muestra de 20 alumnos sabemos que por lo menos 8 son repitentes ¿cuál es la probabilidad de
que haya menos de 15?
SOLUCIÓN

X: “ N° estudiantes repitentes “
X  B ( 20 ; 0.6)
P( x <15/ X ≥ 8)=0.8717
EJERCICIOS PROPUESTOS
EVALUACIÓN
En una prueba de evaluación de 10 ítems con cuatro opciones, de las cuales sólo una es verdadera,
¿Cuál es la probabilidad de que un estudiante acierte cuatro ítems por mero azar? Rpta. P =
0.145
ESTUDIANTE 1
La probabilidad de que un estudiante universitario que comienza los estudios los termine es de 0.60.
De 10 universitarios nuevos en la universidad, ¿Cuál es la probabilidad de que sólo tres de ellos
terminen? Rpta. p = 0.042
DIPLOMADO
La probabilidad de que un estudiante obtenga el Diplomado en Matemáticas es 0.3. Hallar la
probabilidad de que su grupo de trabajo que consta de 8 estudiantes matriculados
a) Ninguno de los ocho finalicen el postgrado.
b) Finalicen todos
c) Al menos 3 finalicen el postgrado.
d) Hallar el valor esperado y la varianza del número de alumnos que finalizan la carrera.
ESTUDIANTES 2
Cuatro compañías están entrevistando a cinco estudiantes universitarios para ofrecerles trabajo
después de que se gradúen. Si se supone que los cinco reciben ofertas de cada compañía, y
que las probabilidades de que las compañías los contraten son iguales.
a) ¿ Cuál es la probabilidad de que una compañía los emplee a los cinco ?
b) ¿ Cuál es la probabilidad de que una compañía emplee a ninguno de ellos ?
VERDADERO - FALSO
A un grupo de estudiantes se le plantea una prueba de “ verdadero o falso “. ¿Cuál es la probabilidad
de que un estudiante obtenga, cuatro respuestas correctas, si contesta al azar, sabiendo que la
prueba consta de un total de seis cuestiones? Rpta p
= 0.234
ESTUDIANTES 3
Sabiendo por experiencias previas que el 70 % de los estudiantes de Psicología de una Universidad
promocionan el curso de inglés y suponiendo que esta proporción se mantenga el presente semestre,
calcule la probabilidad de que en una muestra aleatoria de 10 estudiantes:
a) Por lo menos uno no promocione
b) No promocionen cinco
c) Promocione por lo menos la mitad
d) No promocione a lo sumo dos
e) Promocionen más de cuatro y menos de ocho
PROFESORES
Si el 10 % de todos los profesores de la Facultad de Educación tienen doctorado y se toma una
muestra aleatoria simple de 4 profesores de carrera, ¿cuál es la probabilidad de encontrar:
a ) Más de 3 con ese grado?
b ) Entre 1 y 3 con ese grado?
c ) Más de la mitad con ese grado?
ESTUDIANTES 4
La probabilidad de que un alumno inscrito en el primer semestre termine la carrera es 0.4. Calcule la
probabilidad de que de cuatro amigos que están en primer semestre ( EVENTOS INDEPENDIENTES )
a) Al menos uno termine la carrera
b) A lo más dos terminen la carrera
c) Solo uno termine la carrera
d) Todos terminen la carrera.
EXAMEN
Se calcula que 10% de los alumnos que presentan la parte correspondiente a métodos cuantitativos
del examen Certified Public Account (CPA) la reprobará. Este sábado presentarán el examen 60
estudiantes.
a) ¿Cuántos esperaría que reprueben?
b) ¿Cuál es la desviación estándar?
c) ¿Cuál es la probabilidad de que reprueben exactamente 2 estudiantes?
ENCUESTA
Una encuesta reciente de la JPG - INTERNATIONAL reveló que 23% de los estudiantes graduados en
contabilidad elige la contaduría pública. Suponga que elige una muestra de 15 recién graduados.
a) ¿Cuál es la probabilidad de que dos hayan elegido contaduría pública?
b) ¿Cuál es la probabilidad de que cinco hayan elegido contaduría pública?
c) ¿Cuántos graduados esperaría que eligieran contaduría pública?

UNIVERSIDAD
En una universidad se ha observado que el 60% de los estudiantes que se matriculan lo hacen en una
carrera de Ciencias, mientras que el otro 40% lo hacen en carreras de letras. Si en un determinado día
se realizan 20 matrículas, calcular la probabilidad de que:
a) Haya igual número de matrículas en Ciencias y Letras.
b) El número de matrículas en Ciencias sea menor que en Letras
c) Haya al menos 8 matrículas en Ciencias
d) No haya más de 12 matrículas en Ciencias
e) Si las cinco primeras matriculas son de Letras, calcular la probabilidad de que :
e1) En total haya igual número de matrículas en Ciencias y en Letras
e2) En total haya al menos 6 en Ciencias más que en Letras.

PERMISO
Durante el mes de Enero (20 días laborales), la probabilidad de que una persona pida un día de baja
para asistir a una boda es 0.05. Si en una empresa hay 10 empleados. ¿Cuál es la probabilidad de que
alguno de ellos pida baja por dicho motivo durante ese mes? Rpta. 0.99996

CHOCOLATE OSCURO
A pesar de informes de que el chocolate oscuro es benéfico para el corazón, 47% de los adultos
todavía prefieren más el chocolate con leche que el oscuro.
Suponga que una muestra aleatoria de n = 5 adultos se selecciona y se les pregunta si prefieren más
el chocolate con leche que el oscuro.
a) ¿Cuál es la probabilidad de que los cinco adultos digan que prefieren más el chocolate con leche
que el oscuro?
b) ¿Cuál es la probabilidad de que exactamente tres de los cinco adultos digan que prefieren más el
chocolate con leche que el oscuro?
c) ¿Cuál es la probabilidad de que al menos un adulto prefiera más el chocolate con leche que el
oscuro?
TERREMOTOS
Suponga que uno de entre 10 propietarios de casa en el estado de California ha invertido en un seguro
contra terremotos. Si 15 propietarios se seleccionan al azar para ser entrevistados,
a. ¿Cuál es la probabilidad de que al menos uno tenía seguro contra terremotos?
b. ¿Cuál es la probabilidad de que cuatro o más tengan seguro contra terremotos?
c. ¿Dentro de qué límites esperaría usted que baje el número de propietarios asegurados contra
terremotos?
CELULAR
Se reporta que 16% de los hogares estadounidenses utilizan exclusivamente un teléfono celular como
servicio telefónico. En una muestra de ocho hogares, encuentra la probabilidad de que:
a) Ninguno use un celular como su servicio exclusivo.
b) Cuando menos uno use sólo el celular.
c) Cuando menos cinco usen el celular.
ESTUDIANTES
Se cree que un conjunto de estudiantes está dividido en dos facciones aproximadamente iguales
con respecto a una propuesta. Suponiendo que así es en efecto, ¿ Cuál es la probabilidad de que la
encuesta realizada con 100 estudiantes por la mesa directiva de la sociedad de alumnos indique
que por lo menos 60% está a favor de la propuesta ?

EXAMEN
Se cree que el tiempo necesario para terminar un examen de aprovechamiento académico es de
150 minutos, y que su desviación estándar es igual a 20 minutos. Si se desea dar el tiempo
suficiente para que lo termine el 80% de los examinados, ¿cuándo debe darse por concluido el
examen ¿ ( Suponga que los tiempos necesarios para terminar el examen están distribuidos
normalmente ).
TOYOTA
Los diseñadores del nuevo TOYOTA 2020, desean que el techo de su nuevo modelo sea
suficientemente alto, de manera que quede por lo menos una pulgada de espacio entre éste y la
parte superior de la cabeza del 90% de los conductores. Si las estaturas de quienes gustan de los
autos deportivos están distribuidas normalmente con media y desviación estándar iguales a 68 y
2.5 pulgadas, respectivamente, ¿qué altura debe especificarse en el diseño del nuevo modelo?
RESTAURANTES
MUESTRA : 5 restaurantes de la ciudad de Cajamarca
X: Calidad de servicio al cliente
Reporte datos históricos: probabilidad de buen servicio : 5% ( p = 0.05 ),
Si se selecciona un restaurante al azar . Calcular las siguientes probabilidades:
a) Qué ningún restaurante brinde buen servicio al cliente
b) Qué uno brinde buen servicio al cliente
c) Qué mínimo 2 restaurantes brinden buen servicio al cliente
d) Qué máximo 2 restaurantes brinden buen servicio al cliente
e) Qué la mayoría de restaurantes brinden buen servicio al cliente.

TIRO AL BLANCO
Se sabe que cuando un hombre tira al blanco. La probabilidad de dar al blanco es 1/3 y la
probabilidad de fallar es de 2/3. ¿Cuál es la probabilidad de acertar dos veces de un total de 3
intentos? Rpta. 2/9

MICROEMPRESAS
MUESTRA : 5 microempresas de la ciudad del Cuzco
X : Pago de impuestos
Además se conoce por datos históricos que la probabilidad de pagar impuestos en forma puntual
es del 30% ( p = 0.3 ). Si se selecciona una microempresa al azar . Calcular las siguientes
probabilidades
a) Qué ninguna microempresa pague impuestos a tiempo
b) Qué una pague impuestos a tiempo
c) Qué dos microempresas paguen impuestos a tiempo
d) Qué más de dos paguen impuestos a tiempo
e) Qué dos o más paguen impuestos a tiempo
f) Qué la mayoría paguen sus impuestos puntualmente

EXAMEN
Un examen consta de cinco preguntas. Para aprobar el examen, hay que responder correctamente al
menos tres de las preguntas. La probabilidad de que Mark responda una pregunta correctamente es
igual a 1/5. Sea X el número de preguntas que Mark responde correctamente.
a)
i) Halle E(X ) .
ii) Halle la probabilidad de que Mark apruebe el examen.
Bill también hace el examen. Sea Y el número de preguntas que Bill responde correctamente. La
siguiente tabla muestra la distribución de probabilidad correspondiente a Y.

Y 0 1 2 3 4 5
P( Y = y ) 0.67 0.05 a + 2b a–b 2a + 0.04
b
b)
i) Compruebe que 4a + 2b = 0, 24 .
ii) Sabiendo que E(Y) = 1, halle a y b.
c) Halle cuál de los alumnos es más probable que apruebe el examen.

PENSION 65
La Ministra “ Bella “ . Últimamente, se ha estado preocupando acerca de la posibilidad de que
muchas personas que cobran el beneficio PENSIÓN 65 en realidad, no cumplan los requisitos
respectivos. Sus asistentes estiman que 40% de los beneficiarios entran en esta categoría, pero la
Ministra no está convencida. Le pide a uno de sus ayudantes que haga una investigación de 10
beneficiarios tomados al azar.
a) Si los asistentes de la Ministra tienen razón, ¿Cuál es la probabilidad de que los individuos
investigados tengan un empleo?
b) Si los asistentes de la Ministra están en lo correcto, ¿Cuál es la probabilidad de que sólo
tres de los individuos investigados tengan trabajo?
MINISTRA BELLA
Un mes más tarde, la Ministra Bella (del ejercicio anterior) toma la edición matutina del principal
diario de la ciudad, el COMERCIO y lee la noticia sobre un fraude en el beneficio PENSION 65. En el
artículo, el periódico afirma que, de cada 15 beneficiarios, la probabilidad de que cuatro o más
tengan en realidad un empleo es de 0.9095, y que el número esperado de beneficiarios con trabajo
excede de siete. Usted es un asistente especial de la Ministra y debe responder a estas afirmaciones
en una conferencia de prensa que se llevará a cabo esa misma tarde. Ella le pide a usted que
encuentre respuestas a las preguntas siguientes:
a) ¿Son las afirmaciones del diario EL COMERCIO congruentes entre sí?
b) ¿La primera afirmación del periódico contradice la opinión de los asistentes de la Ministra?
ESTUDIANTES
Cuatro compañías están entrevistando a cinco estudiantes universitarios para ofrecerles trabajo
después de que se gradúen. Si se supone que los cinco reciben ofertas de cada compañía, y
que las probabilidades de que las compañías los contraten son iguales.
c) ¿ Cuál es la probabilidad de que una compañía los emplee a los cinco ?
d) ¿ Cuál es la probabilidad de que una compañía emplee a ninguno de ellos ?

TELEVISORES
En un estudio reciente se descubrió que 90% de las familias del Cusco tienen televisores de pantalla
grande. En una muestra de seis familias. Cuál es la probabilidad de que:
a) Las seis tengan televisores de pantalla grande?
b) Menos de tres tengan televisores de pantalla grande?
c) Más de dos tengan televisores de pantalla grande?
d) Al menos cuatro familias tengan televisores de pantalla grande?

DISTRIBUCIÓN DE POISSON
Se llama así en honor del matemático francés Simón Poisson (1781-1840).
Problema de las colas.
" Cuando entré en esta tienda no había nadie en la fila (cola) en el proceso de pago rápido, pero en el
lapso de 10 minutos, llegaron 6 personas "

Problema de fallas o defectos.


Ejemplo : Una recorte de tela

   
xx xx
   
   
xx  
  xx
¿Cuántos defectos o fallas por cuadradito hay ? : …2 fallas / cuadradito, luego :  = 2 fallas/
cuadradito
Ejemplos:
 El número de clientes que ingresan al centro comercial El Quinde en el mediodía.
 El número de llamadas que ingresan a una centralita de 9 a 10 de la mañana.
 El número de tornados que ocurrieron en Kalamazoo Country en julio.
 El número de accidentes de avión en un año.

Su función de probabilidad es :
e−λ . λ x
P( X =x)=
x!
X : 0,1,2, . . .
Donde :
𝞴 : Número promedio de “ éxitos “ que se dan en un intervalo particular.
e : Base de logaritmos neperianos = 2.7183
X : Número de “ éxitos “ que presenta un evento.( entero no negativo )
P(x) : Probabilidad para un valor específico de x.

En símbolos : X  P (𝞴 ), entonces :
MEDIA : μ = 
VARIANZA σ2 = 

VISITAS
Suponga que el número de visitas a cierto sitio web durante un intervalo fijo sigue una distribución de
Poisson. Suponga que la media de la razón de visitas es de cinco cada minuto.
Determine la probabilidad de que haya sólo 17 visitas en los siguientes tres minutos.
Solución
Sea X : número de visitas en tres minutos.
La media del número de visitas en tres minutos es (5)(3) = 15
Por lo que X  Poisson (𝞴 = 15).
Reemplazando en la fórmula se tiene:
x 15 17
−15
e
P ( X=17 )= =0.0847
17 !

IMPERFECCIONES
Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una
distribución Poisson con una media de 2.4 imperfecciones por milímetro.
a) Determine la probabilidad de 2 imperfecciones en un milímetro de alambre.
b) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre.
c) Determine la probabilidad de al menos una imperfección en 2 mm de alambre
MENSAJES
El número de mensajes recibidos por el tablero computado de anuncios es una variable aleatoria de
Poisson con una razón media de ocho mensajes por hora.
a) ¿Cuál es la probabilidad de que se reciban cinco mensajes en una hora?
b) ¿Cuál es la probabilidad de que se reciban diez mensajes en 1.5 horas?
c) ¿Cuál es la probabilidad de que se reciban menos de tres mensajes en 11⁄2 horas?
PARTICULAS
El número de partículas emitidas por una fuente radioactiva durante un periodo especifico es
una variable aleatoria con una distribución de Poisson. Si la probabilidad de ninguna emisión
es igual a 1/3, ¿ cuál es la probabilidad de que ocurran 2 o más emisiones ?
ACCIDENTES
Supóngase que el número de accidentes mortales por día en cierta ciudad sigue una distribución
Poisson de parámetro λ = 1. Calcúlese,
a) La probabilidad de que ocurran más de 10 accidentes.
b) La probabilidad de que transcurran más de 2 días entre dos accidentes mortales.
BOMBEROS
Supongamos que sabía que el número medio de llamadas a una estación de bomberos en un día
laborable es 8. ¿Cuál es la probabilidad de que en un día laborable determinado haya 11 llamadas?
Este problema se puede resolver utilizando la siguiente fórmula basada en la distribución de Poisson:
TEXTO
Un libro de texto de matemáticas tiene 200 páginas en las que pueden ocurrir errores tipográficos
en las ecuaciones. Si hay cinco errores dispersos de manera aleatoria entre las 200 hoja.
a) ¿cuál es la probabilidad de que en una muestra aleatoria de 50 páginas contenga al
menos un error?
b) ¿Qué tan grande debe ser la muestra aleatoria para asegurar que al menos tres errores
se encontrarán con probabilidad de 90 por ciento?
SUPERMERCADO
Tiempo de llegada de clientes a la caja registradora.
Los clientes de un supermercado llegan a la caja registradora con una rapidez promedio de dos
clientes por minuto. Si un cliente acaba de llegar, cuál es la probabilidad de que el siguiente cliente
llegue:
a) En medio minuto (es decir, dentro de medio minuto).
b) Dentro de un minuto.
c) Dentro de minuto y medio.
d) Dentro de dos minutos y medio.
e) Entre el lapso de tiempo de uno a 2,5 minutos.

DISTRIBUCIÓN NORMAL
La curva normal es una distribución teórica, simétrica y asintótica, donde la media , mediana y la moda
coinciden.
Muchas variables educativas , psicológicas y biológicas se distribuyen según la llamada
distribución normal = curva normal = campana de Gauss
( rendimiento académico, inteligencia, aptitud, motivación, peso, altura, etc )
En símbolos: X  N( μ ;  )
σ
⇒ X́ → N μ ;( √n )
De modo general , se dice que la Normal es aditiva en sus parámetros media y varianza

Σ X i → N ( Σ μ i ; Σ σ 2i )
La figura siguiente muestra el resultado de trazar tres curvas normales dos de ellas tiene diferentes
medias y diferentes desviaciones estándar. Evidentemente, están centradas en posiciones diferentes
sobre el eje horizontal y sus formas reflejan los valores diferentes de σ.

¿Qué cosas observamos en esta distribución?


a) La distribución de probabilidad normal es simétrica alrededor de su media. (Coef. Simetría =
0)
b) Media = mediana = moda
c) La curva normal desciende suavemente en ambas direcciones a partir del valor central.
d) Es asintótica, lo que quiere decir que la curva se acerca cada vez más al eje X pero jamás llega
a tocarlo. Es decir, las “colas” de la curva se extienden de manera indefinida en ambas
direcciones.
e) Coeficiente de Kurtosis = 0
f) El área total encerrada por f(x) vale 1: P (− ∞ < X < + ∞ ) =1
g) Si X es una v.a. que se distribuye según una normal de media µ y desviación estándar
σ, Z = ( x−µ )/ σ se distribuye como una normal tipificada, es decir, de media 0 y desviación
estándar = 1.
SOBRECOSTOS
Los sobrecostos por actualización de computadores en su empresa tienen un promedio de $ 23 500.
Con una desviación estándar de $ 9 400. Como director ejecutivo de la división de investigación, usted
no desea arriesgarse a más de 34% de la probabilidad que el sobrecosto en una actualización
propuesta recientemente exceda de $25 000. ¿Debería ejecutar la actualización?
Solución
Media = 23 500
Desviación Estándar = 9400
P( X > 25000 ) = P( Z > 0.16 ) = 0.4364 ( 43.64% )
No lo ejecutaría ya que, se excede el sobrecosto límite que es de 34%.

DISPOSITIVO
La vida útil de un determinado tipo de dispositivo se modela mediante una variable aleatoria que sigue
una ley normal de promedio y desviación estándar desconocido. Las especificaciones implican que el
80% de la producción de los dispositivos tiene una esperanza de vida entre 120 y 200 días y que el 5%
de la producción tiene una vida útil menor a 120 días.
a) Cuáles son los valores  y 𝞼
b) ¿Cuál es la probabilidad de tener un dispositivo cuya vida útil este entre 200 y 230 días?
2

Solución
a) P(120 < X < 200 ) = 0.80 y P(X < 120 ) = 0.05
Entonces : P [ Z < ( 200 -  ) / 𝞼 ] = 0.85 P[Z < ( 120 -  ) / 𝞼 ] = 0.05
Observando la tabla normal Z :
(200 -  ) / 𝞼 = 1.0364 y ( 120 -  ) / 𝞼 = - 1.645
Resolviendo :
  169 y 𝞼  30
b) P( 200 < X < 230 ) = 0.13

MÁQUINA
Para que una pieza fabricada por una máquina sea utilizable, su longitud debe estar entre 14.7 y 15.3
cm, de lo contrario es rechazada. Sabiendo que la longitud de esta pieza es una variable normal de
parámetros μ = 15 y  = 0.2 cm , qué proporción de piezas puede rechazarse.
Solución
X  N( μ = 15 ;  = 0.2 )
Pieza utilizable : ( 14.7 y 15.3 )
P(rechazar pieza ) = 1 - P(aceptar pieza )
= 1 – P( 14.7 < X < 15.3 )
= 1 – P( -1.5 < Z < 1.5 )
= 1 – 0.87
= 0.13

ESTUDIANTES 1
El promedio de estudiantes inscritos en el jardín de niños ¨ HIJOS DE DIOS ¨ tienen una media de 500
estudiantes y una desviación estándar de 100. De acuerdo a la Directora, los alumnos inscritos forman
una distribución normal. Hallar la probabilidad de que él número de alumnos inscritos este:
a) Entre 500 y 650 alumnos
b) Entre 450 y 600 alumnos

ESTUDIANTES 2
Utilizar los siguientes datos referidos a X : Puntuaciones
X́ =22 puntos ; S=2 puntos; n=64 estudiantes
a) ¿Qué proporción de estudiantes obtuvo una puntuación arriba de 26 ?
b) ¿Qué número de estudiantes tuvieron una puntuación entre 17 y 19 ?
c) ¿Qué proporción de estudiantes cayó entre 18 y 23 ?
d) Determine la puntuación debajo de la cual caen 90% de las puntuaciones
e) Si un aspirante tiene que estar al menos en el 90 rango percentil para ingresar a un
programa universitario ¿Qué puntuación necesita obtener ?
ESTUDIANTES 3
Si las estaturas de 10 000 estudiantes universitarias tienen una distribución normal con media 175
cm. y con desviación estándar de 6.25 cm.
a) Cuantos estudiantes tendrán por lo menos 180 cm de estatura?
b) Entre que valores se encuentra el 75% central de las mediciones ?
PESOS
Los pesos de los 10 488 estudiantes de la UNC están distribuidos normalmente con una media de 71 kg
y una desviación estándar de 9kg. Hallar el número de estudiantes con pesos:
a) Inferiores o iguales a 46kg
b) Entre 55 y 60kg
c) Entre 68 y 80kg
d) Mayores o iguales a 70 kg

EXAMEN
En un examen de matemáticas las notas se distribuyen según N( μ =6 ;  = 6.25). Si el profesor decide
poner sobresaliente al 20% con mayor nota, indicar cuál es la nota mínima para alcanzar tal
distinción.

ESTRÉS
En una muestra de 200 trabajadores, se administra una escala de estrés y determina una calificación
media de 18.5 puntos con una desviación estándar de 4.5. La distribución es normal. Considere que
X= “Puntuación en la escala de estrés ” ?
a) Si puntaje esta entre 14 o más, es elegible para entrevista. ¿ A cuántos de los 200
trabajadores en tu muestra les harás una entrevista?
b) ¿Cuál es la probabilidad de que el siguiente trabajador examinado tenga una puntuación de
10 o menos ?
c) A los trabajadores con puntuaciones en el 15% superior se les hará pruebas cardiacas. ¿Qué
puntuación en la escala de estrés los califica como participantes para estos servicios?
ANSIEDAD
Las puntuaciones en un test de ansiedad - rasgo siguen, en una población de mujeres, una distribución
Normal de media 25 y desviación estándar 10. Si queremos clasificar la población en cuatro grupos de
igual tamaño, ¿Cuáles serán las puntuaciones que delimiten estos grupos?

HABILIDAD
En dos grupos de 2do. Año de la carrera de cierta Facultad de Ciencias se ha medido una cierta
habilidad
Grupo A, μ = 100 y σ = 10, y
Grupo B : μ = 105 y σ = 12.
Ambos grupos tienen igual número de alumnos y escogido uno al azar se comprueba que su habilidad
es superior a 120; si se supone que las habilidades se distribuye según una normal tanto en el grupo A
como en el B, ¿cuál es la probabilidad de que el citado alumno provenga del grupo B?
TAREA
Un especialista en Educación ha aplicado a un grupo piloto de 10 estudiantes una prueba
estandarizada de rendimiento lector para conocer su nivel de lectura.
La muestra representativa de la población está formada por 1600 personas. Dicha muestra tiene una
distribución normal. La media de dicha muestra es de 80.5 y la desviación estándar de 8.6.
NOTA: Para responder, marque el resultado que más se aproxime a su solución.

a) ¿Cuál es el nivel de medida de la variable rendimiento lector ?


a1) Nominal
a2) Intervalo
a3) Razón
b) Según lo indicado en el enunciado. ¿Cuál es la variable independiente?
b1) Grupo
b2) Rendimiento lector
b3) No hay
c) Según lo indicado en el enunciado , el investigador se enfrenta a :
c1) Un problema de estadística descriptiva
c2) Un problema de estadística inferencial
c3) Un problema de validación de instrumentos de medida.
d) ¿Cuántos estudiantes obtuvieron una puntuación entre 60 y 90 ?
d1) 1370
d2) 203
d3) 231
e) ¿Cuál es la probabilidad de obtener una puntuación superior a 100 ?
e1) 0.99
e2) 0.05
e3) 0.01
f) ¿En qué percentil se encuentra un estudiante que se aleja dos desviaciones estándar por
debajo de la media del grupo ?
f1) 2
f2) 98
f3) 0.02

EJERCICIOS PROPUESTOS
ESTUDIANTES
La media de los pesos de 50 estudiantes de cierto colegio es 75 Kgs. con una desviación estándar de 7.5
kg. Suponiendo que los pesos se distribuyen normalmente, determinar cuántos estudiantes pesan:
a) Entre 60 y 77 kg.
b) Más de 94 Kg

EXAMEN FINAL
El tiempo necesario para terminar un examen final en determinado curso se distribuye normalmente con 80
minutos de media y 10 minutos de desviación estándar.
Calcular:
a) La probabilidad de terminar el examen en una hora o menos?
b) La probabilidad de que un alumno termine el examen en más de 60 minutos, pero en menos de 75
minutos?
c) Suponga que en el grupo hay 60 alumnos, y que el tiempo del examen es de 90 minutos.
¿Cuántos alumnos espera que no puedan terminar el examen en el tiempo indicado?

6.67 ¿CUÁNTO DURA EL EXAMEN?


Se ha encontrado que la duración promedio, requerida para completar un examen de conocimientos en una
universidad, es igual a 70 minutos con una desviación estándar de 12 minutos. ¿Cuándo debe terminarse el
examen si se desea permitir tiempo suficiente para que 90% de los estudiantes lo completen? (Suponga que
el tiempo necesario para completar el examen está normalmente distribuido.) Rpta. 85.36 minutos

CALIFICACIONES
Si las calificaciones obtenidas en un examen por los aspirantes a un empleo tienen una distribución normal
con media μ = 85 y desviación estándar  = 4.
a) ¿Qué porcentaje de los aspirantes se espera que obtengan una calificación superior a 90?
b) Si para aprobar el examen se requiere obtener una calificación superior a 80. ¿Cuál es la
probabilidad de que una persona desapruebe el examen?
EXAMEN 1
Para ingresar a cierta universidad se debe rendir un examen de ingreso y sólo hay cupo para el 20% de
los aspirantes. Suponiendo que los puntajes se distribuyen normalmente en el grupo de aspirantes con
media 60 y desviación estándar 15.
a) ¿Qué nota mínima de aprobación debe fijarse? Rpta. 72.6
b) ¿Cuál es la probabilidad de que en una muestra aleatoria de 15 aspirantes más de la tercera parte
aprueben el examen de ingreso? [Combinación Normal y Binomial ; n =15 ; p = 0.20 ] Rpta.
0.061
EXAMEN 2
En contraste con exámenes de aptitud, que son medidas predictivas de lo que se puede lograr con
capacitación, los exámenes de conocimientos indican lo que una persona puede hacer en el momento
del examen. Se encontró que las calificaciones de un examen de conocimientos matemáticos para 400
estudiantes tenían una media y varianza igual a 600 y 4900, respectivamente. Si la distribución de
calificaciones del examen tiene distribución normal:
a) ¿Más o menos cuántas de las calificaciones caerían en el intervalo de 530 a 670?
b) ¿Aproximadamente cuántas calificaciones se esperaría caigan en el intervalo de 460 a 740?

PRUEBA
Se ha utilizado una prueba de iniciación a la lectoescritura con 90 niños de un centro de Educación
Infantil. Se obtiene que esta variable se distribuye normalmente, siendo la media 34 y la desviación
estándar de 6. Responde a las siguientes cuestiones:
a) ¿Dónde se sitúa el decil 2?
b) ¿Qué puntuación permite seleccionar a los 5 niños con mejor nivel lectoescritura? Rpta. 43.53
c) ¿Cuántos/as niños obtienen puntuaciones comprendidas entre 30 y 40?
d) ¿Qué porcentaje de niños obtiene puntuaciones por encima de 45?

ESTATURA 1
La estatura de los estudiantes de una universidad están distribuidos normalmente. Si 13.57% de los
estudiantes miden más de 174.4 cm. y 8.08 % miden menos de 164.4 cm., ¿cuál es la media y la
desviación estándar de las estaturas de dichos estudiantes?
ESTATURA 2
La estatura de los estudiantes al ingresar a la universidad es una variable normalmente distribuida, con
una media de 1.65 m, con una desviación estándar de 16 cm. Si se toma una muestra aleatoria de 25,
¿cuál es la probabilidad de que la muestra revele una media muestral de por lo menos 1.70 m? ¿Cuál
es la probabilidad de que la muestra revele una media muestral entre 1.58 y 1.73 m? ¿Cuál será la
estatura mínima del 8% de los estudiantes más altos?
ESTATURA 3
Se sabe que la media aritmética de la estatura de los estudiantes de la carrera de Informática es μ =
1.66 m, con desviación típica σ = 0.07 m. Si se toma una muestra de tamaño 40, y considerando que
está distribuida normalmente, determina la probabilidad de que la media obtenida en la muestra:
a ) Exceda de 1.65 m.
b ) Esté entre 1.63 m y 1.68 m.
c ) Sea inferior a 1.64 m.
d ) Sea inferior a 1.63 m o superior a 1.69 m.
e ) ¿Cuál será la estatura mínima del 10% de los estudiantes más altos?
MÁQUINA
Una máquina envasadora de azúcar sirve el producto en bolsas de plástico y está ajustada para verter
2 kg netos. La desviación estándar del proceso es  = 18 gramos. Si se toma una muestra de 40 bolsas:
a ) ¿Cuál será el peso máximo que tendrán el 8% de las bolsas más vacías?
b ) ¿Cuál será el peso mínimo que tendrán el 10% de las bolsas más llenas?
GASTOS 1
Las cuentas de gastos en gasolina por día de los vendedores de una empresa de cigarros tiene una
media de 65 soles y una desviación estándar de  = 7 soles. Si se selecciona una muestra aleatoria de
25 cuentas, y considerando que estos gastos tienen una distribución normal, ¿cuál es la probabilidad
de que la muestra revele una media:
a) Al menos de 68 soles?
b) Entre 64 pesos y 66 soles?
c) ¿Cuál es el gasto máximo reportado del 20% de los vendedores que gastan menos en este rubro?

GASTOS 2
Con referencia al problema anterior, si la empresa tiene un total de 190 vendedores, contesta las
mismas preguntas.
AEROPUERTO
El objetivo de los aeropuertos de Estados Unidos que tienen vuelos internacionales consiste en autorizar
estos vuelos en un lapso de 45 minutos. Es decir, 95% de los vuelos se autoriza en un periodo de 45 minutos,
y la autorización del 5% restante tarda más. Suponga, asimismo, que la distribución es aproximadamente
normal.
a) Si la desviación estándar del tiempo que se requiere para autorizar un vuelo internacional es de 5 minutos,
¿cuál es el tiempo medio para autorizar un vuelo?
b) Suponga que la desviación estándar es de 10 minutos, no los 5 del inciso a). ¿Cuál es la nueva media?
c) Un cliente tiene 30 minutos para abordar su limusina a partir del momento que aterriza su avión. Con una
desviación estándar de 10 minutos.

TAREA
El tiempo que tarda un alumno en terminar una tarea dada sigue una distribución normal, de media 20
minutos y desviación típica 1.25 minutos.
a) Se elige un alumno al azar. Halle la probabilidad de que el alumno termine la tarea en menos de 21.8
minutos.
b) La probabilidad de que un alumno tarde entre k minutos y 21.8 minutos es igual a 0.3. Halle el valor de k .

PUNTUACIONES
Las puntuaciones en un test de ansiedad-rasgo siguen, en una población de mujeres, una distribución
Normal de media 25 y desviación estándar 10. Si queremos clasificar la población en cuatro grupos de
igual tamaño ¿Cuáles serán las puntuaciones que delimiten estos grupos? Rpta. Q1 = 18.3; Q2 = 25, Q3 = 31.7

Aproximación entre las distribuciones: Normal, Binomial y Poisson

Si λ≥ 5 Una Poisson Puede aproximarse N( μ = λ;  = √ λ


Si n ≥ 20 y p ≤ 0.05 Una Binomial " P( λ)
Si np, nq ≥ 5 Una Binomial N( μ = np ;  = √ npq
" )
CASO : COMPRAR 4 NEUMÁTICOS
Un ingeniero decide comprar cuatro neumáticos nuevos para su coche. Él encuentra que el minorista
A está ofreciendo un descuento especial, que depende de cuánta nieve cae durante el primer invierno.
Si esta nevada es inferior al 50% de la media anual de nevadas de su ciudad, su descuento será del 50%
del precio de lista. Si la nevada que el invierno es más del 50%, pero menos del 75% de la nevada
media anual, su descuento será del 25% del precio de lista. Si la nevada es más del 75% de la nevada
media anual, no recibirá ningún reembolso.
El ingeniero encuentra en un libro de referencia que la nevada anual de su ciudad tiene una media de
80 cm y desviación estándar de 20 cm y se aproxima a una distribución normal. El precio de lista para
la marca y el tamaño de los neumáticos que quiere es de S/. 80.00 por neumático.
El ingeniero cotiza a otros minoristas y descubre que el minorista B vende la misma marca y tamaño
de neumáticos con la misma garantía por el mismo precio de lista pero ofrece un descuento del 5% del
precio de lista, independientemente de las nevadas de ese año.
a) Comparar los costos esperados de los dos acuerdos. ¿Qué costo esperado es menor?
b) ¿Cuál es la diferencia para cuatro neumáticos de nieve nuevos? Desprecie las ventajas relativas de
un reembolso en efectivo en comparación con un descuento.
SOLUCION
a) Para el minorista A: μ = 80 cm, σ = 20 cm.
50% de μ es 40 cm y 75% de μ es 60 cm

40−80
Z1 =X i− ¿ = =−2¿ =
σ 20
P( nieve < 50% de  ) = P(Z < -2 ) = 0.0228

60−80
Z1 =X i− ¿ = =−1 ¿
σ 20
P( nieve < 75% de  ) = P(Z < - 1 ) = 0.1587
Entonces : P(50% de  < nieve < 75% de  ) = P(Z < - 1 ) - P( Z < - 2 ) = 0.1359
Entonces el descuento esperado del minorista A es:
50%P[ nieve < 50% de  ] + 25%P[50% de  < nieve < 75% de  ]
= 50% ( 0.0228 ) + 25% ( 0.1359 )
= 4.54% del precio de lista
El descuento del minorista B es el 5% del precio de lista, por lo que el descuento del minorista B es
mayor que el reembolso esperado del minorista A.
Por tanto, el costo esperado de la compra del minorista B es un poco menos que el costo esperado de
la compra del minorista A.
b) El costo de cuatro neumáticos de nieve nuevos son los siguientes.
Precio de lista: (4) (S/. 80.00) = S/. 320.00
Después del reembolso del minorista A, costo esperado = (1- 0.0454) (S/320.00) = S/305.472
Después del descuento del minorista B, costo = (1 - 0.05) (S/. 320.00) = S/. 304.00
Entonces la diferencia en el costo esperado para cuatro neumáticos nuevos de la nieve es S/. 1.472.
Por lo que conviene comprarle al minorista B, ya que su costo es menor que el minorista A.
CASO : PROGRAMA DE BECAS UNIVERSITARIAS
En un programa de becas universitarias, cualquier persona con un promedio superior a 7.5 recibe una
beca de S/ 1 000, cualquiera con un promedio entre 7.0 y 7.5 recibe S/ 500, cualquiera con un
promedio entre 6.5 y 7.0 recibe S/ 100, y todos los demás no reciben nada. Una clase particular de 500
estudiantes tiene un promedio general de 4.8 con una desviación estándar de 1.2. Calcule el costo
para la universidad de proporcionar becas para esta clase. Indique cualquier suposición.
Resp. 13 660
CORRELACIÓN LINEAL SIMPLE
El concepto de relación o correlación entre dos variables se refiere al grado de parecido o variación
conjunta existente entre las mismas.

El coeficiente de correlación lineal de Pearson permite estudiar la fuerza de la asociación lineal entre
dos variables. Este coeficiente, cuando se calcula a partir de datos muestrales, suele representarse por
r, que es un estimador del coeficiente de correlación poblacional r.

Una relación lineal positiva entre dos variables X e Y significa que los valores de las dos variables varían
de forma parecida: los sujetos que puntúan alto en X tienden a puntuar alto en Y y los que puntúan
bajo en X tienden a puntuar bajo en Y.

Una relación lineal negativa significa que los valores de ambas variables varían justamente el revés.

El coeficiente de correlación lineal de Pearson permite estudiar la fuerza de la asociación lineal entre
dos variables, Este coeficiente, cuando se calcula a partir de datos muestrales, suele representarse por
r, que es un estimador del coeficiente de correlación poblacional ρ.

Agua desagüe …….salud publica

Mide la intensidad o grado de asociación relación lineal entre dos variables numéricas
Dos variables están asociadas en la extensión en que una de ellas es un buen predictor de la otra.
Si R = 0 no significa que son independientes. En cambio sí hay independencia sí implica incorrelación.
 Relación positiva
 Relación negativa
Relación positiva Relación negativa
Estudiante A B A B
1 2  12 2 44
2 3  16 3 36
3 6  32 6 32
4 12  36 12 16
5 17  44 17 12
Media 8 28 8 28
Nube de puntos
Coeficiente de Correlación
Es una forma de describir qué tan cercana es la relación entre dos variables.
Mide la fuerza de la asociación entre pares de variables y la dirección de la relación, de manera que
puede predecirse o esperarse los cambios en una de ellas cuando la otra presenta variaciones.
Se denota por r y se calcula usando la siguiente fórmula:

Cov (x , y )
r=
σx .σy

Σ ( x−x́ ) .( y− ý )
Cov ( x , y )=
n

2
Σ ( x− x́ )
σ=
√ n

Rango de variación del Coeficiente de Correlación

Covarianza : indica si existe asociación lineal y su signo


Si dos variables X e Y son estadísticamente independientes, la covarianza es 0. Pero si Cov( X; Y ) =
0 no implica que las variables sean independientes.

REGRESIÓN LINEAL SIMPLE


Es la recta que mejor se ajusta a la nube de puntos.
La relación entre las variables es lineal
Relación funcional entre dos o más variables.
X : variable independiente
Y : variable dependiente
Ambas variables deben ser al menos de la escala de intervalo
El criterio de mínimos cuadrados se usa para determinar la ecuación.

Modelo determinista lineal


Y = a + bX
La forma matemática más simple en que podría representarse este tipo de relación, sería por una
expresión del tipo: y1 = f(x1) es decir, una dependencia de tipo funcional
Al admitir un modelo del tipo anterior, es importante la hipótesis de aislamiento, que consiste en
suponer que el error aleatorio no depende del resto de las variables.
La hipótesis de aislamiento se cumple cuando los datos se han tomado aleatoriamente, y han sido
medidos todos con el mismo instrumento, pero puede no cumplirse en otros casos.
a: Constante ; intercepto
b: Coeficiente de regresión ; pendiente
X: Variable independiente ( exógena, predictora )
Y: Variable dependiente ( endógena , respuesta )
a=?
b=?
Cov ( x , y )
b=
σ 2x

a= ý−b x́
Características:
 La recta de regresión siempre pasa por el punto ( X́ ; Ý )
 La pendiente ( b) presenta el mismo signo que la covarianza entre X e Y ( Sxy )
 El coeficiente de correlación lineal R , está directamente relacionado con b ( siempre
presentan el mismo signo ).
 La recta de regresión de Y sobre X, en general, no presenta la misma solución que la regresión
de X sobre Y.

Coeficiente de determinación ( r2 )
Mide en que porcentaje la variable X explica el comportamiento de Y
Que tanto explican nuestras variables independientes a la variable dependiente Y

Regresión lineal simple:


Tensión arterial sistólica = f( colesterol )

Regresión lineal simple:


Tensión arterial sistólica = f( edad, colesterol, nivel de ácido úrico )

El modelo resultante es: peso’i = -118,375 + 105,437 estaturai. Como se observa,


el coeficiente de determinación (R al cuadrado) es 0,734 por lo que el modelo es
adecuado para explicar la relación entre la variable ‘estatura’ y la variable
‘peso’. Es decir, la variable ‘estatura’ tiene una alta capacidad predictiva para
explicar la variable del criterio, el ‘peso’.
El gráfico obtenido definiendo las opciones del diagrama de dispersión
interactivo de la figura 3.11. es el siguiente:
1
AUTOESTIMA y DEPRESIÓN
Estamos investigando la posible relación existente entre las variables: AUTOESTIMA y DEPRESIÓN, en
un grupo de 10 pacientes aquejados en los últimos 5 años de problemas de esta índole. Los datos
obtenidos son los siguientes:
Autoestima ( X ) Depresión ( Y )
2 2.5
3 2.5
4 3
1 2
5 4
3 2.5
8 6
6 5
4 3.5
3 3.5

a) Hallar la recta de regresión que permite predecir el grado de depresión a partir del nivel
de autoestima
b) Has una valoración del modelo lineal encontrado.
c) Que nivel de depresión pronosticarías a una persona de caracteristicas idénticas a las del
grupo investigado, sabiendo que su nivel de autoestima es de 6 ?
Solución
a) Recta de Regresión Lineal Simple : Y = 1.13 + 0.59X
b) R = 0.96 , R 2 = 0.92 ( El 92% de la variabilidad de las puntuaciones en depresión se
puede predecir a partir de las puntuaciones en la variable ansiedad )
^ =1.13+ 0.59 x 6=4.67
c) Y
Pronóstico: 4.67 de depression
VENTAS DIARIAS y FLUIDEZ VERBAL
Cierta empresa necesita contratar para su plantilla fija un determinado número de vendedores. El
encargado de la selección de personal desea pronosticar el número de ventas diarias ( Y ) a partir de la
fluidez verbal ( X ) del aspirante. Para ello, dispone de una serie de antiguos trabajadores, que se
muestran en la tabla:
FLUIDEZ VERBAL ( X ) VENTAS ( Y )
1 2
5 4
6 5
6 3
2 1
Calcular :
a) El coeficiente de correlación. Interpretar
b) El coeficiente de determinación
c) La recta de regresión del número de ventas diarias sobre la fluidez verbal.
Rptas: R = 0.81 b) R2 = R2 = 0.66 c) Y = 0.82 + 0.55X
COEFICIENTE DE CORRELACIÓN
Los puntajes obtenidos por 10 alumnos en Matemática y Música son:
Matemática 6 4 8 5 3.5 7 5 10 5 4
Música 6.5 4.5 7 5 4 8 7 10 6 5
a) Calcular e interpretar el coeficiente de correlación
b) Cuál sería la nota esperada en música para un alumno que hubiese obtenido un 8.3 en
matemática
RAZONAMIENTO LÓGICO y TIEMPO
Al registrarse el puntaje de 5 sujetos en una prueba de razonamiento lógico y el tiempo empleado para
resolverla se obtuvieron las siguientes observaciones apareadas:

Puntaje X (sobre un total de 20) : 15 13 20 15 18


Tiempo Y (en minutos) : 60 55 68 50 65
a) Calcular e interpretar el coeficiente de correlación
b) Determinar la ecuación de regresión lineal simple de Y sobre X.
REGRESIÓN
Cierta empresa necesita contratar para su planilla fija un determinado número de vendedores. El
encargado de la selección de personal desea pronosticar el número de ventas diarias (Y) a partir de la
fluidez verbal (X) del aspirante. Para ello, dispone de una serie de datos de antiguos trabajadores, que
se muestran en la tabla :
X Y X – media Y – media ( ).( ) (X - media)2 (Y - media)2
1 2
5 4
6 5
6 3
2 1
ΣX = ΣY =

X́ =¿ Ý =¿
a) Calcular el coeficiente de correlación de Pearson.
b) Calcular la recta de regresión del número de ventas diarias sobre la fluidez verbal.
HABILIDAD VERBAL y RAZONAMIENTO ABSTRACTO
Las puntuaciones obtenidas por un grupo de personas en un test para medir la habilidad verbal X y el
razonamiento abstracto Y son:
Y
X Total
20 30 40 50
[ 25 ; 35 ) 6 4 0 0
[ 35 ; 45 ) 3 6 1 0
[ 45 ; 55 ) 0 2 5 3
[ 55 ; 65 ] 0 1 2 7
Total
a) Obtenga las tablas de las distribuciones marginales
b) Calcular la media y la desviación estándar de las distribuciones marginales
c) Calcular las medias Y/X , ∀i,

RECTA DE REGRESIÓN
Se conocen los siguientes datos relativos a 5 observaciones de la producción X y el costo total Y
de una industria. :
5 5 5 5 5

∑ Xi=64 ; ∑ Yi=247 ; ∑ Xi . Yi=3199 ;∑ X =828; ∑ Y 2=12363 2

i=1 i=1 i=1 i=1 i =1

a) Determine la recta de regresión de Y sobre X


b) Estime el costo si la producción es 15.

RECTA DE REGRESIÓN
De una distribución bidimensional de frecuencias se sabe que :
1
M(Y) = 5 ; V(Y) = 5 ; x = 10 ; xy = 10 ; Σ X 2=200
n
a) Determinar la regresión de Y sobre X
b) Calcular el coeficiente de correlación lineal
c) Calcular la varianza residual de la anterior regresión.

EDAD y ACCIDENTES
Sobre un conjunto de conductores se ha realizado una encuesta para analizar su edad (Y) y el número
de accidentes que han sufrido (X). A partir de la misma se obtuvieron los siguientes resultados:
X/Y [20;30) [30;40) [40;50) [50;60) [60;70] Total
0 74 82 78 72 7
1 7 6 5 6 5
2 3 2 2 1 1
Total
A partir de estos datos, se le pide que determine para esta distribución las curvas de regresión de Y
sobre X y de X sobre Y

GASTO y VENTAS
La recta de regresión X = 3 + 0.5Y , expresa la relación estadística entre un número X de unidades
vendidas diariamente de un bien y el gasto mensual Y en hacerle publicidad. Se sabe que la covarianza
es 22.5 y que la distribución marginal de X es la siguiente:
Xi 5 7 10 12
Frecuencia absoluta 2 5 3 2
a) Determine las respectivas medias de X e Y , y la varianza de Y
b) Determine la recta de regresión de Y sobre X, su coeficiente de determinación y la varianza
residual.
RECTA DE REGRESIÓN
De una distribución de dos variables se conocen los siguientes datos:
R = 0.9 Sx = 1.2 Sy = 2.1 M(X) = 5 M(Y) = 10
Obténgase las rectas de regresión de Y sobre X y de X sobre Y.

EMPRESAS
Datos: correspondientes a 8 empresas de la ciudad de Trujillo
Variables: Ventas y beneficios
Empresas Ventas Beneficios
A 7 2.25
B 6 1.10
C 7 1.75
D 5 1.55
E 4 0.40
F 3 0.50
G 5 0.20
H 3 0.25
Calcular:
a) La covarianza y la correlación lineal simple
b) Si las ventas de todas estas empresas se incrementan en un 5% y los beneficios en 0.5 ¿Cuál
será la covarianza de las variables transformadas ? y ¿ el coeficiente de correlación lineal ?
RECTA DE REGRESIÓN
Se sabe que la recta de regresión de Y sobre X es ^y =ax+ 4 , y su coeficiente de determinación es
0.8; además V(Y) = 16 y las rectas de regresión se cortan en el punto (1; 2 ). Determine las varianzas
de X y de Y, y la covarianza. Estime el valor de X si Y = 2.

RECTA DE REGRESIÓN
Se sabe que la recta de regresión de Y sobre X para un conjunto de 10 datos es Y = 0.84 + 0.74X,
siendo V( e ) = 3.218 , la correspondiente varianza residual. También se sabe que ΣYi = 82.4 y ΣX2 =
3340. Determine la recta de regresión de X sobre Y, y el coeficiente de determinación.
MODELOS
Un concesionario, para analizar la aceptación de dos nuevos modelos de motocicleta ha observado
durante los 25 días laborables del último mes las unidades vendidas:
X: Unidades vendidas del modelo A
Y: Unidades vendidas del modelo B
Modelo A ( X ) Modelo B ( Y ) N° de días
0 3 1
1 1 5
2 1 10
3 2 9

Se pide:
a) Vector de medias y matriz de varianzas y covarianza
b) Coeficiente de correlación lineal e interpretación
c) Si el número de motos vendidas de cada modelo en cada uno de los días observados fuera el doble
¿ Cuál sería la covarianza y el coeficiente de correlación entre las unidades vendidas de los dos
modelos.
Rpta. a) [ 2.08 1.44 ] ¿
b) rxy = 0.341
c ) Sxy = 0.6868 rxy = 0.341
RENTA
A partir de una muestra de 100 observaciones referente a las variables:
X: Renta familiar disponible
Y: Saldo de las imposiciones en Cajas de Ahorros.
Se han obtenido los siguientes resultados:

X́ =4.65 ; Ý =1.55 ; S2X =5.48 ; S2Y =1.04 ; S XY =2.13


Se pide:
a) Determinar el grado de asociación lineal entre estas variables
b) Obtener la ecuación de regresión lineal que explica el Saldo de las Imposiciones en función de la
Renta Familiar.
c) Indique el porcentaje de variación observado en Y explicado por el ajuste anterior.

Rpta: a ) 0.892 ^ =−0.2574+0.3887


b) Y X c ¿ 79.6 %
VECTOR
El vector de medias y la matriz de varianzas y covarianzas de las variables:
X1 = Ingreso semanal
X2 = Gasto semanal ( um. )
Observadas sobre un conjunto de 100 familias son:
X́ =[ 1250 1050 ] S2=¿
a) Calcule el coeficiente de correlación lineal
b) Obtener el ajuste lineal del gasto semanal en función del ingreso.
c) ¿Qué porcentaje de variación del gasto no queda explicado por el ajuste anterior?
d) ¿Qué predicción del gasto semanal haría para una familia con 1100 u.m. de ingreso semanal?
Comente la validez de resultado anterior.
Rpta. a) r = 0.41
b) a = 112.5 b = 0.75 y = 112.5 + 0.75x
c) 83.19% ( 1 - r2 )
d) 937.5
JUSTIFICAR
Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes sean,
respectivamente, las lineas de regresión mínimo-cuadráticas de Y sobre X y de X sobre Y de una serie
de observaciones.
Y/X : Y = 2X + 1
X/Y : X = - 5Y + 10
PRECIOS
Suponga que ha observado simultáneamente el precio X y la demanda Y de un determinado producto:
X 1 2 3 4 5 6 7 10 10 12
Y 12 10 10 8 6 5 7 6 4 2
Obteniendo:

∑ (X − X́ )2=¿ ¿124 ∑ (Y −Ý )2=84 ∑ ( X− X́ ) . ( Y −Ý )=−93


a) Obtener el ajuste lineal de la demanda en función del precio
b) Determine la bondad del ajuste
c) Si el precio se incrementa en 1 unidad, ¿Cuál es el incremento esperado en la demanda?
d) Obtener la predicción de la demanda esperada si el precio es 9.
Rptas.:
a) Y^ =11.5−0.75 X
b) 0.83
c) Un decremento de 0.75 unidades
ANALIZAR
Analizar si son posibles las siguientes situaciones
a) ¿ Es posible que Y = ( 2 – x ) / 3 ; X = 1 – 4y ?
b) ¿ Si 2x – y = 1 en una recta de regresión, puede ser negativo r?
c) Si X + 2y = 1 y 3X + 5y = 2 son rectas de regresión, calcule M(X) y M(Y).
d) Si entre X e Y hay correlación positiva. ¿Cómo es la correlación entre U = 3 – 2x y V = 4 +
3y?
2 2
e) ¿ Es cierto que Se =S y −aS xy ?

ANTIGÜEDAD y SALARIO
Datos sobre la antigüedad X y salario Y de los trabajadores de una empresa:
Antigüedad “ X “ Salario “ Y “ Trabajadores
a c-6 d
b 6-8 2
2 8 – 14 4
1 14 - 18 4
a) Hallar a ; b ; c y d sabiendo que Sxy = -7, que las rectas de regresión se cortan en el
punto ( 3 ; 9.5 ) y que la distribucion de frecuencias relativas de y es :
Salario c -6 6-8 8 - 14 14 - 18
hi d 0.125 0.25 0.25
b) Si se prescinde del 15% de los empleados con salarios má bajos y el 10% con salarios más
altos ¿ Entre qué valores están los salarios del 75% restante ?
c) Hallar la recta de regresión de Y sobre X y el coeficiente de determinacion.
JUSTIFICAR
Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes sean,
respectivamente, las lineas de regresión mínimo-cuadráticas de Y sobre X y de X sobre Y de una misma
serie de observaciones.
Y/X : Y = 2X + 1
X/Y : X = 5Y + 10
Si se acepta como válida la recta Y/X, ¿ entre qué valores puede variar el parametro b´ ,
de la recta X/Y ?
NOTAS
Las notas de Estadistica ( X ) y en matematicas ( Y ) obtenidas por 10 alumnos elegidos al azar en un
grupo de primer curso de la Facultad de Ciencias de la Educación han sido las siguientes, según el
orden de selección de la muestra:
N° orden 1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Xi ( Est.) 9 7 3 6 7 5 10 8 2 5
Yi ( Mat. ) 8 5 4 2 9 6 10 9 1 5
a) Estime los parámetros de la recta de regresión de Y/X. Interprete los resultados
b) Estime los parámetros de la recta de regresión de X/Y. Interprete los resultados
c) Calcule la varianza residual en la regresión Y/X
d) Calcule la varianza residual en la regresión X/Y
e) Para un alumno que haya obtenido un 7 en Matemáticas ¿ qué nota le pronosticaría
en Estadística ?
f) Para un alumno que haya obtenido un 4 en Estadística ¿ qué nota le pronosticaría en
Matemática ?

MUESTREO
CALIFICACIONES
Un profesor de inferencia estadística quiere saber las calificaciones que obtuvieron sus alumnos en
estadística descriptiva. En la primera clase del curso les pregunta a los diez estudiantes sentados en la
primera fila sus calificaciones en esa asignatura. Concluye, con base en las respuestas recibidas, que el
grupo obtuvo muy buenas calificaciones.
¿Cuál es la muestra?
¿Cuál es la población?
¿Puedes identificar cualquier problema relacionado con la forma en que el profesor seleccionó la
muestra?
SOLUCIÓN
Población: está formada por todos los estudiantes de la clase.
Muestra : se conformó con los diez estudiantes sentados al frente.
Esta muestra probablemente no es representativa por la tendencia que existe a que los más aplicados
se sienten al frente y éstos alcancen las más altas calificaciones. Por tanto, la muestra puede
proporcionar una calificación promedio más alta que la que realmente le corresponde al grupo.

RENDIMIENTO
Un profesor de deportes está interesado en determinar el rendimiento promedio de los estudiantes en
una carrera con obstáculos. Ocho estudiantes de su clase se apuntan como voluntarios. Después de
observar su desempeño, el profesor concluye que sus estudiantes pueden realizar exitosamente la
prueba.
SOLUCIÓN
Población : Todos los estudiantes del grupo.
Muestra : se conformó con ocho voluntarios.
La selección de la muestra fue deficiente porque los voluntarios son probablemente más hábiles en
realizar la prueba que el resto de los estudiantes. Los estudiantes sin habilidad casi con seguridad no
se anotaron como voluntarios. Además, nada se dice del género de los voluntarios. Por ejemplo,
¿cuántas voluntarias hubo? Esto puede afectar el resultado, adicionalmente al hecho de que la
muestra no es representativa.

ALGUNAS FÓRMULAS: TAMAÑO DE MUESTRA

¿ Fórmula mágica ?
¿ De qué depende el tamaño de muestra ?
“ UNA GOLONDRINA NO HACE VERANO “
( Por uno o dos hechos no se puede generalizar )

Este es un tema crucial en todo trabajo de investigación, ya que en muchos estudios de investigación
científica es imperativo conocer el tamaño de muestra.
De que depende el tamaño de muestra ?........ podemos mencionar algunos factores:

Objetivo del trabajo de investigación ( proporciones; promedios ; totales ; variabilidad )


Tipo de población en estudio
Variable a estudiar (Cualitativa o cuantitativa)
Grado de homogeneidad de los datos
Presupuesto ( materiales y equipos ,….)
a) Para estimar la media poblacional

Z2. σ2
Población Infinita n=
e2

Z2 . σ2. N
Población Finita n=
e2 . ( N −1 ) +Z 2 . σ 2

b) Para estimar la proporción de la población

2
Z . P .Q
Población Infinita n=
e2

Z 2 . P . Q. N
Población Finita n= 2 2
e . ( N −1 ) +Z . P . Q

Si no se conoce el valor de p :
 Antecedentes históricos
 Publicaciones, revistas
 Informes OMS , OPS , instituciones reconocidas etc.
 Estudios de postgrado
 Muestra piloto
 Si no se cuenta con información, antecedentes, p = 0.5
Un Banco desea identificar el promedio de cuentas por cobrar, estudios previos han determinado
que la variación de las cuentas está en 1000 soles. El Banco cuenta con 1400 clientes activos. Si el
límite de error de estimación es de 50 soles ¿Cuál debe ser el tamaño de la muestra a un nivel de
significancia del 5%?
Solución
Se trata de una población finita.
Por teoría la amplitud de variación es 4 veces la desviación estándar: A = 4σ
Entonces: σ = A/4 = 1000/4 = 250

Z2 . σ2. N 1.96 2 x 250 2 x 1400


n= =n= =89.93
e2 . ( N −1 ) +Z 2 . σ 2 502 ( 1400−1 ) +1.962 x 2502
En una fábrica de alimentos para animales se producen diariamente 58500 sacos de alimento de 5
kg. Para garantizar que el peso del contenido sea correcto, se toma aleatoriamente algunos sacos y
se pesan.
Se sabe que la variabilidad positiva es de p = 0.7. Si se quiere garantizar un nivel de confianza de 95%
y un porcentaje de error de 5%, ¿cuántos sacos se debe pesar?
Rpta. 320
Solución
N=
P=
Q=
E=
Z=
n=

Se desea realizar un estudio sobre la incidencia de complicaciones postoperatorias en mujeres. El


estudio no tiene antecedentes, pero se desea garantizar un nivel de confianza de 95% y un
porcentaje de error máximo de 10%, ¿cuál debe ser el tamaño de la muestra?
Rpta. 96
Solución
P=
Q=
E=
Z=
n=
Un estudio pretende estimar la cantidad de niños(as) que no tiene un nivel de nutrición adecuado,
en determinada zona rural. Se sabe que hay 480 niños(as) en la zona.
Calcula el tamaño de la muestra para garantizar un nivel de confianza del 95%, y un porcentaje de
error de 4%. Rpta. 266 niños
Solución

N=
P=
Q=
E=
Z=
n=

MUESTREO SISTEMATICO
 Listado de la Población debidamente ordenados ( N ) [ homogénea ]
 Decidir el tamaño de muestra (n)
 Calcular :
K = N / n (tamaño de muestra)
 Seleccionar aleatoriamente un entero entre 1 y k
 Luego se tomaran las muestras cada k elementos en la población
Ejemplo :
N = 12
n=4
Entonces K = 3
Seleccionar un número al azar entre 1 y 3
Escogemos el 2
Empezar con el 2 , luego se toman cada 3 unidades.
Muestra = { 2 , 5 , 8 , 11 }
CUIDADO :
Si en la lista existen periodicidades, obtendremos una muestra sesgada.( Iglesia, centro
comercial, casa abandonada etc. ) por lo que sólo se aplica en poblaciones homogéneas.
Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una
ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha
frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas,…

Ejemplos:
 Tomar canaletas en una galería cada 2 metros.
 En una cinta transportadora, tomar una muestra cada 10 minutos.
 Si queremos saber cómo afecta el factor altitud a la altura máxima de los pinos,
tomaremos muestras cada 100 metros de incremento de altitud, hasta llegar al
límite superior del bosque.
 Suponga que la población de interés consiste de 2000 expedientes en un archivo.
Para seleccionar una muestra de 100 con el método sistemático, se selecciona el
primer expediente de acuerdo al método aleatorio simple, luego como se quiere
una muestra de 100, se divide 2000 / 100 = 20, y se selecciona un expediente cada
20, hasta completar la muestra.

MUESTREO ESTRATIFICADO
Población heterogénea con N unidades, se subdivide en subpoblaciones homogéneas dentro de si y
heterogéneas entre sí.
Estratos o grupos: N1 ; N2 ; . . . . NL . , denominadas estratos.
y se selecciona al azar una muestra de cada estrato.
Objetivo principal:
a) Maximizar las diferencias entre bloques
b) Minimizar la variación dentro de bloques
 Genero: Hombres y mujeres.
 Grupos etareos: Jóvenes, adultos y ancianos.
 Profesiones.
 Niveles S.E.
 Sexo.
 Población.
 Edades.
Se realiza entonces un m.a.s. de los individuos de cada uno de los estratos.

Ejemplo: Un caso de muestreo estratificado proporcional.


Considerando que se conoce la muestra total n = 200, luego se pide determinar la muestra
proporcional por estrato
Nivel S.E. N° alumnos Proporción Muestra
Bajo 800 0.67 134
Medio 300 0.25 50
Alto 100 0.08 16
Total 1200 1.00 200

MUESTREO POR CONGLOMERADOS

La población se divide en grupos tales que internamente sus miembros son heterogéneos, pero los
grupos son parecidos entre si. Los individuos constituyen agrupaciones naturales. Elegir todos los
miembros de esos grupos.
Los conglomerados son los subconjuntos que se dan en la vida real o ya están agrupados de esa
manera.
Por ejemplo:
Escuelas.
Divisiones geográficas.( barrios, comunidades,…)
Tipos de Industrias.
Bloques de casas y otros.
Las unidades hospitalarias,
Una caja de determinado producto

EJERCICIOS PROPUESTOS
En ciertas ocasiones, en el muestreo estadístico, es difícil definir la población o lote. Por ejemplo, se
desea hacer una encuesta de votación acerca del apoyo al candidato A en una cierta asociación.
¿Cuál es la población?
(Los socios inscritos, los socios al día en las cuotas, los socios que votaron la vez anterior, ...).
Supongamos que van a votar N = 580 socios y que se hace una encuesta tomando, al azar, n =
100 socios, obteniendo el apoyo de 62 socios. Comprobar que el error de muestreo verifica
(con 95% de confianza): -0.09 < error < 0.09. ¿Está seguro de ser elegido el candidato?
Son buenas o son malas las muestras siguientes:
a) 1cc de sangre para medir glóbulos rojos.
b) 5cc de orina para medir glucosa.
c) Llamadas por teléfono
d) Usar la guía telefónica
El Ex - Presidente Kennedy leía una cada 50 cartas de las 30,000 que llegaban semanalmente a la
Casa Blanca. Comentar desde el punto de vista del muestreo.
Una empresa de cosméticos y perfumería desea conocer la aceptación de su nueva colonia infantil.
Para ello decide preguntar a mil personas sobre la utilización y ventajas de dicha colonia.
a) ¿A qué mil personas debe elegir?
∗ A las mil primeras personas que entren en un paradero de metro.
∗ A las mil primeras personas que esperen a sus hijos a la puerta del colegio.
∗ A las mil primeras personas que salgan del Supermercado.
∗ A las mil primeras personas que abran la puerta a las 10 de la mañana, en diversos barrios
de la ciudad.
b) ¿Qué población queda excluida en cada una de las muestras anteriores?.
Queremos seleccionar cinco alumnos de cada curso de un Colegio para realizar una competición de
baloncesto. Carlos propone el siguiente procedimiento para seleccionar a los cinco alumnos de entre
los 30 que componen el grupo de tercero del colegio:
Carlos dice: “Cojo 30 folios en blanco y en 5 de ellos pongo una marca; los doblo varias veces y hago
que cada compañero coja uno. Los cinco de la señal formarán el equipo de baloncesto de la clase “.
a) ¿Crees que esta muestra elegida por Carlos es representativa del colegio ?. ¿Por qué?.
b) Inventa algún otro procedimiento para elegir a los 5 alumnos de tercero del colegio.
En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450
en el departamento de ventas, 200 en el de contabilidad y 100 en el de servicios al cliente. Con el
objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Qué
número de trabajadores tendríamos que seleccionar en cada departamento atendiendo a un criterio
de proporcionalidad Rpta. : 30, 90, 40, 20

a) Para estimar la estatura media de 685 hombres se extrae una muestra de 35 de ellos. La media de
la muestra es de 174.3 cm. Expresa este resultado sabiendo que en la ficha técnica se dice que el
error máximo es de ± 1.9 cm con una probabilidad de 0.90.
b) Si con el mismo estudio anterior admitimos que se comete un error de ± 2.4 cm, el nivel de
confianza será ¿inferior o superior al 90%?
c) ¿Cómo podríamos aumentar el nivel de confianza manteniendo la cota de error en ± 1.9 cm?

Solución:
a) La estatura media de los hombres se encuentra en el intervalo: (174,3 − 1,9; 174,3 + 1,9) = (172,4;
176,2) Esta afirmación se hace con un nivel de confianza del 90%.
b) Si admitimos que se comete un error de ± 2,4 cm, el intervalo en el que se encontrará la estatura
media será mayor que el anterior: (174,3 − 2,4; 174,3 + 2,4) = (171,9; 176,7) A mayor intervalo,
mayor nivel de confianza; será por tanto superior al 90%.
c) Manteniendo la cota de error en ±1,9 cm, mantenemos la amplitud del intervalo. Luego para
mejorar el nivel de confianza hay que aumentar el tamaño de la muestra.

INTERVALOS DE CONFIANZA

NIVELES DE CONFIANZA MÁS USADOS


90%  ( Z = 1.64 )
95%  ( Z = 1.96 )
99%  ( Z = 2.58 )
ESTIMA PARAMETROS : μ ; P ;  ; μ1 – μ2 ; P1 – P2
.

INTERPRETACIÓN

INTERVALO 99% ( Para  ) : 105 +/- 0.82

EN CONCLUSIÓN PODEMOS DECIR CON UN NIVEL DE CONFIANZA DEL 99% QUE, SI


REPITIESEMOS LA ESTIMACION 100 VECES, EN EL 99% DE ESAS MUESTRAS , LA MEDIA
POBLACIONAL, SE ENCONTRARIA ENTRE LOS VALORES 104.18 y 105.82

Se tiene una confianza del 99% que la media poblacional real se ubica entre 104.18 y
105.82

ANALOGIA DEL PEZ:


“ SI LANZAMOS LA RED 100 VECES, ATRAPAREMOS AL PEZ 95 VECES “

RELACION ENTRE EL NIVEL DE CONFIANZA y EL GRADO DE PRECISIÓN


A > nivel de confianza, > término del error y por lo tanto será menos preciso el intervalo de
confianza

RELACION ENTRE EL TAMAÑO DE MUESTRA y EL GRADO DE PRECISIÓN


A > n , más preciso será el intervalo de confianza

Tabla : Intervalo de confianza para quince muestras aleatorias de tamaño diez obtenidas de una
parcela de cien árboles de eucalipto.
Muestra Media ( cm ) S ( cm) Limite Inf. ( cm ) Limite sup. ( cm )
1 16.5 7.3 11.3 21.7
2 18.1 7.8 12.5 23.7
3 16.7 5.6 12.7 20.7
4 17.3 6.3 12.8 21.8
5 19.4 6.4 14.8 24.0
6 17.6 5.6 13.6 21.6
7 17 7.5 11.6 22.4
8 16.8 5 13.2 20.4
9 17.6 4.4 14.5 20.7
10 19.3 7.9 13.7 24.9
11 16.5 4.6 13.2 19.8
12 17.6 4.7 14.2 21.0
13 20.3 7.9 14.7 25.9
14 17.8 6.6 13.1 22.5
15 17 4.7 13.6 20.4

Intervalos de confianza para 15 muestras de


30 tamaño 10
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Muestras

Media Lim. Inf. Lim. Sup.

Casos de Intervalos de confianza


a) I.C. para la media poblacional (  )
( n ≥ 30 y Varianza conocida )
Z∗σ
μ : x́ ±
√n
Los límites son valores o cantidades aleatorias.

b) I.C. para la media poblacional (  )


( n < 30 y Varianza no conocida )
t∗S
μ : x́ ±
√n

Gl = n-1 t con(n−1; 1− )
2
c) I.C. para Diferencia de medias ( 1 - 2 )
( n1 , n2 ≥ 30 y Varianza 1 , Varianza 2 conocida )

σ 21 σ 22
μ1−μ 2 : ( x́ 1−x́ 2 ) ± Z∗
NOTA:
√ +
n1 n2

Si el cero ( 0 ) no se encuentra en el intervalo de confianza, hay


alguna evidencia de que las medias de la población no son iguales.
d) I.C. para Diferencia de medias: muestras independ. ( 1 -
2 )
( n 1 , n2 < 30 y Varianza 1 , Varianza 2 no conocida )

S 2c S 2c
μ1−μ 2 : ( x́ 1− x́ 2 ) ± t∗
2
√ +
n1 n 2
2
2 ( n1 −1 ) S 1+ ( n2−1 ) S2
S=c
n1 +n2−2
Gl = n1 +n2 -2

t con(n ¿ ¿ 1+n2 −2; 1− ) ¿
2
Supuesto:
Las muestras provienen de una población normal con varianza conocida. En la
práctica, esto es una situación muy poco probable; sin embargo su cálculo nos sirve
para ilustrar algunos aspectos teóricos de los intervalos de confianza.
e) I.C. para diferencia de medias: datos pareados ( 1 - 2 )
(muestras dependientes )
Z∗Sd
μd : d́ ± n≥ 30
√n
t∗S d
μd : d́ ± n < 30
√n
Σ di Sd Σ( d−d́ )2
d́=
n
, S d́ =
√n
y Sd =
n−1 √
Ley T con n-1 grados de libertad ( g.l. ) y probabilidad = 1 – alfa/2
f) I.C. para la Proporción poblacional ( P )
p.q
P : p ± Z∗
√ n
p: proporción muestral q=1–p

g) I.C. para diferencia de proporciones ( P1 - P2 )

p 1 . q1 p2 . q2
P1−P2 : ( p1− p2 ) ± Z∗
q1 = 1 – p1 ; q2 = 1 – p2
√ n1
+
n2

h) I.C. para la varianza poblacional ( σ2 )

(n−1) S2 2 ( n−1) S2
≤σ ≤
χ2 α χ 2α
1−
2 2

σ 21
i) I.C. para la razón de varianzas ( 2 )
σ2

S 21 S21
∗1 ∗1
S 22 σ 21 S22
≤ ≤
F α
(n1−1 , n2−1 ,1− )
σ 22 F α
(n 1−1 ,n 2−1 , )
2 2

NOTA:
Si 1 no se encuentra en el intervalo de confianza, hay alguna evidencia de que las variaciones de la
población no son iguales.

EJERCICIOS
TEMPERATURA DE PACIENTES ( I.C. PROMEDIO  )
Sobre una muestra de n = 64 pacientes de un hospital, se midieron sus temperaturas para
estimar la temperatura media de sus enfermos.
Media de la muestra = 37.1 oC
Desviación estándar = 1.04 oC.
a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
b) Con qué nivel de confianza podemos afirmar que la media de la población está comprendida 
36.8oC y 37.4 oC ?
Solución
1.64∗1.04
μ : 37.1 ±
√64
μ : 37.1 ± 1.64∗0.13
μ : 37.1 ± 0.2132

Luego : LIS ( 90 % )=(36.89; 37.31)


CONCLUSION
Podemos estimar, con un 90% de confianza, que la media de temperaturas de todos los
pacientes enfermos del hospital está entre 36.89 y 37.31°C.

TAMAÑO DE MUESTRA
El director de un colegio quiere saber el tiempo medio que tardan los alumnos en cambiar de
clase, con una confianza del 99% y un error que no sobrepase 0.25 minutos. Si se puede suponer
que el valor de σ es 1.40 minutos, ¿Cuál debe ser el tamaño de la muestra?
Solución
Usando la distribución normal, ya que se supone conocida la desviación estándar de la población :
Z(99%) = 2.58
E = 0.25
𝞼 = 1.4
n=?
(Z . σ )2
n=
E2
(2.58 x 1.4)2
n= =209
0.252
Tomaremos una muestra mayor o igual a 209 alumnos
EJERCICIOS PROPUESTOS
ELECCIONES
A las siguientes elecciones locales en una ciudad se presentan tres partidos: A, B y C. con el objetivo
de hacer una estimación sobre la proporción de voto que cada uno de ellos obtendrá, se realiza una
encuesta en la que responden 300 personas, de las cuales:
60 piensan votar por A,
80 por B y
90 por C.
Blancos: 15
Abstenciones: 55.
Calcular un intervalo de confianza del 95% para la proporción de votos , sobre el total del censo, de
cada uno de los partidos que se presentan.

PUNTAJES ( MEDIA )
Se toma una muestra de 22 de una población de puntajes de prueba, y la media de su muestra es 60.
a) Sabe que la desviación estándar de la población es 10.
¿Cuál es el intervalo de confianza del 99% sobre la media de la población?
b) Ahora suponga que no conoce la desviación estándar de la población, pero la desviación estándar
en su muestra es 10. ¿Cuál es el intervalo de confianza del 99% en la media ahora?

ENCUESTA ( PROPORCIÓN )
Leyó sobre una encuesta en un periódico y descubrió que el 70% de las 250 personas de la muestra
prefieren al Candidato A. Le sorprende esta encuesta porque pensó que más del 50% de la población
prefería a este candidato. En base a esta muestra, ¿es el 50% una posible proporción de población?
Calcule el intervalo de confianza del 95% para estar seguro.

ALTURAS ( DIFERENCIA DE MEDIAS INDEPENDIENTES )


Se calcularon las alturas para adolescentes y niñas. La altura media para la muestra de 12 niños fue de
174 cm y la varianza fue de 62. Para la muestra de 12 niñas, la media fue de 166 cm y la varianza fue
de 65. Suponiendo que las variaciones y distribuciones normales en la población son iguales,
a) Cuál es el intervalo de confianza del 95% sobre la diferencia entre las medias de la población?
b) ¿Cuál es el intervalo de confianza del 99% sobre la diferencia entre las medias de la población?
c) ¿Crees que es muy improbable que la diferencia media en la población sea de aproximadamente 5?
¿Por qué si o por qué no?
SONDEO ( MEDIA )
Un partido político pretende conocer la intención de voto de cara a las próximas elecciones. Para ello
encarga un sondeo sobre un total de 230 personas, de las que 69 contestan que votarían por ellos.
a) Hallar un intervalo de confianza del 90% para la verdadera proporción poblacional a favor del
partido.
b) Encuentre un intervalo de confianza del 99% para la proporción poblacional a favor de partido.
ESTUDIANTES ( MEDIA )
El departamento de servicios escolares considera que el número promedio de estudiantes por grupo
para las licenciaturas de Administración y Contaduría es muy importante para optimizar las
instalaciones de la Facultad. Para estimar esta variable tomó una muestra de 40 grupos y encontró un
promedio de 39.8 alumnos por grupo con una desviación estándar de 9.1 alumnos por grupo.
Construye un intervalo de confianza al 99% para estimar el promedio real de estudiantes por grupo.

TRABAJO 1 ( MEDIA )
En una muestra de 50 estudiantes de la I.E. Andrés Avelino Cáceres utilizaban Internet en promedio
12 horas por semana, con una desviación estándar de 4.5 horas. Establece una estimación por
intervalo al 95% para la media verdadera del tiempo de uso de Internet.
ESCUELA ( MEDIA )
En una escuela para adultos, se seleccionó una muestra de 100 alumnos aparentemente sanos, de 25
años de edad, donde se muestra una presión sanguínea media de 125. Si se supone que la desviación
estándar de la población es de 15, calcule
a) El intervalo de confianza del 90 por ciento para μ
b) El intervalo confianza del 95 por ciento para μ
DOCENTES ( MEDIA )
Una investigación realizada en el área de educación sostiene que la edad promedio de los docentes del
área rural ha disminuido. La edad promedio de los docentes rurales en los últimos años fue de 35
años.
Para ello, se extrae una muestra aleatoria de 100 docentes en la que la edad promedio es de 28 años
con una desviación estándar de 8 años.
¿Confirman estos datos la hipótesis de esta investigación?. Trabaje con  = 0.01 y  = 0.05.
ESTUDIAN ( DIFERENCIA DE MEDIAS INDEPENDIENTES )
Comparar las horas que pasan estudiando por día los estudiantes de primer semestre y los del último
semestre. Seleccionas una muestra de 11 personas de cada grupo. Para los del primer semestre la
media fue de 3, con una varianza igual a 1.2 y para los del último semestre la media fue de 2 con una
varianza de 1.
Calcular un intervalo de confianza al 90% para la diferencia de medias (primer semestre - último
semestre).
EXAMEN ( DIFERENCIA DE MEDIAS DEPENDIENTES )
Se realizó un examen a los alumnos del primer y segundo curso de estadística para comparar su
desempeño. Cinco estudiantes del primer curso obtuvieron los siguientes puntajes: 4, 3, 5, 7, 4, y en el
segundo curso obtuvieron los siguientes resultados: 7, 9, 8, 6, 9.
Calcular un intervalo de confianza al 95% para la diferencia de medias (segundo curso - primer curso).
TRABAJO 2 ( MUESTRA )
Se desea estimar el salario de los docentes de la Facultad de Educación. Si se sabe que la desviación
estándar es de 2 100 soles, ¿qué tamaño de la muestra se necesita para estimar la media de la
población, si se desea tener un error de 500 soles, con una confianza de 99 % ?

ESTUDIANTES ( MEDIA )
Se desea conocer cuánto tiempo en promedio un estudiante de Estadística estudia esta asignatura
durante la noche. Se les hizo esta pregunta a 10 estudiantes y los resultados en horas fueron los
siguientes: 2 ; 1.5 ; 3 ; 2 ; 3.5 ; 1 ; 0.5 ; 3 ; 2 y 4.
a) Encuentra un intervalo de confianza al 95% para la media de la población.
b) Encuentra un intervalo de confianza al 99% para la media de la población.

TRABAJO 3 ( PROPORCIÓN )
El responsable de la biblioteca está preocupado por la cantidad de libros que presentan daños por el
uso de los estudiantes. Tomó una muestra de 45 libros que los estudiantes entregaron en el día y
descubrió que 18 presentaban algún tipo de daño. Dar un intervalo de la proporción de libros con
daños que ofrezcan una seguridad de 96% de contener la verdadera proporción.

TRABAJO 4 ( PROPORCIÓN )
La proporción de estudiantes fumadores es del 80%. Encuentra el tamaño de la muestra necesario
para estimar la proporción real, con un error del 6 %.

HÁBITO DE FUMAR ( PROPORCIÓN )


El Ministerio de salud desea realizar una campaña a fin de disminuir el porcentaje de funcionarios
públicos que tienen el hábito de fumar en horas de trabajo, para ello decide realizar una investigación
por muestreo a 28 funcionarios, encontrando que 16 de ellos fuman.
a) Determinar el intervalo de confianza del 90% con respecto a la proporción de funcionarios que
fuman.
b) Determinar el intervalo de confianza del 99% con respecto a la proporción de funcionarios que
fuman.

CAFETERIA ( PROPORCIÓN )
En cierto instituto de enseñanza secundaria hay matriculados 800 alumnos. A una muestra
seleccionada aleatoriamente de un 15% de ellos, se les preguntó si utilizaban la cafetería del instituto.
Contestaron negativamente un total de 24 alumnos. Halla el intervalo de confianza del 99% para
estimar la proporción de alumnos que utilizan la cafetería del instituto.

TRABAJO 5 ( MUESTRA )
Un curso de lectura rápida garantiza cierto incremento en la velocidad de lectura en un plazo de dos
días. El maestro sabe que habrá pocos que no logren ese aumento, por lo cual antes de señalar el
incremento garantizado quiere tener una confianza de 95% de que el porcentaje haya sido estimado
dentro de 3% del valor verdadero. ¿Cuál es el tamaño más conservador de la muestra necesario en
este problema?
FACULTAD ( MUESTRA )
El departamento de asuntos estudiantiles de una Facultad desea saber qué proporción de estudiantes
tienen promedios por debajo de 8.0. ¿Cuántos historiales académicos deben examinarse a fin de
determinar la proporción dentro de 0.05 con un nivel de confianza de 95 % ?
TRABAJO 6 ( DIFERENCIA DE MEDIAS INDEPENDIENTES )
Con el fin de comparar el promedio de faltas de ortografía cometidas en una composición por dos
clases similares de alumnos, se tomaron dos muestras de 7 y 8 alumnos, respectivamente y se
observaron los siguientes errores:
Clase 1: 10 ; 10 ; 12 ; 12 ; 13 ; 13 ; 14
Clase 2: 8 ; 9 ; 10 ; 10 ; 10 ; 10 ; 12 ; 12
Suponiendo que el número de errores en ambas clases son normales, calcular un intervalo de
confianza del 95% para la diferencia de medias:
a) suponiendo que las varianzas poblacionales son iguales y valen σ 2 = 1.44 Resp: (0.658, 3.092)
b) suponiendo que las varianzas son desconocidas pero iguales. Resp: (0.215, 3.535)
ESTUDIANTES ( MEDIA )
Si las notas de un grupo de estudiantes de Ciencias Sociales se distribuyen normalmente con media μ
= 1000 y varianza 2 = 400.
a) Entre que valores estará el 95% de las medias de muestras de tamaño 9 ?
b) Y si el tamaño es 1 ?
c) Construir un intervalo de confianza del 95% para la media poblacional
ENFERMEDAD ( PROPORCIÓN )
La tasa de curación para el tratamiento estándar de una enfermedad es del 45%. El Dr. Sánchez ha
perfeccionado un tratamiento primitivo que, según él, es mucho mejor. Como evidencia, dice que ha
usado su nuevo tratamiento en 50 pacientes con la enfermedad y curado a 25 de ellos. ¿Qué piensas?
¿Es este nuevo tratamiento mejor. Use un intervalo de confianza del 95% para responder la pregunta.
Rpta ( 0.36 ;
0.64)
HORMONA ( PROPORCIÓN )
Los experimentadores inyectaron un gen de la hormona del crecimiento en miles de huevos de carpa.
De las 400 carpas que crecieron de estos huevos, 20 incorporaron el gen en su ADN. Calcule un
intervalo de confianza del 95% para la proporción de carpa que incorporaría el gen en su ADN.
Rpta ( 0.03 ;
0.07)
COMPLETAR
Completa la tabla siguiente, donde n= 1000 y p = 0.5.
Nivel de Margen Ancho de
Z S L.i. L.s.
confianza de error intervalo
95% 1.96 0.0158 0.0310 0.4690 0.5310 0.0620
99%
99.9% 0.0520

a) ¿ Cuál es la relación entre el nivel de confianza y el ancho del intervalo ?. Explica


b) ¿Cómo se calcula el ancho de intervalo?
c) ¿ Cuál es la relación entre el nivel de confianza y el margen de error ?. Explica
ORTOGRAFIA ( MEDIA )
La doctora Rodríguez es profesora de inglés. Hace poco contó el número de faltas ortográficas que
cometió un grupo de estudiantes en sus ensayos. Observó que la distribución de las faltas de
ortografía por ensayo se regía por la distribución normal con una desviación estándar de 2.44 palabras
por ensayo. En su clase de 40 alumnos de las 10 de la mañana, el número medio de palabras con faltas
de ortografía fue de 6.05. Construya un intervalo de confianza de 95% del número medio de palabras
con faltas de ortografía en la población de ensayos.
MUESTRAS ( VARIANZA)
De una población con distribución N( μ ; 12 ) se extraen muestras aleatorias de tamaño 101, cuál es
la probabilidad de que la varianza muestral sea superior a 105.82 e inferior a 199.99
Rpta. 0.97
SAL ( VARIANZA )
Se estudian las concentraciones de sal en dos oceanos, que siguen una ley normal.
Oceano Atlantico : n = 9 muestras ; salinidad media = 37g/l ; S = 2.5 g/l.
Oceano pacifico : n = 11 muestras ; salinidad media = 35 g/l ; S = 1.5 g/l
a) Calcule un intervalo de confianza para la varianza al 90%, ( Océano Atlántico ).
b) Calcule un intervalo de confianza para la varianza al 90% ( Océano Pacifico ).
c) ¿ Se puede aceptar que las varianzas son iguales , con un nivel de confianza del 98 % ?
¿ Y las medias ?
ENCUESTA ( DIFERENCIA DE PROPORCIONES )
En una muestra al azar de 600 mujeres, 300 indican que están a favor de la ayuda del estado a los
colegios privados. En una muestra al azar de 400 hombres, 100 indican que están a favor del mismo.
Determine un intervalo de confianza del 90%, 95% y 99% para la diferencia de proporciones de todas
las mujeres y todos los hombres que favorecen tal ayuda

ENCUESTA DE EMPLEO ( DIFERENCIA DE PROPORCIONES )


Una encuesta de empleo involucró a 220 personas, 115 en áreas rurales y 105 en áreas urbanas. De los
115 encuestados rurales, 74 estaban activos, mientras que para los encuestados urbanos, 81 están
activos. ¿Podemos admitir, en el umbral del 5%, que no hay una diferencia significativa entre las tasas
de actividad en los dos entornos? Para responder a esta pregunta, se debe realizar una prueba de
comparación de dos proporciones.

INVESTIGACIÓN EDUCATIVA ( DIFERENCIA DE MEDIAS )


Los estudiantes que se matricularon en un curso de investigación educativa fueron distribuidos al azar
en dos grupos. El grupo A utilizó numerosas técnicas y actividades para enriquecer el curso. El grupo B
estudió mediante el método tradicional de conferencias. Los puntajes obtenidos en una prueba de
rendimiento, hecha al terminar el curso dieron los siguientes resultados:
Grupo n x́ S
A 10 80 8
B 12 72 10
Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios poblacionales.
INGRESOS ( MEDIAS )
Un estudio de 29 familias de una zona residencial de la ciudad de Lima, revela que el ingreso medio
por familia durante el año 1999 fue de $ 508 con una desviación estándar de $ 16. Probar la hipótesis
de que el verdadero ingreso medio por familia en Lima durante 1999 fue de $ 500 frente a la
alternativa de que no fue de $ 500. Utilizar un nivel de significancia del 5%.

VIOLENCIA TV ( DIFERENCIA DE PROPORCIONES )


Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico
determinado (grupo A) y que ven regularmente lucha en TV. supera mucho a un segundo grupo de
hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos grupos arrojaron los
siguientes resultados
Grup Tamaño de N° de hombres que ven
o la muestra regularmente lucha en TV
A n1 = 150 Aa1 = 98
B n2 = 200 Aa2 = 80
¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? use = 0.05

ENCUESTA
En una encuesta realizada en una facultad, sobre si el alumnado utiliza habitualmente ( al menos una
vez a la semana ) la biblioteca de la misma, se han obtenido los siguientes resultados: O = No ;1 = Si
Alumno Respuesta Sexo
1 0 H
2 1 M
3 0 M
4 0 H
5 0 H
6 1 H
7 0 M
8 1 M
9 1 M
10 1 M
11 1 H
12 0 H
13 1 M
14 0 H
15 1 M
16 0 H
17 0 H
18 0 M
19 1 H
20 1 M
21 1 M
22 0 M
23 0 H
24 1 M
25 0 H
26 0 H
27 1 M
28 1 M
29 0 H
30 0 H
31 1 M
32 0 M
33 1 M
34 0 H
a) Existen diferencias significativas entre las proporciones de chicos y chicas que usan
habitualmente la biblioteca ?. justificar la respuesta ( usar INTERVALOS, hay diferencias
si el intervalo resultante no contiene al valor 0 , en el nivel de confianza fijado)
b) Contrastar si el porcentaje de alumnos que utiliza regularmente la biblioteca es superior
al 40% .
c) Calcular el intervalo de confianza con  = 0.01 para la proporción del alumnado que
utiliza habitualmente la biblioteca. Interpretar. ¿Cómo es su precisión?
d) ¿Qué tamaño de muestra sería necesario para obtener una estimación del porcentaje de
alumnos que utilizan regularmente la biblioteca con un margen de error de 1% y una
confianza del 95%.

ENCUESTA ( PROPORCIÓN )
El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio
adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos,
75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como
para apoyar la opinión del alcalde?

DESNUTRICIÓN ( PROPORCIÓN )
Se tomó una muestra aleatoria de 400 escolares, de los cuales 120 tuvieron signos de
desnutrición. Verifique la hipótesis de que el porcentaje de desnutridos no excede a 25%
en la cobertura de estudio (Use 5% como nivel de significación).
PRUEBA DE HIPÓTESIS
Pregunta, idea, suposición.
Población : parametros.
Muestra : Contexto muestral, estadisticos
Hipótesis nula ( estado actual )
Es lo que dudamos y queremos contrastar.
Ejemplo:
¿el porcentaje total es = 10 %?,
¿la media de los ingresos es superior a cinco?
Bajo Ho, el estadístico sigue el modelo, y la diferencia observada es únicamente fruto del
azar.

Hipótesis alternativa ( Cambio )


Permiten rechazar la hipótesis nula:
Ejemplo:
Porcentaje total ≠ 10 %.
Media menor a cinco, etc.

Tipos de errores

Ejemplos:
a) En una compañía farmacéutica, se ha desarrollado un nuevo medicamento que debería
reducir el colesterol mucho más que su medicamento actual en el mercado. ¿Es esto
cierto?
Hipótesis:
Ho: El nuevo fármaco tiene el mismo efecto sobre el colesterol que el fármaco actual.
H1: El nuevo fármaco reduce el colesterol más que el fármaco actual.

b) Se ha desarrollado un nuevo método para enseñar estadísticas utilizando tecnología. ¿Es


más exitoso que el enfoque de conferencia habitual?
Hipótesis:
Ho: Los dos métodos de enseñanza son igualmente efectivos.
H1: El nuevo método de enseñanza es más exitoso que el enfoque habitual.

c) Se desarrolla una nueva variedad de trigo que debería producir más trigo por Ha. que una
variedad popular actual.
Hipótesis:
Ho: Los rendimientos de las dos variedades de trigo son iguales.
H1: Los rendimientos de la nueva variedad de trigo son mayores que la variedad popular
actual
Las hipótesis alternativas son de la forma : ≠ ; < ; ˃

Test bilateral Test Unilateral Test unilateral

SUPUESTOS:
- Independencia de las observaciones ( aleatoriedad )
- Nivel de la variable dependiente : Intervalo o Razón
- Normalidad de la distribución en la población ( Kolmogorov – Smirnov ) : Test X 2
- Homocedasticida de las varianzas poblacionales (igualdad de varianza ) : Test F ,

TIPOS DE ERRORES

Realidad
Decisión
Ho es V Ho es F
Rechazar Ho Error tipo I (α ) Ok
Aceptar Ho Ok Error tipo II ()
Suma 1 1
 = Riesgo del productor : nivel de significación
Muchas veces se decide de antemano cuán pequeño debe ser el valor-p para declarar que la
diferencia entre el valor especificado en la hipótesis nula y el valor observado es
estadísticamente significativo. Ese valor se lo llama nivel de significación, y se lo indica por la
letra griega α (alfa).

 = Riesgo del consumidor


 = P( rechazar Ho / Ho es V ) = P( Error tipo I ) = FALSO POSITIVO
 = P( aceptar Ho / Ho es F ) = P( Error tipo II ) = FALSO NEGATIVO
Potencia de una prueba : 1 -  [ P(rechazar Ho / Ho es F ) ]

 = P( no aceptar Ho / H1 es F )
 = P( no rechazar Ho / H1 es V )
ESTUDIO DE MERCADO
Se consideran los datos de n = 400 personas
OBJETIVO: posibilidad de lanzar una campaña de marketing.
La campaña será lanzada solo si menos del 45% de la población consume el producto de la firma.
168 afirmaron consumieron.
¿Qué decisión tomará la firma al nivel del 5%?

SOLUCION
HIPÓTESIS
Ho : P ≥ 0.45 [Al menos 45% de las personas consume el producto de la firma ]
H1 : P < 0.45 [Menos del 45% de las personas consume el producto de la firma ]
NIVEL DE SIGNIFICACIÓN:  = 0.05
PRUEBA ESTADÍSTICA
168
p= =0.42
400
p−P
Z=
P. Q

0.42−0.45
√ n
Zc= =−1.2
0.45∗0.55
√ 400
Ztabla = - 1.65
DECISIÓN
Se acepta la hipótesis nula, al 5% de significación, ya que Zc < Z tabla; es decir no podemos creerle al
amigo.
Conclusión: la campaña no será lanzada por no haber suficiente evidencia de su necesidad.

FÁBRICA
Se tiene que reparar una máquina en cierta fábrica si produce más del 10% de artículos defectuosos
del gran lote de producción de un día. Una muestra aleatoria de 100 artículos de la producción
contiene 15 defectuosos y el supervisor decide que debe repararse la máquina. ¿ La evidencia de la
muestra apoya la decisión del supervisor? Utilice un nivel de significación del 1%.

DECIDIR
Se realiza una prueba de significación y p = 0.20. ¿Por qué el experimentador no puede afirmar que la
probabilidad de que la hipótesis nula sea cierta es de 0.20?
APTITUD ACADÉMICA
Se aplicó un examen de aptitud matemática a un grupo de 40 estudiantes, y 18 de ellos fueron
clasificados como aptos para las matemáticas; mientras que en otro grupo de 80 estudiantes a quienes
se les aplicó el mismo examen, 32 fueron clasificados como aptos. Determina si es significativa la
diferencia entre ambos grupos respecto a la aptitud para las matemáticas. Usa un error alfa del 5%.
ORTOGRAFIA
Se aplicó un examen de ortografía a una muestra aleatoria de 25 secretarias que laboran en la FES-C
de campo 1, obteniendo un puntaje medio de 78 puntos, y una desviación estándar de 7 puntos. Se
aplicó el mismo examen a una muestra aleatoria de 25 secretarias de campo 4 y se obtuvo un
promedio de 75 puntos con una desviación estándar de 9 puntos. ¿Consideras que las secretarias de
campo 1 obtuvieron mejores calificaciones? Use α = 0.01.
EXPERTOS EDUCATIVOS
Un equipo de expertos educativos está estudiando el sistema universitario Australiano y Canadiense y
desean saber si hay diferencias significativas entre las puntuaciones que el ranking asigna a las
universidades de estos dos países. Use el nivel de confianza del 95% . Los datos extraídos de la base
de datos son los siguientes:
Puesto Universidad País Puntuación
28 Universidad de Melbourne Australia 779
37 Universidad Nacional Australiana Australia 754
62 Universidad de Sidney Australia 657
65 Universidad de Queensland Australia Australia 644
85 Universidad de Nueva Gales del Sur Australia 596
99 Universidad Monash Australia 575
176 Universidad de Adelaide Australia 488
190 Universidad del Oeste de Australia Australia 473
21 Universidad de Toronto Canadá 822
30 Universidad de Columbia Britanica Canadá 773
34 Universidad McGill Canadá 757
84 Universidad de Montreal Canadá 598
88 Universidad McMaster Canadá 590
121 Universidad de Alberta Canadá 547
171 Universidad de Ottawa Canadá 490
196 Universidad de Victoria Canadá 467

Estadísticos de grupo
Desviación Error típico
País N Media
Estándar de la media
Australia 8 620.75 111. 36266 39.37265
Puntuación
Canadá 8 630.50 135.81605 48.01823

Salida Informática del contraste de hipótesis


F de Levene Estadístico Error
Sig. Diferencia
(contraste Sig. T de Gl. estándar de
( bilateral) de medias
varianzas ) contraste la diferencia
Puntuación 0.869 0.367 - 0.157 14 0.877 - 9.75 62.09634

DIFERENCIA DE MEDIAS
Se comparan dos computadoras según su vida esperada:
Computadora A : n = 10 ; media = 25 meses ; S = 2.3
Computadora B : n = 12 ; media = 28 meses ; S = 2.1
a) Podemos aceptar que las desviaciones estándares son iguales al nivel 0.90 ? y ¿ Y a los
niveles 0.80 y 0.98 ?
b) Admitiendo que las varianzas son iguales , ¿ podemos concluir que la duración media
de las computadoras del segundo tipo es mayor que la de los del primer tipo ? ( con
niveles de significación 0.05 y 0.01 ).
TAREA
Sobre la base de una muestra de 20 padres de familia de la ciudad de Cajamarca, se desea someter a
contraste la hipótesis de que los hijos de padres universitarios perciben que tienen mejor relación con
su padre que el grupo de hijos de padres sin estudios.
Variable : Cal_rel ( calidad de relación )
Grupos de los padres:
1 = sin estudios
2 = estudios secundarios
3 = estudios universitarios
El grupo de investigación desea compararán sólo los dos grupos extremos.
Si se probara su hipótesis, lo tendrían en cuenta a la hora de seleccionar a los estudiantes a los que se
ofrecerían cursos optativos para mejorar la comunicación padre-hijo.
Para medir la calidad de la relación paterno-filial se utiliza una escala de 1 a 6, donde:
1 = muy mala, hasta 6 = Muy buena, considerando que se alcanza un nivel de medida de intervalo o
cuasi-intervalo.
Los datos obtenidos en el análisis de datos son los siguientes:
Iden Titulación del padre Calidad de relación ( Cal_rel)
1 2 6
2 2 4
3 2 6
4 3 5
5 3 5
6 2 1
7 2 3
8 1 5
9 2 6
10 2 4
11 2 2
12 3 5
13 3 1
14 1 4
15 3 4
16 2 4
17 1 4
18 2 2
19 2 5
20 2 4
Estadísticos de grupo
Desviación Error estándar de la
Titulación N Media
estándar media
Cal_rel 1.00 3 4.3333 0.57735 0.33333
3.00 5 4.0000 1.73205 0.77460

Prueba de muestras independientes


Prueba para la
igualdad de Prueba T para la igualdad de medias
varianzas
95% intervalo de
Error est.
Sig. Diferencia confianza para la
F Sig. t Gl. de la
( bilateral ) de medias diferencia
diferencia
Inferior Superior
Cal_rel 1.318 0.295 0.314 6 0.764 0.33333 1.0611 - 2.26308 2.92974

1. Cuál es la media aritmética en Cal_Rel del grupo de hijos de padres con estudios secundarios?
a) 3.92*
b) 4.00
c) 2.81
2. De los tres grupos formados en Cal_Rel en función de la formación de los padres, ¿cuál puede
considerarse más homogéneo partiendo de los datos aportados en las tablas anteriores?
a)1
b)2
c)3
3. Al contrastar si existen diferencias en Cal_Rel en función del nivel de formación de los padres,
¿se cumple el supuesto de homocedasticidad de varianzas para un α = 0.05?
a) No, porque la probabilidad asociada a F es mayor que α
b) Sí, porque la probabilidad asociada a F es mayor que α*
c) Sí, porque la probabilidad asociada a t es mayor que α

4. ¿Cuál ha sido el valor de t utilizado para calcular el intervalo de confianza para la diferencia de
medias?
a) 2.015
b) 2.571
c) 2.447*

5. El intervalo de confianza para la diferencia de medias que aparece en la tabla,


a) Indica que la diferencia de medias empírica es estadísticamente distinta de cero al nivel
de confianza del 95%.
b) Indica que la diferencia de medias empírica es estadísticamente igual a cero al nivel de
confianza del 95%.
c) Es incompatible con una diferencia de medias igual a cero al nivel de confianza del 95%.
6. El contraste estadístico de hipótesis ha sido
a) Unilateral*
b) Bilateral
c) Multilateral

7. El contraste de medias en Cal_Rel en función del nivel de formación de los padres, nos permite
concluir que:
a) La hipótesis de los investigadores al nivel de confianza del 95% era correcta: la media en
Cal_Rel es estadísticamente superior en el grupo de hijos de universitarios que en el
grupo de hijos de padres sin estudios/estudios primarios.
b) La hipótesis de los investigadores al nivel de confianza del 95% era errónea: la media en
Cal_Rel es estadísticamente inferior en el grupo de hijos de universitarios que en el grupo
de hijos de padres sin estudios/estudios primarios.
c) La hipótesis de los investigadores al nivel de confianza del 95% era errónea: la media en
Cal_Rel es estadísticamente igual en el grupo de hijos de universitarios que en el grupo
de hijos de padres sin estudios/estudios primarios*
8. Además podemos concluir que:
a) Se rechazó la hipótesis nula.
b) No se pudo rechazar la hipótesis nula. *
c) Se aceptó la hipótesis alternativa.

EXAMEN PARCIAL
Un investigador en educación aplicó como estrategia pedagógica el uso de un video educativo
interactivo a una muestra de 14 estudiantes para tratar el tema de palancas de primer grado y desea
saber si los alumnos retuvieron el contenido de manera significativa.
Para determinar si existe diferencia se aplicó una prueba objetiva, a dos grupos ( 14 por grupo )
GRUPO 1 : Método tradicional
GRUPO 2 : Método nuevo
Los puntajes obtenidos se muestran en la Tabla adjunta.
Método Método
N° alumno tradicional nuevo
X1 X2
1 16 16
2 14 18
3 14 18
4 18 16
5 16 14
6 14 20
7 12 20
8 14 18
9 10 12
10 16 14
11 12 14
12 20 18
13 14 14
14 12 16
Σ
Media
Varianza
Desviación Estándar
SOLUCIÓN

Prueba Levene de
igualdad de Prueba T para la igualdad de medias
varianzas
95% intervalo de
Error est.
Sig. Diferencia confianza para la
F Sig. t Gl.
( bilateral ) de medias
de la
diferencia
diferencia
Inferior Superior
Se 0.012 0.912 - 1.931 26 0.064 - 1.857 0.962 - 3.834 0.119
asumen
varianzas
iguales
No se - 1.931 25.8 0.064 - 1.857 0.962 - 3.834 0.120
asumen
varianzas
iguales

PRUEBA DE HIPÓTESIS : CHI CUADRADO


Asociación entre variables cualitativas
 Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables
categóricas.
 Se simboliza por : X2
 Se usa para pruebas de asociación o de significación estadística
 Nivel de medición de las variables: nominal
 Se utilizan tablas de contingencia
 Esta prueba trata de determinar si dos variables categóricas tienen un nivel de correlación
significativo entre ellas.

Procedimiento
1. Formular las hipótesis:
Ho : No hay asociación o significación estadística
H1 : Si hay asociación o significación estadística
2. Se construye una tabla de tabulación cruzada para las frecuencias observadas (O ij )
3. Se construye una tabla de tabulación cruzada para las frecuencias teóricas ( E ij)
4. Se determina el nivel de significado deseado en la prueba.
5. Se determina el valor calculado de la prueba Chi-cuadrado, usando la siguiente ecuación :

(O−E)2
X 2 =∑
E
O : Valor observado
E : Valor esperado
6. Se obtiene el valor crítico de la tabla Chi - cuadrado y se toma la decisión:
Si X2 calculado  X2 tabular, se rechaza la hipótesis nula ( Hay asociación entre las
variables ).
Caso contrario se acepta Ho , ( No hay asociación entre las variables )

7. Considerar : g.l = ( filas – 1 ) x ( columnas – 1 )


g.l. = grados de libertad

(O−E−0.5)2
8. Usar el corrector de Yates ( gl. = 1 y n < 30 )  X 2 =∑
E
TRATAMIENTO y RESULTADO
Una muestra de 110 pacientes con trastorno de ansiedad generalizada son asignados a tres
tratamientos para abordar su trastorno: cognitivo / conductual, farmacológico y control (mediante
placebo). Después de aplicar los tratamientos, se determina el resultado obtenido: positivo o negativo.
Se desea averiguar si existe relación o dependencia entre el tratamiento aplicado y el resultado
obtenido.( Usar alfa = 0.05 )
RESULTADO
TRATAMIENTO
Positivo Negativo Total
Cognitivo/conductual 25 15
Farmacológico 13 12
Control ( placebo) 10 35
Total
Rpta. X 2 = 14.89 p = 0.0006

CURSO e INTERES
Un equipo de investigación, con el fin de hacer un estudio diagnostico en la Facultad de Filosofía,
pregunta a estudiantes de distintos grados ( n = 526 ) , si tienen interés por los estudios que están
realizando. Se obtiene los siguientes resultados:
Primero Segundo Tercero Cuarto Quinto Sexto Total
Tienen interés 80 65 70 80 78 50 423
No tienen interés 20 15 10 5 6 47 103
Total 100 80 80 85 84 97 526

¿ Se puede afirmar que existe relación entre el curso y el interés por la carrera de Filosofía ? (  =
0.05)

SEXO y DELINCUENCIA
Interesa conocer si existe relación entre las variables “ Sexo “ y “ delincuencia “ . Para ello, se elige al
azar una muestra de 76 personas de una determinada población suburbana y se encuentran los
siguientes resultados:
Hombre Mujer
No delincuente 18 25
Con alguna acción delictiva 16 17

¿Existe tal relación? (  = 0.05)

HÁBITO DE FUMAR e INCONTINENCIA


Se realiza un experimento para estudiar la relación entre el hábito de fumar y la incontinencia urinaria.
De 322 personas que presentaban incontinencia, 113 eran fumadores, 51 ex fumadores y 158 nunca
habían fumado. 284 personas no presentaban incontinencia y 68 de ellas eran fumadores, 23 ex
fumadores y 193 nunca habían fumado.
a) Elabora una tabla para mostrar estos datos.
b) Calcula la frecuencia esperada para cada celda.
c) Realiza una prueba de significancia para averiguar si existe relación entre la incontinencia y el hábito
de fumar. ¿Cuál es el valor de Chi cuadrada? ¿Cuál es el valor de p?
d ) ¿Cuáles son tus conclusiones?

PROBLEMA DE INVESTIGACIÓN
A partir de la tabla de frecuencias siguiente, formule un problema de investigación experimental, que
requiera, para su solución, la aplicación de la prueba “ Chi - Cuadrado “ y realice el contraste. Alfa =
0.05
A B C Total
I 60 70 80
II 60 40 30
Total
GRADO y OPINIÓN
A una muestra de estudiantes se les pregunta su opinión acerca de un cambio propuesto en la parte
medular del programa estudios. Los resultados se presentan a continuación:
Opinión
Grado
Favorable Opuesta
1er. año 120 80
2do. año 70 130
3er. año 60 70
4to. año 40 60
Pruebe la hipótesis de que las opiniones son independientes del agrupamiento por grados, alfa = 5%

CALIFICACIÓN y HORAS
Se examinan 300 alumnos de una asignatura y durante el examen se les pregunta por el tiempo que
han dedicado a su preparación ( menos de una hora, entre una hora y tres, más de tres ),
obteniéndose la siguiente tabla de calificaciones según el tiempo de estudio:
Horas de estudio
Calificación
<1 1a3 >3
Bajo 43 32 10
Promedio 31 48 81
Alto 7 13 20
Muy alto 3 4 8
¿ Están relacionadas la Calificación con las horas de estudio ?. Usar alfa = 1%

CAPACITACIÓN y ÉXITO
Un examen está abierto a estudiantes de diferentes especialidades: Economía, Informática y
Matemáticas. El examinador desea saber si la capacitación inicial de un estudiante influye en su
éxito. Con este fin, construye la siguiente tabla a partir de los resultados obtenidos por los 286
candidatos, cuyas especialidades se especifican en la columna:
Resultado Especialidades
Total
capacitación Economía Informática Matemáticas
Éxito 41 59 54
Fracaso 21 36 75
Total
¿ Cuál es su conclusión ?. Use alfa = 1%
DIETA y ENFERMEDAD
En la siguiente tabla de contingencia se muestra el tipo de enfermedad y formas de dieta por una
muestra de 605 persona.
Se pide responder las siguientes preguntas:
a) ¿Qué porcentaje de personas en la dieta A tuvo algún tipo de enfermedad o muerte?
b) ¿Qué porcentaje de personas en la dieta B tenía algún tipo de enfermedad o muerte?
c) Realice una prueba de Chi-cuadrado de Pearson para determinar si existe alguna relación entre la
dieta y el Reporte del hospital.
d) Calcule un intervalo de confianza del 95% sobre la proporción de personas que están sanas en la
dieta A

REPORTE DEL HOSPITAL


DIETA
Cáncer Muertes Enfermedad no fatal Sano Total
A 15 24 25 239
B 7 14 8 273
total

ENCUESTA
En una encuesta realizada en una facultad, sobre si el alumnado utiliza habitualmente ( al menos una
vez a la semana ) la biblioteca de la misma, se han obtenido los siguientes resultados: O = No ;1 = Si
Alumno Respuesta Sexo
1 0 H
2 1 M
3 0 M
4 0 H
5 0 H
6 1 H
7 0 M
8 1 M
9 1 M
10 1 M
11 1 H
12 0 H
13 1 M
14 0 H
15 1 M
16 0 H
17 0 H
18 0 M
19 1 H
20 1 M
21 1 M
22 0 M
23 0 H
24 1 M
25 0 H
26 0 H
27 1 M
28 1 M
29 0 H
30 0 H
31 1 M
32 0 M
33 1 M
34 0 H

a) Existen diferencias significativas entre las proporciones de chicos y chicas que usan
habitualmente la biblioteca ?. justificar la respuesta ( usar INTERVALOS, hay diferencias
si el intervalo resultante no contiene al valor 0 , en el nivel de confianza fijado)
b) Contrastar si el porcentaje de alumnos que utiliza regularmente la biblioteca es superior
al 40% .
c) Calcular el intervalo de confianza con  = 0.01 para la proporción del alumnado que
utiliza habitualmente la biblioteca. Interpretar. ¿Cómo es su precisión?
d) ¿Qué tamaño de muestra sería necesario para obtener una estimación del porcentaje de
alumnos que utilizan regularmente la biblioteca con un margen de error de 1% y una
confianza del 95%.

APROBADOS
Un profesor universitario ha tenido dos grupos de clase a lo largo del año:
GRUPO 1 : Horario mañana , 80 alumnos : aprobados 55
GRUPO 2 : Horario tarde , 90 alumnos : aprobados 32.
a) ¿Existen diferencias significativas en el porcentaje de aprobados en ambos grupos?
b) ¿ Pueden ser debidas al turno horario ?. Justificar la respuesta.

ESTATURA MEDIA
Para comprobar si la estatura media de los estudiantes de cierta Facultad es 1.75 m., se toma una
muestra de 16 alumnos y se obtiene M(X) = 1.72 y S = 0.1. Compruébese la hipótesis planteada con  =
0.05
ANÁLISIS DE VARIANZA
El análisis de varianza lo vamos a utilizar para verificar si hay diferencias estadísticamente
significativas entre medias cuando tenemos más de dos muestras o grupos en el mismo
planteamiento.
En estos casos no utilizamos la t de Student que solamente es un procedimiento válido cuando
comparamos únicamente las medias de dos muestras.

El objetivo del ANOVA es evaluar :


La influencia de uno o más factores en una variable dependiente.

ALGUNOS EJEMPLOS DE APLICACIÓN DEL ANOVA

a) Estudio del rendimiento escolar, para niños de diferentes clases sociales (por un factor). y
clase social sobre el éxito en las mujeres? hombres? (Dos factores).
b) Estudio comparativo de 4 pastillas para dormir con un puntaje de satisfacción dado por el
sujeto que tomó las pastillas para dormir.
c) Comparación de 5 métodos de enseñanza en términos de aprendizaje.
d) Estudio sobre el estrés en el trabajo: ¿el nivel de responsabilidad tiene un impacto en el
estado de estrés? Un factor de 3 modalidades: 3 categorías de personal (técnico / ejecutivo
responsable de un pequeño equipo / ejecutivo responsable de un departamento). Una
variable dependiente: la medida del estrés subjetivo.
VARIABILIDAD ENTRE GRUPOS Y DENTRO DE GRUPOS

Tomemos el ejemplo ( b ) anterior.


El grado de satisfacción expresado varía según la persona, debido a la variabilidad de los sujetos
(sensibilidad a la medicación, efectos secundarios, sensación de resto, etc ...). Así que tenemos, incluso
con una sola pastilla para dormir, una variabilidad, una variación entre los sujetos. Pregunta: ¿Existe
una variabilidad debido al tipo de pastillas para dormir más grandes que la variabilidad entre sujetos
para la misma pastilla para dormir? ¿Una variabilidad demasiado grande para ser debida al azar? Se
pueden distinguir dos tipos de variabilidad: la variabilidad intragrupo, que es la variabilidad dentro de
cada grupo y la variabilidad intergrupo, que es la variabilidad entre los diferentes grupos.

Supuestos:
 Independencia: las muestras son aleatorias e independientes
 Normalidad: las muestras provienen de poblaciones normales
 Homocedasticidad: las poblaciones tienen la misma variabilidad

Résumée dans I ´erreur expérimentale, tout ce que I ´ on ne connaít pas sur le sujet

L ´objectif de ´ANOVA est d´ évaluer


I ´influence de ces facteurs ( parfois, le facteur de bloc peut étre introduit dans
I´analyse.

o^
ANÁLISIS DE VARIANZA DE UN FACTOR
FÓRMULAS USADAS

Suma de cuadrados total ( SCT ) SCT = ( n – 1 ). S2

Suma de cuadrados entregrupos ( SCTR )


SCTR=Σn . j ( Ý . j −Ý )2

Suma de cuadrados dentro de grupos


SCE=Σ ( ni−1 ) . S 2i
( SCE )

Varianza residual
SCE / n – k
Varianza entre grupos
SCTR / k -1
Varianzaentre grupos
F=
Varianza residual
Prueba F
Buscar el valor p en la tabla F con k-1,
( n-k ) grados de libertad

SCTR
Coeficiente de determinación r 2=
SCT
Explica la calidad del modelo en estudio

La variabilidad total se puede descomponer en dos partes :


a) Variabilidad entre tratamientos ( SCTR )
b) Variabilidad dentro de tratamientos ( SCE )

SCT = SCTR + SCE


SCT: Suma de cuadrados del total
SCTR : Suma de cuadrados entre tratamientos
SCE : Suma de cuadrados del error.

SCT =Σ Σ(Y ij −Ý )2

SCTR=Σn . j ( Ý . j −Ý )2
SCE=Σ Σ (Y ij −Ý . j )2
También :

SCE = SCT – SCTR


Σ Ý . j∗n. j
Ý =
Σ n. j
2
2SCTot ∑ ( Yi−Ý )
S=y =
n−1 n−1

Tabla de Análisis de Varianza ( ANOVA )


Fuente de variación G.l. SC CM ( Varianza ) Fc F critico
Tratamientos ( Explicada ), SCTR / (k-1) =
k-1 SCTR CMTR/CME
(entre grupos) CMTR
Error (Residual) (dentro de SCE / ( n – k ) = F(1 -  ; k-1 ; n-k )
n-k SCE
grupos) CME
SCT
S2y =
Total n-1 SCT n−1

Decisión : Si Fc > F crítico , se rechaza la hipótesis nula


Si Fc ≤ F crítico, se acepta la hipótesis nula.

F crítico = F(1 -  , m1 , m2 ) m1 = k – 1 m2 = n - k
1 -  : Nivel de confianza
m1 : grados de libertad de tratamientos ( g.l. del numerador )
m2 : grados de libertad del error ( g.l. del denominador )

Variabilidad entre grupos


Fc=
Variabilidad dentro de grupos

Ejemplo:
Tenemos 3 grupos de estudios ( k = 3 ) ; n = n1 + n2 + n3 = 21
GRUPO 1 GRUPO 2 GRUPO 3
12 18 6
18 17 4
16 16 14
8 18 4
6 12 6
12 17 12
10 10 14
n1 = 7 n2 = 7 n3 = 7
M1 = 11.71 M2 = 15.43 M3 = 8.57
S1 = 4.23 S2 = 3.16 S3 = 4.58
Media global : Ý =11.90
SCT = ( 12 – 11.9)2 + (18 – 11.9 )2 + . . . + (14 – 11.9)2 = 457.81

SCTR = 7( 11.71– 11.9)2 + 7(15.43– 11.9)2 + 7(8.57 – 11.9)2 = 165.1013

SCE = SCT – SCTR = 457.81 – 165.1013 = 292.7087

ANOVA - NOTAS
SC. gl CM. F Sig.
Entre grupos 165.1013 2 82.55 5.08 0.018
Dentro de grupos 292.7087 18 16.26
Total 457.810 20
Sig: infostat Estadisticas  Probabilidades y cuantiles F no central ingresar 2 y 18 
valor de x : 5.08  calcular : p = 0.0178
EJERCICIOS PROPUESTOS
Se presenta a continuación el resumen de los resultados de un examen de cuatro centros educativos
seleccionados aleatoriamente entre los centros de una misma región:
N° de Varianza
Centro Media
alumnos muestral
A 104 4.99 4.19
B 102 4.63 5.75
C 69 4.53 5.15
D 80 4.79 5.35

Utilizar la tabla ANOVA para contrastar si los resultados obtenidos son homogéneos en los
diferentes centros educativos al nivel de significación  = 0.05 . Indicar el modelo utilizado, las
hipótesis del modelo y el contraste de hipótesis realizado.
Estimar todos los parámetros del modelo

Resultados del análisis de plomo en agua de rio realizado por 5 laboratorios ( K = n°


laboratorios )
Resultados Laboratorio A Laboratorio B Laboratorio C Laboratorio D Laboratorio E
1 2.3 6.5 1.7 2.1 8.5
2 4.1 4 2.7 3.8 5.5
3 4.9 4.2 4.1 4.8 6.1
4 2.5 6.3 1.6 2.8 8.2
5 3.1 4.4 4.1 4.8 -
6 3.7 - 2.8 3.7 -
7 - - - 4.2 -

Comparar si existe diferencia significativa entre los resultados promedio del análisis de plomo
realizado por los 5 laboratorios. Hacer ANOVA con alfa = 5%.

A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro réplicas
cada uno. Completar la tabla y anotar el modelo estadístico.
Fuente de

Fuente de variación g.l. SC CM Fc


Tratamientos 800
Error 400
Total
En un experimento se compararon tres métodos de enseñar un idioma extranjero; para evaluar la
instrucción, se administró una prueba de vocabulario de 50 preguntas a los 24 estudiantes del
experimento repartidos de a 8 por grupo.
¿ Cuál es la variable respuesta y la explicativa en este estudio ?
Rpta. Vr : Puntajes ; v.explic: métodos de enseñanza. Es un factor con tres niveles.

Usando los datos del cuadro adjunto responder las preguntas correspondientes:
Fuente de
g.l. SC CM Fc p
variación
Dieta 2 12 6 6.6
Error 11 10 0.909
Total 13
Calcular el valor p
Interprete : Cuantas dietas se analizan.

Se aplican 4 tratamientos a 4 grupos de 5 pacientes, obteniéndose los resultados de la tabla que se


adjunta. Queremos saber si se puede concluir que todos los tratamientos tienen el mismo efecto.
Para ello vamos a suponer que estamos en condiciones de aplicar el modelo de un factor.

T1 T2 T3 T4
-1 -2 0 1
1 -4 -1 4
2 -5 -2 6
0 -4 -4 3
-1 -7 -1 8

Un investigador en Psicología ha estudiado los efectos de cuatro técnicas de estudio sobre el


aprendizaje del idioma inglés en una muestra aleatoria de 20 niños. Los 4 grupos del mismo tamaño
se han formado aleatoriamente y han sido asignados a cada tratamiento al azar. Algunos de los
resultados se muestran en la siguiente tabla.
Fuente de variación GL. SC CM Fc F crítico
Entre 4.83
Dentro 1.75
Total 80

a) Definas las variables y el tipo de ANOVA que se ha aplicado.


Vr.: Aprendizaje del Inglés, v.explic.: técnicas de estudio
ANOVA de un factor DCA.
b) Completar la tabla
c) Que decisión estadística es razonable tomar según los datos.
Como Fc > F crítico, se rechaza la hipótesis nula

Objetivo : Verificar si tres marcas distintas de mezcladora de concreto tardan lo mismo.


Experimento : Poner a trabajar 3 máquinas distintas y se toma el tiempo en preparar el concreto.
Variable que se va estudiar ( dependiente ) = tiempo en preparar el concreto ( minutos)
Réplicas : 5
Mediante el análisis de varianza de un factor, verifique que los tiempos promedio de preparación del
concreto son los mismos. ( usar alfa = 5% )
Datos :
Trompo 1 Trompo 2 Trompo 3
13.5 10.8 11.6
12.9 11.5 18.4
12.5 12.5 16.2
13 15 13.8
15.9 13.5 15.6

Cinco tipos de material sintetico: ( A, B , C , D y E ) se han sometido a un ensayo de desgaste. Para


cada tipo de material la prueba se repitió 6 veces. El desgaste medio y la desviación estándar
corregida en cada caso es la siguiente :
A B C D E
Media 14.1 16.3 13.5 14.8 15.3
Desv. Estándar 1.3 1.2 1.4 1.2 1.5

a) Contratar la hipótesis ( alfa = 0.05 )


H o = 𝞵A = 𝞵B = 𝞵C = 𝞵D = 𝞵E
Frente a la hipotesis alternativa :
H1 : Alguna media es distinta a las demás.
b) Indicar con un nivel de confianza 95% el material con desgaste menor y que materiales
tienen desgaste medio , distinto.

Una empresa debe elegir entre cinco procedimientos para fabricar un cierto producto químico. Se
sospecha que existen diferencias entre ellos aunque pequeñas. Para detectar estas diferencias se
pretende realizar un experimento a gran escala con el mismo número de observaciones en cada
grupo. Para determinar este tamaño muestral se ha realizado un experimento piloto con 6
observaciones de cada método y los resultados ( medias de cada grupo ) han sido los siguientes :
Método 1 2 3 4 5
Media 425.6 423.2 418.8 430.2 422.2
Y la varianza residual = 198.5

a) Cuál debe ser el tamaño muestral del experimento a gran escala para que el contraste de
análisis de la varianza sea significativo con alfa = 0.01 si el coeficiente de determinación es
igual al del experimento piloto.
b) Dar un intervalo de confianza ( alfa = 0.05 ) para la previsión del rendimiento realizado
mediante el método 4 ( Nota: se pide un intervalo para una observación no para la media )

Un fabricante de televisores está interesado en el efecto de cuatro tipos diferentes de


recubrimiento para cinescopios ce color sobre la conductividad de un cinescopio. Se obtienen
los siguientes datos de la conductividad:
Tipo de recubrimiento
T1 T2 T3 T4
143 152 134 146
141 149 136 143
150 137 132 127
146 143 127 129
a) Hay alguna diferencia en la conductividad debida al tipo de recubrimiento ? Usar alfa = 0.05
b) Estimar la media global y los efectos de los tratamientos
c) Estimación de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4.
d) Calcular la estimación de un intervalo de confianza de 99% para la diferencia media entre
los tipos de recubrimiento 1 y 4.
e) Probar todos los pares de medias utilizando el método LSD de Fisher con alfa = 0.05

PROGRAMA TÉCNICO
Quince personas que se capacitan en un programa técnico son asignadas en forma aleatoria a tres
tipos diferentes de enfoques de instrucción. Los puntajes de las pruebas de rendimiento, al concluir la
especialización, se presentan en la tabla siguiente. Use el procedimiento de análisis de varianza para
probar la hipótesis nula de que las tres medias muestrales son iguales a un nivel de significación del
5%.
ANÁLISIS DE VARIANZA CON DOS FACTORES
FACTOR A

a1 a2
FACTOR B b1

b2

Factor A : a niveles
Factor B : b niveles
Modelo Estadístico

Yijk = i + i + j + (  )ij + ij


i=1,2,...a
j=1,2,...b
k = 1 , 2 , . . . r ( repeticiones )

Yijk : Observación correspondiente al nivel i del factor A y al nivel j del factor B


𝞵ijk : Efecto constante denominado media global.
i : Efecto producido por el i - ésimo nivel del factor A (  i = 0 )
j : Efecto producido por el j - ésimo nivel del factor B (  j = 0 )
(  )ij : Efecto combinado de los factores A y B.
 ij : Variación aleatoria de las Yij ( igual para todas ellas ) con distribución normal N(0, 𝞼 )

Análisis Estadístico
El objetivo del análisis es realizar los contrastes de hipótesis nula siguientes :
Ho : 1 = 2 = 3 = . . . = i = 0 El factor 1 no influye
H1 : Algún i ≠ 0

Ho : 1 = 2 = 3 = . . . = j = 0 El factor 2 no influye
H1 : Algún j ≠ 0
Ho : (  )ij = 0 ;  i , j La interacción de los factores 1 y 2 no influye

H1 : Algún (  )ij ≠ 0

Interacción por sinergismo


Los dos factores se combinan y generan un efecto muy superior al que ellas exhiben por separado

Ejemplo de:
Presentación de datos: ANOVA DE DOS FACTORES ( Factor A : 2 niveles y Factor B : 3 niveles )
Factor B
b1 b2 b3 Y1.j
Y111 Y121 Y131 Y1.1
Y112 Y122 Y132 Y1.2
a1
Y11. Y12. Y13. Y1 . .
Ý 11. Ý 12. Ý 13.
Factor A Y211 Y221 Y231
Y212 Y222 Y232
a2 Y21. Y22. Y23. Y2 . .
Ý 21. Ý 22. Ý 23.

Total Y.j. Y.1. Y.2. Y.3. Y...


n.j n.1 n.2 n.3

Tabla de Análisis de Varianza ( ANOVA )

Fuente de
g.l. SC CM F F crítico
variación
Factor A a-1 SCA CMA = SCA /a-1 CMA/CME
Factor B b-1 SCB CMB = SCB / b - 1 CMB/CME
Interacción (a-1).(b-1) SCAxB CMAxB = SCAxB /(a-1).(b-1) CMAxB/CME
Error ab(r -1) SCE CME = SCE / ab(r – 1)
Total a.b.r - 1 SCT

Decisión : Si Fc ≥ F tabular , se rechaza la hipótesis nula


Si Fc < F tabular, se acepta la hipótesis nula.
F tabular = F(1 -  , m1 , m2 )
1 -  : nivel de confianza
m1 : grados de libertad de tratamientos ( g.l. del numerador )
m2 : grados de libertad del error ( g.l. del denominador )

FORMULAS PARA LA TABLA ANOVA


Y 2. ..
SCT=Σ Σ Σ Y 2ijk -
abr

Σ Y 2i .. Y 2. ..
SCA= −
br abr

Σ Y 2. j . Y 2. ..
SCB= −
ar abr

Σ Y 2ij. Y 2.. .
SCAxB= − −SCA −SCB
r abr
SCE = SCT – SCA – SCAB - SCAxB

Ejemplo
Se tienen:
 4 tipos de máquinas
 3 operarios
 Objetivo : resistencia de un tipo particular de fibra.
 Analizar resultados y obtener conclusiones usando ANOVA.
Datos
a=3
b=4
r=2
FACTOR B : TIPO DE MAQUINA
A B C D
109 110 108 110 Y1.j
1 110 115 109 108
219 225 217 218 879

110 110 111 114


FACTOR A :
2 112 111 109 112
OPERARIO
222 221 220 226 889

116 112 114 120


3 114 115 119 117
230 227 233 237 927
Y.j. 671 673 670 681 2695

SCT = ( 1092 + . . . + 1172 ) - (2695 )2 / 24 = 262.96


SCA = ( 8792 + 8892 + 9272 )/(4x2) - (2695 )2 / 24 = 160.33
SCB = ( 6712 + 6732 + 6702 + 6812 ) / ( 3 x2 ) - (2695 )2 / 24 = 12.46

SCAxB = ( 2192 + 2252 + . . . + 2372 ) /2 - (2695 )2 / 24 = 44.67

Entonces: SCE = SCT – SCA – SCB – SCAxB = 262.96 – 12.46 – 160.33 – 44.67 = 45.5

Tabla de Análisis de Varianza ( ANOVA )


Fuente de
g.l. SC CM Fcalc. Fcrítico
variación
Significativo
Factor A 2 160.33 80.17 21.15 3.49
No Significativo
Factor B 3 12.46 4.15 1.09 3.89
Interacción 6 44.67 7.44 1.96 3 No significativo

Error 12 45.5 3.79

Total 23 262.96

SALIDA
Variable dependiente: REND SPSS

Origen
S. C. gl CM. F Sig.
OPERARIO 160.333 2 80.167 21.143 0.000

MÁQUINA 12.458 3 4.153 1.095 0.389

OPERARIO x MÁQUINA 44.667 6 7.444 1.963 0.151

Error 45.500 12 3.792


Total
262.958 23      

FÓRMULAS USADAS EN ANÁLISIS DE VARIANZA DE DOS FACTORES CON


INTERACCIÓN

Suma de cuadrados total ( SCT ) SCT = ( n – 1 ). S2

Suma de cuadrados de factor 1(flas)


( SC A )
SCA=Σ ni . ( Ý i. −Ý )2

Suma de cuadrados factor 2( columnas )


( SC B ) SCB=Σ n. j( Ý . j −Ý )2

Suma de cuadrados de interacción


( SC AxB ) SC Ax B=Σ nij ( Ý ij + Ý −Ý i. −Ý . j )2

Suma de cuadrados del error SCE = SCT – SC A – SCB – SC AxB

EJEMPLO
Se pretende investigar si diferentes maestros y métodos de enseñanza influyen en el aprendizaje de
los estudiantes. Se realizó un estudio y se registraron 18 marcas asociadas a 18 estudiantes.
Profesores
Métodos
A B C
I 15 12 16 14 15 15 12 12 10
II 13 10 11 12 11 10 13 14 11
Con estos datos, y utilizando un ANOVA bidireccional, obtuvimos los siguientes resultados:
Métodos Profesor Interacción Residual Total
S.C. 14.22 2.78 22.11 23.33 62.44
Se pretende probar las siguientes hipótesis:
- No hay diferencias entre los métodos;
- No hay diferencia entre educadores;
- No hay interacción entre métodos y educadores
- Indique las alternativas, la regla de decisión y la conclusión. ¿Cuál es el p-valor de cada prueba?
SOLUCION
Cuadro de Análisis de la Varianza (SC tipo III)( SALIDA INFOSTAT )

F.V. SC gl CM F p-valor
METODOS 14.22 1 14.22 7.31 0.0191
PROF 2.78 2 1.39 0.71 0.5092
METODOS*PROF 22.11 2 11.06 5.69 0.0183
Error 23.33 12 1.94
Total 62.44 17___________________

En un laboratorio de microbiología se realiza un experimento para investigar si influye el tipo de


verdura : lechuga(L), cilantro (C), zanahoria ( Z) y la temperatura ( 8°C y 20 °C ) de almacenamiento
en la sobrevivencia del vidrio.
Se hicieron varias réplicas. El porcentaje de sobrevivencia obtenido después de 24 horas de
inoculado el alimento se muestra a continuación
Temperatura
Alimento 8 20
L 13.1 15 33.6 35.5 6.2 28.5 41 35.9
42 11.1 12.8 25 23.8 79 41.6
C 19 19 66.6 66.6 84.3 68.7 68.7 30.5
11 11 49 49 30.5 11 11 20
Z 1.2 1.2 0.2 0.1 0.3 25.8 21.8 16 16
0.2 0.1 0.4 0.2 0.3 20.1 15.4 13.3 25.2
Señale el tipo de diseño que se ha empleado
Haga un análisis de varianza . Interprete
PRÁCTICAS CON SOFTWARE SPSS

TAREA 1
CASO : ANOVA DE 1 FACTOR
Tomamos tres grupos diferentes de diez estudiantes seleccionados al azar (todos de la misma edad) de
tres aulas diferentes. A cada salón se le proporcionó un ambiente diferente para que los estudiantes
estudiaran.
La clase A tenía música constante de fondo,
La clase B tenía música variable
La clase C era una clase regular sin música.
Después de un mes, realizamos una prueba para los tres grupos y recopilamos sus calificaciones. Los
resultados de los exámenes que obtuvimos fueron los siguientes:

Puntajes del Test de los estudiantes ( 10 / grupo )


GRUPO A 14 18 10 16 12 16 12 20 14 8 n1 = 10
GRUPO B 8 6 12 4 14 10 10 8 2 6 n2 = 10
GRUPO C 12 2 6 10 6 8 12 10 14 6 n3 = 10
n = 30
SOLUCIÓN
Al observar la tabla anterior, podemos suponer que el puntaje promedio de los estudiantes del Grupo
A es definitivamente mayor que los otros dos grupos, por lo que el tratamiento debe ser útil. Tal vez
sea cierto, pero también existe una pequeña posibilidad de que seleccionáramos a los mejores
estudiantes de la clase A, lo que resultó en mejores calificaciones en los exámenes (recuerde, la
selección se realizó al azar). Esto lleva a algunas preguntas, como:
1) ¿Cómo decidimos que estos tres grupos funcionaron de manera diferente debido a las
diferentes situaciones y no simplemente por casualidad?
2) En un sentido estadístico, ¿qué tan diferentes son estas tres muestras entre sí?
3) ¿Cuál es la probabilidad de que los estudiantes del grupo A se desempeñen de manera tan
diferente a los otros dos grupos?
Para responder a todas estas preguntas, primero calcularemos el estadístico F que se puede expresar
como la relación entre la variabilidad entre grupos y la variabilidad dentro del grupo. Usamos  = 0.05

ANOVA – NOTAS - SPSS


S.C. gl C.M. F Sig.
Entre grupos 218.4 2 109.2 8.181 0.002
Dentro de grupos 360.4 27 13.348
Total 578.8 29

F crítico = F(2,27,0.05 ) = 3.3541


El valor F es mayor que el valor crítico F para el nivel alfa seleccionado (0.05).

CONCLUSIÓN :
Por tanto, tenemos evidencia para rechazar la hipótesis nula y decir que al menos una de los tres
grupos tiene medias significativamente diferentes y, por ende, pertenecen a una población
completamente diferente.
Si el valor de p es menor que el nivel alfa seleccionado , rechazamos la Hipótesis Nula.
Hay varios métodos para descubrir cuáles de los grupos representan dos poblaciones diferentes:
1) Enfoque de Bonferroni
2) Prueba de diferencia menos significativa
3) HSD de Tukey

Comparaciones en parejas de Tukey ( Minitab v. 17 )


Agrupar información utilizando el método de Tukey y una confianza de 95%

Factor N Media Agrupación


A 10 14.00 A
C 10 8.60 B
B 10 8.00 B

Las medias que no comparten una letra son significativamente diferentes.

Los grupos A y B y los grupos A y C tienen menos del 5% de probabilidad de pertenecer a la misma
población.
Mientras que para (B vs C) es mucho mayor que el nivel de significación. Esto significa que B y C
pertenecen a la misma población.

Entonces, está claro que A (grupo de música constante) pertenece a una población completamente
diferente. O podemos decir que la música constante tuvo un efecto significativo en el rendimiento de
los estudiantes.
¡ El experimento musical realmente ayudó a mejorar los resultados de los estudiantes !

OJO: Si los datos originales se multiplican por 2 , que sucede con el nuevo ANOVA ?

TAREA 2
Se diseña un experimento con el fin de comprobar si el uso de tres métodos de enseñanza produce
resultados diferentes en el rendimiento de una cierta asignatura. Sean tres grupos de estudiantes
seleccionados al azar, con las puntuaciones obtenidas en la tabla adjunta.
Método
Lectura individual Exposición Discusión
12 12 4
18 14 10
20 18 8
20 16 12
TAREA 3
CASO: BASE DE DATOS I : ESTUDIANTES PRE-GRADO y UNIVERSITARIOS
Este estudio examina la información de SAT y GPA de 105 estudiantes que se graduaron de una
universidad estatal con un B.S. en informática. Usando las calificaciones y los resultados de los
exámenes de la escuela secundaria, ¿puedes predecir las calificaciones universitarias de un
estudiante?
IDM Notas_sec Matem_sec Verbal_sec Comput_sec Notas_Univ
1 3.45 643 589 3.76 3.52
2 2.78 558 512 2.87 2.91
3 2.52 583 503 2.54 2.4
4 3.67 685 602 3.83 3.47
5 3.24 592 538 3.29 3.47
6 2.1 562 486 2.64 2.37
7 2.82 573 548 2.86 2.4
8 2.36 559 536 2.03 2.24
9 2.42 552 583 2.81 3.02
10 3.51 617 591 3.41 3.32
11 3.48 684 649 3.61 3.59
12 2.14 568 592 2.48 2.54
13 2.59 604 582 3.21 3.19
14 3.46 619 624 3.52 3.71
15 3.51 642 619 3.41 3.58
16 3.68 683 642 3.52 3.4
17 3.91 703 684 3.84 3.73
18 3.72 712 652 3.64 3.49
19 2.15 564 501 2.14 2.25
20 2.48 557 549 2.21 2.37
21 3.09 591 584 3.17 3.29
22 2.71 599 562 3.01 3.19
23 2.46 607 619 3.17 3.28
24 3.32 619 558 3.01 3.37
25 3.61 700 721 3.72 3.61
26 3.82 718 732 3.78 3.81
27 2.64 580 538 2.51 2.4
28 2.19 562 507 2.1 2.21
29 3.34 683 648 3.21 3.58
30 3.48 717 724 3.68 3.51
31 3.56 701 714 3.48 3.62
32 3.81 691 684 3.71 3.6
33 3.92 714 706 3.81 3.65
34 4.00 689 673 3.84 3.76
35 2.52 554 507 2.09 2.27
36 2.71 564 543 2.17 2.35
37 3.15 668 604 2.98 3.17
38 3.22 691 662 3.28 3.47
39 2.29 573 591 2.74 3.00
40 2.03 568 517 2.19 2.74
41 3.14 607 624 3.28 3.37
42 3.52 651 683 3.68 3.54
43 2.91 604 583 3.17 3.28
44 2.83 560 542 3.17 3.39
45 2.65 604 617 3.31 3.28
46 2.41 574 548 3.07 3.19
47 2.54 564 500 2.38 2.52
48 2.66 607 528 2.94 3.08
49 3.21 619 573 2.84 3.01
50 3.34 647 608 3.17 3.42
51 3.68 651 683 3.72 3.6
52 2.84 571 543 2.17 2.4
53 2.74 583 510 2.42 2.83
54 2.71 554 538 2.49 2.38
55 2.24 568 519 3.38 3.21
56 2.48 574 602 2.07 2.24
57 3.14 605 619 3.22 3.4
58 2.83 591 584 2.71 3.07
59 3.44 642 608 3.31 3.52
60 2.89 608 573 3.28 3.47
61 2.67 574 538 3.19 3.08
62 3.24 643 607 3.24 3.38
63 3.29 608 649 3.53 3.41
64 3.87 709 688 3.72 3.64
65 3.94 691 645 3.98 3.71
66 3.42 667 583 3.09 3.01
67 3.52 656 609 3.42 3.37
68 2.24 554 542 2.07 2.34
69 3.29 692 563 3.17 3.29
70 3.41 684 672 3.51 3.4
71 3.56 717 649 3.49 3.38
72 3.61 712 708 3.51 3.28
73 3.28 641 608 3.40 3.31
74 3.21 675 632 3.38 3.42
75 3.48 692 698 3.54 3.39
76 3.62 684 609 3.48 3.51
77 2.92 564 591 3.09 3.17
78 2.81 554 509 3.14 3.2
79 3.11 685 694 3.28 3.41
80 3.28 671 609 3.41 3.29
81 2.70 571 503 3.02 3.17
82 2.62 582 591 2.97 3.12
83 3.72 621 589 4.00 3.71
84 3.42 651 642 3.34 3.5
85 3.51 673 681 3.28 3.34
86 3.28 651 640 3.32 3.48
87 3.42 672 607 3.51 3.44
88 3.90 591 587 3.68 3.59
89 3.12 582 612 3.07 3.28
90 2.83 609 555 2.78 3.00
91 2.09 554 480 3.68 3.42
92 3.17 612 590 3.30 3.41
93 3.28 628 580 3.34 3.49
94 3.02 567 602 3.17 3.28
95 3.42 619 623 3.07 3.17
96 3.06 691 683 3.19 3.24
97 2.76 564 549 2.15 2.34
98 3.19 650 684 3.11 3.28
99 2.23 551 554 2.17 2.29
100 2.48 568 541 2.14 2.08
101 3.76 605 590 3.74 3.64
102 3.49 692 683 3.27 3.42
103 3.07 680 692 3.19 3.25
104 2.19 617 503 2.98 2.76
105 3.46 516 528 3.28 3.41

PREGUNTAS
1. Dibuje un diagrama de dispersión comparando : notas de secundaria con notas de la
Universidad. ¿ Qué parece ser la relación.
2. ¿Cuál es la correlación entre notas de la escuela secundaria y notas de la universidad?
3. Encuentre la línea de regresión para predecir las notas de la universidad a partir de las notas
de la escuela secundaria.
a) ¿Qué es la pendiente?
b) ¿Qué es el intercepto?
c) Si alguien tuvo un puntaje de 2.2 en la escuela secundaria ¿Cuál es la mejor estimación
de su puntaje universitario?
d) Si alguien tuvo un rendimiento de 4 en la escuela secundaria ¿Cuál es la mejor estimación
de su rendimiento universitario
4. ¿Cuál es el puntaje promedio en matemática y razonamiento verbal ?
5. ¿Cuáles son las desviaciones estándar de las calificaciones matemáticas y verbales ?
6. Calcular la correlación entre los puntajes matemáticos y verbales.
7. Cuál es la correlación entre los puntajes universitarios y sus notas en computación?
8. ¿Tuvieron los estudiantes un rendimiento más alto en la Universidad o en sus clases de
computación?
a) Calcula cada uno de estos medios
b) Realice una prueba T pareada para ver si esta diferencia es estadísticamente
significativa
9. Encuentre la línea de regresión para predecir el puntaje universitario a partir de la puntuación
en matemáticas y la puntuación verbal.
a) Escribe la ecuación de regresión. Note los coeficientes y la constante.
b) ¿Cuál es la R cuadrada del modelo?
c) ¿ Cuál es el valor de p para el coeficiente de cada puntaje de la secundaria ? ¿Son
ambos significativos en el nivel 0.05?
d) ¿Cuál sería el puntaje universitario de alguien si obtuviera 600 en matemáticas y 540 en
verbal ?

TAREA 4 : ANOVA 2 FACTORES

Un experimentador quiere comparar la influencia de tres dietas y dos granjas en la producción de


leche. Los resultados experimentales se encuentran en la siguiente tabla.
D I E T A S
A B C
1 7 36 2
GRANJAS
2 13 44 18
TOTAL
MEDIA

Nueve personas que se capacitan en cada una de cuatro áreas temáticas diferentes fueron
asignadas en forma aleatoria a tres métodos de instrucción distintos. Se asignaron tres
estudiantes a cada método de instrucción. Se refiere a la tabla siguiente, pruebe las diversas
hipótesis nulas que son de interés respecto a tal diseño, a un nivel de significación del 5%.
Conclusión: Hay diferencia satisfactoria entre los porcentajes de los métodos de instrucción,
no hay diferencia significante entre las distintas áreas hay interacción importante entre los
dos factores:

La última conclusión indica que varía la efectividad de los tres métodos de instrucción para las
diferentes áreas temáticas.
TAREA 5
CASO BASE DE DATOS II : ESTUDIANTES DE 1er. GRADO DE EDUC. PRIMARIA
Base de datos correspondiente a una muestra de 36 estudiantes de 1er. Grado de educación
Primaria que fue utilizada en un diseño experimental sobre la influencia de los métodos de enseñanza
de la lectura
V1 V1 V1
1 V2 V3 V4 V5 V6 V7 V8 V9 0 V11 2 V13 4 V15
0
1 1 1 18 1 1 28 43 69 30 29 28 17 9 1
0
2 1 1 17 1 2 27 30 68 20 30 22 16 8 1
0
3 1 1 7 2 3 14 18 38 30 10 15 9 6 1
0
4 1 1 12 2 2 23 23 50 26 21 25 14 5 1
0
5 1 1 15 3 1 24 19 57 37 24 19 8 3 1
0
6 1 1 6 3 3 14 22 33 15 11 20 11 4 2
0
7 1 2 7 1 3 14 26 30 21 12 27 13 7 1
0
8 1 2 10 1 2 18 20 38 27 8 19 12 6 2
0
9 1 2 9 2 1 14 19 39 20 7 16 10 4 2
1
0 1 2 4 2 3 10 18 22 32 5 12 8 5 2
1
1 1 2 2 3 2 5 12 20 16 3 9 4 1 2
1
2 1 2 7 3 1 14 17 37 27 6 14 9 3 2
1
3 2 1 20 1 1 30 29 62 30 28 25 15 7 1
1
4 2 1 9 1 3 18 22 35 30 12 21 11 8 2
1
5 2 1 10 2 2 15 20 41 25 9 24 6 7 1
1
6 2 1 13 2 2 20 25 50 22 20 22 16 4 1
1 2 1 11 3 1 16 15 43 21 16 11 8 2 2
7
1
8 2 1 2 3 3 8 11 19 12 2 8 10 1 2
1
9 2 2 16 1 1 22 33 55 29 28 26 18 5 2
2
0 2 2 8 1 2 18 28 30 16 11 19 16 7 1
2
1 2 2 3 2 3 7 24 24 10 4 23 12 5 2
2
2 2 2 9 2 2 12 20 47 19 7 20 7 2 1
2
3 2 2 4 3 3 9 13 21 30 5 10 5 4 2
2
4 2 2 2 3 1 8 14 23 22 3 12 6 1 2
2
5 3 1 19 1 2 27 27 68 34 25 21 13 7 1
2
6 3 1 14 1 3 24 22 60 32 23 16 8 6 1
2
7 3 1 15 2 1 24 28 70 30 22 18 13 4 1
2
8 3 1 9 2 3 17 19 31 24 10 16 6 7 1
2
9 3 1 8 3 2 12 18 28 20 7 13 5 2 2
3
0 3 1 11 3 1 18 20 46 19 15 17 7 2 2
3
1 3 2 10 1 3 14 20 50 12 6 14 8 5 1
3
2 3 2 13 1 1 18 24 48 19 18 20 14 4 2
3
3 3 2 10 2 2 17 21 37 26 18 19 12 3 1
3
4 3 2 4 2 3 10 18 35 14 6 10 5 2 1
3
5 3 2 10 3 1 16 10 42 18 10 7 3 1 1
3
6 3 2 3 3 2 12 14 17 22 2 9 4 2 2

Variables utilizadas:
V2. Métodos de enseñanza de lectura ( 1: silábico 2: Global 3: Mixto )
V3. Aprestamiento ( 1 : Si 2: No )
V4. Madurez lectora ( 0 – 20 )
V5. Ambiente familiar (Interacción en el seno familiar 1 : Alta 2: Media 3 : Baja )
V6. Nivel Socioeconómico ( 1: Alto 2: Medio 3: Bajo )
V7. Nivel de vocabulario previo a Primaria ( 0 – 30 )
V8. Nivel intelectual ( Pretest : 0 – 50 )
V9. Velocidad lectora ( 0 – 80 )
V10. Memoria general ( 0 – 40 )
V11. Comprensión lectora ( 0 – 30 )
V12. Calculo ( 0 – 30 )
V13. Estilo cognitivo ( 0 – 18 )
V14. Adaptación escolar ( 0 – 10 )
V15. Nivel de aspiraciones de los padres ( 1: Si 2: No )

a) La media obtenida en la variable madurez lectora ( var. 4 ) por las 36 personas de la base de
datos es 9.639 y desviación estándar 4.891 . A partir de estos datos , ¿ Entre que valores se
encontrará la media de la población a la que pertenece la muestra , a un nivel de confianza
del 95% ?
b) Calcular el intervalo de confianza de la media obtenida en madurez lectora ( var. 4) para las
18 personas que tuvieron Educación Inicial, a un nivel de confianza del 99%
c) Se desea saber si, con un riesgo menor o igual al 5%, se puede afirmar que la media
poblacional en la variable “ madurez lectora “ es igual a 15.
d) Tomando solamente a niños con una inteligencia alta,
d1) ¿Existen diferencias significativas entre los alumnos que asistieron a Educación Inicial
y los que no asistieron ( var. 3 ) ?
d2) ¿Existen diferencias significativas entre los alumnos que asistieron a “ Educación
Inicial “ ( var. 3 ) y “madurez lectora “(var.4) ?
e) ¿Existen diferencias significativas en el nivel de “madurez lectora “ ( var.4 ) entre los
estudiantes que asistieron a Educación Inicial y los que no asistieron ( var. 3 )? . Use  =
0.01
f) ¿Existen diferencias significativas en el nivel de “madurez lectora “ ( var.4 ) entre los
estudiantes que asistieron a Educación Inicial y los que no asistieron ( var. 3 )? . Use  =
0.01
g) ¿Es significativa la relación entre la variable “ Velocidad Lectora “ ( var. 9 ) y la “
Comprensión lectora “ var. 11. Use  = 0.05
h) Se puede afirmar que hay diferencias significativas en : “ Comprensión Lectora “ ( var. 11 )
entre los grupos de alumnos que asistieron a “ Educación Inicial y los que no asistieron ( var.
3 ) , controlando la influencia debida al “ Nivel de vocabulario previo “ ( var. 7 ) de los
estudiantes ? Use  = 0.05
i) Existen diferencias significativas en “ Cálculo “ ( var. 12 ) entre los niños que han asistido y
los que no han asistido a educación Inicial ( var. 3 ) controlando por emparejamiento la
variable “ cociente Intelectual “ ( var. 8 ). Use  = 0.05

TAREA 6
Sobre la base de una muestra de 20 padres de familia de la ciudad de Cajamarca, se desea someter a
contraste la hipótesis de que los hijos de padres universitarios perciben que tienen mejor relación con
su padre que el grupo de hijos de padres sin estudios.
Variable : Cal_rel ( calidad de relación )
Grupos de los padres:
1 = Sin estudios
2 = Estudios secundarios
3 = Estudios universitarios
El grupo de investigación desea compararán sólo los dos grupos extremos.
Si se probara su hipótesis, lo tendrían en cuenta a la hora de seleccionar a los estudiantes a los que se
ofrecerían cursos optativos para mejorar la comunicación padre-hijo.
Para medir la calidad de la relación paterno-filial se utiliza una escala de 1 a 6, donde:
1 = Muy mala, hasta 6 = Muy buena), considerando que se alcanza un nivel de medida de intervalo o
cuasi-intervalo.
Los datos obtenidos en el análisis de datos son los siguientes:
Iden Titulación del padre Calidad de relación ( Cal_rel)
1 2 6
2 2 4
3 2 6
4 3 5
5 3 5
6 2 1
7 2 3
8 1 5
9 2 6
10 2 4
11 2 2
12 3 5
13 3 1
14 1 4
15 3 4
16 2 4
17 1 4
18 2 2
19 2 5
20 2 4
Estadísticos de grupo
Desviación Error estándar de
Titulación N Media
estándar la media
Cal_rel 1.00 3 4.3333 0.57735 0.33333
3.00 5 4.0000 1.73205 0.77460

Prueba de muestras independientes


Prueba para la
igualdad de Prueba T para la igualdad de medias
varianzas
95% intervalo de
Error est.
Sig. Diferencia confianza para la
F Sig. t Gl. de la
( bilateral ) de medias diferencia
diferencia
Inferior Superior
Cal_rel 1.318 0.295 0.314 6 0.764 0.33333 1.0611 - 2.26308 2.92974

Cuál es la media aritmética en Cal_Rel del grupo de hijos de padres con estudios
secundarios?
a) 3.92*
b) 4.00
c) 2.81

De los tres grupos formados en Cal_Rel en función de la formación de los padres, ¿cuál puede
considerarse más homogéneo partiendo de los datos aportados en las tablas anteriores?
a)1
b)2
c)3
Al contrastar si existen diferencias en Cal_Rel en función del nivel de formación de los
padres, ¿se cumple el supuesto de homocedasticidad de varianzas para un α = 0.05?
a) No, porque la probabilidad asociada a F es mayor que α
b) Sí, porque la probabilidad asociada a F es mayor que α*
c) Sí, porque la probabilidad asociada a t es mayor que α

¿Cuál ha sido el valor de t utilizado para calcular el intervalo de confianza para la diferencia de
medias?
a) 2.015
b) 2.571
c) 2.447*

El intervalo de confianza para la diferencia de medias que aparece en la tabla,


a) Indica que la diferencia de medias empírica es estadísticamente distinta de cero al nivel de
confianza del 95%.
b) Indica que la diferencia de medias empírica es estadísticamente igual a cero al nivel de
confianza del 95%.*
c) Es incompatible con una diferencia de medias igual a cero al nivel de confianza del 95%.
31. El contraste estadístico de hipótesis ha sido
a) Unilateral*
b) Bilateral
c) Multilateral

32. El contraste de medias en Cal_Rel en función del nivel de formación de los padres, nos
permite concluir que:
a) La hipótesis de los investigadores al nivel de confianza del 95% era correcta: la media en
Cal_Rel es estadísticamente superior en el grupo de hijos de universitarios que en el grupo de
hijos de padres sin estudios/estudios primarios.
b) La hipótesis de los investigadores al nivel de confianza del 95% era errónea: la media en
Cal_Rel es estadísticamente inferior en el grupo de hijos de universitarios que en el grupo de
hijos de padres sin estudios/estudios primarios.
c) La hipótesis de los investigadores al nivel de confianza del 95% era errónea: la media en
Cal_Rel es estadísticamente igual en el grupo de hijos de universitarios que en el grupo de
hijos de padres sin estudios/estudios primarios*
33. Además podemos concluir que:
a) Se rechazó la hipótesis nula.
b) No se pudo rechazar la hipótesis nula. *
c) Se aceptó la hipótesis alternativa.

TAREA 7 : 2 FACTORES
ANSIEDAD
En un estudio se quiere analizar la influencia sobre la ansiedad social, cuantificada mediante una
escala numérica que va de 0 a 10, de la edad, dividida en tres categorías, y si se fuma o no. Los datos
obtenidos fueron:
Si fuma No fuma
Edad 1 4.83 ; 3.95 ; 4.04 ; 3.66 ; 9.44 3.91 ; 5.01 ; 4.47 ; 3.33 ; 4.71
Edad 2 9.66 ; 7.68 ; 9.57 ; 7.98 ; 7.39 5.65 ; 6.49 ; 5.50 ; 5.72 ; 5.44
Edad 3 5.92 ; 5.48 ; 5.19 ; 6.12 ; 4.45 4.94 ; 7.13 ; 5.54 ; 5.94 ; 6.16
a) Considerando la posibilidad de interacción entre las variables independientes, ¿ se puede
considerar que la edad, expresada en forma de categorías, influye en la ansiedad ? ¿ Y el
fumar ?¿ Se puede considerar que el fumar o no influye de forma diferente en la ansiedad
dependiendo de la categoría de edad analizada ?

b) Dependiendo de los resultados del apartado anterior. ¿entre qué medias habría diferencias
estadísticamente significativas? Calcular los intervalos de confianza para las diferencias.

TAREA 8
La vida útil (en horas) de las baterías se compara por tipo de material (1, 2 o 3) y temperatura de
funcionamiento: baja (-10 ºC), media (20 ºC) o alta (45 ºC). Doce baterías se seleccionan al azar de
cada tipo de material y luego se asignan al azar a cada nivel de temperatura. La vida útil resultante de
las 36 baterías se muestra a continuación:
Tabla : VIDA ( HORAS ) DE BATERÍAS POR TIPO DE MATERIAL Y TEMPERATURA
Tipo de Temperatura ( ° C )
material Baja ( - 10°C ) Media (20°C ) Alta ( 45°C )
M1 130 155 74 180 34 40 80 75 20 70 82 58
M2 150 188 159 126 136 122 106 115 25 70 58 45
M3 138 110 168 160 174 120 150 139 96 104 82 60

Pregunta de investigación:
¿Hay diferencias en la vida media de las baterías para diferentes tipos de materiales y niveles de
temperatura de funcionamiento?
SOLUCIÓN
PREESENTACION EN SPSS
MAT TEMP DURACION

1 1 130

1 1 155

1 1 74

1 1 180

1 2 34

1 2 40

1 2 80

1 2 75

1 3 20

1 3 70

1 3 82

1 3 58

2 1 150

2 1 188

. . .

. . .

ANOVA - SPSS
Variable dependiente: DURACION
Origen Tipo III S.C. gl CM. F Sig.
MAT 10683.22 2 5341.861 7.911 0.002

TEMP 39118.722 2 19559.361 28.968 0.000

MAT * TEMP 9613.778 4 2403.444 3.560 0.019

Error 18230.750 27 675.213

Total 77646.972 35

Estadísticos descriptivos
Variable dependiente: REN
MAT TEMP Media Desv. Estándar n
1 1 134,75 45,353 4

2 57,25 23,599 4

3 57,50 26,851 4

Total 83,17 48,589 12

2 1 155,75 25,617 4

2 119,75 12,659 4

3 49,50 19,261 4

Total 108,33 49,472 12

3 1 144,00 25,974 4

2 145,75 22,544 4

3 85,50 19,279 4

Total 125,08 35,766 12

Total 1 144,83 31,694 12

2 107,58 42,883 12

3 64,17 25,672 12

Total 105,53 47,101 36

Resultados:
En la tabla de Estadísticas descriptivas y en la gráfica se puede ver que, en general, la vida útil de la
batería disminuye con una temperatura de funcionamiento más alta, aunque la vida de la batería
permanece alta para el material 3 a temperatura media.
Como las líneas que representan los tres materiales en la gráfica no son paralelas, esto implica que hay
un efecto de interacción entre el material y la temperatura de operación. [Las líneas serían
aproximadamente paralelas si no hubiera interacción.] Entonces, la forma en que la vida de la batería
cambia con la temperatura depende del material y viceversa.
Variable dependiente: DURACION
Origen Tipo III S.C. gl CM. F Sig.
MAT 10683.22 2 5341.861 7.911 0.002

TEMP 39118.722 2 19559.361 28.968 0.000

MAT * TEMP 9613.778 4 2403.444 3.560 0.019

Error 18230.750 27 675.213

Total 77646.972 35

La tabla ANOVA da estadísticas de F = 7.91, p = 0.002; 28.967, p < 0.001 y 3.56, p = 0.019, para el
material, la temperatura de operación y la interacción MAT x TEMP , respectivamente [NUNCA escriba
p = 0.000]. Por consiguiente , tanto el material como la temperatura son necesarios, así como su
interacción, para explicar la duración de la batería.
La naturaleza de estas diferencias se puede explorar más a fondo observando el resultado de SPSS de
las pruebas 'post hoc'. Estos sugieren que la vida útil media de la batería en general es
estadísticamente significativamente más larga para el material 3 que 1 (p = 0.001), y menor en
comparación con los niveles de temperatura más altos. Sin embargo, a bajas temperaturas de
funcionamiento, el material 2 parecía dar una vida más larga que para los materiales 1 y 3, pero duró
menos a altas temperaturas.
Conclusión:
De los resultados se puede decir que hay pruebas sólidas de que la duración media de la batería varía
con el material utilizado y la temperatura de funcionamiento (p = 0.002 y p < 0.001). La presencia de
interacción entre el material y la temperatura significa que la forma en que cambia la vida útil de la
batería para diferentes materiales depende de la temperatura. Del mismo modo, la forma en que
cambia la vida útil de la batería para diferentes temperaturas depende del material. En general, el
material 3 se desempeña mejor.

Las tres tablas de medias marginales estimadas proporcionan detalles de la vida útil media de la
batería por factor, más 95% de IC, y brindan más detalles sobre la precisión de estas estimaciones de la
vida útil de la batería desde la muestra hasta la población general. En este ejemplo, los IC son bastante
"amplios", por lo que los resultados deben usarse con precaución.

TAREA 9
Se realiza un experimento para estudiar el EFECTO del NIVEL de agua sobre la longitud del tallo de
dos TIPOS de plantas de guisantes. Para ello se utilizaron tres niveles de agua, los datos obtenidos se
reflejan en la tabla adjunta:
NIVEL DEL AGUA
Nivel I Nivel II Nivel III
71,3 107,5 123,1
75, 1 96,1 125,2
Tipo 1 69,0 103,6 125,7
73,2 100,7 121,0
TIPO DE 74,4 102,3 122,9
PLANTA 70,4 88,1 109,0
73,2 85,8 101,1
Tipo2 71,1 86,0 103,2
71,2 87,5 109,7
69,2 81,0 106,1

SOLUCION
TABLA : ANOVA - Variable dependiente: EFECTO
Origen Tipo III de SC. gl CM. F Sig.
TIPO 1062,075 1 1062,075 125,923 0,000
NIVEL 9200,201 2 4600,100 545,402 0,000
TIPO * NIVEL 401,834 2 200,917 23,821 0,000
Error 202,424 24 8,434
Total corregido 10866,534 29
Las diferentes combinaciones de efectos principales e interacción pueden ilustrarse
mediante gráficos en los que los promedios se representan en función de las
modalidades de uno de los factores. Hay dos gráficos posibles dependiendo del
factor en la abscisa.

PARALELISMO

El paralelismo de las líneas refleja el hecho de que el efecto del factor A (o B) en la variable de
respuesta Y es el mismo independientemente del valor del factor B (o A). Los efectos de los
factores A y B son aditivos y no hay efecto de la interacción entre los dos factores A y B en Y.

NO PARALELISMO
El no paralelismo de las líneas refleja el hecho de que el efecto del
factor A (o factor B) no es el mismo según la modalidad del factor B
(o factor A). Los efectos de los factores A y B en la variable Y no son
aditivos. A los efectos simples de los factores se les agrega el efecto de
la interacción entre los dos factores.
El paralelismo con el eje de abscisas refleja la ausencia de efecto del
factor A (o B). Además, si se confunden las diferentes líneas
correspondientes a las modalidades de B (o A) es la ausencia total
de efectos.

TAREA 10
Un experimentador quiere probar la hipótesis de que el nivel de excitación fisiológica de una
persona frustrada depende del tipo de agresión permitida. Luego construye el siguiente
experimento:
- 30 sujetos seleccionados al azar se dividen aleatoriamente en 6 grupos de 5 sujetos,
correspondientes a 6 condiciones experimentales definidas por el cruce de dos factores.
A: factor de frustración: 2 modalidades: A1: frustrada A2: no frustrada
B: factor de agresión: 3 modalidades:B1: no agresiva B2: moderadamente agresiva B3: muy
agresiva
Los resultados se dan en la tabla opuesta.
B
B1 B2 B3
A1 1 6 4 3 0 3 5 2 4 4 6 7 4 5 3
A
A2 8 8 10 8 11 6 8 4 4 3 5 7 3 1 1
SOLUCIÓN
Tabla de análisis de varianza
Variable dependiente: EFECTO
Origen S.C. G.L. C.M. FOBS Sig.
A 30,0 1 30,000 8,072 0,009
B 18,2 2 9,100 2,448 0,108
AxB 77,4 2 38,700 10,413 0,001
Error 89,2 24 3,717
Total 214,8 29
TAREA 11
En muchas disciplinas se hacen preguntas para determinar la fuerza de una opinión mantenida por un
grupo de gente con respecto a un tema determinado. Las respuestas se puntúan según la escala
«Likert». Una escala típica de este tipo etiquetaría las respuestas como sigue:
1 = Bastante en desacuerdo
2 = Algo en desacuerdo
3 = Neutral
4 = Algo de acuerdo
5 = Bastante de acuerdo
En un estudio sobre la opinión de estudiantes acerca de la afirmación de que «El centro de salud de
R.U. tiene horarios convenientes para los estudiantes», se extrajo una muestra de 245 estudiantes y
cada uno de ellos se clasificó en función de su género y de su respuesta a la afirmación según la escala
Likert. Utilizar el resultado en la Tabla adjunta, para responder a las siguientes preguntas:
a) ¿Cuántos estudiantes fueron mujeres y estuvieron bastante de acuerdo?
b) ¿Qué % de la muestra eran mujeres y estaban bastante de acuerdo con la afirmación?
c) ¿Qué porcentaje de las mujeres estuvieron bastante de acuerdo con la afirmación?
d) ¿Qué porcentaje de los varones estuvieron bastante de acuerdo con la afirmación?
e) De los que estuvieron bastante de acuerdo, ¿qué porcentaje eran mujeres?

Tabla de doble entrada para las variables género y horario del centro de Salud
RESPUESTA Total
GÉNERO Bastante en Algo en Algo de Bastante de
Neutral
desacuerdo desacuerdo acuerdo acuerdo
Femenino 20 23 45 36 142
 Frecuencia 18 8.16 9.39 18.37 14.69 57.96
 % total 7.35 14.08 16.20 31.69 25.35
 % fila 12.68 50 47.92 61.64 59.02
 % columna 78.26
Masculino
5 20 25 28 25 103
2.04 8.16 10.20 11.43 10.20 42.04
4.85 19.42 24.27 27.18 24.27
21.74 50 52.08 38.36 40.98
23 40 48 73 61 245
9.39 16.33 19.59 29.80 24.90 100.00