Вы находитесь на странице: 1из 57

Índice

La estadística—introducción .....................................................................................1
Muestreo aleatorio simple.........................................................................................2
Sumatorias ................................................................................................................3
Distribución de frecuencias .............................................................................................................................................. 4
Parcial ............................................................................................................................................................................... 5
Medidas de dispersión ..................................................................................................................................................... 6
Análisis de regresión múltiple…………………………………………………………………………………………………………………………………..7

Ecuación normal para la regresión múltiple…………………………………………………………………………………………………………..8

Series de tiempo…………………………………………………………………………………………………………………………………………………..9

Probabilidades …………………………………………………………………………………………………………………………………………………….10

1
La Estadística
1.1. Introducción
En la sociedad actual encontramos gran cantidad de información en forma de números y gráficas, el
ciudadano a través de la comprensión de esa gran cantidad de información que se encuentra por lo general
en forma de estadísticas ha podido entender la sociedad actual.

La aplicación de la estadística está ligada prácticamente a casi todas las actividades humanas.

La estadística es una rama de las matemáticas cuyo propósito consiste en analizar problemas apoyándose
en la teoría de la probabilidad para lograr su solución.

1.2. Ramas de la estadística


 La estadística descriptiva:

Es parte de la estadística se relaciona con la recopilación, presentación y descripción de datos (métodos


puramente descriptivos).

 La estadística inferencial:

Se refiere a la técnica de interpretar y usar los valores resultantes de la estadística descriptiva para alcanzar
conclusiones más generales.

1.3. Tipos de variables


Las variables son la materia prima de la estadística, sin ellas carece de sentido su trabajo al no producirse los
datos.

Medición y variables

Medir una propiedad es asignar números a los posibles resultados de la misma.

Variable es cualquier característica cambiante que se desea medir en el objeto bajo estudio.

1. Ejemplo:

Suponga que se desea medir la temperatura de Monterrey a las 12:00 a.m. diariamente.

a) Operacionalizacion:

Con un termómetro se medirá la temperatura ambiental de Monterrey a las 12:00 a.m.

b) Indicador:

La temperatura a las 12:00 a.m.

c) Instrumento:

Un termómetro.

Tipos de variables

 Variables cualitativas
2
(También llamadas de atributo)

Asignan atributos a las características medibles de los elementos bajo estudio.

2. Ejemplo:

Nombre de la variable: Sexo .

Atributo a medir o indicador empírico: Genero (sexo) de la persona.

Valores de la variable: Femenino o masculino.

 Variables cuantitativas

(También llamadas numéricas)

Asignan números a las características medibles de los elementos bajo estudio.

3. Ejemplo:

Nombre de la variable: Edad.

Operacionalizacion de la variable o indicador empírico: Tiempo transcurrido desde el nacimiento hasta el


momento de la toma del dato.

Valores de la variable: (0,120) años.

Niveles de medición

Capacidad de obtener información de alguna propiedad analizada.

En el proceso de obtención de información de las propiedades medidas de los elementos bajo estudio se
pueden reconocer tres aproximaciones importantes:

 La diferenciación
 La jerarquización o clasificación
 La asignación de números

Escala nominal para variables cualitativas

Diferencia entre los posibles valores de la variable.

4. Ejemplo:

Los posible valores de la variable sexo son femenino y masculino.

Escala ordinal para variables cualitativas

Además de diferenciar también permite jerarquizar u ordenar los posibles valores de la variable

5. Ejemplo

3
¿Cómo calificarías tu desempeño como estudiante en una escala donde 1 = deficiente y 2, 3, 4 y 5 =
excelente?

Escala de intervalo para variables cuantitativas

Asigna números a los posibles valores de la variable, y donde los intervalos son iguales, pero la posición del
cero es arbitraria.

Escala de razón para variables cuantitativas

Asigna números a los posibles valores de la variable, y en ella, la posición del cero es real y necesariamente
refleja la ausencia completa de la propiedad medida.

Ejercicios

1.

Como podemos ver en cuanto al pre-grado hay mas estudiantes en universidades privadas esto se debe que
durante los ultimos años se ha incrementado el número de universidades privadas y con esto los postulantes
a esas universidades escogen cual de ellas se acomodan a sus recursos economicos.

2.

Lima Cómo Vamos: El 80% de limeños usa el transporte público

Una de las causas es que el 72.8% de peatones considera que utilizar las vías de la capital es inseguro pues
se calcula que siete de cada diez fallecidos en sinestros vehiculares son transeúntes.

Por último, el estudio precisó que, si bien el 30% de hogares cuenta con bicicleta, únicamente el 0.8% la usa
como medio de transporte para ir a trabajar o a estudiar.

3. “siete de cada 10 dentistas recomiendan la goma de mascar No-sugar”.

4
¿Qué pretende hacer esta afirmación?

Convencer a los consumidores ya que el 70% de dentistas la recomiendan y con eso los consumidores se
sentirán más confiados al comprar ese producto.

¿Tiene validez?

No está comprobado científicamente, pero con ese tipo de anuncios las personas confían en el producto sin
investigar más.

¿Por qué?

Es fácilmente creíble y llamativo que el 70% de dentistas lo prefieran.

4. “Estudios clínicos realizados en mujeres que utilizaron la crema reafirmante Belle mostraron que la
mayoría obtuvieron resultados satisfactorios”

Es un tipo de anuncio muy común en cuanto a productos de belleza y con esa afirmación es más que
suficiente creer en la afirmación pues es parte de la competencia en el mercado de belleza.

5. Suponga que desea comprar baterías para su equipo portátil de discos compactos, y que ha visto en un
anuncio en la TV que afirma que la marca X dura en promedio más que las demás marcas que hay en el
mercado. Describa como podría utilizar la estadística para verificar la afirmación del fabricante de tal marca
de baterías.

Comprando la marca X y las demás marcas que hay en el mercado para poder usarlas (ver las características,
tiempo de duración) y así sacar las conclusiones.

6. “Estudios comparativos entre el detergente Blanquex y otras marcas del mercado demostraron que
Blanquex deja su ropa 50% más blanca que las otras marcas.”

No puedo aceptar esa afirmación como verdadera sin antes haberla demostrado por lo tanto para que la
afirmación tenga validez se tiene que experimentar con los demás detergentes para saber en cuanto tiempo
y grado de blancura en los lavados solo así sabré si es verdadera la afirmación.

7. “De acuerdo con los expertos, es más seguro viajar en avión que en automóvil. “A muchas personas les da
pavor viajar en avión, porque creen que es altamente riesgoso. ¿Qué información estadística pudiera utilizar
para apoyar la afirmación anterior y convencer a una persona que en realidad es relativamente más seguro
viajar en avión que en automóvil?

5
En la siguiente grafica vemos que la tasa de mortalidad de viajar en avión es mínima en todo el mundo por
lo tanto se demuestra que es el medio más seguro.

En cuanto a accidentes de transito cada día alrededor de 3500 personas fallecen en las carreteras. Decenas
de millones de personas sufren heridas o discapacidades cada año. Los niños, los peatones, los ciclistas y los
ancianos son los usuarios más vulnerables de la vía pública. Según la OMS.

8. Supóngase que el fabricante de la batería A afirma que su marca es mejor que la batería B, su más cercano
competidor. El fabricante basa su afirmación en el hecho de que en un experimento realizado para comparar
ambas marcas resulto que la marca A dura, en promedio, 2 horas más que la marca B.

a) ¿Aceptaría la afirmación del fabricante A?

Primero tengo que experimentarlo para poder verificarlo.

¿Qué afirmación adicional necesitaría para aceptar como válida tal afirmación?

Saber el porcentaje de personas que usan la marca A.

b) Suponga que los resultados del experimento fueron los siguientes:

Marca A: 25 27 29 33 35 37 Promedio = 31

Marca B: 28 29 29 29 29 30 Promedio = 29

¿Qué le sugieren los resultados anteriores en cuanto a la afirmación del fabricante?

Que la batería A tiende a durar más, es una inferencia respecto a los datos estadísticos.

9. Un investigador selecciono al azar del directorio telefónico a siete personas y les llamo para preguntarles
cuanto tiempo tenían encendida la TV durante el día en su casa. Las respuestas que obtuvo fueron 1, 3, 3, 4,
5, 7, 9

a) Con base en estos resultados se puede decir que más de 50% de las personas de la ciudad tienen encendida
la televisión en su casa más de 3 horas.
6
Inferencia, porque los datos se obtienen de la información suministrada.

b) El tiempo promedio que tienen encendida la TV en las casas de estas siete personas es de 4.57 horas.

Descripción, porque la información se obtiene de la información suministrada.

c) El rango de valores observados en estos resultados es 8.

Verdadero, porque 9-1 = 8

d) En las casas donde las personas dijeron tener encendida la TV 3 horas o menos las personas que viven ahí
trabajan.

Generalización, porque la información se obtiene de la información suministrada más la experiencia.

e) Los resultados sugieren que los habitantes de la ciudad tienen encendido el televisor 4.57 horas en
promedio al día.

Inferencia, porque la información se obtiene de la información suministrada.

10. El jefe de personal de una gran empresa ha revisado en los últimos cuatro meses el número de personas
que han renunciado a la empresa por diversas razones. Los resultados fueron: 15, 33, 36, 45

a) En el cuarto mes abandonaron el trabajo el triple de número de personas que durante el primer mes.

Inferencia, porque la información se obtiene de la información suministrada.

b) Como los números van en ascenso, el jefe de personal toma medidas para abatir el aumento de la rotación
del personal.

Descripción, porque la información se obtiene directamente de la información suministrada.

c) El número mínimo de personas que renunciaron en estos cuatro meses fue de 15.

Descripción, porque la información se obtiene directamente de la información suministrada.

d) Los resultados sugieren que el número de personas que renunciaran el siguiente mes será mayor de 45.

Inferencia, porque los datos se obtienen de la información suministrada.

e) El hecho de que en el segundo mes renunciaran más del doble personas que en el primero se debió al
cambio de políticas laborales en la empresa.

Generalización, porque la información se obtiene de la información suministrada más la experiencia.

11. Un médico tiene a su cargo el monitoreo de un grupo de pacientes varones con una enfermedad en la
tiroides. Particularmente, una de las variables analizadas es el cambio de peso semanal durante el periodo
en que han sido sometidos a un tratamiento. En las últimas seis semanas se ha medido el cambio de peso
promedio y se obtuvieron los resultados siguientes expresados en Kg 0.3, 0, -1.3, 0.2, -0.5, 0.4

a) El máximo cambio obtenido es de -1.3

7
Descripción, porque la información se obtiene directamente de la información suministrada.

b) El valor de -1.3, comparado con los demás, sugiere que hubo algún problema al tomar la medición en esa
semana.

Generalización, porque la información se obtiene de la información suministrada más la experiencia.

c) Como el cambio promedio de peso es cercano a cero, los resultados de este estudio sugieren que el
tratamiento realmente ayuda a controlar el peso de este tipo de pacientes.

Inferencia, porque los datos se obtienen de la información suministrada.

d) La mayoría de los datos tiene un valor absoluto menor o igual que 0.5.

Descripción, porque la información se obtiene directamente de la información suministrada.

e) Los datos sugieren que en las últimas seis semanas el tratamiento ha logrado controlar el peso de los
pacientes.

Descripción, porque la información se obtiene directamente de la información suministrada.

12. El jefe de recursos humanos registró el número promedio de palabras por minuto que cinco aspirantes
al puesto de mecanógrafa hicieron en una prueba de transcripción de un texto durante un periodo de 10
minutos. Los resultados fueron como siguen: 75, 79, 97, 102 y 115.

a) Tres de las cinco aspirantes tuvieron un promedio de menos de 100 palabras por cada 10 minutos.

Descripción, porque la información se obtiene directamente de la información suministrada.

b) Las aspirantes con promedio de más de 100 palabras por cada 10 minutos son personas con mucha
experiencia.

Generalización, porque la información se obtiene de la información suministrada y la experiencia.

c) Este estudio permite estimar que una mecanógrafa tiene una velocidad de escritura de 120 palabras por
cada 10 minutos.

Inferencia, porque la información se obtiene de la información suministrada.

d) El número de aspirantes con un promedio menor a 90 palabras por cada 10 minutos es dos.

Descripción, porque la información se obtiene directamente de la información suministrada.

e) Las aspirantes con un promedio de más de 90 palabras por cada 10 minutos deben tener el mismo tiempo
de experiencia en puestos de mecanógrafa.

Generalización, porque la información se obtiene de la información suministrada y la experiencia.

13. Una trabajadora recopila datos de muertes por sobredosis de heroína en una pequeña ciudad en los
últimos cuatro años. Los resultados que obtuvo fueron: 10, 10, 15, 20.
8
a) El número de muertes se ha incrementado de manera alarmante en los últimos dos años reportados.

Descripción, porque la información se obtiene directamente de la información suministrada.

b) El número de muertes observado en el último año es el doble que en el primero.

Inferencia, porque la información es obtenida de la información suministrada.

c) Como el número de muertes se ha duplicado del primero al cuarto año, debe ser que el número de
consumidores de heroína también se ha duplicado del primero al cuarto año.

Generalización, porque la información se obtiene de la información suministrada y la experiencia.

d) De continuar esta tendencia se espera que en los siguientes años el número de muertes sea superior a 20
al año.

Inferencia, porque la información se obtiene de la información suministrada.

e) El número de muertes por sobredosis de heroína no cambio durante los dos primeros años observados.

Descripción, porque la información se obtiene directamente de la información suministrada.

14. El empleado de una compañía registro la cantidad de café que proporciono una máquina expendedora
de café en ocho ocasiones que algún empleado uso la máquina.

Los valores fueron los siguientes: 110, 95, 105, 90, 94, 92, 89 y 100 mililitros.

a) En más de la mitad de las observaciones la maquina proporciono menos de 100 mililitros.


Descripción, porque la información se obtiene directamente de la información suministrada.
b) La máquina expendedora de café tiende a proporcionar menos de 100 mililitros de líquido.
Descripción, porque la información se obtiene directamente de la información suministrada.
c) La mínima cantidad de líquido proporcionada por la maquina fue de 89 mililitros.
Descripción, porque la información se obtiene directamente de la información suministrada.
d) Puesto que la maquina debe proporcionar 100 mililitros de café, la muestra indica que la maquina
debe estar fallando.

Inferencia, porque la información se obtiene de la información suministrada.

e) Las veces que la maquina proporciono menos de 95 mililitros debió de haber fallas en la energía
eléctrica.

Generalización, porque la información se obtiene de la información suministrada y la experiencia.

15. Cinco estudiantes fueron escogidos al azar y se registraron sus notas finales de:

Estudiantes 1 2 3 4 5

Estadística 6 7 8 8 9

Historia 8 8 7 7 8

9
a) El promedio en ambas clases es el mismo.

Inferencia, porque la información se obtiene de la información suministrada.

b) Al estudiante 1 no ha de gustarle la clase de estadística, puesto que saco menor nota en este curso
que en el curso de historia.

Inferencia, porque la información obtenida se obtiene de la información suministrada.

c) En la clase de historia tres de los cinco estudiantes sacaron 8 de nota final.

Descripción, porque la información se obtiene directamente de la información suministrada.

d) Puesto que el promedio en ambas materias es el mismo, este resultado indica que en general los
estudiantes tienen el mismo desempeño en historia y en estadística.

Generalización, porque la información se obtiene de la información suministrada y la experiencia.

e) En la clase de historia ninguno de los cinco estudiantes saco menos de 7 en el curso.

Descripción, porque la información se obtiene directamente de la información suministrada.

16. En cada una de las siguientes situaciones, determine el problema de medición a resolver, la
operacionalizacion de la variable, el indicador y el instrumento.

a) El jefe de cierta línea de producción desea determinar la velocidad con que se ensambla un producto
de cinco componentes.

Problema de medición a resolver velocidad con que se ensambla un producto de cinco


componentes

Operacionalizacion de la variable velocidad para ensamblar componente por componente

Indicador eficacia en el ensamblaje

Instrumento número de productos ensamblados al día

b) Un funcionario bancario desea determinar qué servicios adicionales les gustaría a los clientes que
tuviera el banco.

Problema de medición a resolver determinar qué servicios adicionales les gustaría a los clientes
que tuviera el banco

Operacionalizacion de la variable mediante una encuesta preguntar qué servicios les gustaría que
tenga el banco

Indicador servicios adicionales en el banco

Instrumento encuesta

c) Un psicólogo desea determinar el nivel de memoria auditiva. Para hacer esto decide realizar el
siguiente experimento. Toma una persona, le dicta progresivamente une serie de números y le pide que
10
repita la secuencia en voz alta. En cada repetición se agrega un número a la serie, y la experiencia termina
cuando el sujeto ya no puede repetir correctamente la secuencia de números.

Problema de medición a resolver determinar el nivel de memoria auditiva

Operacionalizacion de la variable dictarle a una persona una serie de números y que repitan la
secuencia en voz alta

Indicador memoria auditiva

Instrumento serie de palabras

d) Un ingeniero desea determinar el diámetro interior de un tubo de cobre diseñado para instalaciones
de gas natural.

Problema de medición a resolver determinar el diámetro de un tubo de cobre

Operacionalizacion de la variable con un pie de rey medir el diámetro del tubo

Indicador diámetro de un tubo de cobre

Instrumento pie de rey

e) Un periodista desea determinar el grado de popularidad del presidente municipal de cierta ciudad.

Problema de medición a resolver determinar el grado de popularidad del presidente municipal

Operacionalizacion de la variable mediante una encuesta dirigida a la población para determinar


el grado de popularidad del presidente municipal

Indicador popularidad del presidente municipal

Instrumento encuesta

17. Para cada una de las siguientes variables determine los valores de la variable, y si la variable es
cualitativa o cuantitativa. Si la variable es cuantitativa determine si es discreta o continua.

a) ¿Cómo calificas la atención recibida durante el proceso de inscripción?

1 = deficiente; 2, 3, 4, 5 = excelente

Valores de la variable: cuantitativa

Tipo de variable: discreta

b) Peso de un producto enlatado de 400 g +- 15

Valores de la variable: cuantitativa

Tipo de variable: continua

c) Tipo de pasto que tiene sembrado una vivienda.

11
Valores de la variable: cualitativa

Tipo de variable: ninguna

18. Para cada una de las siguientes variables, determine su nivel de medición.

a) Opinión que se tiene acerca de la calidad en el servicio

(1 = deficiente; 2, 3, 4, 5 = excelente)

Nivel de medición: ordinal

b) Variedad de trigo que se cultiva en cierta región

Nivel de medición: nominal

C) Consumo mensual de energía que tiene un cierto tipo de refrigerador

Nivel de medición: numérica

Ejercicios

Discreta

1) La población de buses de transporte privado de pasajeros de Lima a Tingo María de la empresa “León
de Huánuco” Lima-Perú

Número de pasajeros que puede llevar el bus: 50 (10 abajo y 40 arriba)

N = 20

n = 10 columna (30-34)

1=07 (30) 4=06 (32) 7=19 (35) 10=03 (45)

2=17 (37) 5=14 (40) 8=05 (29)

3=09 (30) 6=18 (28) 9=08 (38)

2) La población de camiones de transporte de concentrados de mineral de la “Empresa Dinet Logística


Inteligente” San Borja-Lima-Perú

Capacidad de carga de cada camión: 36 toneladas

N = 80

n = 20 columna (60-64 65-69)

1=52 (34T) 6=35 (28T) 11=65 (36T) 16=10 (23T)

12
2=77 (30T) 7=73 (25T) 12=71 (34T) 17=34 (33T)

3=51 (35T) 8=57 (35T) 13=78 (29T) 18=70 (34T)

4=64 (31T) 9=76 (36T) 14=62 (18T) 19=09 (22T)

5=36 (31T) 10=84 (30T) 15=02 (28T) 20=42 (26T)

Continua

3) La población de camiones refrigerados de la empresa “Eroski Consumer” España

Temperatura de refrigeración no más de 7°C

N = 50

n = 15 columna (75-79)

1=17 (6.1°C) 6=33 (5.9°C) 11=10 (5.8°C)

2=13 (6.6°C) 7=48 (6.8°C) 12=42 (6.9°C)

3=39 (6.5°C) 8=29 (6.3°C) 13=01 (6.7°C)

4=09 (6.5°C) 9=08 (6.2°C) 14=03 (6.5°C)

5=49 (6.2°C) 10=14 (5.9°C) 15=23 (6.1°C)

4) Población de furgonetas para realizar el servicio de entrega puerta a puerta (recojo de la carga, estiba,
transporte, desestiba y entrega al usuario final) de la “Empresa LOG Operador Logístico” Santiago de
Surco-Lima-Perú

Tiempo de entrega 3 h 45 min – 5 h 30 min

N = 20

n = 10 columna (90-94)

1=06 (2.30 h) 6=20 (3.55 h)

2=15 (3.40 h) 7=09 (5.10 h)

3=01 (4.15 h) 8=16 (4.45 h)

4=17 (4.25 h) 9=03 (4.15 h)

5=05 (5.12 h) 10=08 (5.20 h)

Ejercicios
A. Sumatorias Simples

13
1. ∑3𝑖=1(𝑥𝑖 − 1)2 = ∑3𝑖=1 𝑥𝑖2 -2𝑥𝑖 +1 = 𝑥12 − 2𝑥1 + 1 + 𝑥22 − 2𝑥2 + 1 + 𝑥32 − 2𝑥3 + 1

2. Hallar el número de términos:


100
∑ 𝑥𝑖
𝑖=80

⇒ Número de términos = (100-80+1) = 21

3. ∑𝟓𝟐 𝒙𝒊−𝟏 = 𝑥2−1 + 𝑥3−1 + 𝑥4−1 + 𝑥5−1 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4

4. ∑𝟒𝟏 𝟓𝒙𝒊 = 5∑41 𝑥𝑖 = 5(𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) = 5𝑥1 + 5𝑥2 + 5𝑥3 + 5𝑥4

5. ∑𝟐𝟎𝟎
𝟓𝟎 𝟐 = 2(200-50+1) = 2(151) = 302

6. ∑𝟓𝟐(𝒙𝒊 + 𝒚𝒊 + 𝒛𝒊 ) = ∑52 𝑥𝑖 + ∑52 𝑦𝑖 + ∑52 𝑧𝑖 = (𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 ) + (𝑦2 + 𝑦3 + 𝑦4 + 𝑦5 ) + (𝑧2 + 𝑧3 +


𝑧4 + 𝑧5 )

7. ∑𝟒𝒊=𝟏(𝒙𝒊 + 𝟐)𝟑 = ∑4𝑖=1(𝑥𝑖3 + 6𝑥𝑖2 + 12𝑥𝑖 + 8) = ∑4𝑖=1 𝑥𝑖3 + ∑4𝑖=1 6𝑥𝑖2 + ∑4𝑖=1 12𝑥𝑖 + ∑4𝑖=1 8 = (𝑥13 +
𝑥23 + 𝑥33 + 𝑥43 ) + 6(𝑥12 + 𝑥22 + 𝑥32 + 𝑥42 ) + 12(𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ) + 8(4-1+1)

8. ∑𝟑𝒊=𝟏 𝟑(𝒙𝒊 + 𝒚𝒊 ) = 3∑3𝑖=1(𝑥𝑖 + 𝑦𝑖 ) = 3∑3𝑖=1 𝑥𝑖 + 3∑3𝑖=1 𝑦𝑖 = 3(𝑥1 + 𝑥2 + 𝑥3 ) + 3(𝑦1 + 𝑦2 + 𝑦3 )

9. ∑𝟕𝒊=𝟑 𝟐(𝒙𝒊 + 𝟐)𝟐 = 2∑7𝑖=3(𝑥𝑖 + 2)2 = 2∑7𝑖=3(𝑥𝑖2 + 4𝑥𝑖 + 4) = 2∑7𝑖=3 𝑥𝑖2 + 2 ∑7𝑖=3 4𝑥𝑖 + 2 ∑7𝑖=3 4 =
2(𝑥32 + 𝑥42 + 𝑥52 + 𝑥62 + 𝑥72 ) + 8(𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + 𝑥7 ) + 8(7-3+1)

14
𝟏 1 1 1 1 1
10. ∑𝟑𝒊=𝟏 𝟐 (𝒙𝟐𝒊 + 𝒚𝟐𝒊 + 𝒛𝟐𝒊 ) = 2 ∑3𝑖=1(𝑥𝑖2 + 𝑦𝑖2 + 𝑧𝑖2 ) = 2 ∑3𝑖=1 𝑥𝑖2 + 2 ∑3𝑖=1 𝑦𝑖2 + 2 ∑3𝑖=1 𝑧𝑖2 = 2 (𝑥12 + 𝑥22 + 𝑥32 )
1 1
+ 2 (𝑦12 + 𝑦22 + 𝑦32 ) + 2 (𝑧12 + 𝑧22 + 𝑧32 )

B. Sumatorias Dobles

1. ∑𝟒𝒊=𝟏 ∑𝟐𝒋=𝟏 𝒙𝒊𝒋 = ∑2𝑗=1(𝑥1𝑗 + 𝑥2𝑗 + 𝑥3𝑗 + 𝑥4𝑗 )

x𝟏𝟏 + x𝟐𝟏 + x31 + x41

x𝟏𝟐 + x𝟐𝟐 + x𝟑𝟐 + x𝟒𝟐

2. ∑5𝑖=2 ∑7𝑗=5 3(𝑥𝑖𝑗 ) = 3∑5𝑖=2 ∑7𝑗=5(𝑥𝑖𝑗 ) = 3∑7𝑗=5(𝑥2𝑗 + 𝑥3𝑗 + 𝑥4𝑗 + 𝑥5𝑗 )

𝑥25 + 𝑥35 + 𝑥45 + 𝑥55


3.|𝑥26 + 𝑥36 + 𝑥46 + 𝑥56 |
𝑥27 + 𝑥37 + 𝑥47 + 𝑥57

3. ∑𝟒𝒊=𝟐 ∑𝟔𝒋=𝟑(𝒙𝒊𝒋 + 𝟏) = ∑6𝑗=3(𝑥2𝑗 + 𝑥3𝑗 + 𝑥4𝑗 + 3)

𝒙𝟐𝟑 + 𝒙𝟑𝟑 + 𝒙𝟒𝟑 + 𝟑

𝒙𝟐𝟒 + 𝒙𝟑𝟒 + 𝒙𝟒𝟒 + 𝟑

𝒙𝟐𝟓 + 𝒙𝟑𝟓 + 𝒙𝟒𝟓 + 𝟑

𝒙𝟐𝟔 + 𝒙𝟑𝟔 + 𝒙𝟒𝟔 + 𝟑

4. Hallar el número de términos:

𝟏𝟎 𝟖

∑ ∑ 𝒙𝒊𝒋
𝒊=𝟐 𝒊=𝟓

⇒ Número de términos = (10-2+1) . (8-5+1) = 36

5. ∑7𝑖=1 ∑3𝑗=1 5 = 5 (7-1+1) . (3-1+1) = 105

3 3 3 3 3
6. ∑4𝑖=1 ∑2𝑗=1(𝑥𝑖𝑗 ) = ∑2𝑗=1(𝑥1𝑗 + 𝑥2𝑗 + 𝑥3𝑗 + 𝑥4𝑗 )
3 3 3 3
𝑥11 + 𝑥21 + 𝑥31 + 𝑥41

15
3 3 3 3
𝑥12 + 𝑥22 + 𝑥32 + 𝑥42

7. ∑𝟑𝒊=𝟏 ∑𝟓𝒋=𝟑 𝒙𝒊 = 5. ∑3𝑖=1 𝑥𝑖 = 5(𝑥1 + 𝑥2 + 𝑥3 ) = 5𝑥1 + 5𝑥2 + 5𝑥3

8. ∑𝟐𝒊=𝟏 ∑𝟑𝒋=𝟏(𝒙𝒊𝒋 + 𝒚𝒊𝒋 ) = ∑𝟐𝒊=𝟏 ∑𝟑𝒋=𝟏(𝒙𝒊𝒋 ) + ∑𝟐𝒊=𝟏 ∑𝟑𝒋=𝟏(𝒚𝒊𝒋 ) = ∑3𝑗=1(𝑥1𝑗 + 𝑥2𝑗 ) + ∑3𝑗=1(𝑦1𝑗 + 𝑦2𝑗 )

𝒙𝟏𝟏 + 𝒙𝟐𝟏 + 𝒚𝟏𝟏 + 𝒚𝟐𝟏

𝒙𝟏𝟐 + 𝒙𝟐𝟐 𝒚𝟏𝟐 + 𝒚𝟐𝟐

𝒙𝟏𝟑 + 𝒙𝟐𝟑 𝒚𝟏𝟑 + 𝒚𝟐𝟑

9. ∑𝟐𝟎 𝟓 𝟓
𝒊=𝟓 ∑𝒋=𝟐 𝒙𝒋 = 20. ∑𝒋=𝟐 𝒙𝒋 = 20 (𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 ) = 20𝑥2 + 20𝑥3 + 20𝑥4 + 20𝑥5

10. ∑𝟓𝒊=𝟑 ∑𝟐𝒋=𝟏(𝒙𝟐𝒊𝒋 ) = ∑2𝑗=1(𝑥3𝑗


2 2
+ 𝑥4𝑗 2
+ 𝑥5𝑗 )

2 2 2
𝑥31 + 𝑥41 + 𝑥51
2 2 2
𝑥32 + 𝑥42 + 𝑥52

C. Datos de variables discretas

Empresa de transporte privado de pasajeros “Civa”.

Destino Lima a Piura.

1. Número de autobuses (33)


2. Salidas diaria de autobuses (22)
3. Número de llantas de cada vehículo (6)
4. Número de asientos (50)
5. Agencias en Piura (5)
6. Agencias a nivel nacional (63)
7. Aforo de personas en cada agencia
8. Choferes y terramosas en cada bus
9. Total de equipajes en cada viaje
10. Paradas autorizadas por viaje

16
D. Datos de variables continuas

Empresa de transporte de carga pesada “LOG”

Tipo de vehículo: Tractor con Semi-Remolque

1. Tolva del camión (31.60m3)


2. Distribución máxima de carga por eje (6; 17.6; 17.5)
3. Peso máximo permitido (42.5 toneladas)
4. Dimensiones de largo (13.38 m),
5. Dimensiones de ancho (2.60 m)
6. Dimensiones de alto (4.10 m)
7. Aros del vehículos (8.25x22.5)
8. Diámetro de la llanta (22.5)
154
9. Índice de carga de la llanta (150M)
10. Capacidad del tanque de combustible.

Tablas de Frecuencia

1. R = 44 – 10 + 1 = 35

K = 1 + 3.3log 30 = 5.87 = 6
35
TIC = = 5.83 = 6
6

Ls = 10 + 6 – 1 = 15

Ex = (3).(6) – 35 = 1 ⇒ V máx. = 45

Li Ls [ Lri - Lrs> conteo f Xi Fi hi Hi


10 15 [9.5–15.5> IIIIII 6 12.5 6 6/30 6/30
16 21 [15.5-21.5> IIIII 5 18.5 11 5/30 11/30
22 27 [21.5-27.5> IIIIIIII 8 24.5 19 8/30 19/30
28 33 [27.5-33.5> IIIIIIII 8 30.5 27 8/30 27/30
34 39 [33.5-39.5> I 1 36.5 28 1/30 28/30
40 45 [39.5-45.5> II 2 42.5 30 2/30 30/30

(6)(12.5)+(5)(18.5)+(8)(24.5)+(8)(30.5)+(36.5)+(2)(42.5)
x= = 24.3
30

30
mH = 6 5 8 8 1 2 = 21.2
+ + + + +
12.5 18.5 24.5 30.5 36.5 42.5

15−11
me = 21.5 + 6( 8
) = 24.5

17
POLIGONO DE FRECUENCIA
ABSOLUTA
9
8
7
6
5
4
3 POLIGONO DE
2 FRECUENCIA ABSOLUTA
1
0

POLIGONO DE FRECUENCIA RELATIVA


0.3
0.25
0.2
0.15
0.1 POLIGONO DE FRECUENCIA
RELATIVA
0.05
0

18
OJIVA "MENOR QUE"
35

30

25

20

15 OJIVA "MENOR QUE"

10

0
9.5 15.5 21.5 27.5 33.5 39.5 45.5

2. R = 19.2 – 10.5 = 8.7

K = 1 + 3.3log 35 = 6.09 = 6.1 = 7


8.7
TIC = 7
= 1.24 = 1.3

Ls = 10.5 + 1.3 – 0.1 = 11.7

Li Ls [Lri - Lrs> conteo f Xi Fi hi Hi


10.5 11.7 [10.45-11.75> IIIIII 6 11.1 6 6/35 6/35
11.8 13 [11.75-13.05> IIIIII 6 12.4 12 6/35 12/35
13.1 14.3 [13.05-14.35> IIIIIIII 8 13.7 20 8/35 20/35
14.4 15.6 [14.35-15.65> IIIIIIII 8 15 28 8/35 28/35
15.7 16.9 [15.65-16.95> III 3 16.3 31 3/35 31/35
17 18.2 [16.95-18.25> II 2 17.6 33 2/35 33/35
18.3 19.5 [18.25-19.5> II 2 18.9 35 2/35 35/35

(6)(11.1)+(6)(12.4)+(8)(13.7)+(8)(15)+(3)(16.3)+(2)(17.6)+(2)(18.9)
x= 35
= 14.07

35
mH = 6 6 8 8 3 2 2 = 13.75
+ + + + + +
11.1 12.4 13.7 15 16.3 17.6 18.9

13−12.4
me = 13.05 + 1.3 8
= 13.14

19
POLIGONO DE FRECUENCIA
ABSOLUTA
9
8
7
6
5
4
3 POLIGONO DE
2
1 FRECUENCIA ABSOLUTA
0

POLIGONO DE FRECUENCIA RELATIVA


0.25

0.2

0.15

0.1
POLIGONO DE
0.05 FRECUENCIA RELATIVA

20
OJIVA "MENOR QUE"
40
35
30
25
20
OJIVA "MENOR QUE"
15
10
5
0
10.45 11.75 13.05 14.35 15.65 16.95 18.25 19.5

3. R = 50.9 – 13.3 = 37.6

K = 1 + 3.3log 25 = 5.61 = 6
37.6
TIC = 6
= 6.26 = 6.3

Ls = 13.3 + 6.3 – 0.1 = 19.5

Li Ls [ Lri - Lrs> conteo f Xi Fi hi Hi


13.3 19.5 [13.25–19.55> III 3 16.4 3 3/25 3/25
19.6 25.5 [19.55-25.85> IIIIIIIII 9 22.7 12 9/25 12/25
25.9 32.1 [28.85-32.15> IIIIIII 7 29 19 7/25 19/25
32.2 38.4 [32.15-38.45> IIII 4 35.3 23 4/25 23/25
38.5 44.7 [38.45-44.75> I 1 41.6 24 1/25 24/25
44.8 51.0 [44.75-51.05> I 1 47.9 25 1/25 25/25

(3)(16.4)+(9)(22.7)+(7)(29)+(4)(35.3)+(1)(41.6)+(1)(47.9)
x= 25
= 27.48

25
mH = 3 9 7 4 1 1 = 25.53
+ + + + +
16.4 22.7 29 35.3 41.6 47.9

21
POLIGONO DE FRECUENCIA RELATIVA
0.4
0.35
0.3
0.25
0.2
0.15
0.1 POLIGONO DE
FRECUENCIA RELATIVA
0.05
0

POLIGONO DE FRECUENCIA
ABSOLUTA
10
8
6
4
2 POLIGONO DE
FRECUENCIA ABSOLUTA
0

22
OJIVA "MENOR QUE"
30

25

20

15
OJIVA "MENOR QUE"
10

0
13.25 19.55 28.85 32.15 38.45 44.75 51.05

4. R = 75.3 – 66.4 = 8.9

K = 1 + 3.3log 58 = 6.81 = 7
8.9
TIC = 7
= 1.27 = 1.3

Ls = 66.4 + 1.3 – 0.1 = 67.6

Li Ls [ Lri - Lrs> conteo f Xi Fi hi Hi


66.4 67.6 [66.35-67.65> I 1 67 1 1/58 1/58
67.7 68.9 [67.65-68.95> IIIIII 6 68.3 7 6/58 7/58
69 70.2 [68.95-70.25> IIIIIIIIIIIIIII 15 69.6 22 15/58 22/58
70.3 71.5 [70.25-71.55> IIIIIIIIIIIIIIIII 17 70.9 39 17/58 39/58
71.6 72.8 [71.55-72.85> IIIIIIIIIIII 12 72.2 51 12/58 51/58
72.9 74.1 [72.85-74.15> IIII 4 73.5 55 4/58 55/58
74.2 75.4 [74.15-75.45> III 3 74.8 58 3/58 58/58

(1)(67)+(6)(68.3)+(15)(69.6)+(17)(70.9)+(12)(72.2)+(4)(73.5)+(3)(74.8)
x= 58
= 57.39

23
58
mH = 1 6 15 17 12 4 3 = 70.8
+ + + + + +
67 68.3 69.6 70.9 72.2 73.5 74.8

POLIGONO DE FRECUENCIA RELATIVA


0.35
0.3
0.25
0.2
0.15
0.1 POLIGONO DE
0.05 FRECUENCIA RELATIVA

POLIGONO DE FRECUENCIA
ABSOLUTA
18
16
14
12
10
8
6
4 POLIGONO DE
2 FRECUENCIA ABSOLUTA
0

24
OJIVA "MENOR QUE"
70

60

50

40

30 OJIVA "MENOR QUE"

20

10

0
66.35 67.65 68.95 70.25 71.55 72.85 74.15 75.45

5.
[ Lri - Lrs> f Xi Fi hi Hi
[8-12> 36 10 36 0.30 0.30
[12-16> 18 14 54 0.15 0.45
[16-20> 45 18 99 0.375 0.825
[20-24> 21 22 120 0.175 1

(36)(10)+(18)(14)+(45)(18)+(21)(22)
x= 120
= 15.7

120
mH = 36 18 45 21= 14.38
+ + +
10 14 18 22

25
POLIGONO DE FRECUENCIA
ABSOLUTA
50

40

30
POLIGONO DE
20 FRECUENCIA ABSOLUTA

10

0
[8-12> [12-16> [16-20> [20-24>

OJIVA "MENOR QUE"


140

120

100

80

60 OJIVA "MENOR QUE"

40

20

0
8 12 16 20 24

6. Los datos indican el número de veces que trabajó una combi en el mes de abril 2018.

22 19 16 13 18 15 20 14 15 16
15 16 20 13 15 18 15 13 18 15

Construir la tabla de frecuencia:

R=Vmax-Vmin+1 = 10 Ls=Li+TIC-1

K=1+3,322Log(20)=5,32 =>5 Lri=Li-0,5

TIC= R/K = 10/5 =2 Lrs=Ls+0,5

26
[ Li - Ls] [Lri – Lrs> conteo fi Xi Fi hi Hi
[13 - 14] [12,5 – 14,5> llll 4 13,5 4 4/20 4/20
[15 - 16] [14,5 – 16,5> lllllllll 9 15,5 13 9/20 13/20
[17 - 18] [16,5 – 18,5> lll 3 17,5 16 3/20 16/20
[19 - 20] [18,5 – 20,5> lll 3 19,5 19 3/20 19/20
[21 - 22] [20,5 – 22,5> l 1 21,5 20 1/20 20/20
20 1

Histograma y poligono de frecuencias


10
9
8
7
6
5
4
3
2
1
0
13.5 15.5 17.5 19.5 21.5

Resolución de parcial
1.

Lri - Lrs f Xi Fi hi Hi
20 - 40 5 30 5 0,1 0,1
40 - 60 12 50 17 0,24 0,34
60 - 80 25 70 42 0,5 0,84
80 - 100 5 90 47 0,1 0,94
27
100 - 120 3 110 50 0,06 1

20(10−5) 20(20−17)
D2 = 40 + = 48,3 D4 = 60 + = 62,4
12 25

20(30−17 ) 20(40−17)
D6 = 60 + 25
= 70,4 D8 = 60 + 25
= 78,4

Media = 65,6

1er método abreviado

di=Xi - Ot f.di
-40 -200
-20 -240
0 0
20 100
40 120
-220

1 −220
Media = 𝑛 ∑ f. di + Ot = 50
+ 70 = 65,6

2do método abreviado

u = (Xi - Ot)/TIC f.u


-2 -10
-1 -12
0 0
1 5
2 6
-11

∑ f.u −11
Media = TIC 𝑛
+ Ot = 20 50 + 70 = 65,6

2.

Grupo I: 86 81 79 73 95 86 94 90 86 88

28
22
R = 95 – 73 = 22 ⇒ 5
= 4,4 Es más homogéneo.

Grupo II: 16 19 13 20 14 16 18 19 18 17

R = 20 – 13 = 7

3.

1er año 3% 3%(100) = 3 M = C + I = 100 + 3 = 103

2do año 5% 5%(103) = 5,15 M = C +I = 103 + 5.15 = 108,15

3er año 8% 8%(108,15) = 8,65 M = C + I = 108,15 + 8,65 = 116,8

4.

Recorren = 200 Km

1° 50 200/50

2° 45 200/45

3° 60 200/60

3(200)
XH = 200 200 200 = 50,9
+ +
50 45 60

5. Explicar:
 Estadística inferencial: Es el conjunto de métodos que posibilitan la generalización o toma de las decisiones en
base a una información parcial obtenida mediante técnicas descriptivas.
 Estadístico: Es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo
de estimar o inferir características de una población.
 Muestreo aleatorio: Es la técnica de muestreo en la que todos los elementos que forman el universo
y que, por lo tanto, están descritos en el marco muestral, tienen idéntica probabilidad de ser
seleccionados para la muestra.
 Medida de dispersión: Las medidas de dispersión son números reales no negativos, su valor es igual a
cero cuando los datos son iguales y este se incrementa a medida que los datos se vuelven más diversos.

Medidas de dispersión
1. Defina la estadística descriptiva y la estadística inferencial.

Estadística Descriptiva

La estadística descriptiva es el conjunto de métodos que implican la recolección, presentación y caracterización


de un conjunto de datos a fin de describir las diversas características de estas.

Estadística Inferencial

29
La estadística inferencial es el conjunto de métodos que posibilitan la generalización en base a una información
parcial obtenida mediante técnicas descripticas.

2. El distrito de Lima y el distrito de Breña seleccionó una muestra aleatoria de 21 clientes. En seguida aparecen
las sumas, redondeadas al dólar más próximo, que se cobraron a los clientes por el servicio de luz el mes
pasado:

54 48 58 50 25 47 75 46 60 70 67 68 39 35 56 66 33 62 65 67 70

a) ¿Construir el polígono?, ¿Calcule la media, la mediana y la moda? E indicar la medida más confiable de
posición central y su interpretación de acuerdo a las relaciones de las tres medidas de posición central
mediante una gráfica.

SOLUCION:

R = 75 - 25 + 1 = 51

K = 1 + 3.3ln 21 = 5, 36 = 6 Ex = 54 – 51 = 3
51
TIC = 6
= 8, 9 = 9 Ls = 25 + 9 – 1 = 33

Li Ls Lri - Lrs CONTEO f Xi Fi hi Hi


25 33 24,5 - 33,5 II 2 29  0,09 0,09
34 42 33,5 - 42,5 II 2 38 4 0,09 0,19
43 51 42,5 - 51,5 IIII 4 47 8 0,19 0,38
52 60 51,5 - 60,5 IIII 4 56 12 0,19 0,57
61 69 60,5 - 69,5 IIIIII 6 65 18 0,28 0,85
70 78 69,5 - 78,5 III 3 74 21 0,14 1

30
7

5
POLIGONO DE
4 FRECUENCIA
ABSOLUTA
3 Series2

0
20 29 38 47 56 65 74 83

Media

1158
𝑥̅ = ∑𝑚
𝑖=1 𝑓𝑖. 𝑥𝑖 = = 55, 14 “Es la medida más confiable de posición central”
21

Mediana
22−8
me = 51, 5 + 9 ( 4
) = 83

Moda
2
mo = 60, 5 + 9( ) = 64, 1
2+3

3. El director de relaciones humanas de la Empresa de transporte Ormeño inició un estudio de las horas de
trabajo extra en el departamento de inspección. Una muestra de 20 trabajadores reveló que estos laboraron
la siguiente cantidad de hora extra el mes pasado:

13 13 12 15 7 15 5 12 15 6 6 7 7 12 10 9 13 12 15 10

b) ¿Calcule medida de dispersión absoluta más confiable?, ¿Calcule el coeficiente de variabilidad e


interpretación?, ¿Halle la asimetría y curtosis de la distribución de frecuencia?

SOLUCION:

R = 15 - 5 + 1 = 11

K = 1 + 3.3ln 20 = 5, 2= 6 Ex = 12 – 11 = 1

11
TIC = 6
= 1, 8 = 2 Ls = 5 + 2 – 1 = 6

31
Li
Ls Lri - Lrs CONTEO f Xi Fi hi Hi
5 6 4,5 - 6,5 III 3 5,5 3 0,15 0,15
7 8 6,5 - 8,5 III 3 7,5 6 0,15 0,3
9 10 8,5 - 10,5 III 3 9,5 9 0,15 0,45
11 12 10,5 - 12,5 IIII 4 11,5 13 0,2 0,65
13 14 12,5 - 14,5 III 3 13,5 16 0,15 0,8
15 16 14,5 - 16,5 IIII 4 15,5 20 0,2 1

Media
216,9
𝑥̅ = ∑𝑚
𝑖=1 𝑓𝑖. 𝑥𝑖 = 20
= 10, 8 “Es la medida más confiable de posición central”

Mediana
10−9
me = 10, 5 + 2 ( 4
) = 11

Varianza

1 3(28)+3(10,8)+3(1,6)+4(0,4)+3(7,2)+4(22)
v(x) = ∑ 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2 = = 12, 23
𝑛−1 19

Desviación

S = √𝑣(𝑥) = √12,23 = 3, 49

Coeficiente de Variabilidad
𝑆 3,49
CV = x100% = x100% = 0, 32
𝑥̅ 10,8

32
4.5

3.5

3 POLIGONO DE
2.5 FRECUENCIA
ABSOLUTA
2
Series2
1.5

0.5

0
3.5 5.5 7.5 9.5 11.5 13.5 15.5 17.5

Coeficiente de Asimetría

3(𝑥̅ −𝑚𝑒) 3(10,8−11)


As = 𝑆
= 3,49
= -0, 17 2 “curva asimétrica ( - ) sesgada a la izquierda”

CURVA ASIMETRICA ( - ) SESGADA A


LA IZQUIERDA
4.5
4
3.5
3
2.5 CURVA ASIMETRICA ( -
2 ) SESGADA A LA
1.5 IZQUIERDA
1
0.5
0
0 5 10 15 20

Coeficiente de Curtosis
Q3−Q1
Kp = 2(P90 − P10)

Q1 = 7, 8 Q3 = 13, 8

33
P10 = 5, 8 P90 = 15, 5

13,8−7,8
Kp = 2(15,5−5,8)
= 0, 3 “Leptocúrtico”

LEPTOCÚRTICO
4.5
4
3.5
3
2.5
2 LEPTOCÚRTICO
1.5
1
0.5
0
0 5 10 15 20

4. La empresa Ford emplea a 10 vendedores. El número de automóviles nuevos vendidos el mes pasado por los
respectivos fueron:

15 23 4 19 18 10 10 8 28 19

c) ¿Halle la media, mediana, moda, desviación y CV?

SOLUCION:

R = 28 - 4 + 1 = 25

K = 1 + 3.3ln 20 = 4, 3= 5 Ex = 25 – 25 = 0
25
TIC = 5
=5 Ls = 4 + 5 – 1 = 8

Li Ls Lri - Lrs CONTEO f Xi Fi hi Hi (𝑋𝑖 − 𝑥̅ )2


4 8 3,5 - 8,5 II 2 6 2 0,2 0,2 90,25
34
9 13 8,5 - 13,5 II 2 11 4 0,2 0,4 20,25
14 18 13,5 - 18,5 II 2 16 6 0,2 0,6 0,25
19 23 18,5 - 23,5 III 3 21 9 0,3 0,9 30,25
24 28 23,5 - 28,5 I 1 26 10 0,1 1 110,25

Media
155
𝑥̅ = ∑𝑚
𝑖=1 𝑓𝑖. 𝑥𝑖 = 10
= 15, 5 “Es la medida más confiable de posición central”

Mediana
5−4
me = 13, 5 + 5 ( 2
) = 16

Moda
1
mo = 18, 5 + 5 (1+2) = 20, 16

Varianza

1 2(90,25)+3(20.25)+2(0,25)+3(30,25)+1(110,25)
v(x) = ∑ 𝑛−1 𝑓𝑖(𝑥𝑖 − 𝑥̅ )2 = 9
= 46, 9

Desviación

S = √𝑣(𝑥) = √46,9 = 6, 8

Coeficiente de Variabilidad
𝑆 6,8
CV = 𝑥̅ x100% = 15,5x100% = 0, 43

Análisis de regresión y correlación

1. En una fábrica de cierta marca de refrescos ha tomado al azar 10 semanas al año, observando
la temperatura media correspondiente (en grados centígrados) a cada una de ellas y la
cantidad de refrescos pedidos durante cada uno de dichos periodos. La información obtenida
es la siguiente:
Tmedia 10 28 12 31 30 19 24 5 9 15
cantidad de refrescos 21 65 19 72 75 39 67 11 12 24

35
DIAGRAMA DE DISPERSIÓN
80
70
60
50
40 DIAGRAMA DE
DISPERSIÓN
30
20
10
0
5 9 10 12 15 19 24 28 30 31

x y x.y X2 Y2
10 21 210 100 441
28 65 1820 784 4225
12 19 228 144 361
31 72 2232 961 5184
30 75 2250 900 5625
19 39 741 361 1521
24 67 1608 576 4489
5 11 55 25 121
9 12 108 81 144
15 24 360 225 576
183 405 9612 4157 22687

𝑛 ∑ 𝑥𝑦−∑ 𝑥 ∑ 𝑦 10(9612)−(183)(405)
 b= 2 = 10(4157)−(183)2
= 2.723
𝑛 ∑ 𝑥 2 −∑ 𝑥

183
𝑥̅ = = 18.3
10

405
𝑦̅ = = 40.5
10

𝑦̅ = a + b𝑥̅
40.5 = a + (2.723).(18.3) ⇒ a = -9.3

y =-9.3 +2.7x

𝑐𝑜𝑣(𝑥,𝑦)
 r= 𝑆𝑥.𝑆𝑦
36
∑ 𝑥.𝑦 9612
Cov(x,y) = 𝑛
- 𝑥̅ . 𝑦̅ = 10
− (18.3)(40.5) = 220.05

∑ 𝑥1 4157
(Sx)2 = 𝑛
- 𝑥̅ 2 = 10
– (18.3)2 = 80.8 ⇒Sx = 8.9

∑ 𝑦2 22687
(Sy)2 = 𝑛
- 𝑦̅ 2 = 10
– (40.5)2 = 628.4 ⇒Sy = 25

220.05
r = (8.9).(25) = 0.98

∑ 𝑦 2 +𝑎 ∑ 𝑦−𝑏 ∑ 𝑥𝑦
 Se = √ 𝑛−2
= 7.91

2. Los siguientes datos son la inversión neta (y) y la tasa de interés (x).

x 2,5 3 4 5 5,5 6 7
y 12,5 10 7 4,5 4 3 3,5

DIAGRAMA DE DISPERSIÓN
14

12

10

8
DIAGRAMA DE
6 DISPERSIÓN
4

0
12.5 10 7 4.5 4 3 3.5

X Y log 𝑥 log 𝑦 log 𝑥. log 𝑦 log 𝑥 2 log 𝑦 2


37
2,5 12,5 0,39794001 1,09691001 0,43650438 0,15835625 1,20321158
3 10 0,47712125 1 0,47712125 0,22764469 1
4 7 0,60205999 0,84509804 0,50879972 0,36247623 0,7141907
5 4,5 0,69897 0,65321251 0,45657595 0,48855907 0,42668659
5,5 4 0,74036269 0,60205999 0,44574275 0,54813691 0,36247623
6 3 0,77815125 0,47712125 0,3712725 0,60551937 0,22764469
7 3,5 0,84509804 0,54406804 0,45979084 0,7141907 0,29601004
4,53970324 5,21846986 3,1558074 3,10488322 4,23021982

𝑛 ∑ 𝑥𝑦−∑ 𝑥 ∑ 𝑦 7(3.1558)−(4.5397)(5.2185)
 b= 2 = 7(3.1049)−(4.5397)2
= -1.421
𝑛 ∑ 𝑥 2 −∑ 𝑥

log 𝑦 = log 𝑎 + b. log 𝑥

∑ log 𝑥 ∑ log 𝑦
𝑦̅ = log 𝑎 + b𝑥̅ 𝑥̅ = 𝑛
= 0.648 , 𝑦̅ = 𝑛
= 0.745

0.745 = log 𝑎 + (-1.421).(0.648)

log 𝑎 = 1.665 ⇒ a = 101.665 = 46.496

y = 46.496x-1.421

𝑐𝑜𝑣(𝑥,𝑦)
 r=
𝑆𝑥.𝑆𝑦

∑ 𝑥.𝑦 3.1558
Cov(x,y) = 𝑛
- 𝑥̅ . 𝑦̅ = 7
− (0.648)(0.745) = -0.031

∑ 𝑥2 3.1049
(Sx)2 = 𝑛
- 𝑥̅ 2 = 7
– (0.648)2 = 0.023 ⇒Sx = 0.151

∑ 𝑦2 4.2302
(Sy)2 = 𝑛
- 𝑦̅ 2 = 7
– (0.745)2 = 0.049 ⇒Sy = 0.221

−0.031
r = (0.151).(0.221) = -0.92

∑ 𝑦 2 +𝑎 ∑ 𝑦−𝑏 ∑ 𝑥𝑦
 Se = √ 𝑛−2
=7

3. El volumen de ventas mensuales (y) en miles de dólares y los años de experiencia en ventas (x)
registradas de una muestra aleatoria de 6 vendedores de la empresa PREVENTSA es la siguiente:

38
x 1 2 3 4 5 6
y 10 40 120 300 800 500

DIAGRANA DE DISPERSIÓN
900
800
700
600
500
DIAGRANA DE
400 DISPERSIÓN
300
200
100
0
1 2 3 4 5 6

x y ln 𝑦 x. ln 𝑦 X2 ln 𝑦 2
1 10 2,30963263 2,30963263 1 5,33440286
2 40 3,70017002 7,40034005 4 13,6912582
3 120 4,80214484 14,4064345 9 23,0605951
4 300 5,72124007 22,8849603 16 32,7325879
5 800 6,70507135 33,5253567 25 44,9579818
6 500 6,23362918 37,4017751 36 38,8581327
21 1770 29,4718881 117,928499 91 158,634959

𝑛 ∑ 𝑥𝑦−∑ 𝑥 ∑ 𝑦 6(117.569)−(29.382)
 b= 2 = 6(91)−(21)2
= 0.84
𝑛 ∑ 𝑥 2 −∑ 𝑥

ln 𝑦 = log 𝑎 + x. log 𝑏

∑𝑥 ∑ ln 𝑦
𝑥̅ = 𝑛
= 3.5 , 𝑦̅ = 𝑛
= 4.89

4.89 = log 𝑎 + (3.5).(0.84)

ln 𝑎= 1.95 ⇒ a = e1.95 = 7.03

y = (7.03).(0.84)x

39
𝑐𝑜𝑣(𝑥,𝑦)
 r= 𝑆𝑥.𝑆𝑦

∑ 𝑥 ln 𝑦 117.569
Cov(x,y) = - 𝑥̅ . 𝑦̅ = − (3.5)(4.89) = 2.479
𝑛 6

∑ 𝑥2 91
(Sx)2 = 𝑛
- 𝑥̅ 2 = 6
– (3.5)2 = 2.916 ⇒Sx = 1.707

∑ ln 𝑦 2 158.634
(Sy)2 = 𝑛
- 𝑦̅ 2 = 6
– (4.89)2 = 2.526 ⇒Sy = 1.589

2.479
r = (1.707).(1.589) = 0.91

∑ 𝑦 2 +𝑎 ∑ 𝑦−𝑏 ∑ 𝑥𝑦
 Se = √ = 8.16
𝑛−2

Bibliografía:

 Rufino Moya Calderón.

Ecuación Normal para regresión Múltiple

1. Hallar el coeficiente de correlación múltiple y el error estándar.

X1 0 2 2,5 1 4 7
X2 0 1 2 3 6 2
Y 5 10 9 0 3 27

Solución

X1 X2 Y X1. X2 X1.Y X2.Y X12 X22 𝑌2


0 0 5 0 0 0 0 0 25
2 1 10 2 20 10 4 1 100
2,5 2 9 5 22,5 18 6,25 4 81
1 3 0 3 0 0 1 9 0
4 6 3 24 12 18 16 36 9
7 2 27 14 189 54 49 4 729
16,5 14 54 48 243,5 100 76,25 54 944

40
6𝑏0 + 16.52𝑏1 + 14𝑏2 = 54
{16.5𝑏0 + 76.25𝑏1 + 54𝑏2 = 243.5
14𝑏0 + 48𝑏1 + 54𝑏2 = 100

6 16.5 14 54 16.5 14
S = |16.5 76.25 48| = 3852.7 b0 = |243.5 76.25 48| = 17052.5
14 48 54 100 48 54

6 54 14 6 16.5 54
b1 = |16.5 243.5 48| = 13642 b2 = |16.5 76.25 243.5| = -10231.5
14 100 54 14 48 100

b0 17052.5 b1 13642 b2 −10231.5


b0 = S
= 3852.7
= 4.4 b1 = S
= 3852.7 = 3.5 b0 = S
= 3852.7
= -2.6

y = 4.4
𝑦̂ = 4.4 + 3.5x + 3.5x
1 – 2.6x – 2.6x2 + Se
2 +1 Se

944 −(4.4).(54)−(3.5).(243.5)−(−2.6).(100)
Se = √ 3
= 6.16

2. Hallar el coeficiente de correlación múltiple y el error estándar.

X1 1 2 3 4
X2 5 0 5 2
Y 18 10 15 19
Solución

X1 X2 Y X1. X2 X1.Y X2.Y X12 X22 𝑌 2


1 5 18 5 18 90 1 25 324
2 0 10 0 20 0 4 0 100
3 5 15 15 45 75 9 25 225
4 2 19 8 76 38 16 4 361
10 12 62 28 159 203 30 54 1010

4𝑏0 + 10𝑏1 + 12𝑏2 = 62


{10𝑏0 + 30𝑏1 + 28𝑏2 = 159
12𝑏0 + 28𝑏1 + 54𝑏2 = 203

4 10 12 62 10 12
S = | 10 30 28 | = 344 b0 = | 159 30 28 | = 3156
12 28 54 203 28 54

41
4 62 12 4 10 62
b1 = | 10 159 28 | = 424 b2 = | 10 30 159 | = 372
12 203 54 12 28 203
b0 3156 b1 424 b2 372
b0 = S
= 344
= 9.17 b1 = S
= 344 = 1.23 b2 = S
= 344 = 1.08

y𝑦̂= 4.4 + 3.5x


= 9.17 1 – 2.6x
+ 1.23x 1 + 21.08x2 + Se

(62)2 −(9.17).(62)−(1.23).(159)−(1.08).(203)
Se = √ = 53.48
1

3. Hallar el coeficiente de regresión múltiple y el error estándar.

X1 2,1 1,1 0,9 1,6 6,2


X2 3 4 5 4 4
Y 0,43 0,31 0,32 0,46 1,25

Solución

X1 X2 Y X1. X2 X1.Y X2.Y X12 X22 𝑌2


2,1 3 0,43 6,3 0,90 1,29 4,41 9 0,18
1,1 4 0,31 4,4 0,34 1,24 1,21 16 0,10
0,9 5 0,32 4,5 0,29 1,6 0,81 25 0,10
1,6 4 0,46 6,4 0,74 1,84 2,56 16 0,21
6,2 4 1,25 24,8 7,75 5 38,44 16 1,56
11,9 20 2,77 46,4 10,02 10,97 47,43 82 2,16

5𝑏0 + 11.9𝑏1 + 20𝑏2 = 2.77


{11.9𝑏0 + 47.43𝑏1 + 46.4𝑏2 = 10.02
20𝑏0 + 46.4𝑏1 + 82𝑏2 = 10.97
5 11.9 20 2.77 11.9 20
S = |11.9 47.43 46.4| = 201.8 b0 = |10.02 47.43 46.4| = -18.3
20 46.4 82 10.97 46.4 82

5 2.77 20 5 11.9 2.77


b1 = |11.9 10.02 46.4| = 33.6 b2 = |11.9 47.43 10.02| = 10
20 10.97 82 20 46.4 10.97
b0 −18.3 b1 33.6 b2 10
b0 = S
= 201.8 = -0.09 b1 = = 201.8 = 0.16
S
b2 = S
= 201.8 = 0.04
42
𝑦̂ = -0.09 + 0.16x1 + 0.04x2 + Se
(2.77)2 −(−0.09).(2.77)−(0.16).(10.02)−(0.04).(10.97)
Se = √ 2
= 1.71

4. Hallar el coeficiente de regresión múltiple y el error estándar.

X1 -10 0 10 -10 0 10
X2 0 -5 5 0 5 -5
Y 11 8 73 21 46 30

Solución

X1 X2 Y X1. X2 X1.Y X2.Y X12 X22 𝑌2


-10 0 11 0 0 0 100 0 121
0 -5 8 0 80 -40 0 25 64
10 5 73 50 -730 365 100 25 5329
-10 0 21 0 0 0 100 0 441
0 5 46 0 460 230 0 25 2116
10 -5 30 -50 0 -150 100 25 900
0 0 189 0 -190 405 400 100 8971

6𝑏0 + 0𝑏1 + 0𝑏2 = 189


{0𝑏0 + 400𝑏1 + 0𝑏2 = −190
0𝑏0 + 0𝑏1 + 100𝑏2 = 405
6 0 0 189 0 0
S = | 0 400 0 | = 240000 b0 = | −190 400 0 | = 7560000
0 0 100 405 0 100

6 189 0 6 0 189
b1 = | 0 − 190 0 | = 114000 b2 = |0 400 − 190| = 972000
0 405 100 0 0 405
b0 7560000 b1 114000 b2 972000
b0 = S
= 240000
= 31.5 b1 = S
= 240000 = 0.47 b2 = S
= 240000 = 4.05

𝑦̂ = 31.5 + 0.47x1 + 4.05x2 + Se


43
(189)2 −(31.5).(189)−(0.47).(−190)−(4.05).(405)
Se = √ 3
= 96.98

5. Hallar el coeficiente de regresión múltiple y el error estándar.

X1 0,3 1,5 0,7 1,1


X2 4 9 6 7,5
Y 1,3 3,5 2,8 3

Solución

X1 X2 Y X1. X2 X1.Y X2.Y X12 X22 𝑌2


0,3 4 1,3 1,2 0,39 5,2 0,09 16 1,69
1,5 9 3,5 13,5 5,25 31,5 2,25 81 12,3
0,7 6 2,8 4,2 1,96 16,8 0,49 36 7,84
1,1 7,5 3 8,25 3,3 22,5 1,21 56 9
3,6 26,5 10,6 27,15 10,9 76 4,04 189 30,8

4𝑏0 + 3.6𝑏1 + 26.5𝑏2 = 10.6


{3.6𝑏0 + 4.04𝑏1 + 27.15𝑏2 = 10.9
26.5𝑏0 + 27.15𝑏1 + 189𝑏2 = 76
4 3.6 26.5 10.6 3.6 26.5
S = | 3.6 4.04 27.15 | = -0.56 b0 = |10.9 4.04 27.15| = -2.16
26.5 27.15 189 76 27.15 189

4 10.6 26.5 4 3.6 10.6


b1 = |3.6 10.9 27.15| = -3.13 b2 = | 3.6 4.04 10.9 | = 0.52
26.5 76 189 26.5 27.15 76
b0 −2.16 b1 −3.13 b2 0.52
b0 = S
= −0.56 = 3.8 b1 = S
= −0.56 = 5.5 b2 = S
= −0.56 = -0.9

𝑦̂ = 3.8 – 5.5x1 – 0.9x2 + Se

44
(10.9)2 −(3.8).(10.9)−(5.5).(10.9)−(−0.9).(76)
Se = √ 1
= 9.26

Series de tiempo

1. Marcos el gerente de ventas, el responsable por la división de una gran campaña de consumos ha
reunido :

AÑOS VENTAS UNIDADES X100 XY


1 2014 30 1 30 900
2 2015 40 4 80 1600
3 2016 20 9 60 400
4 2017 60 16 240 3600
5 2018 50 25 250 2500
Σ=200 Σ=55 Σ=600 Σ=9000

𝐱̅ = 𝟑 , 𝐲̅ = 40

𝑛𝛴𝑥𝑦 − ∑𝑥𝛴𝑦
𝑏=
𝑛𝛴𝑥 2 − ∑(𝑥)2
𝑏 = 5(660) − 15(200) /5(55)-225
𝑏=6
𝑎 = 𝑦̅− 𝑏𝑥
a=40-6(3)
a=22

45
por lo tanto:

y= a + bx

 X=1 . X=3 X=5


 Y=28 Y=58 Y=70
 X=2 X=4
 Y=34 Y=64

2: una constructora ha terminado estos números de casas en 8 años :

AÑO TERMINACIONES x^2 XY


1 1982 12 1 12
2 1983 11 4 22
3 1984 19 9 57
4 1985 17 16 68
5 1986 19 25 95
6 1987 18 36 108
7 1988 20 49 140
8 1989 23 64 512
36 139 204 1014

TENDENCIA SEGULAR
160
140
120
TERMINACIONES

100
80
46
60
40 23
19 17 19 18 20
12
y ̅=17.38
x ̅=4.5
b=8(1014)-
36(139)/8(204)-
1296
a= 17.38-(9.25)4.5
b= 9.25 a=-24.25

Por lo tanto :
y=a+bx
cuando:
x=1 y=-15 x=8 y=49.75
x=2 y=-5.75
x=3 y=3.5
x=4 y=12.75
x=5 y=22
x=6 y=31.25
x=7 y=40.5

47
3) El volumen de envíos de maquinaria agrícola al mercado nacional desde 1983
hasta 1989(en millones de soles) viene dado por la tabla siguiente:

Años envíos x^2 xy


1 1983 106 1 106
2 1984 92 4 184
3 1985 95 9 285
4 1986 103 16 412
5 1987 107 25 535
6 1988 98 36 216
7 1989 92 49 343
28 693 140 2081

b=7(2081)-28(693)/7(140)-784
b=-24,7 a=99-(-24,7)4

48
a=197.8

Por lo tanto :
y=a+bx
para : x=1 y=173.1
x=2 y=148.4
x=3 y=123.7
x=4 y=99
x=5 y=74.3
x=6 y=49.6
x=7 y=24.9

49
4: Los gastos de una dependencia publica ( en miles de soles ) son:

gastos en
meses x dolares (y) x^2 xy
enero 1 75 1 75
febrero 2 79 4 158
marzo 3 74 9 222
abril 4 81 16 324
mayo 5 77 25 385
junio 6 82 36 492
julio 7 80 49 560
28 548 140 2216

b=7(2216)-28(548)/7(140)-784
b=7(2216)-28(548)/7(140)-784 a=4-0.9(78.3)

50
b=0.9 a=-66.5

POR LO TANTO
Y=A+BX
ENTONCES
X=1 Y=-65.6
X=2 Y=-132.1
X=3 Y=-198.6
X=4 Y=-265.1
X=5 Y=-331.6
X=6 Y=-398.1
X=7 Y=-464.6

51
TENDENCIA SIGULAR
82

81

80

79

77

75

74

1 2 3 gastos en 4dolares (y) 5 6 7

5:El auditor del sistema educativo público ha estudiado los registros del inventario
averiguar si el inventario actual de libros de texto es típico. Las siguientes existencias
corresponden a los 5 años precedentes.

inventarios
años x ($1000) x^2 xy
2000 1 4620 1 4620
2001 2 4910 4 9820
2002 3 5490 9 16470
2003 4 5730 16 22920
2004 5 5990 25 29950
15 26740 55 83780

52
b=5(83780)-15(26740)/5(55)-225
b=195.6 a=5348-195.6(3)
a=4761.2

7000
tendencia sigular
6000 5990
5730
5490
5000 4910
4620
inventario

4000

3000

2000

1000

0
1 2 3 4 5
años

53
Probabilidades

1-Si yo tengo una canasta llena de peras y manzanas, de las cuales hay 20 peras y 10 manzanas. ¿Qué
fruta es más probable que saque al azar de la canasta?

Para este ejemplo tenemos que 30 es el total de frutas en la canasta; es decir los casos posibles. Para
calcular la probabilidad de sacar una manzana mis casos favorables son 10 puesto que existen sólo 10
manzanas. Así, aplicando la fórmula obtenemos que:

P(Manzana)=10/30=1/3= 33.3% probable

Calculando igual, la probabilidad de sacar pera es:

P(Pera)=20/30=2/3= 66.7% probable

Como 66.7 es mayor que 33.3 es más probable que saque una pera, pues hay más peras que manzanas
en la canasta.

2-En una sala de clases hay 20 mujeres y 12 hombres. Si se escoge uno de ellos al azar. ¿Cuál es la
probabilidad de que la persona escogida sea hombre?
Solución:
Por definición, la probabilidad de que un suceso ocurra viene dada por:
P=casos favorables/casos totales o posibles (P).
En particular, hay 12 hombres, por lo tanto son 12 los casos favorables a dicha selección. Pero ella se
hará de un total de 20 + 12 = 32 personas sumamos la cantidad de mujeres y hombres que forman parte
de la selección y por tanto, los casos posibles o totales.
Así, la probabilidad pedida es
P= 12/32

3-En una comida hay 28 hombres y 32 mujeres. Han comido carne 16 hombres y 20 mujeres, comiendo
pescado el resto. Si se elige una de las personas al azar. ¿Cuál es la probabilidad de que la persona
escogida sea hombre?
Solución:
La información sobre lo que come cada una de las personas es insustancial. Pues en lo que solicita no hay
relación con ello. Por definición, la probabilidad pedida viene dada por:
P= casos favorables a la selección 28/casos totales de la muestra 60
P= 28/60

4-En un curso de 30 alumnos 18 son mujeres. ¿Cuál es la probabilidad de que al escoger una persona
está no sea mujer?
Solución:
54
Claramente nos piden la probabilidad de que al escoger una persona, esta sea hombre. Pues bien, si de
los 30 alumnos, 18 son mujeres, entonces hay 12 hombres. Luego, la probabilidad pedida es:
P=casos favorables a la selección 12/casos totales de la muestra 30
P=12/60

5-¿Cuál es la probabilidad de ganar en una rifa de 1000 números en total, si se compran los 3 centésimos
de tal cantidad?
Solución:
3 Centésimos equivalen al 3%. Y la probabilidad asociada a tal porcentaje es 3/100.
P= 3/100

6-La probabilidad de que al sacar una carta al azar de un naipe inglés (52 cartas), ella sea un as es:
Solución:
Los casos favorables a obtener un as son 4.
Los casos totales o posibles de extraer son 52 (puede salir cualquier carta).
Por lo tanto, la probabilidad pedida es:
P=4/52
P=1/13

7-En un jardín infantil hay 8 morenos y 12 morenas así como 7 rubios y 5 rubias. Si se elige un integrante
al azar, la probabilidad de que sea rubio o rubia es:
Solución:
Hay un total de 32 niños. Los rubios o rubias suman 12. Por lo tanto, la probabilidad pedida es:
P=casos favorables (rubios o rubias)/ total de niños
P=(7 + 5)/(8 +12 +7 + 5)
P=12/32 8
P=3/8

8-Al lanzar al aire tres veces una moneda, la probabilidad de que en el primer lanzamiento se obtenga
sello es:
Solución:
No importa lo que ocurra en los dos últimos lanzamientos. Es sólo considerar la probabilidad de que en el
primer lanzamiento se obtenga sello. Por lo tanto, la probabilidad pedida es:
P=cantidad de resultado(s) favorable(s) / cantidad resultados posibles
P=1/2

9-Se lanzó un dado honesto –no cargado- dos veces, obteniéndose 4 en ambas oportunidades. ¿Cuál es
la probabilidad de que en un tercer lanzamiento se obtenga nuevamente 4?
Solución:
Los dos lanzamientos previos ya no son de interés, dado que se tiene certeza de sus resultados. Solo nos
interesa a partir de ello la probabilidad de que en un lanzamiento se obtenga 4. Como hay seis resultados
posibles y uno solo favorable, la probabilidad pedida es:
P= cantidad de resultado(s) favorable(s) /cantidad resultados posibles
P=1/6

10-Una persona tira tres veces una moneda y las tres veces obtiene cara. ¿Cuál es la probabilidad de que
la cuarta vez obtenga sello?
Solución:

55
Los tres primeros lanzamientos ya no son de interés, dado que se tiene certeza de sus resultados. Solo
nos interesa a partir de ello la probabilidad de que en un solo lanzamiento se obtenga sello. Como hay
dos resultados posibles y uno solo favorable, la probabilidad pedida es: 1/2

56
57

Вам также может понравиться