Академический Документы
Профессиональный Документы
Культура Документы
MÓDULO DE APRENDIZAJE
UNIDAD ACADÉMICA DE ESTUDIOS GENERALES
ESTADÍSTICA
Autores:
Mg. Agustina Ramírez Torres Mg. Gonzalo Juan Fernández Romero
Mg. Dina Ñuflo Valdivia
Lima – Perú
2019
Módulo de Aprendizaje
Estadística
Unidad Académica de Estudios Generales
Mg. Jorge Antonio Gonzales Miranda
Coordinadora
Mg. Agustina Ramírez Torres
Autores:
Mg. Agustina Ramírez Torres
Mg. Gonzalo Juan Fernández Romero Mg. Dina Ñuflo Valdivia
Corrección de estilo:
Lic. Aram Roosell Simangas Villalobos
Población de estudio Todos los clientes que visitaron la tienda del importador en diciembre 2018
Muestra Los 85 clientes que visitaron la tienda del importador en diciembre 2018
Unidad de estudio Cada cliente que visitó la tienda del importador en diciembre 2018
18
27
37
41
41
43
52
56
59
66
69
71
73
nes gubernamentales, educativas, empresarial, ingenierías,
tadística es que el estudiante adquiera la competencia para aplicar las
udio.
iciembre 2018
embre 2018
e 2018
Valores (datos)
1 año
5 años
Masculino
Femenino
Mala
Regular
Buena
0, 1, 2, 12,….
1.3. Preguntas de aplicación
Problema 01:
El gerente de la Administradora de Fondos de Privado de Pensiones de Jubilación SECURITEX S.A (AFP), sabe que cuentan con una ca
asegurados. Ante la aprobación de nuevas leyes por el estado, es necesario realizar un estudio sobre algunas características
fidelizar a sus afiliados y no retiren sus fondos ante nuevas políticas de inversión. Para el estudio, se seleccionó una muestra repres
para aplicarles una encuesta, y algunas de las variables consideradas fueron el número de miembros por afiliado, el tipo de segu
seguro, edad, sexo, satisfacción por la inversión de sus fondos y grado de instrucción. De acuerdo al texto contestar el siguie
1. Se pide identificar los conceptos estadísticos relacionando las frases y colocando la letra que corresponda.
( ) Variable a) Del total de afiliados, el número promedio de miembros por familia de cada afiliado es de 5
miembros.
( ) Parámetro b) De los 654 afiliados seleccionados para el estudio, el 25% cuenta con un seguro de vida.
( ) Muestra c) Se observó que el Sr. Pérez, uno de los 654 clientes elegidos, tiene grado de instrucción superior.
1 35 M 3 Salud 60 Superior Si
2 24 F 1 Vida 54 Superior No
3 42 F 1 Salud 55 Secundaria Si
: : : : : : : :
: : : : : : : :
De la matriz de datos se pide clasificar las variables según su naturaleza y escala de medición.
RITEX S.A (AFP), sabe que cuentan con una cartera de 985 537
izar un estudio sobre algunas características importantes para
ra el estudio, se seleccionó una muestra representativa de 654 clientes
úmero de miembros por afiliado, el tipo de seguro, pago mensual del
ucción. De acuerdo al texto contestar el siguiente cuestionario.
ndo la letra que corresponda.
de la AFP, el gerente
ión de todos los asegurados que
encuesta.
Insatisfecho
Muy satisfecho
Poco satisfecho
Poco satisfecho
Insatisfecho
escala de medición.
Variable Tipo de variable Escala de medición
Problema 02:
Clasifica las variables según su naturaleza y escala de medición en las casillas que están en blanco.
Nº Variable Tipo de variable Escala de Valores (Ej. Datos)
medida
1 Edad de los congresistas
Población de estudio
Muestra
Unidad de estudio
Estadístico
medición
.
Valores (Ej. Datos)
Problema 04:
Un grupo de investigadores tienen el propósito de conocer cuáles son las condiciones socioeconómicas de las familias resident
Ventanilla. Para el estudio se ha determinado entrevistar a 300 familias elegidas aleatoriamente. La encuesta se realizó e
distrito y algunas características estudiadas son:
Tamaño familiar:Número de miembros en la familia Ingresos:Ingreso familiar mensual
Estudios:Grado de instrucción alcanzado por el jefe de familia
Vivienda:Tipo de material de la vivienda (Prefabricado, material noble, Quincha)
a. Complete las casillas en blanco identificando en enunciado del problema lo siguiente:
Población de estudio
Muestra
Unidad de Estudio
b. Determine y clasifique las variables según su naturaleza y escala de medición
Variable Tipo de variable Escala de medida Valores
Problema 05:
Bendezú Vilma y Chirinos Claudia realizaron una investigación en 76 adolescentes embarazadas nuevas y continuadoras de 13
determinar las características sociodemográficas, culturales y familiares de adolescentes embarazadas atendidas en los co
Gineco-Obstetricia del Hospital Daniel Alcides Carrión del Callao en los meses de enero a marzo del 2015. Entre a
muestran que el 40.9% tuvo 16 años de edad, el 80.3% no asistieron a ningún programa de educación sexual y planificac
inicio de relaciones sexuales del 60.5% fue a los 15 años de edad, el 68.4% mencionan que sus padres no le prestan atención y
sufrido violenciapor parte de sus padres.
a. Identifica los conceptos estadísticos y relaciona las frases colocando la letra que corresponda
Valores
obstetricia durante el
e educación sexual y
o- obstetricia,68.4%
( ) Unidad de
estudio
( ) Dato
( ) Estadístico
1.4 Bibliografía
1. Ávila, RB. (2010). Estadística Elemental. Lima: Estudios y ediciones R.A.
2. Córdova, M. (2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.). Lima: Moshera.
3. Newbold, P., Carlson, WL.,Tghorne, B. (2008). Estadística para Administración y Economía. (6ª ed.). España:Edit. Pearson Educación
4. Black, K. (2008). Estadística en los negocios. (2ª ed.). México: Grupo Editorial Patria S.A.
Tema 2 ElMuestreo
2.1 Competencia a desarrollar
Determina el tipo de muestreo en la selección de muestras probabilísticas y no probabilísticas que se debe aplicar en un estudio.
2.2 Contenido del tema 2
Cuando una población de estudio no se puede estudiar todas las unidades, ya sea por la gran cantidad de unidades o por el costo que implic
seleccionar una muestra representativa utilizando un método de selección llamado muestreo.
Muestreo
Es el proceso de seleccionar los individuos o elementos (unidades de estudio) que conformarán la muestra representativa de una d
estudio con el propósito de hacer inferencias. Esta selección se hace utilizando un muestreo probabilístico o no probabilístico según el dise
Tipos de muestreo
Muestreo probabilístico
Son métodos probabilísticos que se basan en el principio que cada unidad de estudio de la población tenga igual probabilidad de ser selecc
asegurar la representatividad de la muestra extraída, de tal modo que sea útil para hacer inferencias sobre dicha población. Esto
probabilísticos puede realizarse de forma manual o mediante software y son: Muestreo aleatorio simple, muestreo sistemático, mue
muestreo por conglomerados.
Muestreo no probabilístico
Es útil para estudios exploratorios y cuando el muestreo probabilístico es muy costoso. La muestra extraída no da certeza de representati
todos los sujetos de la población tienen la misma probabilidad de ser elegidos. Por lo general, la selección de las unidades de la muestra se
criterios del investigador, procurando en la medida de lo posible que sea representativa. Entre los métodos de muestreo no probabi
Accidental, por selección de criterio, por cuotas y bola de nieve.
Ejemplo 2
Un candidato a la alcaldía de cierto distrito, solicita los servicios de una encuestadora para que realicen un estudio con la fin
gasto promedio mensual en alimentación en las familias de su comuna. El responsable del estudio ha seleccionado aleatoriament
residentes en el distrito; los resultados revelan que las familias en promedio gastan en alimentación 650 soles mensuales. Determ
muestra, muestreo, unidad de estudio, variables, estadístico y parámetro:
Solución
Población de estudio: Todas las familias que son residentes del distrito Unidad de estudio: Cada una de las familias que vive en el distrito M
residentes del distrito
Variable de estudio: Gasto mensual en alimentación Tipo de variable: Cuantitativa continua
Escala de medición: Razón Muestreo: Aleatorio sistemático
Estadístico: Gasto promedio en alimentación de las 200 familias es 650 soles.
Parámetro: Gasto promedio estimado en alimentación de las familias del distrito es de 650 soles.
1.3 Preguntas de aplicación Problema 01:
El departamento de control de calidad de ANCORP S.A. ante las quejas de sus clientes, decide investigar si sus productos cumplen con las e
exacto en el etiquetado de bolsas de arroz
superior de 5kg. Para comprobar la sospecha, selecciona al azar 5 bolsas de un lote de producción
El departamento de control de calidad de ANCORP S.A. ante las quejas de sus clientes, decide investigar si sus productos cumplen con las e
exacto en el etiquetado de bolsas de arroz
superior de 5kg. Para comprobar la sospecha, selecciona al azar 5 bolsas de un lote de producción
durante 3 semanas consecutivas y registra su peso luego de ser pesadas en una balanza calibrada. Si se
comprueba la veracidad de la sospecha la máquina de llenado debe ser regulada. Los resultados revelan que el peso medio fue
determinar:
j) En el periodo de estudio se atendió a 132 adolescentes embarazadas.
estreo
tencia a desarrollar
tipo de muestreo en la selección de muestras probabilísticas y no probabilísticas que se debe aplicar en un estudio.
nido del tema 2
oblación de estudio no se puede estudiar todas las unidades, ya sea por la gran cantidad de unidades o por el costo que implica la investigación, se debe
na muestra representativa utilizando un método de selección llamado muestreo.
o de seleccionar los individuos o elementos (unidades de estudio) que conformarán la muestra representativa de una determinada población de
propósito de hacer inferencias. Esta selección se hace utilizando un muestreo probabilístico o no probabilístico según el diseño de la investigación.
streo
obabilístico
probabilísticos que se basan en el principio que cada unidad de estudio de la población tenga igual probabilidad de ser seleccionado en la muestra para
presentatividad de la muestra extraída, de tal modo que sea útil para hacer inferencias sobre dicha población. Estos métodos de muestreos
s puede realizarse de forma manual o mediante software y son: Muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y
r conglomerados.
probabilístico
studios exploratorios y cuando el muestreo probabilístico es muy costoso. La muestra extraída no da certeza de representatividad, debido a que no
tos de la población tienen la misma probabilidad de ser elegidos. Por lo general, la selección de las unidades de la muestra se hace bajo determinados
investigador, procurando en la medida de lo posible que sea representativa. Entre los métodos de muestreo no probabilísticos más utilizados son:
or selección de criterio, por cuotas y bola de nieve.
a la alcaldía de cierto distrito, solicita los servicios de una encuestadora para que realicen un estudio con la finalidad de estimar el
dio mensual en alimentación en las familias de su comuna. El responsable del estudio ha seleccionado aleatoriamente cada 15 a 200 familias
n el distrito; los resultados revelan que las familias en promedio gastan en alimentación 650 soles mensuales. Determinar la población,
streo, unidad de estudio, variables, estadístico y parámetro:
estudio: Todas las familias que son residentes del distrito Unidad de estudio: Cada una de las familias que vive en el distrito Muestra: 200 familias
l distrito
studio: Gasto mensual en alimentación Tipo de variable: Cuantitativa continua
dición: Razón Muestreo: Aleatorio sistemático
asto promedio en alimentación de las 200 familias es 650 soles.
asto promedio estimado en alimentación de las familias del distrito es de 650 soles.
ntas de aplicación Problema 01:
nto de control de calidad de ANCORP S.A. ante las quejas de sus clientes, decide investigar si sus productos cumplen con las especificaciones de peso
etiquetado de bolsas de arroz
5kg. Para comprobar la sospecha, selecciona al azar 5 bolsas de un lote de producción
nto de control de calidad de ANCORP S.A. ante las quejas de sus clientes, decide investigar si sus productos cumplen con las especificaciones de peso
etiquetado de bolsas de arroz
5kg. Para comprobar la sospecha, selecciona al azar 5 bolsas de un lote de producción
durante 3 semanas consecutivas y registra su peso luego de ser pesadas en una balanza calibrada. Si se
comprueba la veracidad de la sospecha la máquina de llenado debe ser regulada. Los resultados revelan que el peso medio fue de 4999 gr. Se pide
determinar:
:Edit. Pearson Educación S.A. P: 1-13.
en un estudio.
a. Población:
b. Muestra:
c. Unidad de estudio:
d.Tipo de muestreo:
Problema 02:
En las oficinas administrativas del MINSA, en el área de Logística trabajan 150 personas, se desea saber sobre el manejo del
encargado del estudio tiene que seleccionar una muestra representativa de 30 trabajadores, y luego se debe aplicar el cu
recolectar datos. Se pide presentar el listado de los números seleccionados utilizando un muestreo aleatorio simple y la tabla
considerando como arranque fila5 y columna3.
Población de estudio: Muestra de estudio:
Listado de los 30 números seleccionados
aleatorio simple:
1 11 21
2 12 22
3 13 23
4 14 24
5 15 25
6 16 26
7 17 27
8 18 28
9 19 29
10 20 30
Problema 03:
El alcalde de Lima está interesado en evaluar el nivel de satisfacción sobre el servicio de transporte urbano “Corredor Azul”
la continuidad del contrato. El encargado del estudio realizó una encuesta a 375 personas, quienes fueron seleccionados según
jóvenes, 175 adultos y 50 adultos mayores. Se pide identificar:
a. Población:
b. Muestra:
c. Unidad de estudio:
d.Tipo de muestreo:
Problema 04:
El4 de octubre del 2014, IPSOS Perú realizó una encuesta de opinión sobre la intención de voto, respecto a las preferencias po
alcaldía de Lima, la cual reveló que el 46.6% votaría por Luis
Castañeda. Este resultado proviene de una muestra de 2140 electores hábiles, seleccionados por muestreo bietápicod
provincia de Lima. Se pide determinar:
Valores
Valore
s
a. Población:
b. Unidad de estudio
c. Muestreo:
d. Muestra:
Problema 05:
Se tiene el listado de 30 estudiantes que participaronde un curso virtual en cierta institución. Se pide seleccionar una muestra
8 estudiantes que deben participar en un estudio de
FocusGroup con el propósito de conocer la satisfacción del curso desarrollado.
1 Rocío 11 Alejandro 21 José
2 Gustavo 12 Norma 22 Luis
3 Javier 13 Jacobo 23 Ana Luisa
4 Tomás 14 Natalia 24 Viviana
5 Ana 15 Susana 25 Santiago
6 Lucía 16 Edith 26 Ulamer
7 Ernesto 17 Samuel 27 Marcos
8 Celinda 18 Roberto 28 Lely
9 Jorge 19 Carlo 29 Antonieta
10 Willian 20 Rousse 30 Pablo
Indique el arranque y el listado de los 8 estudiantes seleccionados utilizando un muestreo aleatorio sistemático.
2.4 Bibliografía
1. Ávila, RB. (2010). Estadística Elemental. Lima: Estudios y ediciones R.A.
2. Córdova, M. (2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.). Lima: Moshera.
3. Black, K. (2008). Estadística en los negocios. (2ª ed.). México: Grupo Editorial Patria S.A.
4. Martínez, C. (2005). Estadística y Muestreo. (12ª ed.) Colombia. Editorial Eco Ediciones.
Tema 3
Instrumento de recolección y elaboración de la base de datos
3.1 Competencia a desarrollar
Elaborala matriz de datos en Excel con las variables consideradas en el instrumento de recolección de datos.
3.2 Contenido del tema 3
Técnicas de recolección de datos
Requiere la elección de una técnica y de un instrumento que permita medir las características de las unidades de estudio en una muest
acuerdo con Hernández, Fernández y Baptista (2010), “Recolectar datos implica elaborar un plan detallado de procedimientos qu
reunir datos con un propósito específico” (p.198). Entre las técnicas de recolección tenemos:
Encuesta Documentos Entrevista Observación
Instrumentos
Recurso que usa el investigador para registrar información y son: cuestionarios, guías de observación, inventario y escalas. Todo instrumen
comprobarse la confiabilidad y validez, con la finalidad de garantizar datos útiles y confiables. La elaboración del instrumento se ha
operacionalización de variables.
Con los datos obtenidos de los sujetos implicados en el estudio, es necesario organizar la información recolectada para el procesamiento d
puede hacerse de forma manual o con el uso de un software como Excel, SPSS, Stata, Statgraphics, Minitab, entre otros.
El uso de software para el procesamiento de datos, nos permite el manejo de muestras o poblaciones con gran número de unidades y la ob
con mayor velocidad.
Elaboración de la base de datos
Es el traslado de la información recogida mediante los instrumentos de recolección de datos a un software estadístico o Excel, el
investigador procesar y obtener resultados que describan la magnitud del problema en estudio. Una base de datos contiene todos los regist
población en estudio lista para ser procesada en cualquier momento.
Para el procesamiento de datos se realizará usando el complemento MegaStat de Excel.
3.3 Preguntas de aplicación
Problema 01:
El Director del Centro Geriátrico RENACER del distrito del Rímac, ha realizado un estudio con el propósito de describir el estad
enfermedades más frecuentes que presentan los
pacientes que fueron atendidos en el primer trimestre del año 2016. Se elaboró una ficha de datos para recolectar información de las histo
paciente como se muestra a continuación:
Se obtiene Información
de historias clínicas,
registros físicos o
electrónicos para
investigar un tema de
interés.
Información
proporcionada por los
mismos sujetos sobre
opiniones con un
moderador sobre un
tema de interés.
El investigador recopila
datos de manera
sistemática observando
la ocurrencia de los
hechos.
Información
proporcionada por los
mismos sujetos sobre
opiniones,
conocimientos de un
tema de interés.
Valores
aleatorio sistemático.
datos.
Se pide a usted que elabore una base de datos en Excel y debe grabar como Pacientes Geriátricos.
Base de datos de pacientes del Centro geriátrico Renacer
Fuente: Enfermería, Renacer
Problema 02:
El Director de recursos humanos de la empresa Credisa Philco S.A. ha diseñado un cuestionario, con el propósito de conocer c
compañeros de trabajo. La aplicación de la encuesta se hizo enviando al correo de los trabajadores, luego será devuelto con l
trabajador.
El cuestionario fue el siguiente:
el
Base de datos de pacientes delos empleados CREDISA PHILCO
Empleado Edad Años_Educ Género Ingresos Promoción Area Compañerismo
1 35 20 Masculino 783 1 Administración Regular
2 64 14 Femenino 257 5 Ventas Mala
3 33 15 Femenino 405 5 Producción Mala
4 23 14 Masculino 202 1 Producción Regular
5 33 12 Femenino 252 1 Ventas Mala
6 60 14 Masculino 357 3 Administración Mala
7 37 14 Femenino 150 2 Ventas Mala
8 25 13 Femenino 180 5 Ventas Regular
9 39 18 Masculino 608 4 Administración Mala
10 35 16 Masculino 384 3 Ventas Regular
11 35 12 Femenino 310 2 Ventas Buena
12 49 13 Masculino 766 5 Administración Mala
13 34 12 Femenino 333 1 Producción Muy buena
14 50 14 Femenino 158 1 Ventas Buena
15 49 4 Masculino 275 4 Producción Mala
16 39 16 Masculino 642 1 Producción Mala
17 61 12 Femenino 320 5 Producción Mala
18 59 16 Femenino 266 2 Producción Mala
19 25 16 Masculino 331 1 Ventas Mala
20 20 11 Masculino 105 1 Ventas Mala
21 37 13 Femenino 357 4 Ventas Buena
22 24 12 Femenino 243 1 Producción Regular
23 33 10 Masculino 333 2 Producción Mala
24 30 16 Femenino 300 2 Ventas Regular
25 43 13 Masculino 252 1 Ventas Mala
26 56 16 Femenino 361 1 Ventas Mala
27 35 15 Masculino 427 2 Producción Mala
28 35 16 Masculino 147 1 Ventas Regular
29 42 16 Femenino 237 5 Ventas Mala
30 34 12 Femenino 313 4 Ventas Regular
31 50 14 Femenino 241 2 Ventas Mala
32 34 12 Femenino 303 2 Producción Regular
33 41 13 Masculino 164 5 Ventas Mala
34 44 16 Femenino 179 5 Producción Regular
35 27 17 Femenino 204 2 Producción Regular
36 40 13 Masculino 263 1 Ventas Regular
37 33 16 Femenino 216 4 Ventas Mala
38 38 19 Masculino 487 1 Producción Mala
39 41 15 Masculino 184 4 Ventas Buena
40 32 12 Femenino 148 2 Ventas Buena
41 58 14 Masculino 537 5 Administración Regular
42 28 16 Femenino 170 1 Ventas Mala
43 18 12 Masculino 115 2 Ventas Muy buena
44 33 16 Femenino 177 5 Ventas Mala
45 34 9 Femenino 118 2 Ventas Regular
46 48 17 Femenino 328 4 Administración Regular
47 21 14 Femenino 163 3 Ventas Mala
48 26 16 Femenino 447 3 Producción Mala
49 39 18 Masculino 756 5 Administración Mala
50 29 17 Femenino 501 1 Producción Buena
Fuente: Recursos Humanos Credisa Philco S.A.
Se pide elaborar la base de datos en Excel correspondiente a los empleados de Credisa Philco S.A.
3.4 Bibliografía
1. Ávila, RB. (2010). Estadística Elemental. Lima: Estudios y ediciones R.A.
2. Álvarez, R. (2007). Estadística aplicada a las ciencias de la salud. Madrid: Díaz de Santos.
3. Daniel W. (2009). Bioestadística - Base para el Análisis de las Ciencias de la Salud. (4ª ed.) México: Editorial Limusa S.A.
4. Balzarini, M., Tablada, M. (2011). Introducción a la Bioestadística. Brujas: Córdova.
estionario con toda
A PHILCO
a
ℎ𝑖 =
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 = 𝑓𝑖
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑛
Frecuencia porcentual (hi%).- es la frecuencia relativa simple multiplicada por 100% y se calcula:
hi% = hix100%
Una tabla de distribución de frecuencias de tener las siguientes partes: Número de la tabla, encabezados de las columnas, cuerpo y fuente
clase y se obtiene:
a:
Enumeración y título
Encabezados
Cuerpo
Fuente
de las frecuencias relativas simples es igual a 1y la suma de las
V V V D V O V V V
V D V O V D M D M
O M M O M V V D M
V M M V O M M O D
D M D V V D O V V
b) Datos:
Total de encuestados: n = 586.
Perfil configurado como privado es el 26%: nx0.26 = 586x0.26 = 152.36 = 152
Respuesta: 152 encuestados han configurado su perfil de Facebook como privado.
la:
Hijos Frecuencia
1 7
2 22
3 31
4 15
5 10
6 3
Total 88
a. Elabora el gráfico de bastones
Gráfico 3. Distribución de hijos por familia de la comunidad
Fuente: Elaboración propia
Distribución de frecuencias para una variable cuantitativa continua
El resumen de los datos cuantitativos continuos correspondiente a una sola variable debe presentarse en una tabla de frecuencias agrupada
también clases y su gráfica se representa con histograma de frecuencias, polígono de frecuencias, ojivas, diagrama de cajas simple.
1. Elaboración de una tabla de distribución de frecuencias agrupadas en intervalos
El procedimiento es el siguiente:
1) Calcular el rango (R) o recorrido de los datos, el cual se define:
𝑪=�
�
4) Determinar los límites de cada intervalo o clase, se recomienda entre 5 y 20 intervalos.
Ejemplos de intervalos que se puede utilizar:
1400 1800 1900 2100 2400 2000 2500 1900 2000 2150
2300 2600 2800 1700 1600 1650 2000 2400 1400 2300
1900 1750 2200 1800 1900 2100 2400 2000 2500 2250
Solución
Construcción de la tabla de distribución de frecuencias Muestra: n = 30 datos
•Calcular el rango de datos
Rango: R = Dato máximo – Dato mínimo = 2800-1400 = 1400
•Determinar la cantidad de intervalos (llamado también clases) por el método de Srurges
o de Srurges
K 6
C = 234
• Organizar la tabla de frecuencias
Tabla 4. Ingresos mensuales de trabajadores que estudian maestría
geriátrico?
.
ariable.
8
7
6
4
3
2
0
200 -310 310 - 420 420 - 530 530 - 640 640 - 750 750 - 860
Litros de yogurt (miles)
Pr omedio poblacional x i
N
i1
x f
i i
Ejemplo 7
En la caseta de peaje en la autopista a Ramiro Prialé, se ha registrado el número de vehículos por hora que ingresaron durant
19de septiembre del 2015, con la finalidad de conocer la afluencia de vehículos que recorren esta vía, los datos son: 39, 31, 2
Datos:
medio muestral X xi
n
i1
nal x i
N
i1
x f
i i
i1
n
x. fi i
DATOS)
a registrado el número de vehículos por hora que ingresaron durante las 7 am hasta 12 pm del
fluencia de vehículos que recorren esta vía, los datos son: 39, 31, 23, 18, 15
39 31 23 18 15
x1 x2 x3 x4 x5
Solución
X x x x x x x
i 1 2 3 4
5
39 31 23 18 15 126 25.2
i1
n 5 5 5
Interpretación.-En la autopista Ramiro Prialé, en promedio circulan 25 automóviles por hora entre las 7 am a 12 pm.
a) Mediana (Me).- Es un valor que indica el centro de un conjunto de datos ordenados, cuyos valores son medidos en escala ordi
una medida robusta porque no se ve afectada por la presencia de datos atípicos, por eso se utiliza cuando la distribución
de la mediana representa que el 50% de los datos son menores o iguales a dicho valor y el otro 50% son datos mayores al valor m
El 50% de los datos son menores o El 50% de los datos son mayores a la mediana
iguales a la mediana
Dato mínimo MEDIANA Dato
Mediana para datos no agrupados: máximo
5 5
rculan 25 automóviles por hora entre las 7 am a 12 pm.
unto de datos ordenados, cuyos valores son medidos en escala ordinal, intervalo o razón. Es
de datos atípicos, por eso se utiliza cuando la distribución es asimétrica. El valor
o iguales a dicho valor y el otro 50% son datos mayores al valor mediano.
MEDIANA Dato
máximo
de menor a mayor
e: �(𝑛 +1)
tos ubicados en la posición central
+ C(2 )
1° 2° 3° 4° 5° 6°
1.5 1.55 1.60 16.5 1.70 1.78
Segundo:Determinar la posición del valor mediano: La posición de la mediana es 4°
Tercero: Como la posiciónde la mediana es 4°, entonces el valor Mediano es: Me = 1.65
Interpretación.- El 50% de los 7 peruanos varones con 18 años tienen una estatura menor a 1.65 y el otro 50% tienen una est
metros.
Ejemplo 9
Se ha registrado las edades en años cumplidos a 6 estudiantes ingresantes a la escuela de Farmacia en una universidad, cuyos
18, 27.
Se pide calcular la mediana de las edades
En este caso la muestra es 6 estudiantes, es un número par
Procedimiento:
Primero: Ordenar los datos de menor a mayor
3° 4°
20 21
1° 5° 6°
2° 25 27
18
Segundo:Determinar la posición del valor mediano: La posición de la mediana es la 3° y 4°
Tercero: Como la posiciónde la mediana20es la 3° y 4°,
Cuando el tamaño de la muestra es un número par, la mediana se obtiene sumando los datos ubicados en la posición central:
Calcular la mediana: Me =(201+21)/2 = 20.5
Interpretación.- El 50% de 6 alumnos, tienen menos de 21 años y el otro50% tiene más de 21 años.
b) Moda (Mo).- La moda en un conjunto de datos observados, es el dato que se presenta con más frecuencia. Se cal
medidas en escala nominal, ordinal, intervalo o razón.
a. Si en el conjunto de datos no se repite ningún valor la moda no existe.
b. Cuando se repite más veces un solo valor existe una sola moda y su distribución UNIMODAL.
c. Cuando se repiten el mismo número de veces dos valores, hay dos modas y la distribución es BIMODAL.
d. Cuando se repite el mismo número de veces más de dos valores presenta varias modas, la
distribución es MULTIMODAL.
La distribución de la variable presentarán las siguientes gráficas
(a) Sin moda (b) Unimodal (c) Bimodal (d) Multimodal Moda para datos no agrup
En una muestra o población es el dato que más veces se repite
Moda para datos agrupados en intervalos:
𝑀𝑜 = 𝐿𝐼 + 𝐶 ( 𝑑1 )
𝑑1 + 𝑑2
mpar
7°
1.82
de la mediana es 4°
r Mediano es: Me = 1.65
tienen una estatura menor a 1.65 y el otro 50% tienen una estatura superior a 1.65
ngresantes a la escuela de Farmacia en una universidad, cuyos datos son: 20, 21, 25, 20,
la mediana es la 3° y 4°
existe.
su distribución UNIMODAL.
os modas y la distribución es BIMODAL.
presenta varias modas, la
ble presentarán las siguientes gráficas
Bimodal (d) Multimodal Moda para datos no agrupados:
ón es el dato que más veces se repite
os agrupados en intervalos:
𝑜 = 𝐿𝐼 + 𝐶 ( 𝑑1 )
𝑑1 + 𝑑2
6 5 5 5 5 5 8 6 6 5 5 4 6 5 5 5
4 6 4 4
4 4 3 3
4 2 2 2 2
2 2 2 2
0 0 0 0
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Donde:
LI : Límite inferior de la posición de la clase modal C : Amplitud de clase modal
d1: Frecuencia clase modal menos frecuencia anterior a la clase modal=fmo-fantfmo d2: Frecuencia clase modal menos frecuencia poster
modal=fmo-fpostfmo n : Tamaño de la muestra
En Excel usar la función y escriba: = MODA(DATOS)
Ejemplo 10
Los datos siguientes corresponden a las edades en años cumplidos de 10 alumnos ingresantes a la universidad en un period
18 29 21 22 21 20 21 20 19 21
¿Cuál es la edad más frecuente de los ingresantes a la universidad en ese periodo académico? El dato que más veces se repite es 21
Entonces la moda es: Mo = 21
Interpretación.- En los 10 alumnos ingresantes a la universidad en el periodo académico, la edad más frecuente fue de 21 años.
5.2.2 Medidas de posición - Cuantiles
Las medidas de posición o denominados también cuantiles, son valores que indican la posición de un dato respecto al conjunto de da
menor a mayor y se calcula para variables de escala ordinal, intervalo o razón. El número de divisiones que se realice al histograma
más utilizados son: cuartiles, quintiles, deciles, percentiles, etc. Los cálculos consisten en hallar la posición del cuantil y luego calcu
En general nos interesa los percentiles y las fórmulas para calcular son:
Percentiles para datos no agrupados:
En un conjunto de n datos ordenados el valor del centil o percentil se calcula:
se modal menos frecuencia posterior a la clase
�( 𝑛
)−�
�� = LI + C( 100 𝑖−1
𝑓
𝑝� )
Donde:
LI : Límite inferior de la posición de la clase percentil k C : Amplitud de clase percentil k
K :posición del percentil k
Fi-1: Frecuencia absoluta acumulada anterior a la clase percentil k Pk Frecuencia absoluta simple de la posición de la clase percentil k n :
a) Cuartiles (Qk).- Son tres valores calculados (Qk = 1, 2, 3) que dividen al conjunto de datos en 4 partes iguales y cada una de ellas represe
Q1 Q2 Q3
Donde:
Q1 : Es el cuartil 1 cuyo valor calculado representa al 25% de los datos menores o igual al valor encontrado y el 75% son datos mayores
Q2 : Es el cuartil 2 cuyo valor calculado representa al 50% de los datos menores o iguales al valor encontrado y el 50% de datos restante son
Q3 : Es el cuartil 3 cuyo valor calculado representa al 75% de los datos menores o iguales al valor encontrado y el 25% de datos son mayores
En Excel usar la función y escriba: =PERCENTIL(DATOS)
Ejemplo 11
Se ha registrado la estatura de 100 personas del sexo masculino que participaron en una maratón de 10k, cuyos datos se muestran en la tab
agrupada.
ndar?
100/4)= 25
reemplazar en la fórmula se necesita: C = 6, LI= 163, fQk = 22
�� = LI + C( 4 𝑓 )
��
1 100
− 14
� = 163 + 6 4
= 166
22
1% 1% ..……. 1%
190
70 100
− 68
� = 177 + 6 100
= 177.8
15
Interpretación.- El 30% de maratonistas con mayor estatura miden más de 177.8 cm.
5.4 Preguntas de aplicación Problema 01:
El jefe de recursos humanos de una empresa está interesado en analizar el impacto económico de horas
extras de trabajo pagadas a sus empleados de la gestión anterior. Los datos fueron extraídos del registro
de control de cada trabajador y son:
2 5 4 5 2 1 4 3
1 3 4 1 2 2 2 1
2 1 5 2 1 3 2 2
3 1 3 4 3 2 1 2
a. Elabore una tabla de frecuencias
b. En promedio se ha pagado horas extras a los empleados de la empresa.
c. ¿Cuántas horas extras como máximo se ha pagado al 50% de empleados?
d. Se pagaron con frecuencia horas extras de trabajo.
Un grupo de investigadores deciden investigar la evolución de los ingresos en las familias de una comunidad. Para el
que tuvieron las familias en alguna entidad bancaria desde enero hasta agosto del 2016. Asumiendo que las familias aume
medida que sus ingresos aumenten. En el estudio fueron consideradas 25 familias que cuentan al menos 400 soles de ahorro,
en la tabla de distribución de frecuencias.
Tabla 3. Distribución de los ahorros en las familias de la comunidad
mplo 12
mínima del 30% de maratonistas con mayor estatura?
ular elpercentil 70
0% de las observaciones y por encima queda el 30%.
ula de percentiles tenemos:
) − �𝑖 −1
( 100 )
𝑓
𝑝�
00
− 68
100
= 177.8
15
77.8 cm.
los ingresos en las familias de una comunidad. Para ello, se observó los ahorros
sta agosto del 2016. Asumiendo que las familias aumentarían sus ahorros a
das 25 familias que cuentan al menos 400 soles de ahorro, cuyos datos se muestran
Ahorro en soles Xi fi hi hi% Fi Hi Hi%
12
10
8
6
4
2
0
La compañía AXE S.A. es una distribuidora de diferentes tipos de bebidas peruanas al por mayor. El gerente de ventas d
comportamiento de las llamadas telefónicas para hacer pedido de productos durante los meses de febrero y marzo del año 20
investigación, delega a su secretaria que registre el número de llamadas por día que hacen sus clientes a la central telefónica
Los datos son los siguientes:
tidad bancaria es
ón de
6. ¿Cuánto es el valor máximo de zinc del 10% que tienen los preparados infantiles con menor contenido de zinc?
5.4 Bibliografía
1. Córdova M. (2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.) Lima: Moshera.
2. Black, K. (2008). Estadística en los negocios. (2ª ed.). México: Grupo Editorial Patria S.A.
3. Daniel W. (2002). Bioestadística. Base para el Análisis de las Ciencias de la Salud. México: Editorial Limusa S.A.
4.Samuels, M, Witmer, J. (2012). Fundamentos de Estadística para las ciencias de la vida. (4ª
ed.)California: Pearson
la ciudad de
cién nacidos viven tanto en el área rural y área urbana.
gramos de zinc.
antidad de zinc y se
considerado en su compra?
n1
(X X)i
nza N
La fórmula de la varianza para datos agrupados es:
(X X) f
i
n 1
(X X) f
i
Varia poblacional
2 i1
nza N
apacidad de interpretación y análisis de los datos en un estudio.
ncentración de los datos, nos indica que tan cercano o lejano están los datos respecto a su valor
lo y razón, entre las más importantes tenemos: El rango, Rango intercuartílico, varianza,
ores se encuentra el conjunto de datos. Es la diferencia entre el valor mayor y el menor de los datos
emos llamado dato atípico.
dedor del promedio eliminando la influencia de los valores extremos, es la diferencia entre el tercer
os.
ENTIL(Datos,0.25)
atos. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
X) 2
n1
(X X) i
ados es:
(X X) f
i
n 1
(X X) f
i
poblacional
2 i1
N
En Excel usar la función: = VAR(Datos)
d) Desviación Estándar.-Se conoce también como desviación típica, mide la dispersión o
distanciamiento de los datos respecto al valor central. Se obtiene calculando la raíz cuadrada positiva de la varianza.
Desviación S
muestral
Desv poblacional
iació
En Excel usar la función: = DESVEST(Datos)
n
e) Coeficiente de variación.- Es una medida de dispersión relativa porque carece de unidad de medida, se utiliza cuando se q
grado de dispersión de dos conjuntos de datos que no tienen las mismas unidades o cuando las medias son diferentes, el coefi
Pearson mide
la proporción de dispersión de los datos respecto a su media y se define como el cociente entre la desviación típica y el valor
aritmética.
2 5 10 8 15 3 20 7 5 13
i
(X X )2
N
(xi x) 2
n 1
Negocio A 245 280 300 286 270 297
Negocio B 102 86 298 265 144 173
ide la dispersión o
ndo la raíz cuadrada positiva de la varianza.
S
*100
*100
s:
a) Calcule las medidas de dispersión: varianza, desviación estándar y coeficiente de variación
b) ¿En qué negocio, la rentabilidad presenta mayor dispersión?
c) ¿En qué negocio la rentabilidad presenta menor dispersión en el 50% central?
d) ¿Cuál de los negocios ofrecerá mayor ganancia?
Solución
a) Calculando los estadísticos tenemos:
Tema 7
Medidas de asimetría y curtosis
7.1 Competencia a desarrollar
Calcula e interpreta las medidas descriptivas de asimetría, curtosis y el diagrama de cajas, demostrando su capacidad de análisis en compo
cuantitativos.
7.2 Contenido del tema 7
Medidas descriptivas de forma
Son valores que nos permite observar el comportamiento o distribución de los datos respecto a su centro. Entre ellos tenemos los
apuntamiento llamado también curtosis:
a) Asimetría.- Indica la distribución del conjunto de datos en forma horizontal, es decir a través del eje X. Compara la forma que tiene lo
histograma con la distribución normal.
Una distribución de datos es simétrica cuando la mediana, moda y media aritmética tienen valores similares. Silos datos tienen distribu
derecha, las frecuencias (absolutas o relativas) descienden más lentamente por la derecha. Si las frecuencias descienden más lentamen
distribución es asimétrica a la izquierda. Entre los índices de asimetría tenemos:
Coeficiente de Asimetría de Pearson está dado por la fórmula:
3( X Me)
nte de variación
al?
oducto.
y sólo se importará el producto, si por lo menos la mitad de los
debe tomar el importador según los resultados de la información
os?
encuestados.
dos en el Hospital Nacional de Arequipa. Se pide:
el área rural y área urbana.
y área urbana
a S.A.
Moshera.
de la vida. (4ª ed.)California: Pearson.
ravés del eje X. Compara la forma que tiene los datos a través del
QQ
3 1
As
Si As = 0, la distribución es simétrica
Si As > 0, la distribución es asimétrica a la derecha
Si As < 0, la distribución es asimétrica a la izquierda.
Los tipos de asimetría se observa en las representaciones gráficas:
b) Curtosis.- Indica la distribución del conjunto de datos en forma vertical, es decir, a través del eje Y. Mide el grado de elev
datos. Se definen 3 tipos de distribuciones, según su grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración medio, alrededor de los valores centrales de la variable (el
distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores
centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la v
La fórmula está dado por:
S
o también
métrica
imétrica a la derecha
simétrica a la izquierda.
erva en las representaciones gráficas:
ución del conjunto de datos en forma vertical, es decir, a través del eje Y. Mide el grado de elevación de la distribución de
istribuciones, según su grado de curtosis:
presenta un grado de concentración medio, alrededor de los valores centrales de la variable (el mismo que presenta una
icúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
o por:
1(P P ) 0.263 la ldistribución es
K= 75 25 =
0.263
la ldistribución es
2(P P )
90 10
0.263 la ldistribución es
platicúrti ca
mesocúrtica
09 - 11 2
11 – 14 13
14 – 17 11
17 - 19 4
Total 30
a) Calcule la nota mínima para estar considerado en el quinto superior.
b) ¿Qué tipo de asimetría presentan la distribución de las notas?
c) Calcula e interpreta el coeficiente de curtosis.
Problema 02:
Cierta universidad brinda capacitaciones con cursos presenciales y virtuales a sus docentes con el propósito de mejo
académica. Para que un docente sea contratado en la próxima convocatoria, Recursos humanos lleva un control de
capacitación docente en ambas
modalidades, los datos son los siguientes:
Virtual 2 3 0 5 2 0 1 1 2 1 3 4 2 2
Presencial 3 5 3 4 1 2 5 5 4 2 1 3 5 4
a) ¿Qué tipo de asimetría presentan las distribuciones del número de capacitaciones por modalidad?
b) ¿Cuál de las modalidades tiene mayor presencia en el número de capacitaciones?
c) Calcula e interpreta el coeficiente de curtosis.
Problema 03:
El administrador de un hospital ordenó un estudio del tiempo que un paciente debe esperar antes de ser tratado por el p
urgencias. Los datos que presentamos a continuación fueron
tomados durante un día normal.
s docentes con el propósito de mejorar la calidad
cursos humanos lleva un control de asistencia a la
or modalidad?
1 -6 3
6-11 12
11-16 15
16-21 8
21-26 2
TOTAL 40
a) Calcule el mínimo de tiempo de espera para estar considerado como tiempo aceptable
b) ¿Qué tipo de asimetría presentan la distribución del tiempo de espera?
c) Calcular e interpretar el coeficiente de curtosis.
Problema 04:
En el siguiente diagrama de cajas, muestra la distribución de los ingresos de los directivos de un grupo de empresas.
¿la distribución de los ingresos es homogénea? justifique
7.4 Bibliografía
1. Ávila, RB. (2010). Estadística Elemental. Lima: Estudios y ediciones R.A.
2. Córdova, M. (2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.) Lima: Moshera.
3. Samuels, M, Witmer, J. (2012). Fundamentos de Estadística para las ciencias de la vida. (4ª ed.) California: Pearson.
4. Daniel, W. (2002). Bioestadística. Base para el Análisis de las Ciencias de la Salud. México: Editorial
Limusa S.A.
Tema 9
Tablas de contingencia y gráficas con dos variables
9.1 Competencia a desarrollar
Elabora tablas de contingencias y gráficos de barras agrupadas para describir la relación y/o asociación de dos variables cualitativas con in
9.2 Contenido del tema 9
Estadística bidimensional
Estudia aquellos problemas en los que intervienen de manera simultánea dos variables (X,Y), buscandoalgún tipo de relación
ambas y la forma en que la variable independiente (X) explica el comportamiento de la dependiente (Y). Así, por ejemplo, se puede
tiene el hábito de fumar con el cáncer al pulmón, los ingresos de las familias con los gastos, o qué relación existe entre lospesos y las
personas.
La presentación de resultados para variables cualitativas será con las tablas de frecuencias bidimensionales o llamado t
gráfica de barras agrupadas, gráfica de barras apiladas.
TABLA DE CONTINGENCIA
un grupo de empresas.
i1
x1 f
11 f
12 … f
1j … f
1l n
1.
x2 f
21 f
22 … f
2j … f
2l n
2.
… … … … … … … …
xi f
i1 f
i2 f
ij f
il n
i.
… …
… … … … … … … …
xk f
k1 f
k2 … f
kj … f
kl n
k.
k
.j
f n
.j j1
n.. fij n
n
.1 n
.2 … n
.j … n
.l
i1 j1
riable Y
X n
i. pi
X1 n
1. p1
… … …
xi n
i. pi
… … …
xk n
k. pk
n 1
- Marginal de Y; expresa como se distribuye Y en la población total al margen de la variableX
Y n.j pj
y1 n.1 p1
… … …
yj n.i pj
… … …
yl n.l Pl
n 1
Distribución de frecuencias condicionales
A partir de una distribución bidimensional en cada fila (o columna) aparecen las distribuciones de frecuencias condic
- Distribución de X condicionado a Y
X Yj X/Y =yj
X1 f
1j f
1j/n.j=f1/j
… … …
xi f
ij f /n
ij .j =fi/j
… … …
xk f
kj f
kj/n.j=fk/j
n
.j 1
- Distribución de Y condicionado a X
Y X
i. Y/X =xi
y1 f
i1 f /n
i1 1.=f1/i
… … …
yj f
ij f /n
ij i. =fj/i
… … …
yl f
l. f
kj/ni.=fl/i
n
i. 1
Ejemplo 15
Un grupo de estudiantes investigó el consumo de tabaco en personas adultas entre 30 a 65 años yuna de
las preguntas fue ¿Usted es fumador de tabaco? y como alternativas son: Fumador, No fumador, Exfumador. Los dato
presentan en la tabla a continuación:
Tabla1. Consumo de tabaco en personas adultas según hábitos y género
al de Y; expresa como se distribuye Y en la población total al margen de la variableX
n de frecuencias condicionales
e una distribución bidimensional en cada fila (o columna) aparecen las distribuciones de frecuencias condicionales:
ón de X condicionado a Y
ución de Y condicionado a X
no son fumadores
0*100)/150 =20%
s y son fumadores.
Varón Mujer
20% 7%
33%
20% 7%
13%
n fumadores.
columnas, es la tabla de frecuencias de X condicionada a Y:pij= (fij*100)/nj
hábitos
0 a 65 años
con los datos del Censo Nacional de Población y Vivienda del año 1993 y 2007
dos por el INEI.
2007
Del total de familias peruanas censadas, tiene como jefe de hogar a un hombre en un 76.7% según el censo del año 1993 y en el cens
Elaboración de tablas de contingencia y gráficas con MegaStat
La secuencia es como se muestra
Elaboración de tablas de cruzadas usando tablas dinámicas
1. Cada columna corresponde a una variable con sus datos y en la primera fila digitar su nombre.
2. Ubique el cursor en cualquier celda de la matriz de datos.
3. Haga clic en la opción Insertar de la barra de menú.
4. Elegir donde crear la tabla dinámica:
o Nueva hoja de cálculo
5. Arrastre las variables que se encuentran en el cuadro de diálogo
- Una variable en fila: Zona de la ciudad
- La otra variable en columna: Forma de pago
- Cualquiera de las variables a de valores
6. Luego nos muestra la siguiente tabla
7. Para obtener los porcentajes con el total general, o total de fila, o total de columna hacer clic en cualquier celda de la tabla
valores como… % total, o % fila, o % columna. Luego
mostrará la tabla en porcentajes.
Cuenta de Zona de la ciudad Rótulos de columna
Rótulos de fila Contado Crédito Total general
Centro 15 19
Norte 10 14
Sur 14 28
Total general 39 61
como jefe de hogar a un hombre en un 76.7% según el censo del año 1993 y en el censo del 2007 es de 71.5%.
cas con MegaStat
las dinámicas
n sus datos y en la primera fila digitar su nombre.
triz de datos.
e menú.
el cuadro de diálogo
eneral, o total de fila, o total de columna hacer clic en cualquier celda de la tabla y seleccione Mostrar
uego
Crédito Total general
34
24
42
100
9.3 Preguntas de aplicación Problema 01:
Se extrae una muestra aleatoria de 200 habitantes de una ciudad para analizar la actitud frente a un cierto proyecto de alcaldía.
siguiente:
Opiniones de los habitantes según área de residencia respecto al proyecto
grupode clientesclasificados en cuatro grupos. La muestra aleatoria de las ventas de productos se observa en la siguie
Clasificación de consumidores según grupos de clientesy productos Premium
ar la actitud frente a un cierto proyecto de alcaldía. El resultado fue el
al
al de las columnas.
idencia condicionado a la opinión respecto al proyecto.
tem a, b, c
l hospital.
ficadora de dependencia.
o a la pretensión de continuidad de los estudios.
(f
ij
x i1
e
j1
2 ij
Donde:
fij : son las frecuencias observadas de la muestra eij : son las frecuencias esperadas , se obtiene:
f f . j
e
ij
i.
n
k: número de categorías de la variable en fila
l: número de categorías de la variable en columna
El proceso para contrastar la independencia de variables X e Y es el siguiente:
1. Formular las hipótesis estadísticas y son dos: Hipótesis nula (Ho), Hipótesis alterna o trabajo (H1) Ho: La variable X es ind
H1: La variable X es dependiente de la variable Y
2. Determinar el nivel de significancia (probabilidad de error): = 0.05
3. Estadistico de prueba: Chi cuadrado de independencia
4. Calcular el P-Valor con MegaStat o cualquier software estadísitco
5. Criterio de Decisión: Si el P-Valor ≤ se rechaza Ho
6. Conclusión; se concluye con la hipótesis que no fue rechazada acompañdo del nivel de significancia
Ejemplo 17
El consejo de administración de Comunicatel S.A. quiere determinar si la opinión de sus accionistas respecto a una posible
independiente del número de acciones que poseen, las acciones se agrupó por el número de acciones en tres categorías
accionistas proporciona la siguiente tabla:
k l
e) ij
1 j1
ij
f f . j
i.
n
fila
columna
a de variables X e Y es el siguiente:
on dos: Hipótesis nula (Ho), Hipótesis alterna o trabajo (H1) Ho: La variable X es independiente de la variable Y
iable Y
probabilidad de error): = 0.05
independencia
quier software estadísitco
e rechaza Ho
s que no fue rechazada acompañdo del nivel de significancia
tel S.A. quiere determinar si la opinión de sus accionistas respecto a una posible fusión de la empresa es
e poseen, las acciones se agrupó por el número de acciones en tres categorías. Una muestra de 500
Distribución de acciones de los socios según opinión a la posible fusión
Número de Opinión respecto a una posible fusión Total
acciones A favor En contra Indecisos
Menos de 200 25 18 21 64
De 200 a 1000 93 62 67 222
Más de 1000 82 70 62 214
Total 200 150 150 500
Fuente: Comunicatel S.A.
Contraste la hipótesis respectiva con un nivel de significación del 5%.
Solución
1. Formulación de las hipótesis estadísticas
Ho: La opinión de los accionistas respecto a una posible fusión es independiente al número de acciones que poseen.
H1: La opinión de los accionistas respecto a una posible fusión no es independiente al número de acciones que posee
2. Nivel de significancia: 0.05
3. Estadístico de prueba: Chi cuadrado de independencia = 1.53
El cálculo del estadístico Chi cuadrado con MegaStat se obtiene con la siguiente secuencia:
Selección de los datos organizados en una tabla de contingencia
Luego seleccionar OK y se obtiene el valor de Chi cuadrado como se muestra a continuación
4. P-Valor = 0.8218
5. Decisión:
Como el P-Valor = 0.8218 > 0.05 NO se rechaza la hipótesis Ho
6. Conclusión:
Con un nivel de significación del 5%, la opinión de sus accionistas respecto a una posible fusión es independiente del número de accio
10.3 Preguntas de aplicación Problema 01:
Una encuestadora seleccionó una muestra de 800 votantes y se les clasificó de acuerdo a su nivel de
ingresos como: Bajo, Medio, alto, y según su opinión con respecto a una reforma en la constitución política del país de los que
Sin decisión. Las frecuencias observadas se dan en la siguiente tabla.
Opiniones respecto a la reforma en la constitución política según nivel de ingresos
posible fusión
nte secuencia:
ación
o a su nivel de
ma en la constitución política del país de los que están A favor, En contra,
OPINION INGRESOS
Bajo Medio Alto
A favor 200 130 70
En contra 60 60 80
Sin decisión 40 60 100
¿Existen dependencia entre las variables? Realice la contrastación de hipótesis a un nivel de significancia de 0.05.
Problema 02:
Un grupo de estudiantes de Psicología realizaron un estudio sobre el manejo de la ansiedad en las actividades acad
estudios en su carrera profesional. Con la finalidad de conocer esta problemática, se desea comparar la ansiedad de los
con el sexto ciclo de la facultad de medicina de una universidad. A un nivel se significancia de 5% el manejo de ansiedad e
estudios.
Tabla 2. Niveles de ansiedad de los estudiantes según ciclo de estudios
dios
Problema 03:
Un grupo de médicos realizaron un estudio con la finalidad de evaluar el hábito de fumar como factor de riesgo del cáncer d
seleccionan 2 muestras aleatorias, una de pacientes con esta enfermedad y la otra de personas sin esta condición y
fueron fumadores o no. A continuación se brinda la información obtenida:
Distribución de personas con cáncer al pulmón según hábito de fumar
Desarrollo de caries
Tratamientos TOTAL
Bajo Moderado Alto
A 8 40 34 82
B 84 22 12 118
TOTAL 92 62 46 200
A un nivel de s
ignificancia de 5% s
e puede afirmar que el des
arrollo de caries
es
tá relacionado al tipo de tratamiento.10.4
Bibliografía1.
Tema 11 Correlación lineal simple
11.1 Competencia a desarrollar
Determina la asociación variables con gráficas y el coeficiente de correlación de Pearson, demostrando su capacidad de interpretación
estudio correlacional.
11.2 Contenido del tema 11
Correlación
Cuando se realiza un estudio de correlación entre dos variables cuantitativas medidas en escala de intervalo o razón, se tiene
qué medida sus valores se relacionan y cuál es su tendencia que puede ser directa o inversa. El análisis consiste en observar esta asocia
dispersión y el coeficiente de correlación de Pearson.
Gráfico de dispersión
Es una gráfica representa la relación de los valores observados (xi,yi), considerando la variable X como independiente y a la variable Y c
valores de la variable independiente X se grafica en el eje horizontal, mientras que los valores de la variable dependiente Y en el eje ve
relación observada en el diagrama de dispersión puede ser lineal directa o inversa, como se observa en las siguientes gráficas:
Relación lineal directa Relación lineal inversa
Coeficiente de correlación de Pearson
Mide la fuerza y dirección de la relación entre dos variables cuantitativas en una escala que varía entre
+1 y -1, esto significa una relación directa o inversa. La fórmula es:
el hábito de fumar como factor de riesgo del cáncer del pulmón, se
ermedad y la otra de personas sin esta condición y se les preguntó si
enida:
xy
La covarianza está dado por:
x
Covx, y
j 1
i1 f
ij n
y
n el siguiente cuadro.
Ejemplo 18
Se tiene las calificaciones de 40 alumnos en psicología evolutiva y en estadística con calificación de 1 a 10, los datos son los si
X Y Número
calif. enPsicol. calif. en Estad. de alumnos.
3 2 4
4 5 6
5 5 12
6 6 4
6 7 5
7 6 4
7 7 2
8 9 1
10 10 2
¿Cuál es la relación entre las notas en estadística con las notas de psicología?
Solución:
Se pide determinar la correlación de X e Y:
Disponemos los datos de la siguiente forma:
Promedios: x
n x
i i 220 5,5 y n y i i
224
5,6
N 4
0 N 4
0
n
Varianza de X: s2 i i
x x2 (5,6) 32,85 30,25 2,6
2
N 2
4
0
Desviación estándar de X: s x
1,61
1378
n
Varianza de Y: s 2
i i
y y
2 (5,6) 3,09
2
N 4
0
2
Desviación estándar de Y: s y
1,75
Calculando el coeficiente de correlación: r s
xy r 2,6
y resulta
0,92
s .sx y
(1,61).(1,75)
x
s2
2,6
3,09
e 1 a 10, los datos son los siguientes:
La correlación es positiva, es decir, a medida que aumenta la nota de estadística aumenta también la nota en psicología. Su valor está
indica que se trata de una correlación fuerte, las estimaciones realizadas están cerca de los valores reales.
11.3 Preguntas de aplicación Problema 01:
Los siguientes datos corresponden a grupo de estudiantes y se quiere determinar la existencia o no de
asociación entre las calificaciones en las asignaturas de Matemática con el número de horas de estudio diario fuera de clase y qué tipo d
los datos siguientes:
Calificativos 18 12 16 12 10 14 13 8 14 11
Problema 02:
Un consultor quiere averiguar si el salario de los empleados depende del índice de desempeño en el trabajo. Una manera
consiste en examinar la relación entre dicho índice y el salario del empleado. Para ello, se seleccionó una muestra de 8 emple
información
sobre el salario (en cientos de soles) y el índice de desempeño (medido en escala de 1 al 10; donde 1 significa pésimo y 10 si
óptimo).Determine la relación entre las variables de estudio.
Índice de desempeño 9 7 8 4 7 5 5 6
Salario (S/.) 36 25 33 15 28 19 20 22
Problema 03:
Un profesor investiga las notas que obtuvieron 10 alumnos en Matemática y en Estadística con calificación de 1 a 10,
son:
Alumnos Matemática Estadística
1 6 6,5
2 4 4,5
3 8 7
4 5 5
5 3,5 4
6 7 8
7 5 7
8 10 10
9 5 6
10 4 5
de
dio diario fuera de clase y qué tipo de relación presentan
ía1. Webs
ter, A. (2006). Es
tadís
tica aplicada a los
negocios
y la economía. (3° ed.) Colombia: MCGRAW HILL.2. Anális
is
de regres
ión y
de relación de la variable dependiente en función de
�1 = 𝑖=1
𝑛
𝑖=1 𝑖=1
𝑖=1
�2 𝑖 − ( 𝑛 �𝑖 /𝑛)2
β0: Parámetro que es el punto de intersección de la recta con el eje de las ordenadas.
�0 = � − �1�
Bondad de ajuste del modelo
Consiste en analizar el grado de asociación lineal entre la variable dependiente y la independiente así
como determinar la proporción de variabilidad de la variable dependiente explicada por la independiente. Los
�𝑖 /𝑛)2
de la recta con el eje de las ordenadas.
− �1�
75
70
65
60
55
50
45
40
9 11 13 15 17 19 21
Publicidad en miles de soles
En el gráficode dispersión se observa una relación positivacon tendencia lineal, a medida que se aumenta la inversión
incrementolas ventas.
2. Correlación de Pearson
Obtenemosla matriz de correlaciones con MegaStat
Publicidad Ventas
Publicidad 1.000
Ventas 0.885 1.000
Con un coeficiente de correlación de Pearson, R = 0.885, significa que las variables ventas la inversión en publicidad
muy fuerte.
3. Regresión Lineal
Regression output
X 5 7 2 1 9
Y 15 18 10 8 20
a) Elabore el gráfico de dispersión y calcula el coeficiente de correlación lineal.
b) Encuentre el modelo de regresión lineal simple
c) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de
d) ¿Es buena la predicción?
Solución:
a) Gráfico de dispersión
25
20
15
10
5
0
0 2
Nú4mero de a6ccidentes 8 10
En el gráfico de dispersión se observa una relación lineal positiva entre el número de accidentes y la velocidad que reco
si hay aumento de velocidad aumenta el número de accidentes.
Completando la pregunta a, se debe realizar los cálculos de la siguiente forma:
y = 1. 2 2 + 6. 8 2
5
R = 0.
x909
² 9
TES, definimos la ecuación de regresión estimada:
𝒊𝒄𝒊𝒅𝒂𝒅
sión:
ando no hay inversión en publicidad (X = 0)
publicidad las ventas se incrementan en 2.675 soles
egresión lineal
número de vehículos (Y) que circulan por una determinada autopista a más de 120 km/h, puede ponerse en
ocurren en
muestra en la siguiente tabla:
20
15
10
5
0
0 2
Nú4mero de a6ccidentes 8 10
a una relación lineal positiva entre el número de accidentes y la velocidad que recorren los vehículos, es decir
a el número de accidentes.
realizar los cálculos de la siguiente forma:
Accidentes Vehículos con x
2i y
2i xiyi
xi más de
120km/h yi
5 15 25 225 75
7 18 49 324 126
2 10 4 100 20
1 8 1 64 8
9 20 81 400 180
N
1113 4
09
y
2
xy
2
s 2 i
y 14
,2 20,96 ; s
2
i i
x.y 4
,8.14
,2 =13,64
N 5 13,64
N 5
s
xy
a) Por tanto:
r 0,996
s .s
x y
8,96. 20,96
b) Cálculos para la recta de regresión de y sobre x:
y y s (x x) y 14
,2 13,64
(x 4
,8) ;
xy
y 14
,2 1,53(x 4
,8)
2
8,96
Por tanto la recta de regresión de y sobre x:
y =6,89 + 1,53x
Para x = 6, y 14
,2 1,53(6 4
,8) , es decir, y = 16,04. Podemos suponer que ayer circulaban 16 vehículos por la autopista a más de 120 km/h
a) La predicción hecha es buena ya que el coeficiente de correlación está muy próximo a 1.
12.3 Preguntas de aplicación Problema 01:
La tabla siguiente muestra las notas que obtuvieron 8 alumnos en un examen, las horas de estudio dedicadas a su preparación
la televisión por semana previos al examen.
Nota 5 6 7 3 5 8 4 9
Horas de estudio 7 10 9 4 8 10 5 14
Horas de TV 7 6 2 11 9 3 9 5
a) Elabore las gráficas de dispersión correspondientes a: Nota-estudio y Nota-TV.
b) ¿Qué tipo de relación se observa en las gráficas de las variables estudiadas? ¿En qué caso estimas que hay una correlación m
c) Calcular e interpretar el coeficiente de correlación de Pearson: Nota-estudio y nota-TV. ¿Qué conclusión puede d
precisión respecto a la nota que obtuvo una persona en el examen: el tiempo que dedicó al estudio o el tiempo que ded
d) Encuentre las rectas de regresión correspondientes a: Nota-estudio y Nota-TV y estime para un alumno cualquiera
en el examen:
a) Las horas que estudió.
b) Las horas que vio la TV
Problema 02:
La tabla adjunta muestra el índice de mortalidad de una muestra de población en función del consumo diario de cigarrillos:
160
4
,8 8,96
2
4
09
4
,8.14
,2 =13,64
,53(x 4
,8)
Empleado x y x
2
y
2 xy
1 1 2 1 4 2
2 17 5
3 6 3
4 8 6
5 2 5
6 1 2
7 15 4
8 8 3
Total
a) Construya el gráfico de dispersión e interprete la tendencia de los datos.
b) Calcule e interprete el coeficiente de correlación de Pearson.
c) Formule el modelo de regresión lineal e interprete el coeficiente de regresión.
d) Calcule e interprete el coeficiente de determinación.
e) Si un trabajador tiene ocho años de servicio, ¿Cuál es la tasa de eficiencia estimada? Comente la validez de su resultado
Problema 04
Se desea pronosticar el costo de viajar en un avión comercial. Alguna de las variables que contribuyen son el tipo de avión, di
número de pasajeros, cantidad de equipaje, etc. Se realiza un estudio solo en el tipo de avión Boeing 737 que vuela 500
comparables durante la misma estación del año. ¿Puede el número de pasajeros pronosticar el costo de vuelo en esas rutas?
a. La variable independiente es:
b. La variable dependientes es :
c. ¿Existe relación entre las variables número de pasajeros y costo? ¿Qué tipo de relación
es?
d. La ecuación de regresión es:
e. Interprete los parámetros estimados
Vuelos 1 2 3 4
5 6 7 8 9 10 11
Número de pasajeros 61 63 67 69 70 74
76 81 86 91 95
Costo (miles $) 4
280 4
080 4
4
20 4
170 4
4
80 4
300 4
820 4
700 5110 5130 564
0
f. ¿En qué porcentaje el número de pasajeros es explicado por el costo?
g. El modelo estimado sirve para realizar pronósticos futuros?
Problema 05
La compañía Data WireS.A aumentó la productividad de 70 mil a 90 mil libras por semana cuando instituyó un prog
capacitación. Este programa fue aplicado durante un periodo de 18 meses. Los datos recolectados son el número total de
capacitación y la cantidad de producción por semana de cierto producto que fueron tomadas una vez al mes durante este tiem
Con los resultados de los datos se muestra a continuación responder el cuestionario:
s años de servicio y las puntuaciones de eficiencia de
n base a su tiempo de servicio (X). Los datos muestrales
de relación
12
97
5560
a.
Variables
predictoras
: (Cons
tante), Horas
acumuladas
de capacitación
Coef icientesa
Coeficientes
no Coeficientes
es
tandarizados
es
tandarizados
Horas
5.093 .198 .988 25.735 .000
acumuladas
de
a.
Variable dependiente: P roductividad (en libras
por s
emana)
capacitación
Se pide a usted:
a. Analizar la posible relación de las variables con el gráfico de dispersión.
b. Interpretar el coeficiente de correlación de Pearson.
c. Formule el modelo de regresión lineal e interprete el coeficiente de regresión
d. Evaluar la bondad de ajuste del modelo estimado ¿Qué tan bueno es para realizar estimaciones?
Problema 05
Los siguientes datos representan una muestra del consumo de agua por día y la mayor temperatura para ese día.¿Puede prono
agua de una ciudad por medio de la temperatura?
Las variables son:
Y : Cantidad de agua usada (millones de galones) X : Temperatura (grados Fahrenheit)
Algunos resultados que se tienen son los siguientes:
x 2 4
9584
xi * yi 86006
Scatterplot of Uso_agua vs Temperatura
225
200
175
150
125
100
75
50
40 50 60 70 80 90 100 110
Temperatura
Se pide a us
ted:b. Analizar la pos
ible relación de las
variables
en el gráfico de dis
pers
ión.c. Interpretar el coeficiente de correlación de P
Tema 13 Experimentos y probabilidades
13.1 Competencia a desarrollar
Resuelven problemas de probabilidades aplicando los diferentes teoremas y propiedadesdemostrando su proceso y capacidad de análisis
establecido.
13.2 Contenido del tema 13
Conceptos básicos de probabilidades
La teoría de la probabilidadse ocupa de estudios de experimentos aleatorios del cual la ocurrencia de resultados no se puede predeci
probabilidad es una medida de la certidumbre asociada a un suceso (evento) futuro cuyo resultado es un número entre 0 y 1 (o entr
es improbable que ocurra cuando es cercano a 0 y se tiene la certeza que ocurra cuando la probabilidad es cercana a 1.
Experimento aleatorio (ε)
Es cualquier experimento u operación cuyo resultado no puede predecirse con exactitud antes de realizarse el experimento.
Espacio muestral
Es el conjunto formado por todo los resultados posibles del experimento aleatorio. Denotaremos por la notación (omega) o con la let
Evento
Es un subconjunto del espacio muestral.
Tipos de eventos
Suceso seguro; está formado por todos los posibles resultados, es decirS, el espacio muestral.
Ejemplo1
Tirando un dado se obtiene una puntuación que sea menor que 4, más de 5
Evento imposible; carece de elementos
Ejemplo 2
Al tirar un dado obtener una puntuación de 7 A = { }
Operaciones con eventos
Sean los eventos A y B que ocurren en el espacio muestral
a) Unión de eventos:Sean los eventos de A y B eventos dependientes, entonces AUB se obtiene: AUB={w ϵ / w ϵ A ó w ϵ B} = A + B – A
modelo
Error típ. de
la es
timaci ón
.975 1005.64
4
Horas
acumuladas
de capacitación
ntesa
entes
arizados
8 25.735 .000
sión.
e regresión
s para realizar estimaciones?
ados Fahrenheit)
608
s
pers
ión.c. Interpretar el coeficiente de correlación de Pears
on.d. Formule el modelo de regres
ión lineal e interprete el coeficiente de regres
ióne. Evaluar
piedadesdemostrando su proceso y capacidad de análisis en el tiempo
acio muestral.
𝑛𝑠 �ú𝑚𝑒𝑟𝑜𝑑𝑒𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠𝑑𝑒𝑙𝑒𝑠𝑝𝑎𝑐𝑖𝑜𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Donde: 0 ≤ (PA) ≤1
13.3 Preguntas de aplicación Problema 01
El 60% de la población de una determinada ciudad lee el periódico A, el 35% el B y un 15% ambos.
Elegido un ciudadano al azar, calcular la probabilidad de:
a) Ser lector de algún periódico
b) No leer ninguno
c) Leer solo el periódico A
d) Leer solo uno de los dos periódicos
Problema 02
Una pareja al planificar una familia está interesada en tener 3 hijos, de acuerdo a esto determine los siguientes eventos:
A: Todos los hijos del mismo sexo A= { } B: Exactamente un varón B=
{ }
C: Por lo menos dos varones C= { } D: A lo más una mujer D=
{ }
Problema 03
Es frecuente que hombres y mujeres no estén de acuerdo en opinar acerca de seleccionar una pareja. Sin embargo, un grupo
investigación en parejas constituidas y aplicaron una encuesta a 1000 personas entre 20 a 30 años de edad. Una de la
lo más
importante para su futura pareja ser capaz de comunicar sus sentimientos (S) o el vivir bien con esa persona (V).La informació
resume en la siguiente tabla:
SEXO OPINIÓN
Total
Sentimientos (S) Vivir bien (V)
Hombres (H) 350 200 550
Mujeres (M) 360 90 450
Total 710 290 1000
Si se selecciona al azar una persona del grupo de 1000, calcule las siguientes probabilidades:
a) P(S) b) P (H) c) P(S U V) d) P(S U M)
Problema 04
La probabilidad de que un hombre viva 10 años más es 1/4, y la probabilidad de que su esposa viva 10 años más es 1/3. Encon
que (i) ambos estén vivos dentro de 10 años, se pide calcular:
a) Por lo menos, uno esté vivo dentro de 10 años
b) Ninguno de los dos esté vivo dentro de 10 años
c) Solamente la esposa este viva dentro de 10 años
Problema 05
Tres mujeres compiten por un puesto de secretaria ejecutiva. Las candidatas A y B tienen la misma oportunidad de ganar
el doble de oportunidad que las candidatas A y B. ¿Cuál es la probabilidad de que gane C? ¿Cuál es la probabilidad de que A no
Problema 06
La probabilidad de que se venda el producto A es 15%, el producto B es el 5% y la probabilidad que se vendan ambos producto
promoción es 4% ¿Cuál es la probabilidad que se venda el producto A o el producto B dicho día?
Problema 07
En una clase de Administración Financiera hay 6 mujeres y 4 hombres según el número de inscritos. Se han elegido al azar a 7
probabilidad de elegir más mujeres que hombres?
Problema 08
En cada uno de los enunciados califique como verdadero (V) o falso (F) y arguméntelo:
a) La probabilidad de la unión de dos eventos independientes es P(AUB) = P(A) + P(B) ( )
Tema 14
Probabilidad condicional y teorema de Bayes
14.1 Competencia a desarrollar
Resuelven problemas de probabilidad condicional y aplica elteorema de Bayes demostrando su proceso y capacidad de análisis en el tiempo
14.2 Contenido del tema 14
Probabilidad condicional
En un espacio muestral, la probabilidad condicional se define como la probabilidad de un evento A dado que ha ocurrido el evento B.
� 𝐴/𝐵 =
𝑛 𝐴 ∩ 𝐵 = �ú𝑚𝑒𝑟𝑜𝑑𝑒𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠𝑑𝑒𝑙𝑒𝑣𝑒𝑛𝑡𝑜𝐴∩ 𝐵
B
𝑝𝑎𝑐𝑖𝑜𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
ambos.
obabilidades:
M)
éntelo:
+ P(B) ( )
P(B) ( )
r que cualquiera desus
( )
( )
e 1. ( )
austivos. ( )
Moshera.
bia: MCGRAW HILL.
Editores.
stica descriptiva yprobabilidad.(1ª ed) 1Lima: Fondo Editorial USIL.
� 𝐴𝑖/𝐵 = � 𝐵/𝐴𝑖
�𝐵
Ejemplo 23
En esta aula el 70% de los alumnos son hombres.De ellos el 10% son fumadores. El 20% de las mujeres son fumadoras. ¿Cuál es
seleccionar una persona, ésta sea fumadora?
Solución
Sean los eventos:
H: Hombre F: Fuma
Fum
0,1
Hombre
0,7
No fuma
0,9
Estudiante
0,2 Fum
0,3
Mujer
0,8
No fuma
nte excluyentes, y ocurre un evento común B en todas las particiones. Por tanto la probabilidad
� 𝐴𝑖/𝐵 = � 𝐵/𝐴𝑖
�𝐵
10% son fumadores. El 20% de las mujeres son fumadoras. ¿Cuál es la probabilidad que al
firma A produce el 2% de fallados y provee el 25% de las necesidades de la empresa. La firma B
mpresa. La firma C produce un 3% de fallados y provee el 45% de las necesidades de la
e el 60% de sus clientes le compra (solo) periódicos y 20% le compra periódicos con otros
Buenos días Perú” en la mañana, y otro 24 horas”, en la noche. El 10% de las familias de esta
por la noche y 7% ven ambos programas ¿Cuál es el porcentaje de las familias que no ven
ntratos. La Gerencia piensa que la probabilidad de ganar el primer contrato es de 60%, y que
contrato. La Gerencia cree, que si Análisis S.A. gana el primer contrato va a tener un 70% de
la probabilidad de ganar el segundo disminuirá a 0.10.
os?
ontrato?
Región Sí No
Noreste 148 52
Oeste 162 54
medio
Sur 296 74
Oeste 252 48
Total 858 228
a) ¿Cuál es la probabilidad de que en Estados Unidos un conductor lleve puesto el cinturón?
b) Un año antes, la probabilidad en Estados Unidos de que un conductor llevara puesto el cinturón era
0.75. El director de NHTSA, doctor Jeffrey Runge esperaba que en 2003 la probabilidad llegara a
0.78. ¿Estará satisfecho con los resultados del estudio del 2003?
c) ¿Cuál es la probabilidad de que se use el cinturón en las distintas regiones del país?
d) ¿En qué región se usa más el cinturón?
Problema 10
Una empresa que produce pasta de dientes está analizando el diseño de cinco empaques diferentes. Suponiendo que existe
que los clientes elijan cualquiera de los empaques, ¿cuál es la probabilidad de selección que se le asignaría a cada diseño de e
se pidió a 100 consumidores que escogieran el diseño que más les gustara. Los resultados se muestran en la tabla siguiente. ¿
creencia de que existe la misma posibilidad de que los clientes
elijan cualquiera de los empaques? Explique
e al crédito?
n independientes? Explíquelo.
arios de acuerdo a
do que es mujer?
eniería?
ie Contabilidad?
era
ara a
?
1
2
3
4
5
Problema 11
Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan correcciones faciales, un 35% im
restante en otras cirugías correctivas. Se sabe además, que son de género masculino el 25% de los que se realizan correcciones faciales,
40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:
a. Calcula la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, ¿Cuál es la probabilidad que se haya realizado una cirugía de implantes mamarios?
14.4 Bibliografía
1. Córdova, M. (2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.) Lima: Moshera.
2. Webster, A. (2006). Estadística aplicada a los Negocios y la Economía.(3ra ed.) Colombia: McGraw Hill.
3. García, J.(2005). Estadística descriptiva y nociones de probabilidad. España: Thomson Editores.
4. Montesinos, L, Bayonas, Y, Cerna, E, Llanos, K, Pajuelo, S. (2016).Estadística descriptiva yprobabilidad.(1ª ed) 1Lima: F
Bibliografía1.Córdova, M. (2003). Es
tadís
tica Des
criptiva e Inferencial. Aplicaciones
. (5ª ed.) Lima: Mos
hera. 2.Ávila, RB. (20
Número de veces que fue elegido
5
15
30
40
10
ujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan correcciones faciales, un 35% implantes mamarios y el
as cirugías correctivas. Se sabe además, que son de género masculino el 25% de los que se realizan correcciones faciales, 15% implantes mamarios y
as correctivas. Si se selecciona un paciente al azar, determine:
obabilidad de que sea de género masculino
e es de género masculino, ¿Cuál es la probabilidad que se haya realizado una cirugía de implantes mamarios?
afía
(2003). Estadística Descriptiva e Inferencial. Aplicaciones. (5ª ed.) Lima: Moshera.
(2006). Estadística aplicada a los Negocios y la Economía.(3ra ed.) Colombia: McGraw Hill.
005). Estadística descriptiva y nociones de probabilidad. España: Thomson Editores.
L, Bayonas, Y, Cerna, E, Llanos, K, Pajuelo, S. (2016).Estadística descriptiva yprobabilidad.(1ª ed) 1Lima: Fondo Editorial USIL.
ografía1.Córdova, M. (2003). Es
tadís
tica Des
criptiva e Inferencial. Aplicaciones
. (5ª ed.) Lima: Mos
hera. 2.Ávila, RB. (2010). Es
tadís
tica Elemental. Lima
aciales, un 35% implantes mamarios y el
cciones faciales, 15% implantes mamarios y
rios?