Академический Документы
Профессиональный Документы
Культура Документы
Guía de estudios
2019-1
Estadística
Docente:
Dra. Dany B. Lázaro Silva.
Pertenece a:
Este material ha sido preparado para que sea utilizado en las actividades del curso, tanto en clase como en el
desarrollo de actividades por encargo.
Aquí podrás hacer tus anotaciones de clase y ejercitarte para lograr el dominio esperado en este curso.
Recomendaciones:
• Ser puntuales en el ingreso a las aulas, los controles y trabajos para la continua se tomaran o recibirán
en los primeros minutos. La inasistencia a una evaluación es calificada con nota 0 (cero).
• Para el registro de la asistencia en el sistema, la tolerancia será de 5 minutos, pasado los cuales no se
considerará asistencia en el sistema (va para el cómputo del DPI).
• Los celulares deberán mantenerse apagados durante las clases. La interrupción por el uso de ellos
generará la disminución de un punto (cada vez) sobre el promedio de las notas continuas a todos los
estudiantes de la sección.
• Durante el curso de Estadística nos dedicaremos en exclusivo al mismo, por ello traeremos calculadoras
(con cálculo de raíz cuadrada).
• Cumplir con la presentación de los trabajos indicados en la fecha prevista; no se aceptarán trabajos
fuera de fecha.
2
Estadística 2019-I
Contenido: Historia. tipos. usos en la vida cotidiana y en campos especializados. análisis de la realidad.
variables: definición, tipos; unidad de análisis.
Historia de la estadística
Etapas Eventos
Comprendida desde la antigüedad hasta mediados del siglo XVIII.
Inicial Vinculada a los censos poblacionales, registro de bienes y servicios de un Estado.
3
Estadística 2019-I
Lectura
HISTORIA DE LA ESTADÍSTICA
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar,
hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al
historiador griego Herodoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la
construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de
verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en
dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un
censo de Israel con la finalidad de conocer el número de la población.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos
periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres
disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos,
determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de
la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la
obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado
y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del imperio.
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones
Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por
Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos
censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran
Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa
obra fue el primer compendio estadístico de Inglaterra.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William
Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que
cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método
capaz de aplicarse a los datos económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía
por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno
inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en
1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En
1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el
número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones
y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las
Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.
4
Estadística 2019-I
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales,
comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el
siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los
campos de la inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la
especulación sobre si la población aumentaba, decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las
riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos
para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que
vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos
parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años
no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el
astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de
seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades
limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas
científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo
del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el
aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término
latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por
cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la
probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la
variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación práctica de todo el
método Estadístico, entonces conocido, a las diversas ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la
teoría Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los
mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó
el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las
variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores
de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios
sobre la medida de las relaciones.
Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de
probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que
el determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio
se juzga aplicable tanto a las ciencias sociales como a las físicas.
Apoyado en la información de la clase, la lectura y otras fuentes que puedas utilizar (no olvide citarlas en el
trabajo), elabore un gráfico (línea de tiempo u otro) para mostrar la historia de la estadística. Se debe presentar
en la próxima clase.
5
Estadística 2019-I
El trabajo de investigación se desarrollará de manera progresiva conforme se desarrollen los temas en las
sesiones de clase. La presentación de los avances corresponde a las evaluaciones continuas, mientras que el
informe final se vincula al Examen Final.
Debe tener como mínimo 20 ítems: 4 datos generales (por lo menos 1 corresponderá a una variable ordinal), 1
pregunta de filtro, 8 sobre variables cuantitativas y 7 sobre variables cualitativas.
6
Estadística 2019-I
¿Cómo se registra información en una ficha?
7
Estadística 2019-I
Definición de estadística
Etimológicamente:
El término alemán Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refería al análisis de datos del
Estado, es decir, la «ciencia del Estado» (o más bien, de la ciudad-estado). También se llamó aritmética política de acuerdo
con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de
recolectar y clasificar datos. Este concepto fue introducido por el militar británico sir John Sinclair (1754-1835).
Definiciones:
La definición de estadística de Cecili Salazar P. y Santiago del Castillo G. es “Una ciencia que permite recoger, ordenar
presentar, analizar y establecer conclusiones sobre el comportamiento de datos que provienen de variables y ayuda a la
toma de decisiones”. (Salazar P. & Del Castillo G., 2018)
Según lo establecido por Salazar y Del Castillo, la estadística es parte fundamental para estudiar a la sociedad y a los
problemas que lo rodean; por ejemplo, en las campañas electorales se necesita un uso constante de la estadística sea para
recolectar las opiniones, analizar la tendencia a cierto partido político dependiendo de la región y generar conclusiones de
ello. Otro ejemplo, en relación a mi carrera, arquitectura, es la investigación climática de la zona para la construcción de un
lugar que sea bio agradable y ecológico, , es decir, la recolección de datos sobre la temperatura, humedad, velocidad y
dirección de los vientos, precipitaciones, radiación y dirección de los rayos solares; y, zona de confort adicionando datos
invariables como la flora, la fauna, la ubicación (latitud y longitud) y altitud, nos permite entender ciertas características que
condicionan a las decisiones para crear un lugar. Por ejemplo, en Moquegua, existe una arquitectura vernácula, arquitectura
única y nativa de un lugar, que se llaman casas de techos de mojinete. Dichas casas poseen una altura determinada, un
material y grosos para las paredes y techos, ubicación de ventanas y puertas; y, la forma de techo mojinete que responden
adecuadamente al clima del lugar. En fin, la estadística es una ciencia invaluable que ayuda como herramienta para la
investigación sobre cualquier tema.
1. Elaborar tres fichas textuales sobre definiciones de estadística, utilizando fuentes bibliográficas.
2. Realice una ficha de comentario sobre la definición.
3. Elabora un mapa mental o conceptual sobre su propia definición de estadística
Tipos de estadística
Descriptiva Inferencial
Tipos
1. Selecciona y adjunta como mínimo 3 artículos periodísticos o académicos en los que se observe el uso
de la estadística.
2. Resalta la información estadística y coméntala.
9
Estadística 2019-I
Las variables
Ejemplo 1: Artistas
Ejemplo 2: Cantantes
10
Estadística 2019-I
Inspiraciones Lady gaga the beatles
Las variables se denotan (se reemplazan o codifican) con las últimas letras del alfabeto (x, y, z) mientras que los
valores que pueden tomar se los identifica con la letra acompañada de un número sub índice. Por ejemplo:
Ejercicio 1:
Si quisiéramos estudiar las características de los estudiantes que se encuentran en el aula; ¿cuáles serían las
variables y sus dominios de variación?
11
Estadística 2019-I
Tipos de Variables
Las variables toman distintos criterios para poder clasificarlas; en el curso tomaremos como criterio su
naturaleza, de esta manera tenemos tres tipos de variables:
• Ordinales
• Nominales Cualitativas
• Continuas
• Discretas Cuantitativas
Las cualitativas expresan cualidades o atributos que no son susceptibles de cuantificar, no hacen uso de los
números, en cambio se pueden clasificar o categorizar. Por ejemplo:
Edad:
Primero
Segundo
Las ordinales pueden utilizar los números para expresar orden, pero no se puede hacer operaciones
aritméticas con ellos. Admiten relaciones de tipo mayor que- menor que, antes que-después que. Por
ejemplo:
Edad:
Primero
Segundo
Las nominales solo permiten la clasificación o categorización, no se puede establecer ningún tipo de orden
para establecer jerarquías o valores. Por ejemplo:
Edad:
Mayor de edad
Menor de edad
Las cuantitativas utilizan escalas de medición, se pueden medir o contar, representan magnitudes y se puede
realizar operaciones aritméticas con ellas, que tienen un significado. Por ejemplo:
Edad:
10
11
12
13
14
15
Las discretas se expresan en números enteros, son el resultado de contar. Por ejemplo:
Cantidad de personas de cierta edad:
10 – 20 PERSONAS
15- 25 personas
12
Estadística 2019-I
Las continuas se expresan en cualquier número, admite valores decimales o fraccionales, son el resultado
de medir. Por ejemplo:
Porcentaje de personas
10- 40%
15- 60%
Ejercicio 2:
Relacione las variables con el tipo, según corresponda: Variable Cualitativa Ordinal = 1 , Variable Cualitativa
Nominal= 2 , Variable Cuantitativa Discreta= 3 y Variable Cuantitativa Continua= 4.
Unidad de Análisis
Representan los “objetos de investigación”, sobre quienes o qué trata el estudio, son los que portan la variable.
Por ejemplo:
• Se quiere hacer una investigación sobre los colores favoritos de los niños para lanzar un nuevo producto
escolar, dirigido a desarrollar actividades lúdicas.
• Se quiere hacer una investigación sobre las características básicas que deben tener los arquitectos
egresados de UCAL
13
Estadística 2019-I
Perú tiene casi 8.5 millones de jóvenes pero ¿cuántos tienen educación superior?
De la población de 15 a 29 años de edad, el 17.6% no estudian ni trabajan, por lo cual se encuentran en una
situación de mayor vulnerabilidad, según el INEI.
Con motivo del Día de la Juventud, el jefe del Instituto Nacional de Estadística e Informática (INEI),
Aníbal Sánchez, informó que, de acuerdo a proyecciones para el año 2017, en el Perú existen 8
millones 441 mil jóvenes de 15 a 29 años de edad, de los cuales 4 millones 275 mil son hombres y 4
millones 165 mil mujeres.
Al año 2016, se tiene que el 35.8% de jóvenes peruanos cuenta con educación superior, de los cuales
21.5% con educación superior universitaria y 14.3% con superior no universitaria, de acuerdo con los
resultados de la Encuesta Nacional de Hogares (Enaho).
Añadió que, la proporción de jóvenes con educación superior se incrementó cerca de cinco puntos
porcentuales en relación con el año 2011 (30.9%). En el año 2016, el 55.7% cuentan con educación
secundaria y el 8,5%, educación primaria.
De acuerdo al área de residencia, presentaban mejor nivel educativo los jóvenes del área urbana, donde
el 41.3% tiene estudios superiores (16% no universitarios y 25.3% universitarios), que en el área rural, en
que solo 13.9% cuenta con estudios superiores (7.7% y 6.3%, respectivamente).
Censos Nacionales 2017El jefe del INEI señaló que los resultados de los Censos Nacionales 2017, que
se realizarán el 22 de octubre, permitirán obtener información actualizada sobre la población joven en el
Perú y sus condiciones de vida, lo que servirá para implementar adecuadas políticas públicas en beneficio
de este grupo poblacional.
Jóvenes y la PEA Los jóvenes que integran la Población Económicamente Activa (PEA) suman 5 millones
15 mil, de los cuales 3 millones 910 mil se encuentran en el área urbana y 1 millón 105 mil en el área rural.
Del total de jóvenes de la PEA, el 91.6% tiene empleo y el 8.4% busca empleo activamente. Según área
de residencia, la tasa de desocupación es superior en el área urbana (10.2%) que en el área rural (1.7%).
De la población ocupada joven, el 78.6% tiene un empleo informal, lo que muestra una disminución
respecto al año 2015 (80.1%); en tanto, el empleo formal en el año 2016 representó el 21.4%, tasa mayor
a la del año anterior (19.9%).
Área de servicios A nivel nacional, por tipo de ocupación, el 41.9% de la población joven ocupada se
desempeña en la rama de servicios: 10% en Transportes y Comunicaciones; 8% en Hoteles y
restaurantes; 3.5% en Enseñanza; y 20.3% en Otros servicios (como intermediación financiera, actividad
inmobiliaria, empresarial, entre otros).
Les siguen las actividades económicas de Agricultura, Pesca y Minería (22.7%), Comercio (18.7%) y
Manufactura (10.5%).
Por área de residencia, se observa que en el área rural, la población joven ocupada se desempeña
principalmente en el sector primario (68%) Agricultura, Pesca y Minería, en tanto que en el área urbana,
el 50.2% se encuentra en el sector de servicios.
14
Estadística 2019-I
La tasa más alta de jóvenes que no estudian ni trabajan se encuentra en el grupo de 25 a 29 años de
edad (19.4%).
Según sexo, la proporción de mujeres que no estudian ni trabajan (23,5%) es mayor que la de hombres
(11.9%).
Seguro de saludAl año 2016, del total de jóvenes, el 67.6% tienen un seguro de salud, lo que evidencia
un incremento de más de 12 puntos porcentuales con respecto al año 2011 (55.1%).
De acuerdo con el área de residencia, cuentan con un seguro de salud el 79% de los jóvenes en el área
rural y el 64.8% en el área urbana.
40 de cada 100 jóvenes acceden a algún servicio del sistema financiero formalEl 40,1% de los jóvenes de
18 a 29 años de edad han tenido acceso a alguno de los servicios del sistema financiero formal (cuenta
de ahorro, cuenta corriente, ahorro a plazo fijo, cuenta con tarjeta de crédito o tarjeta de débito).
Al año 2016, el 32,8% tiene una tarjeta de ahorro, el 32,4% una tarjeta de débito y solo el 8,8% una tarjeta
de crédito.
https://gestion.pe/economia/peru-8-5-millones-jovenes-educacion-superior-144111
En el texto puedes encontrar variables sin que se expliciten sus dominios de variación o pueden señalar
dominios de variación sin mencionar a la variable. Debes identificar variables (explicitas o no) y señalar sus
dominios (explícitos o no).
15
Estadística 2019-I
Población (N)
La población es el conjunto de todas las observaciones posibles de la unidad de análisis respecto a la variable de
estudio.
Homogénea
La población puede ser
Heterogénea
Población Tipo
Heterogénea
Alpacas blancas puneñas nacidas
en el mes de agosto del 2017
Heterogénea
Jóvenes electores de Lima
Heterogénea
Lectores de El Comercio
Si se desea conocer el promedio de notas de los estudiantes de UCAL ¿quiénes conformarían la población?
Muestra (n)
REPRESENTATIVA
16
Estadística 2019-I
Técnicas de muestreo
Son los métodos y procedimientos para determinar la muestra. Implica determinar el tamaño de la muestra y
los miembros o integrantes de la muestra.
Tamaño de la muestra
Para obtener el mínimo número de elementos que constituyen la muestra se utiliza la siguiente fórmula:
Donde:
Basado en la Teoría
n =Tamaño de la muestra de las Probabilidades
N = Tamaño de la población p+q=1
Z = Nivel de confianza: al 95% = 1,96; al 99% = 2,57
p = Probabilidad de ocurrencia (Si no tenemos el dato asumiremos que
es de 0,5)
q = Probabilidad de no ocurrencia q=1-p
d = Nivel de precisión. Consideraremos que es de 0,1
Ejercicio 4: Se desea realizar un estudio sobre el clima laboral en una empresa de marketing, en la que laboran
120 empleados (N). ¿Cuál es el tamaño mínimo de la muestra, si el nivel de confianza (Z) elegido es de 95%
(1,96), la probabilidad de encontrarlo es 0,5 y el nivel de precisión (d) es de 0.1?
17
Estadística 2019-I
Ejercicio 5: Se desea realizar un estudio sobre la percepción de la calidad de servicio de la cafetería en una
empresa de servicios educativos, en la que estudian 680 seminaristas (N). ¿Cuál es el tamaño mínimo de la
muestra, si el nivel de confianza (Z) elegido es de 95% (1,96), la probabilidad de encontrarlos es 0,8 y el nivel de
precisión (d) es de 0.1?
Procedimientos de muestreo
Ejemplo: Ejemplo:
Tipos de muestreo
18
Procedimientos para obtener una muestra probabilística
Pasos
1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los
elementos que conforman la elementos que conforman la elementos que conforman la elementos que conforman la
población. población. población. población.
2. Elaborar tarjetas o balotas con el dato 2. Elaborar tarjetas o balotas con el dato 2. Tomar en cuenta el número de dígitos 2. Determinar el valor del intervalo K,
de cada elemento de la población. de cada elemento de la población. de la población y el rango válidos para aplicando la fórmula:
3. Colocar las balotas en un ánfora. 3. Colocar las balotas en un ánfora. la selección de la muestra; de 1 a n. K= N
4. Sacar la primera balota, registrarlo en 4. Sacar la primera balota, registrarlo en 3. Establecer una intersección de filas y n
la relación de sujetos muestrales y la relación de sujetos muestrales y columnas así como una dirección 3. Elegir un primer elemento, al azar o
devolver la balota al ánfora. dejar la balota fuera del ánfora. (arriba, abajo, a la derecha o de manera arbitraria, que se
5. Sacar la segunda balota, registrarlo en 5. Sacar la segunda balota, registrarlo en izquierda) para iniciar la búsqueda de encuentre dentro del rango de la
la relación de sujetos muestrales y la relación de sujetos muestrales y los sujetos muestrales. población, de 1 a n. Constituirá el
devolver la balota al ánfora; así dejar la balota fuera del ánfora; así 4. Se elabora la relación de los primer sujeto muestral.
sucesivamente hasta completar la sucesivamente hasta completar la seleccionados, en la que se puede 4. A ese número elegido, se le debe
muestra.. muestra. identificar a la muestra por los sumar el valor de K, y así se obtiene
6. Se elabora la relación de los 6. Se elabora la relación de los números asignados a la población. el segundo sujeto muestral.
seleccionados, en la que se puede seleccionados, en la que se puede 5. A ese segundo sujeto muestral se le
identificar a la muestra por los identificar a la muestra por los adiciona el valor de k, obteniendo el
números asignados a la población. números asignados a la población. tercer sujeto muestral; así
sucesivamente hasta completar la
muestra.
OBSERVACIÓN: Si alguna balota 6. Se elabora la relación de los
seleccionada vuelve a salir debe obviarse OBSERVACIÓN: Se requiere utilizar la seleccionados, en la que se puede
su registro y retornarla al ánfora. tabla de números aleatorios. identificar a la muestra por los
números asignados a la población.
Estadística 2018-2
Ejercicio 6: Se desea seleccionar una muestra para realizar un estudio sobre las marcas de bebidas preferidas
por los estudiantes de un sector de la UCAL al que asisten 80 alumnos. Se ha determinado que la muestra
estará formada por 22 estudiantes. Indica las acciones que se deben realizar para identificar a la muestra,
utilizando el Muestreo Aleatorio Simple sin reemplazo
Ejercicio 7: Se desea seleccionar una muestra para realizar un estudio sobre los cursos de formación general
preferidos por los estudiantes de la UCAL, siendo la población (N) de 359 alumnos. Se ha determinado que la
muestra estará formada por 20 estudiantes. Indica las acciones que se deben realizar para identificar a la
muestra, utilizando la Tabla de Números Aleatorios.
20
Estadística 2018-2
1 2 3 4 5 6 7 8 9 10
1 8735 6744 5149 1898 9784 7522 5329 1052 2687 5492
2 2552 2067 3599 4888 4068 6368 8239 3847 9139 1100
3 8717 8331 2559 8748 2580 2408 8145 2132 9008 4431
4 0504 4035 7295 4856 7757 6319 8019 4852 0647 6498
5 8116 0924 9171 2976 5401 5347 3067 6293 5658 1001
6 5485 7988 5791 1169 1022 7187 2492 5264 4282 7895
7 4478 1918 3540 2766 8972 2117 7169 9517 9717 6260
8 9720 9897 3733 9375 1888 3585 4605 0720 0817 6624
9 9877 5751 4041 7624 1854 6061 7913 9457 5073 8968
10 7812 7730 8330 5928 7333 4707 6007 4538 8210 7319
11 4119 7062 4346 0613 2238 3118 6460 0714 4916 2816
12 7064 3055 6746 9579 6366 8256 6710 7077 0322 4218
13 0656 0989 6887 7919 3594 0618 1794 7281 7377 9239
14 2946 1828 0888 4856 4944 6782 7267 2883 1026 5813
15 4214 5551 7295 2925 1518 2568 4892 8716 7843 1747
16 3375 8715 1523 1379 6273 7669 0977 8265 7247 5956
17 0980 9961 9808 3411 8879 0832 4678 3358 4116 1223
18 9831 5750 8580 5339 0592 5442 2901 3523 0984 9664
19 5170 5255 8312 9502 7911 4979 8795 9848 8868 6477
20 2783 6107 4905 4620 3578 3134 4250 6811 4214 2977
21 7884 6915 6442 9239 3608 5639 3502 9278 4663 8208
22 2212 8966 4909 9910 6253 1931 8183 5043 3742 1000
23 6941 5954 8272 4466 6403 7659 1212 4156 3490 2606
24 5499 4654 5138 5907 6421 8117 8847 2305 6343 0867
25 9991 8479 9262 4424 0134 4516 3356 1778 4286 7094
21
Estadística 2018-2
Ejercicio 8: Se desea seleccionar una muestra con la finalidad de realizar un estudio sobre las empresas de
diseño de interiores de Lima, siendo la población (N) de 337. Se ha determinado que la muestra estará
formada por 21 empresas. Indica las acciones que se deben realizar para identificar a la muestra, utilizando
el muestreo sistemático.
22
Estadística 2018-2
Sistemas
Características
Ejemplo
Fuentes
Primaria Secundaria
Ejercicio 1
El Ministerio de Cultura desea conocer las características sociodemográficas de los usuarios para tomar
decisiones sobre la organización de las visitas a las ruinas de Caral.
23
Estadística 2018-2
Técnicas de Recopilación
Cuestionario Cuestionario
Ejercicio 2
Tomando en cuenta el enunciado del ejercicio 1:
¿qué técnica es la más apropiada?
¿Qué instrumento de recolección de datos desarrollaría? ¿Por qué?
24
Estadística 2018-2
Estructura de la variable
4. Tasa de escolaridad de 06 a 16
años.
Ejercicio 3
25
Estadística 2018-2
Unidad de análisis:
¿Cómo se elaboran los instrumentos?
Se parte de la estructura de la variable y se formula una o más preguntas (o ítems) por cada indicador o
variable de estudio.
Generalmente, se realizan preguntas sobre otras características (datos generales, por ejemplo) que no
siendo variables de estudio son relevantes para entender el comportamiento o respuestas recogidas.
1. Número de ingesta de comidas por Marque con una “X” las comidas que consume
día en un día:
Desayuno
Para el indicador 1
Lonche
La matriz de datos nos permite organizar una base de datos para poder registrar las respuestas de nuestra
unidad de análisis; la referencia de la matriz nos señala los dominios de variación de la variable o indicadores.
Ejercicio 4
26
Estadística 2018-2
Trabajo por encargo 5 (grupal)
En grupos de 4 estudiantes:
• Obtenga información sobre un producto (por ejemplo: pasta dental, bebidas gaseosas, etc).
• Elija una técnica de recolección de datos y elabore el instrumento.
• Debe tener como mínimo 20 items: 4 datos generales (por lo menos 1 corresponderá a una variable
ordinal), 1 pregunta de filtro, 8 sobre variables cuantitativos y 7 sobre variables cualitativas.
• Identifique las variables, indicadores y elabore los ítems.
• Identifique a la unidad de análisis (accesible).
• El instrumento deberá aplicarse a 20 personas, como mínimo.
Amenidades
Xi representa a todos los valores que toma la variable nota (es decir,
reemplaza a X1, X2, … Xn.)
Para denotar la resta se utiliza el signo (-), para la multiplicación se puede usar
(x), (*), (.) o simplemente colocar los factores juntos; para la división se usa (/).
27
Estadística 2018-2
tipo de variable
Frecuencias
sumatoria total
Elementos
Cuadro N° 1
Universidad de Ciencias y Artes de América Latina
Población estudiantil por carrera matriculada en el curso de Estadística
La Molina – 2013-0
Carrera fi hi%
Arquitectura de interiores
Comunicación
Diseño Gráfico Publicitario
Total
Fuente: Estudiantes de estadística 2013-0
Elaboración propia
28
Estadística 2018-2
Si el dominio de variación está constituido por muchos valores distintos, entonces se trabaja con datos
agrupados, por ejemplo: edades de los pacientes de una clínica: 0 -8; 9 – 17; 18 – 26; 27 – 35; 36-44; 45-53;
54-62; etc. Se llama agrupados porque los valores están formando grupos, de los cuales sólo vemos los
extremos: desde 0, hasta 8, lo que incluye 0, 1, 2, 3, 4, 5, 6, 7 y 8.
Recolectemos algunos datos, de 10 compañeros; la pregunta es: ¿A qué edad consumiste alcohol por
primera vez?
Respuestas:
Ejercicio 1: Ordene los datos del grupo, en orden creciente (de menor a mayor)
Rango o Recorrido (R): Es la diferencia entre el mayor y el menor de los valores de la variable.
Ejercicio 2: Identifique
Clase (K): Son las celdas que contienen los dominios de variación o los valores de las variables que se
presentan en una tabla. No existe un número mínimo o máximo de clases; sin embargo, por convención se
recomienda entre 5 a 15 clases para facilitar la organización y presentación de los datos.
Límites de clase: Cuando se trabaja con datos agrupados, estos forman un intervalo. Los límites de clase son
los valores extremos, superiores e inferiores, del intervalo de clase. Por ejemplo:
Notas
3 clases 1 - 5 Clase 1 o K 1
Límite inferior= 6 - 10
K=3 11 - 15 Límite superior =
Total
29
Estadística 2018-2
Ejercicio 3:
Frecuencia: Son las veces en que se observa o se repite un valor o valores de una variable, que se muestran
en las clases.
Frecuencia Absoluta Simple (fi ): Señala las veces que se repite los valores de una clase, basado en los datos
reales, tal como se recogieron de la realidad.
Frecuencia Absoluta Acumulada (Fi): Señala las veces que se repiten los valores en la acumulación de datos,
tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con la que se trabaje. Sólo se
utilizan con variables cuantitativas, en las tablas numéricas.
Frecuencia Porcentual o Relativa Simple (hi% ): Señala el porcentaje en el que se repite los valores de una
clase, basado en los datos reales; se considera como 100% el total de datos obtenidos de la realidad y se
trabaja con las fi. Se obtienen mediante la aplicación de la regla de 3 simple.
Frecuencia Porcentual o Relativa Acumulada (Hi% ): Señala el porcentaje en el que se repite los valores en
la acumulación de datos, tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con
la que se trabaje; se considera como 100% el total de datos obtenidos de la realidad y se trabaja con las Fi. Se
obtienen mediante la aplicación de la regla de 3 simple. Sólo se utilizan con variables cuantitativas, en las
tablas numéricas.
Datos: X= Edad
X1 = 17 X2 = 23 X3 = 23 X4 = 22 X5 = 19
Edad fi Fi hi% Hi%
X6 = 16 X7= 24 X8 = 21 X9 = 20 X10 = 18
16 - 18 años 4 20,00
X11 = 19 X12 = 21 X13 = 23 X14 = 17 X15 = 21 19 - 21 años
X16 = 21 X17 = 20 X18 = 19 X19 = 22 X20 = 21
22 – 24 años
Número de alumnos de un curso de diseño gráfico
Total 20
Si 20 es el 100%,
¿cuánto será 4?
Para hallar h1%
20 - 100%
X = 4 x 100 = 400 = 20,00
4 - X 20 20
30
Estadística 2018-2
Ejercicio 4:
Para formar los intervalos, requerimos trabajar con los siguientes elementos:
Número de clases (K): Se utiliza en el caso de tablas numéricas de datos agrupados. Se calcula aplicando las
siguientes fórmulas:
K = 1 + 3,3 (log.N) ó K = √n ó 2k
Ejercicio 5:
Tamaño de clase (t): Es la longitud o el ancho de los intervalos o la diferencia entre los límites de una misma
clase.
t= R -c o t = L superior - L inferior
K
Ejercicio 6: Para
Valor mayor = 48 Valor mayor = 89 Valor menor = 13 Valor menor = 23
n= 25 n= 36
Amplitud de intervalo (w): Es la cantidad de datos que están comprendidos en un intervalo de clase o la
diferencia de dos límites iguales de dos clases sucesivas.
31
Estadística 2018-2
Ejercicio 7: Halle la amplitud para
Valor mayor = 48 Valor mayor = 88 Valor menor = 13 Valor menor =
26 n= 36 n= 81
32
Estadística 2018-2
Gráficos
Utiliza la frecuencia absoluta simple (f), con Utiliza la frecuencia absoluta simple (f), con variables cuantitativas
discretas. variables cuantitativas continuas.
Polígono de frecuencias
Edad de profesionales
La industria – La Libertad
33
Estadística 2018-2
Ejercicio 9: ¿Qué gráfico se debe usar?
Dados los siguientes datos correspondientes a las notas obtenidas por un grupo de alumnos en el curso de
Estadística:
1 8.5 7 15.5 5
n=
34
Estadística 2018-2
2. Determine el R.
V mayor = V menor=
R=
3. Determine el valor de K.
t= w=
fi Fi hi% Hi%
Total
35
Estadística 2018-2
7. Interprete el f3 y el H4%
A partir del instrumento aplicado por el grupo, elabore la distribución de frecuencias y gráfico
correspondiente para cada dato obtenido. Se presentará en la próxima clase.
36
Estadística 2018-2
Evaluación parcial
RECORDEMOS:
X representa a la variable
Xi representa a todos los valores que toma la variable (reemplaza a X1, X2, …
Xn.)
(x), (*), (.) o simplemente colocar los factores juntos, son las formas en las que
se señala que debe multiplicarse.
∑ Xi =
X i2 =
∑ Xi =
n Xi - 1 =
37
Estadística 2018-2
Contenidos: medidas de tendencia central: media, mediana y moda, interpretación, medidas de tendencia
no central: Cuantiles.
Medidas de tendencia central
Son estadígrafos que ofrecen medidas de resumen de la población o muestra, brindando un solo valor
numérico que nos orienta hacia el “centro” de un conjunto de datos. Su aplicación depende del tipo de
variable.
Tipo de variable
Medida Denotación Definición
Cuantitativa Cualitativa
Es la suma de las observaciones dividida por el
Media número de observaciones. Indica el promedio
obtenido por el grupo.
Se utiliza para describir el centro o medio de
Mediana una distribución o de un grupo de datos,
cuando los valores se colocan en orden
ascendente o descendente.
Es el valor de mayor frecuencia en la
Moda distribución; es decir, aquel que más veces
aparece.
Cálculo de la Media
Para datos no agrupados Donde:
Xi = Datos obtenidos
n
n = Tamaño de la
X = i =1 muestra
Interpretación: La media de VARIABLE es de VALOR EN LA
UNIDAD DE MEDIDA DE LA VARIABLE.
N° de hijos N° de habitantes
Sujeto por familia en el hogar
1 5 5
2 4 6
3 3 4
4 2 3
5 1 6
6 3 6
38
Estadística 2018-2
7 1 2
Ejercicio 2: La siguiente es una tabla de distribución de frecuencia del consumo de vasos agua (a la semana)
por un grupo de estudiantes . Determine la media e interprete los resultados.
Cantidad de vasos
de agua fi Fi hi% Hi%
consumidos
1 -5 5 5 5.21 5.21
6 - 10 10 15 10.42 15.63
11 - 15 50 65 52.08 67.71
16 - 20 20 85 20.83 88.54
21 - 25 11 96 11.46 100.00
TOTAL 96 100.00
Cálculo
Interpretación
39
Estadística 2018-2
Cálculo de la Mediana
Para hallar la mediana, lo primero que debemos hacer es ordenar los datos en orden creciente o
decreciente. Luego hallar la posición de la mediana aplicando la fórmula siguiente:
Me = n + 1
2
Finalmente, buscar el valor que se ubique en la posición encontrada.
Interpretación:
Si las observaciones son impares se encontrará una posición de la variable. Por ejemplo: Tenemos 5 notas
Valor de la variable 12 14 14 15 17
Posiciones 1 2 3 4 5 Si las
n=5
Valor de la variable 12 14 14 15 17 19
Posiciones 1 2 3 3,5 4 5 6
n=6
Sujeto 1 2 3 4 5 6 7
N° de hijos por
5 4 3 2 1 3 -
familia
N° de habitantes
5 6 4 3 6 6 2
en el hogar
40
Estadística 2018-2
Cálculo de la Moda
Para hallar la moda, tenemos que identificar el valor o los valores que se repiten más veces. La moda puede
ser:
2 4 5 6 7 9 9 12 15
2 5 5 6 7 9 9 12 15
2 5 5 6 6 9 9 12 15
2 4 5 6 7 8 9 12 15
2 2 2 4 4 4 6 6 6
2 2 2 2 4 4 4 6 6 6
Recordemos que la moda es la única medida de tendencia central que se aplica en variables cualitativas y
ordinales, en este caso también se reconoce como moda a aquel valor que se repite más veces.
Interpretación:
La moda es TIPO y recae en VALOR QUE SE REPITE MÁS VECES, por haber obtenido la mayor frecuencia que
es VALOR
Ejercicio 4: Consulte a 5 compañeros que estén a su alrededor por las variables solicitadas, identifique la
moda e interprete.
Sujeto 1 2 3 4 5
Plato criollo
favorito
Tiempo de
traslado a la
universidad
en minutos
Deporte
favorito
Horas de
sueño por
día
Curso más
demandante
41
Estadística 2018-2
Los Cuantiles (de cuanto) son estadígrafos que hacen cortes (dividen) a una distribución de frecuencias (lo
que significa que los datos están ordenados) en proporciones de cuatro, diez o cien partes.
Si tuviéramos una n=20 y los dividimos en 4 grupos proporcionales, ¿cuántos habría en el primer grupo o
bloque? ¿Qué porcentaje representan? ¿Cuántos habría en el tercer bloque y qué porcentaje
representan? ¿Cuánto lo diferencia del valor total?
Si tuviéramos que señalar la posición de los datos en cada bloque, ¿cuál sería la posición máxima del bloque
1, del bloque 2 y del bloque 3? Grafícalo.
Cuartiles - Q
i
Percentiles o
Centiles - P
i
Q1 Q2 Q3 Q4
25% 25% 25% 25%
2 3 4 5 7 7 7 8 8 9 10 10 12 12 13 14
25% 75%
42
Estadística 2018-2
¿Cómo hallamos los Cuantiles?
𝑖 ∑ 𝑓𝑖 𝑖 ∑ 𝑓𝑖 𝑖 ∑ 𝑓𝑖
−𝐹𝑖−1 −𝐹𝑖−1 −𝐹𝑖−1
10
𝑄𝑖 = 𝐿𝑖 + [ 4
] 𝑤 𝐷𝑖 = 𝐿𝑖 + [ 𝑓𝐷𝑖
]𝑤 𝑃𝑖 = 𝐿𝑖 + [ 100
]𝑤
𝑓𝑄𝑖 𝑓𝑃𝑖
Donde:
i = 1,2,3, ….100; según se trate de hallar el primer, segundo, tercer, …. centésimo cuantil.
Li = Límite inferior de la clase cuántica
Ʃfi = Suma de todas las frecuencias absolutas simples
(Ʃfi-1) = Fi-1 Suma de las frecuencias absolutas simples de las clases anteriores a la clase
cuantílica. fQi, fDi, fPi = Frecuencia que corresponde a la clase cuantílica. W = Amplitud
Pasos:
Se realizó una encuesta sobre el consumo semanal de carne en una muestra de 80 familias en la comunidad
de “Pachacutec”, los resultados se muestran en el cuadro siguiente. Hallar el Cuartil 1 (Q1)
43
Estadística 2018-2
𝑖 ∑ 𝑓𝑖 1(80)
= = 20
4 4
5° Se aplica la fórmula.
𝑖 ∑ 𝑓𝑖
4
−𝐹𝑖−1 20−15
𝑄𝑖 = 𝐿𝑖 + [ ] 𝑤 =2+[ ] 2 = 2 + 0.38 = 2,38
𝑓𝑄𝑖 26
Interpretación: El 25% de las familias de la comunidad de Pachacútec consumen como máximo 2,38 Kg de
carne por semana.
Ejercicio 5: Halle el Q3
44
Estadística 2018-2
Trabajo por encargo 8 (individual)
16 - 20 5 40 Li de la clase decílica =
26 - 30 12 80 fi (f de la clase decílica)=
TOTAL 80 Amplitud
Interprete:
16 - 20 5 40 Li de la clase percentílica =
26 - 30 12 80 fi (f de la clase percentílica)=
TOTAL 80 Amplitud
Interprete:
45
Estadística 2018-2
Identifique los datos que requiere para hallar el decil 8:
Consumo de vasos de fi Fi
agua por semana
11 - 15 35 35
16 - 20 5 40
21 - 25 28 68
26 - 30 12 80
TOTAL 80
Interprete:
Identifique los datos que requiere para hallar el percentil 75, para el Cuadro 3:
Consumo de vasos de fi Fi
agua por semana
11 - 15 35 35
16 - 20 5 40
21 - 25 28 68
26 - 30 12 80
TOTAL 80
Interprete:
46
Estadística 2018-2
Trabajo por encargo 9 (grupal)
A partir del instrumento aplicado por el grupo, encuentre el valor de 2 cuantiles de cada tipo (cuartiles,
deciles, percentiles) por cada tabla numérica. Se presentará en la próxima clase.
Medidas de dispersión
Son estadígrafos que miden la dispersión o desviación de los datos con respecto al valor central.
Varianza
Rango ( R )
Es la distancia existente entre el valor mayor de todas las observaciones y el valor menor.
3 67 2 72 5 22 11 - 15
31 6 20 12 9 4
16 - 20
13 28 14 52 15 2
21 - 25
33 63 9 58 5 32
26 - 30
18 60 12 90 25 48
TOTAL
47
Estadística 2018-2
Es el promedio de la suma de las desviaciones, en valor absoluto, de cada observación o dato con respecto
a su media aritmética. Nos señala cuánto se alejan los valores respecto del centro.
Para el siguiente caso: ¿Cuál es el valor de la DM del tiempo (en minutos) utilizado por las alumnas para
desarrollar una tarea?
Alumnas 14 16 13 15 17 16
Pasos
1° Hallamos la media
X = i =1 = 14 + 16 + 13 + 15 + 17 + 16 = 91 = 15,67
6 6
2° Aplicamos la fórmula.
Realizamos la sustracción de cada valor de Xi menos la Media, aplicamos el valor absoluto.
∑|𝑥𝑖 − 𝑥̅ | = |14 – 15,67| + |16 – 15,67| + |13 – 15,67| + | 15 – 15,67| + |17 – 15,67| + |16 – 15,67|
̅|
∑ |𝑋𝑖 − 𝑋 7
𝐷𝑀 = = = 1,17 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑛 6
3° Interpretamos: El tiempo utilizado por las alumnas para desarrollar la tarea se dispersa, en promedio,
1,17 minutos con respecto al valor central.
48
Estadística 2018-2
Ejercicio 2: Halle la DM del tiempo utilizado por los niños para desarrollar una tarea. Interprete.
alumnos 16 12 15 18 13 14
Pasos
1° A partir de los datos organizados (clases en intervalos y frecuencia absoluta simple) en una tabla,
procedemos a obtener la marca de clase.
2° Multiplicamos cada marca de clase por su frecuencia y lo sumamos; ese dato se divide entre el total de
datos y obtenemos la media.
3° A cada marca de clase le restamos la media y obtenemos el valor absoluto.
4° Cada valor absoluto lo multiplicamos por su frecuencia absoluta simple (f) y sumamos todos los
productos.
5° Lo dividimos entre el total de las observaciones o la sumatoria de las f.
6° Finalmente, lo interpretamos.
49
Estadística 2018-2
Interpretación: La edad de los clientes se dispersa, en promedio, años con respecto al valor central.
Ejercicio 3: Halle la DM de las notas obtenidas por los estudiantes del curso de redacción e interprete.
1 - 4 5
5 - 8 12
9 - 12 15
13 - 16 10
17 - 20 3
TOTAL 45
50
Estadística 2018-2
Estructura del trabajo final: INFORME ESTADÍSTICO
• APELLIDOS Y NOMBRES
DE LOS INTEGRANTES DEL GRUPO
EN ORDEN ALFABÉTICO
51
Estadística 2018-2
INDICE
INTRODUCCIÓN
Anexos
i. Instrumentos aplicados ...........................................
ii. Formatos Pro.seso… ................................................
xiii. Cálculos realizados .........................................
iii. xiv. Evidencia de aplicación de los instrumentos ..
52