Вы находитесь на странице: 1из 52

[Escriba aquí]

Guía de estudios
2019-1

Estadística

Docente:
Dra. Dany B. Lázaro Silva.

Pertenece a:

Luis Eduardo Acevedo Romero


Estadística 2019-I

Este material ha sido preparado para que sea utilizado en las actividades del curso, tanto en clase como en el
desarrollo de actividades por encargo.

Aquí podrás hacer tus anotaciones de clase y ejercitarte para lograr el dominio esperado en este curso.

Sácale provecho al material.

Recomendaciones:

• Ser puntuales en el ingreso a las aulas, los controles y trabajos para la continua se tomaran o recibirán
en los primeros minutos. La inasistencia a una evaluación es calificada con nota 0 (cero).

• Para el registro de la asistencia en el sistema, la tolerancia será de 5 minutos, pasado los cuales no se
considerará asistencia en el sistema (va para el cómputo del DPI).

• Los celulares deberán mantenerse apagados durante las clases. La interrupción por el uso de ellos
generará la disminución de un punto (cada vez) sobre el promedio de las notas continuas a todos los
estudiantes de la sección.

• Durante el curso de Estadística nos dedicaremos en exclusivo al mismo, por ello traeremos calculadoras
(con cálculo de raíz cuadrada).

• Cuando algún compañer@ participe los demás debemos escuchar.

• Cumplir con la presentación de los trabajos indicados en la fecha prevista; no se aceptarán trabajos
fuera de fecha.

2
Estadística 2019-I

Contenido: Historia. tipos. usos en la vida cotidiana y en campos especializados. análisis de la realidad.
variables: definición, tipos; unidad de análisis.

Historia de la estadística

Toma nota de algunos datos relevantes:

Etapas de la historia de la estadística:

Etapas Eventos
Comprendida desde la antigüedad hasta mediados del siglo XVIII.
Inicial Vinculada a los censos poblacionales, registro de bienes y servicios de un Estado.

En Alemania se crea la primera cátedra de Estadística.


En Inglaterra los aritméticos políticos, intentaron cuantificar las leyes empíricas que
rigen los fenómenos políticos y sociales.
Sistemática En Francia se origina la Escuela Probabilística (basada en juegos de azar).
En la URSS se axiomatiza el cálculo de probabilidades, dándole mayor rigor científico
a la misma.

Se extiende desde principios del siglo XIX hasta nuestros días.


El desarrollo de la Estadística se fundamenta científicamente, a partir de los años 30,
Contemporánea a raíz de los problemas planteados en la sociedad industrial y por el desarrollo de
otras ramas de la Matemática.

3
Estadística 2019-I
Lectura
HISTORIA DE LA ESTADÍSTICA

Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar,
hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al
historiador griego Herodoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la
construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de
verificar un nuevo reparto.

En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en
dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un
censo de Israel con la finalidad de conocer el número de la población.

También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos
periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres
disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos,
determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de
la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la
obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado
y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del imperio.

Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones
Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por
Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos
censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran
Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa
obra fue el primer compendio estadístico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica


romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William
Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que
cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método
capaz de aplicarse a los datos económicos.

Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía
por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno
inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en
1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En
1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el
número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones
y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las
Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.

4
Estadística 2019-I
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales,
comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el
siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los
campos de la inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la
especulación sobre si la población aumentaba, decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las
riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos
para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que
vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos
parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años
no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el
astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de
seguros.

Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades
limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas
científicos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo
del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el
aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término
latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por
cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.

Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la
probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la
variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación práctica de todo el
método Estadístico, entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la
teoría Estadística; la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los
mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó
el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las
variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores
de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios
sobre la medida de las relaciones.

Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de
probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que
el determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio
se juzga aplicable tanto a las ciencias sociales como a las físicas.

Recuperado de: http://estadisticaaplicadaproyecto.wikispaces.com/Estadistiva+Descriptiva, el 20/12/2012


Trabajo por encargo 1

Apoyado en la información de la clase, la lectura y otras fuentes que puedas utilizar (no olvide citarlas en el
trabajo), elabore un gráfico (línea de tiempo u otro) para mostrar la historia de la estadística. Se debe presentar
en la próxima clase.
5
Estadística 2019-I

Trabajo de investigación estadística

Formar grupos de máximo 4 estudiantes.

El trabajo de investigación se desarrollará de manera progresiva conforme se desarrollen los temas en las
sesiones de clase. La presentación de los avances corresponde a las evaluaciones continuas, mientras que el
informe final se vincula al Examen Final.

Trabajo de investigación estadística


Estado Actividad Se presenta Aporta el
y
corresponde
a:
Avance Selección de tema de investigación, Aportes Semana 3 25 % de la
1 teóricos e identificación de la población y Continua 1 nota
muestra.

Avance Elaboración del instrumento de recolección Semana 6 25% de la


2 de Continua 2 nota
datos
Avance Aplicación del instrumento de recolección Semana 10
3 de Continua 3 25% de la
datos nota
Procesamiento de datos 1: Distribución de
frecuencias
Avance Procesamiento de datos 3: Medidas de Semana 13 25% de la
4 dispersión Continua 4 nota
Informe Presentación y breve exposición del informe Semana 14 25% de la
final final nota de la
Prueba
final

Debe tener como mínimo 20 ítems: 4 datos generales (por lo menos 1 corresponderá a una variable ordinal), 1
pregunta de filtro, 8 sobre variables cuantitativas y 7 sobre variables cualitativas.

El instrumento deberá aplicarse a 20 personas, como mínimo.

6
Estadística 2019-I
¿Cómo se registra información en una ficha?

7
Estadística 2019-I
Definición de estadística

Etimológicamente:
El término alemán Statistik, introducido originalmente por Gottfried Achenwall en 1749, se refería al análisis de datos del
Estado, es decir, la «ciencia del Estado» (o más bien, de la ciudad-estado). También se llamó aritmética política de acuerdo
con la traducción literal del inglés. No fue hasta el siglo XIX cuando el término estadística adquirió el significado de
recolectar y clasificar datos. Este concepto fue introducido por el militar británico sir John Sinclair (1754-1835).
Definiciones:
La definición de estadística de Cecili Salazar P. y Santiago del Castillo G. es “Una ciencia que permite recoger, ordenar
presentar, analizar y establecer conclusiones sobre el comportamiento de datos que provienen de variables y ayuda a la
toma de decisiones”. (Salazar P. & Del Castillo G., 2018)
Según lo establecido por Salazar y Del Castillo, la estadística es parte fundamental para estudiar a la sociedad y a los
problemas que lo rodean; por ejemplo, en las campañas electorales se necesita un uso constante de la estadística sea para
recolectar las opiniones, analizar la tendencia a cierto partido político dependiendo de la región y generar conclusiones de
ello. Otro ejemplo, en relación a mi carrera, arquitectura, es la investigación climática de la zona para la construcción de un
lugar que sea bio agradable y ecológico, , es decir, la recolección de datos sobre la temperatura, humedad, velocidad y
dirección de los vientos, precipitaciones, radiación y dirección de los rayos solares; y, zona de confort adicionando datos
invariables como la flora, la fauna, la ubicación (latitud y longitud) y altitud, nos permite entender ciertas características que
condicionan a las decisiones para crear un lugar. Por ejemplo, en Moquegua, existe una arquitectura vernácula, arquitectura
única y nativa de un lugar, que se llaman casas de techos de mojinete. Dichas casas poseen una altura determinada, un
material y grosos para las paredes y techos, ubicación de ventanas y puertas; y, la forma de techo mojinete que responden
adecuadamente al clima del lugar. En fin, la estadística es una ciencia invaluable que ayuda como herramienta para la
investigación sobre cualquier tema.

Trabajo por encargo 2

1. Elaborar tres fichas textuales sobre definiciones de estadística, utilizando fuentes bibliográficas.
2. Realice una ficha de comentario sobre la definición.
3. Elabora un mapa mental o conceptual sobre su propia definición de estadística

Tipos de estadística

De acuerdo a las funciones que realiza, pueden ser:

Descriptiva Inferencial
Tipos

Se dedica a la descripción, visualización y Se dedica a la generación de los modelos,


Propósito resumen de datos originados a partir de los inferencias y predicciones asociadas a los
fenómenos de estudio fenómenos en cuestión teniendo en cuenta la
aleatoriedad de las observaciones.
Las Su objetivo es organizar y describir las Su objetivo es obtener conclusiones útiles para
conclusiones características sobre un conjunto de datos lograr hacer deducciones acerca de la totalidad
son válidas para de todas las observaciones hechas, basándose
en la información numérica.
Método que Ejemplos básicos de parámetros Estas inferencias pueden tomar la forma de
utiliza para el estadísticos son: la media y la desviación respuestas a preguntas sí/no (prueba de
análisis estándar. hipótesis), estimaciones de unas características
numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación
8
Estadística 2019-I
Ejemplos gráficos son: histograma, (correlación) o modelamiento de relaciones
pirámide poblacional, gráfico circular, entre entre variables (análisis de regresión). Otras
otros. técnicas de modelamiento incluyen análisis de
varianza, series de tiempo y minería de datos.

Trabajo por encargo 3

1. Selecciona y adjunta como mínimo 3 artículos periodísticos o académicos en los que se observe el uso
de la estadística.
2. Resalta la información estadística y coméntala.

9
Estadística 2019-I

Las variables

Se llama variable porque


Características varían según un sustantivo

Se opone a constante porque


Son diversas y diferentes

Ejemplo 1: Artistas

Variables Valores (dominio de variación)


Edad De 5 años a 80 años

Color de pelo Rubio Castaño Negro

Estatura Alta Medio Bajo

Color de piel Trigueña Oscura Blanca

Constantes y sus valores

Todos son humanos


Han Actuado

Ejemplo 2: Cantantes

Variables Valores (dominio de variación)


Tipo de voz Soprano Baritono etc

Tipo de música Rock pop

10
Estadística 2019-I
Inspiraciones Lady gaga the beatles

Premios Ninguno Grammys Bildboard

Constantes y sus valores

Las variables se denotan (se reemplazan o codifican) con las últimas letras del alfabeto (x, y, z) mientras que los
valores que pueden tomar se los identifica con la letra acompañada de un número sub índice. Por ejemplo:

Variable: Sexo Denotación: X Valores de dominio: X1: Masculino X2: Femenino

Ejercicio 1:

Si quisiéramos estudiar las características de los estudiantes que se encuentran en el aula; ¿cuáles serían las
variables y sus dominios de variación?

Variables Denotación Valores (dominio de variación)


Sexo X Masculino Femenino

Edad Y Mayor menor

Color de pelo Z Negro Rubio

Color de los ojos E Verde Marrón

Color de piel R Negro Marrón

Tamaño T Alto mediano bajo

11
Estadística 2019-I
Tipos de Variables

Las variables toman distintos criterios para poder clasificarlas; en el curso tomaremos como criterio su
naturaleza, de esta manera tenemos tres tipos de variables:

• Ordinales
• Nominales Cualitativas

• Continuas
• Discretas Cuantitativas

Las cualitativas expresan cualidades o atributos que no son susceptibles de cuantificar, no hacen uso de los
números, en cambio se pueden clasificar o categorizar. Por ejemplo:
Edad:
 Primero
 Segundo

Las ordinales pueden utilizar los números para expresar orden, pero no se puede hacer operaciones
aritméticas con ellos. Admiten relaciones de tipo mayor que- menor que, antes que-después que. Por
ejemplo:
Edad:
 Primero
 Segundo
Las nominales solo permiten la clasificación o categorización, no se puede establecer ningún tipo de orden
para establecer jerarquías o valores. Por ejemplo:
Edad:
 Mayor de edad
 Menor de edad
Las cuantitativas utilizan escalas de medición, se pueden medir o contar, representan magnitudes y se puede
realizar operaciones aritméticas con ellas, que tienen un significado. Por ejemplo:
Edad:
 10
 11
 12
 13
 14
 15
Las discretas se expresan en números enteros, son el resultado de contar. Por ejemplo:
Cantidad de personas de cierta edad:
 10 – 20 PERSONAS
 15- 25 personas

12
Estadística 2019-I

Las continuas se expresan en cualquier número, admite valores decimales o fraccionales, son el resultado
de medir. Por ejemplo:
Porcentaje de personas
 10- 40%
 15- 60%
Ejercicio 2:

Relacione las variables con el tipo, según corresponda: Variable Cualitativa Ordinal = 1 , Variable Cualitativa
Nominal= 2 , Variable Cuantitativa Discreta= 3 y Variable Cuantitativa Continua= 4.

Variable Tipo Variable Tipo


Magnitud de consumo de huevos 1 Religión 1
Carrera profesional 2 Litros de leche adquiridos 1
Estatura 1 Nivel de instrucción 2
Posición que ocupa entre los hijos 2 Estado civil 2
Autor preferido 1 Estado de las carreteras 1
Actividades deportivas 1 Años de estudio 3
Kilometraje de buses interprovinciales 3/4 Jerarquía de puestos en la organización 2
Ritmo cardiaco 3/4 Marca de automóvil preferido 1
Lugar de origen 1 Ingreso anual 3

Unidad de Análisis

Representan los “objetos de investigación”, sobre quienes o qué trata el estudio, son los que portan la variable.

Por ejemplo:

• Se quiere hacer una investigación sobre los colores favoritos de los niños para lanzar un nuevo producto
escolar, dirigido a desarrollar actividades lúdicas.

¿Cuál es la variable de estudio?


Los niños

¿A quién le preguntamos (unidad de análisis) por la variable de estudio?


A sus padres

• Se quiere hacer una investigación sobre las características básicas que deben tener los arquitectos
egresados de UCAL

¿Cuál es la variable de estudio?


Arquitectos egresados
¿A quién le preguntamos (unidad de análisis) por la variable de estudio?
Arquitectos egresados

13
Estadística 2019-I

Trabajo por encargo 4

En el artículo siguiente, identifica las variables y responde a lo solicitado en el cuadro.

Perú tiene casi 8.5 millones de jóvenes pero ¿cuántos tienen educación superior?

De la población de 15 a 29 años de edad, el 17.6% no estudian ni trabajan, por lo cual se encuentran en una
situación de mayor vulnerabilidad, según el INEI.

Con motivo del Día de la Juventud, el jefe del Instituto Nacional de Estadística e Informática (INEI),
Aníbal Sánchez, informó que, de acuerdo a proyecciones para el año 2017, en el Perú existen 8
millones 441 mil jóvenes de 15 a 29 años de edad, de los cuales 4 millones 275 mil son hombres y 4
millones 165 mil mujeres.

Al año 2016, se tiene que el 35.8% de jóvenes peruanos cuenta con educación superior, de los cuales
21.5% con educación superior universitaria y 14.3% con superior no universitaria, de acuerdo con los
resultados de la Encuesta Nacional de Hogares (Enaho).

Añadió que, la proporción de jóvenes con educación superior se incrementó cerca de cinco puntos
porcentuales en relación con el año 2011 (30.9%). En el año 2016, el 55.7% cuentan con educación
secundaria y el 8,5%, educación primaria.

De acuerdo al área de residencia, presentaban mejor nivel educativo los jóvenes del área urbana, donde
el 41.3% tiene estudios superiores (16% no universitarios y 25.3% universitarios), que en el área rural, en
que solo 13.9% cuenta con estudios superiores (7.7% y 6.3%, respectivamente).

Censos Nacionales 2017El jefe del INEI señaló que los resultados de los Censos Nacionales 2017, que
se realizarán el 22 de octubre, permitirán obtener información actualizada sobre la población joven en el
Perú y sus condiciones de vida, lo que servirá para implementar adecuadas políticas públicas en beneficio
de este grupo poblacional.

Jóvenes y la PEA Los jóvenes que integran la Población Económicamente Activa (PEA) suman 5 millones
15 mil, de los cuales 3 millones 910 mil se encuentran en el área urbana y 1 millón 105 mil en el área rural.
Del total de jóvenes de la PEA, el 91.6% tiene empleo y el 8.4% busca empleo activamente. Según área
de residencia, la tasa de desocupación es superior en el área urbana (10.2%) que en el área rural (1.7%).
De la población ocupada joven, el 78.6% tiene un empleo informal, lo que muestra una disminución
respecto al año 2015 (80.1%); en tanto, el empleo formal en el año 2016 representó el 21.4%, tasa mayor
a la del año anterior (19.9%).

Área de servicios A nivel nacional, por tipo de ocupación, el 41.9% de la población joven ocupada se
desempeña en la rama de servicios: 10% en Transportes y Comunicaciones; 8% en Hoteles y
restaurantes; 3.5% en Enseñanza; y 20.3% en Otros servicios (como intermediación financiera, actividad
inmobiliaria, empresarial, entre otros).
Les siguen las actividades económicas de Agricultura, Pesca y Minería (22.7%), Comercio (18.7%) y
Manufactura (10.5%).

Por área de residencia, se observa que en el área rural, la población joven ocupada se desempeña
principalmente en el sector primario (68%) Agricultura, Pesca y Minería, en tanto que en el área urbana,
el 50.2% se encuentra en el sector de servicios.

Ni estudian ni trabajan De la población de 15 a 29 años de edad, el 17.6% no estudian ni trabajan, por


lo cual se encuentran en una situación de mayor vulnerabilidad. En el área urbana el 18.4% y en el área
rural el 14.4% se encuentran en la misma situación.

14
Estadística 2019-I
La tasa más alta de jóvenes que no estudian ni trabajan se encuentra en el grupo de 25 a 29 años de
edad (19.4%).

Según sexo, la proporción de mujeres que no estudian ni trabajan (23,5%) es mayor que la de hombres
(11.9%).

Seguro de saludAl año 2016, del total de jóvenes, el 67.6% tienen un seguro de salud, lo que evidencia
un incremento de más de 12 puntos porcentuales con respecto al año 2011 (55.1%).

De acuerdo con el área de residencia, cuentan con un seguro de salud el 79% de los jóvenes en el área
rural y el 64.8% en el área urbana.

40 de cada 100 jóvenes acceden a algún servicio del sistema financiero formalEl 40,1% de los jóvenes de
18 a 29 años de edad han tenido acceso a alguno de los servicios del sistema financiero formal (cuenta
de ahorro, cuenta corriente, ahorro a plazo fijo, cuenta con tarjeta de crédito o tarjeta de débito).

El mayor acceso de la población joven al sistema financiero formal se registra en la Provincia


Constitucional del Callao (54,5%); y le siguen la Provincia de Lima (53,9%) y los departamentos de
Moquegua (48,8%), Arequipa (46,7%) e Ica (41,1%).

Al año 2016, el 32,8% tiene una tarjeta de ahorro, el 32,4% una tarjeta de débito y solo el 8,8% una tarjeta
de crédito.

https://gestion.pe/economia/peru-8-5-millones-jovenes-educacion-superior-144111

En el texto puedes encontrar variables sin que se expliciten sus dominios de variación o pueden señalar
dominios de variación sin mencionar a la variable. Debes identificar variables (explicitas o no) y señalar sus
dominios (explícitos o no).

Variable Tipo Dominio de variación

15
Estadística 2019-I

Población (N)
La población es el conjunto de todas las observaciones posibles de la unidad de análisis respecto a la variable de
estudio.

Homogénea
La población puede ser

Heterogénea

Ejercicio 3: Identifique el tipo de población

Población Tipo
Heterogénea
Alpacas blancas puneñas nacidas
en el mes de agosto del 2017

Heterogénea
Jóvenes electores de Lima

Heterogénea
Lectores de El Comercio

Estudiantes varones de Homogénea


Comunicación de UCAL
matriculados en el 3er ciclo, en el
semestre 2018-2
Heterogénea
Estudiantes de UCAL

Si se desea conocer el promedio de notas de los estudiantes de UCAL ¿quiénes conformarían la población?

Muestra (n)

La muestra es una fracción significativa de la población.


Por ejemplo, si quisiéramos hacer una investigación sobre los hábitos de estudio de los estudiantes de UCAL; la
población estaría conformada por todos los estudiantes de UCAL. La muestra estaría formada por un grupo de
estudiantes que los represente en la condición deseada (estudiantes de UCAL) y cuyo número permita que las
conclusiones se generalicen a toda la población.

REPRESENTATIVA

La muestra puede ser


ERRÁTICA

16
Estadística 2019-I

Técnicas de muestreo

Son los métodos y procedimientos para determinar la muestra. Implica determinar el tamaño de la muestra y
los miembros o integrantes de la muestra.

Tamaño de la muestra

Para obtener el mínimo número de elementos que constituyen la muestra se utiliza la siguiente fórmula:

Donde:
Basado en la Teoría
n =Tamaño de la muestra de las Probabilidades
N = Tamaño de la población p+q=1
Z = Nivel de confianza: al 95% = 1,96; al 99% = 2,57
p = Probabilidad de ocurrencia (Si no tenemos el dato asumiremos que
es de 0,5)
q = Probabilidad de no ocurrencia q=1-p
d = Nivel de precisión. Consideraremos que es de 0,1

Ejercicio 4: Se desea realizar un estudio sobre el clima laboral en una empresa de marketing, en la que laboran
120 empleados (N). ¿Cuál es el tamaño mínimo de la muestra, si el nivel de confianza (Z) elegido es de 95%
(1,96), la probabilidad de encontrarlo es 0,5 y el nivel de precisión (d) es de 0.1?

17
Estadística 2019-I
Ejercicio 5: Se desea realizar un estudio sobre la percepción de la calidad de servicio de la cafetería en una
empresa de servicios educativos, en la que estudian 680 seminaristas (N). ¿Cuál es el tamaño mínimo de la
muestra, si el nivel de confianza (Z) elegido es de 95% (1,96), la probabilidad de encontrarlos es 0,8 y el nivel de
precisión (d) es de 0.1?

Procedimientos de muestreo

Muestreo Probabilístico Muestreo NO Probabilístico

Ejemplo: Ejemplo:

Tipos de muestreo

Muestreo Condición Tipo


Muestreo Aleatorio simple:
Se conoce el valor del total de la a) Con reemplazo
Probabilístico población y existe relación de los b) Sin reemplazo
elementos que la constituyen. Tabla de números aleatorios
Muestreo sistemático
No se sabe cuántos ni quienes
conforman esta población; conforme Muestra espontánea
se los identifica se va formando la
muestra.
No probabilístico
Corresponde a una población
heterogénea y se conoce la Muestra por cuotas
proporción en la que está
conformada.

18
Procedimientos para obtener una muestra probabilística
Pasos

Muestreo aleatorio simple Muestreo con Tabla de Números


Muestreo sistemático
Con reemplazo Sin reemplazo Aleatorios

1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los 1. Elaborar una lista numerada de los
elementos que conforman la elementos que conforman la elementos que conforman la elementos que conforman la
población. población. población. población.
2. Elaborar tarjetas o balotas con el dato 2. Elaborar tarjetas o balotas con el dato 2. Tomar en cuenta el número de dígitos 2. Determinar el valor del intervalo K,
de cada elemento de la población. de cada elemento de la población. de la población y el rango válidos para aplicando la fórmula:
3. Colocar las balotas en un ánfora. 3. Colocar las balotas en un ánfora. la selección de la muestra; de 1 a n. K= N
4. Sacar la primera balota, registrarlo en 4. Sacar la primera balota, registrarlo en 3. Establecer una intersección de filas y n
la relación de sujetos muestrales y la relación de sujetos muestrales y columnas así como una dirección 3. Elegir un primer elemento, al azar o
devolver la balota al ánfora. dejar la balota fuera del ánfora. (arriba, abajo, a la derecha o de manera arbitraria, que se
5. Sacar la segunda balota, registrarlo en 5. Sacar la segunda balota, registrarlo en izquierda) para iniciar la búsqueda de encuentre dentro del rango de la
la relación de sujetos muestrales y la relación de sujetos muestrales y los sujetos muestrales. población, de 1 a n. Constituirá el
devolver la balota al ánfora; así dejar la balota fuera del ánfora; así 4. Se elabora la relación de los primer sujeto muestral.
sucesivamente hasta completar la sucesivamente hasta completar la seleccionados, en la que se puede 4. A ese número elegido, se le debe
muestra.. muestra. identificar a la muestra por los sumar el valor de K, y así se obtiene
6. Se elabora la relación de los 6. Se elabora la relación de los números asignados a la población. el segundo sujeto muestral.
seleccionados, en la que se puede seleccionados, en la que se puede 5. A ese segundo sujeto muestral se le
identificar a la muestra por los identificar a la muestra por los adiciona el valor de k, obteniendo el
números asignados a la población. números asignados a la población. tercer sujeto muestral; así
sucesivamente hasta completar la
muestra.
OBSERVACIÓN: Si alguna balota 6. Se elabora la relación de los
seleccionada vuelve a salir debe obviarse OBSERVACIÓN: Se requiere utilizar la seleccionados, en la que se puede
su registro y retornarla al ánfora. tabla de números aleatorios. identificar a la muestra por los
números asignados a la población.
Estadística 2018-2
Ejercicio 6: Se desea seleccionar una muestra para realizar un estudio sobre las marcas de bebidas preferidas
por los estudiantes de un sector de la UCAL al que asisten 80 alumnos. Se ha determinado que la muestra
estará formada por 22 estudiantes. Indica las acciones que se deben realizar para identificar a la muestra,
utilizando el Muestreo Aleatorio Simple sin reemplazo

Ejercicio 7: Se desea seleccionar una muestra para realizar un estudio sobre los cursos de formación general
preferidos por los estudiantes de la UCAL, siendo la población (N) de 359 alumnos. Se ha determinado que la
muestra estará formada por 20 estudiantes. Indica las acciones que se deben realizar para identificar a la
muestra, utilizando la Tabla de Números Aleatorios.

20
Estadística 2018-2

TABLA DE NÚMEROS ALEATORIOS


Tomado de: Freund, John E. (1988) Estadística Elemental Moderna
Treinta y un mil

1 2 3 4 5 6 7 8 9 10

1 8735 6744 5149 1898 9784 7522 5329 1052 2687 5492

2 2552 2067 3599 4888 4068 6368 8239 3847 9139 1100

3 8717 8331 2559 8748 2580 2408 8145 2132 9008 4431

4 0504 4035 7295 4856 7757 6319 8019 4852 0647 6498

5 8116 0924 9171 2976 5401 5347 3067 6293 5658 1001

6 5485 7988 5791 1169 1022 7187 2492 5264 4282 7895

7 4478 1918 3540 2766 8972 2117 7169 9517 9717 6260

8 9720 9897 3733 9375 1888 3585 4605 0720 0817 6624

9 9877 5751 4041 7624 1854 6061 7913 9457 5073 8968

10 7812 7730 8330 5928 7333 4707 6007 4538 8210 7319

11 4119 7062 4346 0613 2238 3118 6460 0714 4916 2816

12 7064 3055 6746 9579 6366 8256 6710 7077 0322 4218

13 0656 0989 6887 7919 3594 0618 1794 7281 7377 9239

14 2946 1828 0888 4856 4944 6782 7267 2883 1026 5813

15 4214 5551 7295 2925 1518 2568 4892 8716 7843 1747

16 3375 8715 1523 1379 6273 7669 0977 8265 7247 5956

17 0980 9961 9808 3411 8879 0832 4678 3358 4116 1223

18 9831 5750 8580 5339 0592 5442 2901 3523 0984 9664

19 5170 5255 8312 9502 7911 4979 8795 9848 8868 6477

20 2783 6107 4905 4620 3578 3134 4250 6811 4214 2977

21 7884 6915 6442 9239 3608 5639 3502 9278 4663 8208

22 2212 8966 4909 9910 6253 1931 8183 5043 3742 1000

23 6941 5954 8272 4466 6403 7659 1212 4156 3490 2606

24 5499 4654 5138 5907 6421 8117 8847 2305 6343 0867

25 9991 8479 9262 4424 0134 4516 3356 1778 4286 7094

21
Estadística 2018-2

Ejercicio 8: Se desea seleccionar una muestra con la finalidad de realizar un estudio sobre las empresas de
diseño de interiores de Lima, siendo la población (N) de 337. Se ha determinado que la muestra estará
formada por 21 empresas. Indica las acciones que se deben realizar para identificar a la muestra, utilizando
el muestreo sistemático.

22
Estadística 2018-2

Sistemas de recopilación de datos

Sistemas

Características

Ejemplo

¿Qué necesitamos para recolectar datos?

• Determinar, definir (conocer bien) las variables.


• Evaluar si se puede obtener de manera directa (o concreta) o si es necesarios identificar sus aspectos
(indicadores).
• Identificar a la unidad de análisis.
• Elegir la técnica e instrumento más adecuados.

Fuentes

Primaria Secundaria

Ejercicio 1

El Ministerio de Cultura desea conocer las características sociodemográficas de los usuarios para tomar
decisiones sobre la organización de las visitas a las ruinas de Caral.

¿Qué datos recopilamos? ¿Es necesario descomponerlo en aspectos o factores?

¿De quién lo obtenemos? ¿Qué tipo de fuente es?

23
Estadística 2018-2
Técnicas de Recopilación

TÉCNICA INSTRUMENTO CARACTERÍSTICAS

Observación Ficha de Observación

Encuesta: Entrevista Guía de entrevista

Focus group Guía - filmadora

Cuestionario Cuestionario

Prueba: Personalidad Test

Eficiencia Prueba o examen

Escalas de Actitudes y de Escalograma o Escala


opiniones

Experimentación Ficha de Experimentación

Recopilación documental Ficha y registro

Análisis de contenido Ficha de Análisis

Ejercicio 2
Tomando en cuenta el enunciado del ejercicio 1:
¿qué técnica es la más apropiada?
¿Qué instrumento de recolección de datos desarrollaría? ¿Por qué?
24
Estadística 2018-2
Estructura de la variable

VARIABLE INDICADORES DOMINIO DE VARIACIÓN

NIVEL 1. Grado de instrucción Primaria, secundaria, técnica, universitaria.


EDUCACIONAL promedio.
0% - 10% regular, 11% - 20% bueno; etc.
DE LA
POBLACIÓN 2. Tasa de alfabetización. 0- 10 pésimo; 11-20 malo; 21 – 30 regular; 31 -
40 bueno; 41 a más, excelente.
3. Número de profesionales por
100 habitantes. 0% - 10% regular, 11% - 20% bueno; etc.

4. Tasa de escolaridad de 06 a 16
años.

Ejercicio 3

Tomando en cuenta lo desarrollado en el trabajo por encargo N° 4, elabore la estructura de la variable.

VARIABLE INDICADORES DOMINIO DE VARIACIÓN

25
Estadística 2018-2
Unidad de análisis:
¿Cómo se elaboran los instrumentos?

Se parte de la estructura de la variable y se formula una o más preguntas (o ítems) por cada indicador o
variable de estudio.

Generalmente, se realizan preguntas sobre otras características (datos generales, por ejemplo) que no
siendo variables de estudio son relevantes para entender el comportamiento o respuestas recogidas.

VARIABLE INDICADORES Items

1. Número de ingesta de comidas por Marque con una “X” las comidas que consume
día en un día:

Desayuno
Para el indicador 1

Refrigerio de media mañana


Hábitos 2. Horario de ingesta de comidas
alimenticios Almuerzo

Refrigerio de media tarde

3. Tipo de alimentos Cena

Lonche

La matriz de datos nos permite organizar una base de datos para poder registrar las respuestas de nuestra
unidad de análisis; la referencia de la matriz nos señala los dominios de variación de la variable o indicadores.

Ejercicio 4

Forme grupo de 4 alumnos como máximo.

Utilizando los datos del Trabajo por encargo 4 y lo desarrollado en el ejercicio 3:

• definan la técnica y el instrumento más adecuado para recolectar datos.


• elaboren el instrumento (consideren datos generales y de la variable de estudio).

26
Estadística 2018-2
Trabajo por encargo 5 (grupal)

En grupos de 4 estudiantes:

• Obtenga información sobre un producto (por ejemplo: pasta dental, bebidas gaseosas, etc).
• Elija una técnica de recolección de datos y elabore el instrumento.
• Debe tener como mínimo 20 items: 4 datos generales (por lo menos 1 corresponderá a una variable
ordinal), 1 pregunta de filtro, 8 sobre variables cuantitativos y 7 sobre variables cualitativas.
• Identifique las variables, indicadores y elabore los ítems.
• Identifique a la unidad de análisis (accesible).
• El instrumento deberá aplicarse a 20 personas, como mínimo.

Amenidades

X representa a la variable nota

X1 es el valor de la nota del sujeto 1; X2 es el valor de la nota del sujeto 2, y así


hasta tener un Xn

Xi representa a todos los valores que toma la variable nota (es decir,
reemplaza a X1, X2, … Xn.)

∑ (sigma) es el símbolo que significa suma o adición.

¿Qué significará ∑ Xi ? ¿Qué significará Xi 2? ¿Qué significará ∑ Xi 2?

Para denotar la resta se utiliza el signo (-), para la multiplicación se puede usar
(x), (*), (.) o simplemente colocar los factores juntos; para la división se usa (/).

¿Qué significará ∑ Xi - 1? ¿Qué significará Xi 2/5 ? ¿Qué significará ∑ Xi 2 Y?

27
Estadística 2018-2

Contenidos: organización de datos: tabla de distribución de frecuencias, elementos, tipos, interpretación de


datos, representación gráfica.

Tipos de tabla de distribución de frecuencias

tipo de tablas Categórica Numérica

tipo de variable

orden de los dominios

Frecuencias

sumatoria total

Elementos

Cuadro N° 1
Universidad de Ciencias y Artes de América Latina
Población estudiantil por carrera matriculada en el curso de Estadística
La Molina – 2013-0

Carrera fi hi%
Arquitectura de interiores
Comunicación
Diseño Gráfico Publicitario
Total
Fuente: Estudiantes de estadística 2013-0
Elaboración propia

28
Estadística 2018-2
Si el dominio de variación está constituido por muchos valores distintos, entonces se trabaja con datos
agrupados, por ejemplo: edades de los pacientes de una clínica: 0 -8; 9 – 17; 18 – 26; 27 – 35; 36-44; 45-53;
54-62; etc. Se llama agrupados porque los valores están formando grupos, de los cuales sólo vemos los
extremos: desde 0, hasta 8, lo que incluye 0, 1, 2, 3, 4, 5, 6, 7 y 8.

Revisemos algunos conceptos

Recolectemos algunos datos, de 10 compañeros; la pregunta es: ¿A qué edad consumiste alcohol por
primera vez?

Respuestas:

Ordenación: Es la colocación de los datos numéricos tomados en orden decreciente o creciente.

Ejercicio 1: Ordene los datos del grupo, en orden creciente (de menor a mayor)

Rango o Recorrido (R): Es la diferencia entre el mayor y el menor de los valores de la variable.

Ejercicio 2: Identifique

Valor mayor = Valor menor =


o Rango (R)=

Clase (K): Son las celdas que contienen los dominios de variación o los valores de las variables que se
presentan en una tabla. No existe un número mínimo o máximo de clases; sin embargo, por convención se
recomienda entre 5 a 15 clases para facilitar la organización y presentación de los datos.

Límites de clase: Cuando se trabaja con datos agrupados, estos forman un intervalo. Los límites de clase son
los valores extremos, superiores e inferiores, del intervalo de clase. Por ejemplo:

Notas
3 clases 1 - 5 Clase 1 o K 1
Límite inferior= 6 - 10
K=3 11 - 15 Límite superior =
Total

29
Estadística 2018-2
Ejercicio 3:

¿Cuál es el valor del Límite superior de la clase 1?

¿Cuál es el valor del Límite inferior de la clase 3?

Frecuencia: Son las veces en que se observa o se repite un valor o valores de una variable, que se muestran
en las clases.

Frecuencia Absoluta Simple (fi ): Señala las veces que se repite los valores de una clase, basado en los datos
reales, tal como se recogieron de la realidad.

Frecuencia Absoluta Acumulada (Fi): Señala las veces que se repiten los valores en la acumulación de datos,

tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con la que se trabaje. Sólo se
utilizan con variables cuantitativas, en las tablas numéricas.

Frecuencia Porcentual o Relativa Simple (hi% ): Señala el porcentaje en el que se repite los valores de una
clase, basado en los datos reales; se considera como 100% el total de datos obtenidos de la realidad y se
trabaja con las fi. Se obtienen mediante la aplicación de la regla de 3 simple.

Frecuencia Porcentual o Relativa Acumulada (Hi% ): Señala el porcentaje en el que se repite los valores en
la acumulación de datos, tomando en cuenta el límite inferior de la clase 1 y el límite superior de la clase con
la que se trabaje; se considera como 100% el total de datos obtenidos de la realidad y se trabaja con las Fi. Se
obtienen mediante la aplicación de la regla de 3 simple. Sólo se utilizan con variables cuantitativas, en las
tablas numéricas.

Datos: X= Edad

X1 = 17 X2 = 23 X3 = 23 X4 = 22 X5 = 19
Edad fi Fi hi% Hi%
X6 = 16 X7= 24 X8 = 21 X9 = 20 X10 = 18
16 - 18 años 4 20,00
X11 = 19 X12 = 21 X13 = 23 X14 = 17 X15 = 21 19 - 21 años
X16 = 21 X17 = 20 X18 = 19 X19 = 22 X20 = 21
22 – 24 años
Número de alumnos de un curso de diseño gráfico
Total 20

Si 20 es el 100%,
¿cuánto será 4?
Para hallar h1%
20 - 100%
X = 4 x 100 = 400 = 20,00
4 - X 20 20

30
Estadística 2018-2
Ejercicio 4:

¿Cuántos alumnos tienen entre 16 a 18 años? ¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 22 a 24 años? ¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 16 a 21 años? ¿Qué porcentaje representa?

¿Cuántos alumnos tienen entre 16 a 24 años? ¿Qué porcentaje representa?

Para formar los intervalos, requerimos trabajar con los siguientes elementos:

Número de clases (K): Se utiliza en el caso de tablas numéricas de datos agrupados. Se calcula aplicando las
siguientes fórmulas:

K = 1 + 3,3 (log.N) ó K = √n ó 2k
Ejercicio 5:

Tenemos n=25, ¿cuántas clases debemos formar?

Tenemos n = 35, ¿cuántas clases debemos formar?

Tenemos n= 60, ¿cuántas clases debemos formar?

Tamaño de clase (t): Es la longitud o el ancho de los intervalos o la diferencia entre los límites de una misma
clase.

t= R -c o t = L superior - L inferior
K

Ejercicio 6: Para
Valor mayor = 48 Valor mayor = 89 Valor menor = 13 Valor menor = 23
n= 25 n= 36

¿Cuál será el tamaño? ¿Cuál será el tamaño?

Armemos la primera clase: Armemos la primera clase:

Amplitud de intervalo (w): Es la cantidad de datos que están comprendidos en un intervalo de clase o la
diferencia de dos límites iguales de dos clases sucesivas.

w= R+1 o t = L superiork+1 - L superiorK


K

31
Estadística 2018-2
Ejercicio 7: Halle la amplitud para
Valor mayor = 48 Valor mayor = 88 Valor menor = 13 Valor menor =
26 n= 36 n= 81

Ejercicio 8: Armemos las clases

32
Estadística 2018-2
Gráficos

Existen diferentes tipos de gráficos, que se utilizan en función al tipo de variable.


Generalmente para variables cuantitativas se utiliza el gráfico de barras y para variables cualitativas el
gráfico circular (llamado también de pastel o de 360°).

Gráfico de barras Gráfico de Histograma


Número de hijos por familia Ingreso familiar anual
Huaraz – 2012 Surco – 2010

Utiliza la frecuencia absoluta simple (f), con Utiliza la frecuencia absoluta simple (f), con variables cuantitativas
discretas. variables cuantitativas continuas.

Polígono de frecuencias
Edad de profesionales
La industria – La Libertad

Utiliza la marca de clase,


con variables cuantitativas
que se presentan en datos
agrupados.

Utiliza la frecuencia relativa absoluta


(h%), con variables cualitativas y
ordinales.

33
Estadística 2018-2
Ejercicio 9: ¿Qué gráfico se debe usar?

Variable Tipo de variable Gráfico


Notas obtenidas en el promedio general
Marcas de automóviles más vendidas en el 2012

Religión de estudiantes de filosofía

Ventas anuales de una empresa

Años de estudio de los gerentes

Trabajo por encargo 6 (individual)

Dados los siguientes datos correspondientes a las notas obtenidas por un grupo de alumnos en el curso de
Estadística:

1 8.5 7 15.5 5

18.75 16.75 7.25 8.5 18.75

7.25 5.5 4.75 3.75 20

4.5 10.75 7.75 9 12

8 6.25 8 9.25 12.25

1. Identifique el valor de n y ordene los datos.

n=

34
Estadística 2018-2
2. Determine el R.

V mayor = V menor=

R=

3. Determine el valor de K.

4. Identifique el t y el w, conforme los intervalos y elabore la tabla de distribución de frecuencias.

t= w=

5. Formar las clases: K1 , K2 , …,, Kn

6. Elaborar la tabla de distribución de frecuencias

fi Fi hi% Hi%

Total

35
Estadística 2018-2

7. Interprete el f3 y el H4%

8. Elabore el gráfico correspondiente.

Trabajo por encargo 7 (grupal)

A partir del instrumento aplicado por el grupo, elabore la distribución de frecuencias y gráfico
correspondiente para cada dato obtenido. Se presentará en la próxima clase.

36
Estadística 2018-2

Evaluación parcial

RECORDEMOS:

X representa a la variable

Xi representa a todos los valores que toma la variable (reemplaza a X1, X2, …
Xn.)

∑ (sigma) es el símbolo que significa suma o adición.

(-) es el signo que indica que se debe restar.

(x), (*), (.) o simplemente colocar los factores juntos, son las formas en las que
se señala que debe multiplicarse.

(/) o (÷) nos indica que se debe dividir.

Leamos los códigos matemáticos y operemos con ellos.

Datos: Edades de un grupo de niños miembros de una familia: 10, 13, 8, 1, 5, 4, 5, 11

∑ Xi =
X i2 =

∑ Xi =
n Xi - 1 =

37
Estadística 2018-2

Contenidos: medidas de tendencia central: media, mediana y moda, interpretación, medidas de tendencia
no central: Cuantiles.
Medidas de tendencia central

Son estadígrafos que ofrecen medidas de resumen de la población o muestra, brindando un solo valor
numérico que nos orienta hacia el “centro” de un conjunto de datos. Su aplicación depende del tipo de
variable.

Tipo de variable
Medida Denotación Definición
Cuantitativa Cualitativa
Es la suma de las observaciones dividida por el
Media número de observaciones. Indica el promedio
obtenido por el grupo.
Se utiliza para describir el centro o medio de
Mediana una distribución o de un grupo de datos,
cuando los valores se colocan en orden
ascendente o descendente.
Es el valor de mayor frecuencia en la
Moda distribución; es decir, aquel que más veces
aparece.

Cálculo de la Media
Para datos no agrupados Donde:

Xi = Datos obtenidos
n
n = Tamaño de la
X = i =1 muestra
Interpretación: La media de VARIABLE es de VALOR EN LA
UNIDAD DE MEDIDA DE LA VARIABLE.

Ejercicio 1: Hallar la media para los datos solicitados e interprete:

N° de hijos N° de habitantes
Sujeto por familia en el hogar

1 5 5

2 4 6

3 3 4

4 2 3

5 1 6

6 3 6

38
Estadística 2018-2

7 1 2

Para datos agrupados

𝑙𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟


∑𝑛
𝑖=1 𝑥𝑖 𝑓𝑖 𝑥𝑖 =
𝑋= ∑𝑛
Xi = marca de clase 2
𝑖=1 𝑓𝑖

Ejercicio 2: La siguiente es una tabla de distribución de frecuencia del consumo de vasos agua (a la semana)
por un grupo de estudiantes . Determine la media e interprete los resultados.

Cantidad de vasos
de agua fi Fi hi% Hi%
consumidos

1 -5 5 5 5.21 5.21

6 - 10 10 15 10.42 15.63

11 - 15 50 65 52.08 67.71

16 - 20 20 85 20.83 88.54

21 - 25 11 96 11.46 100.00

TOTAL 96 100.00

Cálculo

Interpretación

39
Estadística 2018-2
Cálculo de la Mediana

Para hallar la mediana, lo primero que debemos hacer es ordenar los datos en orden creciente o
decreciente. Luego hallar la posición de la mediana aplicando la fórmula siguiente:

Me = n + 1
2
Finalmente, buscar el valor que se ubique en la posición encontrada.

Interpretación:

El 50% de la muestra tendrá a lo más (o como máximo) VALOR ENCONTRADO EN LA POSICIÓN DE LA


MEDIANA, mientras que el restante 50% lo supera.

Si las observaciones son impares se encontrará una posición de la variable. Por ejemplo: Tenemos 5 notas

Valor de la variable 12 14 14 15 17

Posiciones 1 2 3 4 5 Si las
n=5

Me = = 3 La posición de la mediana es 3 y su valor es 14 puntos.


observaciones son pares no se encontrará una posición real, entonces se trabaja con los valores
circundantes y se obtiene una media de los mismos.

Valor de la variable 12 14 14 15 17 19

Posiciones 1 2 3 3,5 4 5 6

n=6

Me = 6 + 1 = 3,5 14 + 15 = 14,5 puntos


2 2

La posición de la mediana es 3,5 y su valor es 14,5 puntos.

Ejercicio 3: Hallar la mediana para los datos solicitados e interprete:

Sujeto 1 2 3 4 5 6 7

N° de hijos por
5 4 3 2 1 3 -
familia
N° de habitantes
5 6 4 3 6 6 2
en el hogar

40
Estadística 2018-2

Cálculo de la Moda

Para hallar la moda, tenemos que identificar el valor o los valores que se repiten más veces. La moda puede
ser:

2 4 5 6 7 9 9 12 15
2 5 5 6 7 9 9 12 15
2 5 5 6 6 9 9 12 15
2 4 5 6 7 8 9 12 15
2 2 2 4 4 4 6 6 6
2 2 2 2 4 4 4 6 6 6

Recordemos que la moda es la única medida de tendencia central que se aplica en variables cualitativas y
ordinales, en este caso también se reconoce como moda a aquel valor que se repite más veces.

Interpretación:

La moda es TIPO y recae en VALOR QUE SE REPITE MÁS VECES, por haber obtenido la mayor frecuencia que
es VALOR

Ejercicio 4: Consulte a 5 compañeros que estén a su alrededor por las variables solicitadas, identifique la
moda e interprete.

Sujeto 1 2 3 4 5

Plato criollo
favorito

Tiempo de
traslado a la
universidad
en minutos

Deporte
favorito

Horas de
sueño por
día

Curso más
demandante

41
Estadística 2018-2

Medidas de tendencia no central

Los Cuantiles (de cuanto) son estadígrafos que hacen cortes (dividen) a una distribución de frecuencias (lo
que significa que los datos están ordenados) en proporciones de cuatro, diez o cien partes.

Si tuviéramos una n=20 y los dividimos en 4 grupos proporcionales, ¿cuántos habría en el primer grupo o
bloque? ¿Qué porcentaje representan? ¿Cuántos habría en el tercer bloque y qué porcentaje
representan? ¿Cuánto lo diferencia del valor total?

Si tuviéramos que señalar la posición de los datos en cada bloque, ¿cuál sería la posición máxima del bloque
1, del bloque 2 y del bloque 3? Grafícalo.

Cuartiles - Q
i

Los cuantiles pueden ser Deciles - D


i

Percentiles o
Centiles - P
i

Por ejemplo, en el caso de los Quartiles:

Xi = 2, 3, 4, 5, 7, 7, 7, 8, 8, 9, 10, 10, 12, 12, 13, 14

Q1 Q2 Q3 Q4
25% 25% 25% 25%

2 3 4 5 7 7 7 8 8 9 10 10 12 12 13 14

25% 75%

42
Estadística 2018-2
¿Cómo hallamos los Cuantiles?

Cuartiles Deciles Percentiles

𝑖 ∑ 𝑓𝑖 𝑖 ∑ 𝑓𝑖 𝑖 ∑ 𝑓𝑖
−𝐹𝑖−1 −𝐹𝑖−1 −𝐹𝑖−1
10
𝑄𝑖 = 𝐿𝑖 + [ 4
] 𝑤 𝐷𝑖 = 𝐿𝑖 + [ 𝑓𝐷𝑖
]𝑤 𝑃𝑖 = 𝐿𝑖 + [ 100
]𝑤
𝑓𝑄𝑖 𝑓𝑃𝑖

¿Qué diferencias encuentra en las fórmulas?


¿A qué se deberá?

Donde:
i = 1,2,3, ….100; según se trate de hallar el primer, segundo, tercer, …. centésimo cuantil.
Li = Límite inferior de la clase cuántica
Ʃfi = Suma de todas las frecuencias absolutas simples
(Ʃfi-1) = Fi-1 Suma de las frecuencias absolutas simples de las clases anteriores a la clase
cuantílica. fQi, fDi, fPi = Frecuencia que corresponde a la clase cuantílica. W = Amplitud

Pasos:

1° Necesitamos los datos ordenados en una frecuencia.

Se realizó una encuesta sobre el consumo semanal de carne en una muestra de 80 familias en la comunidad
de “Pachacutec”, los resultados se muestran en el cuadro siguiente. Hallar el Cuartil 1 (Q1)

43
Estadística 2018-2

2° Hallar la frecuencia acumulada (Fi)

3° Se calcula la posición que contiene el cuantil solicitado y se identifica


a la clase que lo contiene.

La posición 20 se ubica en la F2, entonces la clase cuartílica es la clase


2.

4° Identificamos los datos que requiere la fórmula:

Li = 2; Fi-1= 15; fQ1= 26; W = 2 (valor constante)

𝑖 ∑ 𝑓𝑖 1(80)
= = 20
4 4

5° Se aplica la fórmula.

𝑖 ∑ 𝑓𝑖
4
−𝐹𝑖−1 20−15
𝑄𝑖 = 𝐿𝑖 + [ ] 𝑤 =2+[ ] 2 = 2 + 0.38 = 2,38
𝑓𝑄𝑖 26

6° Se interpreta los resultados.

Interpretación: El 25% de las familias de la comunidad de Pachacútec consumen como máximo 2,38 Kg de
carne por semana.

Ejercicio 5: Halle el Q3

44
Estadística 2018-2
Trabajo por encargo 8 (individual)

Identifique los datos para hallar el decil 5, para el Cuadro 3:

Consumo de vasos de fi Fi Posición: (i) ∑fi =


agua por semana
10
11 - 15 35 35 Clase decílica (usar F)=

16 - 20 5 40 Li de la clase decílica =

21 - 25 28 68 Fi-1 (F de la clase anterior)=

26 - 30 12 80 fi (f de la clase decílica)=

TOTAL 80 Amplitud

Escriba la fórmula y transforme:

Interprete:

Identifique los datos para hallar el percentil 35, para el Cuadro 3:

Consumo de vasos de fi Fi Posición: (i) ∑fi =


agua por semana
100
11 - 15 35 35 Clase percentílica (usar F)=

16 - 20 5 40 Li de la clase percentílica =

21 - 25 28 68 Fi-1 (F de la clase anterior)=

26 - 30 12 80 fi (f de la clase percentílica)=

TOTAL 80 Amplitud

Escriba la fórmula y transforme:

Interprete:

45
Estadística 2018-2
Identifique los datos que requiere para hallar el decil 8:

Consumo de vasos de fi Fi
agua por semana

11 - 15 35 35

16 - 20 5 40

21 - 25 28 68

26 - 30 12 80

TOTAL 80

Escriba la fórmula y transforme:

Interprete:

Identifique los datos que requiere para hallar el percentil 75, para el Cuadro 3:

Consumo de vasos de fi Fi
agua por semana
11 - 15 35 35

16 - 20 5 40

21 - 25 28 68

26 - 30 12 80

TOTAL 80

Escriba la fórmula y transforme:

Interprete:

46
Estadística 2018-2
Trabajo por encargo 9 (grupal)

A partir del instrumento aplicado por el grupo, encuentre el valor de 2 cuantiles de cada tipo (cuartiles,
deciles, percentiles) por cada tabla numérica. Se presentará en la próxima clase.

Contenidos: medidas de dispersión: rango, desviación media, análisis e interpretación. Medidas


bidimensionales: correlación simple.

Medidas de dispersión

Son estadígrafos que miden la dispersión o desviación de los datos con respecto al valor central.

Rango Pueden ser: Coeficiente de variación

Desviación media Desviación estándar

Varianza

Rango ( R )

Es la distancia existente entre el valor mayor de todas las observaciones y el valor menor.

Ejercicio 1: Halle el R en los datos siguientes:

Gaseosas consumidas al mes por


Consumo de vasos de
estudiantes universitarios: R= agua por semana R=

3 67 2 72 5 22 11 - 15
31 6 20 12 9 4
16 - 20
13 28 14 52 15 2
21 - 25
33 63 9 58 5 32
26 - 30
18 60 12 90 25 48
TOTAL

47
Estadística 2018-2

Desviación Media (DM)

Es el promedio de la suma de las desviaciones, en valor absoluto, de cada observación o dato con respecto
a su media aritmética. Nos señala cuánto se alejan los valores respecto del centro.

¿Cómo hallamos la DM para datos no agrupados?

Se obtiene aplicando la siguiente fórmula:


¿Qué hace la función del
Donde: valor absoluto?
Xi = Observación o dato
̅|
∑ |𝑋𝑖 − 𝑋
𝐷𝑀 = 𝑥̅ = Media
𝑛
n = Número de observaciones

Para el siguiente caso: ¿Cuál es el valor de la DM del tiempo (en minutos) utilizado por las alumnas para
desarrollar una tarea?

Alumnas 14 16 13 15 17 16

Pasos

1° Hallamos la media

X = i =1 = 14 + 16 + 13 + 15 + 17 + 16 = 91 = 15,67
6 6

2° Aplicamos la fórmula.
Realizamos la sustracción de cada valor de Xi menos la Media, aplicamos el valor absoluto.

∑|𝑥𝑖 − 𝑥̅ | = |14 – 15,67| + |16 – 15,67| + |13 – 15,67| + | 15 – 15,67| + |17 – 15,67| + |16 – 15,67|

∑|𝑥𝑖 − 𝑥̅ | = 1,67 + 0,33 + 2,67 + 0,67 + 1,33 + 0,33 = 7,0

̅|
∑ |𝑋𝑖 − 𝑋 7
𝐷𝑀 = = = 1,17 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑛 6

3° Interpretamos: El tiempo utilizado por las alumnas para desarrollar la tarea se dispersa, en promedio,
1,17 minutos con respecto al valor central.

48
Estadística 2018-2
Ejercicio 2: Halle la DM del tiempo utilizado por los niños para desarrollar una tarea. Interprete.

alumnos 16 12 15 18 13 14

¿Cómo hallamos la DM para datos agrupados?

Se obtiene aplicando la siguiente fórmula:


Donde:
𝑙𝑙í𝑚 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟+𝑙𝑖𝑚 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
Xi = Marca de clase 𝑥𝑖 = 2
𝑥̅ = Media
∑ |𝑋𝑖 − 𝑋̅ | 𝑓𝑖
𝐷𝑀 =
∑ 𝑓𝑖
fi = frecuencia absoluta de clase

Pasos

1° A partir de los datos organizados (clases en intervalos y frecuencia absoluta simple) en una tabla,
procedemos a obtener la marca de clase.
2° Multiplicamos cada marca de clase por su frecuencia y lo sumamos; ese dato se divide entre el total de
datos y obtenemos la media.
3° A cada marca de clase le restamos la media y obtenemos el valor absoluto.
4° Cada valor absoluto lo multiplicamos por su frecuencia absoluta simple (f) y sumamos todos los
productos.
5° Lo dividimos entre el total de las observaciones o la sumatoria de las f.
6° Finalmente, lo interpretamos.

49
Estadística 2018-2

Interpretación: La edad de los clientes se dispersa, en promedio, años con respecto al valor central.

Ejercicio 3: Halle la DM de las notas obtenidas por los estudiantes del curso de redacción e interprete.

Notas Fi Xi Xi . fi |Xi - X| (Xi – X).fi

1 - 4 5

5 - 8 12

9 - 12 15

13 - 16 10

17 - 20 3

TOTAL 45

50
Estadística 2018-2
Estructura del trabajo final: INFORME ESTADÍSTICO

Universidad de Ciencias y Artes de América Latina

Carrera Profesional de XXXXXX

XXPoner el título del trabajoXXX

INFORME DE INVESTIGACIÓN ESTADÍSTICA


PRESENTADO POR:

• APELLIDOS Y NOMBRES
DE LOS INTEGRANTES DEL GRUPO
EN ORDEN ALFABÉTICO

Lima, ………, 2017

51
Estadística 2018-2

INDICE
INTRODUCCIÓN

Capítulo I: Descripción de XX la variable de estudio XX ....................... N° de página

1.1. Datos históricos ................................................................ ……………………..


1.2. Características de XX la variable de estudio XX………………………………………. ……

Capítulo II: Descripción de la población y muestra……………………………

2.1 Población: ...................................................................... ………………


2.2 Muestra .......................................................................... ………………………
2.2.1 Tamaño .................................................................. ………………
2.2.2 Selección de la muestra .......................................... ……………….

Capítulo III: Instrumento…………………………………………………………

3.1 Variable(s) de estudio:…………………………………………………


3.1.1 Tipo: ................................................................. ……………………….……..
3.1.2 Dominios de variación… ................................. …………………....
3.2 Técnica e instrumento:…………………………………………………..
3.2.1 Selección y sustento… ......................................................................

3.2.2 Matriz de construcción de reactivos / ítems / preguntas ………...

Capítulo IV: Resultados………………………………………………………...

4.1 Descripción de la muestra


4.2 De la variable de estudio:
4.2.1 Distribución de frecuencias……………………………………….
4.2.2 Medidas de tendencia central……………………………………………………….
4.2.3 Medidas de tendencia no central………………………………………………….
4.2.3 Medidas de dispersión…………………………………………….
Capítulo V: Referencias……………………………………………………..

(Fuentes consultadas y utilizadas en el desarrollo del trabajo: bibliográficas, hemerográficas y electrónicas)

Anexos
i. Instrumentos aplicados ...........................................
ii. Formatos Pro.seso… ................................................
xiii. Cálculos realizados .........................................
iii. xiv. Evidencia de aplicación de los instrumentos ..

52

Вам также может понравиться