Вы находитесь на странице: 1из 208

ESTADISTICAS

Asocia la estadística con la investigación científica identificando su


contribución a la generación de nuevos conocimientos
Contenidos de la Unidad 1

Introducción
Historia de la Conceptos
a la
Estadística Básicos
Estadística

Técnicas de
Tipos de
recolección
Variables
de datos
Godofredo Achenwall
Cientista político y estadístico alemán,
1719-1772.
En 1760 acuñó la palabra
estadística, del italiano statista
(estadista), del latín status,
estado o situación.

Pensaba, y con razón, que esta


nueva ciencia serían el aliado
más eficaz del gobernante.

3
Babilonia 3000 AC Hay registros de datos
comerciales y agrícolas.

4
Antiguo Israel La Biblia, en el Libro de los Números: Hay
datos estadísticos de dos recuentos de la población.

El rey David, alrededor de 1000


AC, ordenó hacer un censo de
Israel, para conocer el número
5

de habitantes.
China, 2000 AC Existen registros numéricos del
bienestar material.

6
Grecia, 540 AC

Censos periódicos para fines tributarios, sociales y


militares.

7
Imperio Romano Eran maestros de la organización
política, y realizaban censos de población cada cinco años.

Recordemos que JESUS nació en Belén porque sus Padres


debieron acudir allí por un censo ordenado por el emperador
Augusto.
8
Francia, 758 y 762 Se hicieron relaciones de tierra de la
Iglesia, ordenadas por Pipino el Breve y por Carlomagno,
respectivamente.

Francia, siglo IX Censos parciales de la


servidumbre de los campos. 9
Inglaterra, 1086

Censo encargado por Guillermo I, el


Conquistador.

Sus resultados aparecen en el


Domesday Book, que es el primer
compendio estadístico de ese país.

Inglaterra, siglo XVI Hicieron un registro


minucioso de muertes por la temida peste.
10
Los Censos continúan en nuestros días...

… pero tienen sus días contados. 11


En efecto, es posible que en 20 años más sean
sustituidos totalmente por muestras.
Las mediciones por muestreo contienen error
muestral, que se puede cuantificar y
controlar.
Los censos no tienen error muestral, pero
contienen error no muestral, muchísimo más
grande, que no se puede cuantificar ni controlar.
12

Aparte de eso, los censos son excesivamente caros.


Hasta ahora la ESTADISTICA estaba constituida sólo
por datos. Faltaba otra componente muy
importante para que se convirtiera en ciencia ...

Datos Probabilidad
13
La teoría de la probabilidad

Es una disciplina matemática que fundamenta la


Estadística
como una lógica y una metodología para la medición y el estudio de
la incertidumbre
en la planeación e interpretación de la observación y la
experimentación.

14
Una aplicación de la
probabilidad
empírica a los
seguros de buques
se encuentra en
Flandes, en el siglo
XIV.
15
Girolamo Cardano Galileo Galilei

Físico italiano, 1501-1576. Físico y astrónomo italiano,


1564-1642.

Habían hecho cálculos de probabilidades numéricas, de


diversas combinaciones de dados. 16
Pero las raíces de la Teoría de la
probabilidad se encuentran en los juegos de
azar.

17
Los inicios de la probabilidad, como teoría matemática,
pueden rastrearse en la correspondencia que sostuvo Pascal
con Fermat, en la década de 1650.

Blaise Pascal Pierre de Fermat


Matemático, físico, filósofo y Jurista y matemático francés,
18
teólogo francés, 1623-1662. 1601-1665.
Christian Huygens
Geómetra, físico, astrónomo
holándés, 1629-1695.

También los orígenes de la


teoría de la probabilidad se
encuentran en un corto
artículo escrito por él en
19

1657.
CONCEPTOS BASICOS
¿ QUE ES LA ESTADISTICA?
Es una ciencia formal y una herramienta que
estudia el uso y el análisis proveniente de una
muestra representativa de datos, busca explicar
las correlaciones y dependencias de un
fenómeno físico o natural de ocurrencia de
forma aleatoria o condicional. es la rama de las
matemáticas que se encarga se organizar y
recopilar datos.
CONCEPTOS BASICOS

 Población
Un estudio estadístico consta de las siguientes
fases:
1- Recogida de datos

2- Organización y representación de datos

3- Análisis de datos

4- Obtención de conclusiones
TIPOS DE ESTADISTICAS.

1. ESTADISTICA DESCRIPTIVA: Se dedica a la


descripción, visualización y resumen de los
datos originados a partir de los fenómenos de
estudio. los datos pueden ser resumidos
numérica o gráficamente.

2. ESTADISTICA INFERENCIAL: se dedica a la


generación de los modelos, inferencias y
predicciones asociadas a los fenómenos en
cuestión teniendo en cuenta la aleatoriedad de
las observaciones.
POBLACION:
 Esun conjunto de individuos u objetos sobre el que
se va a estudiar una característica.
Ejemplo: el conjunto de los ciudadanos españoles.
INDIVIDUO:
 Escada uno de los elementos que componen la
población.
ejemplo: un ciudadano español.
MUESTRA: Conjunto representativo de una población.
ejemplo: un porcentaje de estudiantes del ITCA.

MUESTREO: Recopilación de datos de una parte de la


población en lugar de toda la población.

VALOR O DATO: Diferentes resultados que se pueden


obtener en un estudio estadístico (valores obtenidos).
ejemplo: si lanza una moneda 5 veces, hay dos valores:
cara o cruz.
ejemplo: respuestas.
TEMA # 1
DETERMINACION DE LA MUESTRA
PARA UNA INVESTIGACIÓN.
Introducción
El mundo de los negocios es muy amplio, abarca muchas situaciones
de nuestra vida cotidiana, pero también este mundo es muy complejo,
pues los negocios son manejados por personas y estas son seres
complejos y difíciles de entender. En ocasiones para lograr ejecutar
bien los negocios u otras cuestiones, existe una herramienta que es de
mucha ayuda para entender y a conocer el comportamiento de una
población hacia un tema en específico, esta herramienta es el
muestreo, que es de vital importancia en varios aspectos de la vida
cotidiana como, los negocios, la política, entre otros. Para esto a
continuación se analizará que es muestreo, y lo más importante, el
conocer que es el muestreo probabilístico y no probabilístico y por qué
el conocer esto resulta relevante.
¿Qué es Muestreo?
El muestreo es una herramienta de la
investigación científica. Su función básica es
determinar que parte de una realidad en estudio
(población o universo) debe examinarse con la
finalidad de hacer inferencias sobre dicha
población.
Concepto de Probabilidad
La probabilidad mide la frecuencia con la que se
obtiene un resultado al llevar a cabo un experimento
aleatorio, del que se conocen todos los resultados
posibles, bajo condiciones suficientemente estables.
Muestreo No Probabilístico
No se efectúa bajo normas probabilísticas de selección,
durante sus procesos intervienen opiniones y criterios
personales del investigador o no existe norma bien
definida o validada. Por esta razón es aquel que se
utiliza de forma empírica.
Muestreo Probabilístico
Se basa en el principio de equiprobabilidad, ya que cada
elemento del universo tiene una probabilidad conocida y
no nula de figurar en la muestra, es decir, todos los
elementos del universo pueden formar parte de la
muestra.
TIPOS DE MUESTREO :
Muestreo no probabilístico
 En este tipo de muestreo de población, los miembros de la población no tienen las mismas
posibilidades de ser seleccionados. Debido a esto, no es seguro suponer que la muestra
representa completamente a la población. También es posible que el investigador elija
deliberadamente a las personas que participarán en el estudio.
 El método de muestreo no probabilístico de población es útil para estudios piloto, estudios de
caso, investigación cualitativa y desarrollo de hipótesis.
 Este método de muestreo se utiliza generalmente en estudios que no están interesados en los
parámetros de toda la población. Algunos investigadores prefieren esta técnica de muestreo
porque es barata, rápida y fácil.
El muestreo de población es un proceso que consiste en tomar
un subgrupo de sujetos que sea representativo de toda la
población. La muestra debe tener un tamaño suficiente como
para garantizar un análisis estadístico.
Generalmente, el muestreo se realiza porque es imposible probar
a cada individuo de la población. También se lleva a cabo para
ahorrar tiempo, dinero y esfuerzos mientras se realiza la
investigación. Sin embargo, cada investigador debe tener en
cuenta que lo ideal sería probar a todos los individuos para
obtener resultados fiables, válidos y precisos. Si esto no es
posible, ésta es la única situación en donde confiamos en las
técnicas de muestreo.
La realización del muestreo de población debe llevarse a cabo
correctamente, ya que los errores pueden producir datos
inexactos y engañosos.
Tipos de Muestreo No Probabilístico

1. Muestreo por Cuotas


2. Muestreo Intencional o de
Conveniencia
3. Bola de Nieve
4. Muestreo Discrecional
1. Muestreo por Cuotas
También denominado en ocasiones accidental.
Se asienta generalmente sobre la base de un
buen conocimiento de los estratos de la
población y/o de los individuos más
representativos o adecuados para los fines de
la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de
aleatoriedad de aquél.
2. Muestreo Intencional o de Conveniencia
 Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras representativas mediante
la inclusión en la muestra de grupos supuestamente
típicos. Pretende seleccionar unidades de análisis que
cumplen los requisitos de la población objeto de estudio,
pero que sin embargo, no son seleccionadas al azar.
 Se utiliza preferentemente en estudios exploratorios. Las
pruebas pilotos, también usan con frecuencia éste tipo de
muestreo, es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
3. Bola de Nieve
 Se lleva a cabo generalmente cuando hay una
población muy pequeña. En este tipo de muestreo,
el investigador le pide al primer sujeto que
identifique a otro sujeto potencial que también
cumpla con los criterios de la investigación.
 Para llevarlo a cabo se reúnen los datos de los pocos
miembros de la población objetivo que se puedan
localizar y se les pide información necesaria para
ubicar a otros miembros que conozcan de esa
población.
4. Muestreo Discrecional
A criterio del investigador los elementos son
elegidos sobre lo que él cree que pueden
aportar al estudio.
Aplica bien para estudios de pre-prueba o
prueba piloto para un instrumento. La idea se
centra en que el investigador elige la muestra
por que los considera los más representativos.
Muestreo probabilístico:
 En el muestreo probabilístico, cada individuo de la población
tiene igual probabilidad de ser seleccionado como sujeto de la
investigación.
 Este método garantiza que el proceso de selección sea
completamente aleatorio y sin sesgo.
 El ejemplo más básico de muestreo probabilístico consiste en
enumerar los nombres de todos los individuos de la población en
hojas separadas y luego sacar un número de hojas de a una de la
colección completa de nombres.
 La ventaja de utilizar el muestreo probabilístico es la exactitud
de los métodos estadísticos después del experimento. También se
puede utilizar para determinar los parámetros de la población,
ya que es representativo de toda la población. También es un
método fiable para eliminar el sesgo de muestreo.
 Generalización de resultados
 Los resultados de la muestra pueden ser generalizados para hablar de toda la población de donde se tomó la
muestra antes mencionada.
 Muestreo de población
 La muestra resultante debe ser representativa de la población para garantizar una generalización precisa.
 Experimentación/prueba
 Debe ser sistemática, repetible y no sesgada.
1- Muestreo Aleatorio Simple.
2- Muestreo Aleatorio Sistemático.
3- Muestreo Aleatorio Estratificado.
4- Muestreo Aleatorio por Conglomerados.
Muestreo Aleatorio Simple:
 La selección de la muestra se realiza en una sola
etapa, directamente y sin reemplazamientos.
 Se aplica fundamentalmente en investigaciones
sobre poblaciones pequeñas y plenamente
identificables, por ejemplo cuando disponemos de
la lista completa de todos los elementos del
universo.
Muestreo Aleatorio Sistemático:
 Se utiliza en muestras ordenadas. Consiste en seleccionar al azar un
elemento y a partir de él, incrementando un intervalo fijo, seleccionar
toda la muestra.
 Procedimiento
 N: Tamaño del universo n: el tamaño de la muestra
 Primero se determina de qué tamaño es la muestra, una vez
determinado el tamaño, se calcula el coeficiente de elevación, esto
es, el cociente, la división, entre el tamaño del universo y el tamaño
de la muestra.
 Se opta por un número al azar que sea como el máximo coeficiente de
elevación, un número entre 1 y K, a este número se le nombrará “i”.
 Se debe de contar con un listado de todos los elementos del universo,
donde i+K, i+2K, i+3K, i+4K, i+5K… de tal manera que se continúe hasta
completar toda la muestra.
Muestreo Aleatorio Estratificado:
Se basa en dividir los elementos del universo
en grupos, donde cada elemento del universo
pertenece a un solo grupo, y el conjunto de
los grupos forman la totalidad del universo. A
cada grupo lo llamamos estrato.
Cuanto más homogéneos seas los estratos,
más precisas resultaran las estimaciones.
Muestreo Aleatorio por Conglomerados:

 Se realiza cuando es imposible el muestreo


aleatorio simple debido al tamaño de la población.
 En este tipo de muestreos la unidad muestral no
son los elementos del universo, sino un conjunto de
elementos que bajo determinados aspectos se
puede considerar que forman una unidad.
Pasos para reunir la muestra de investigación adecuada
 En primer lugar, el investigador debe definir claramente la población objetivo.
En investigación, la población es un grupo determinado de personas u objetos que
posee la característica que se cuestiona en un estudio. Para poder definir claramente
la población objetivo, el investigador debe identificar todas las cualidades específicas
comunes a todas esas personas u objetos.
 Una población puede ser tan simple como todos los ciudadanos de California o puede
ser específica, como todos los estudiantes secundarios varones de 17 años de edad
con asma que hayan estado tomando broncodilatadores desde los 12 años.
 Definir la población accesible teniendo en cuenta el tiempo, el presupuesto y la mano
de obra del investigador. Este proceso ayudará a los investigadores a tener una idea
concreta sobre la muestra que pueden obtener de la población.
 Si el investigador tiene mucho tiempo, fondos y mano de obra, puede optar por
realizar el estudio con una muestra completamente aleatoria, pero si el dinero, el
tiempo y la mano de obra son limitados, el investigador puede elegir usar el muestreo
por conveniencia.
 Igualmente, el tipo de muestreo de población debe depender del diseño y la pregunta
de investigación.
 Destinar el dinero, tiempo y mano de obra disponibles para el reclutamiento
Conclusión
 Existen diversos tipos de muestreo, lo más difícil es el saber cuál
es el adecuado para cada circunstancia, ya que el muestreo resulta
ser sumamente importante en una investigación.
 Además de que en ocasiones se escucha hablar del termino
probabilidad e inmediatamente se relaciona con cuestiones de
matemáticas, haciendo de este término, algo complejo.
 Sin embargo el campo de estudio de la probabilidad es muy
amplio, un buen ejemplo de esto es el tema de muestreo
probabilístico y el muestreo no probabilístico, así que en este
documento se descubre los principales métodos de estos dos tipos
de muestreo, así como conocer que, estos métodos de muestreo
son de vital importancia en muchos ámbitos de la vida, como la
política y sobre todo, el campo de los negocios, que son los que
mueven al mundo.
¿Qué es el tamaño de la muestra?
 Eltamaño de la muestra es la cantidad de
respuestas completas que tu encuesta recibe.
Se le llama muestra porque solo representa
parte del grupo de personas (o población
objetivo) cuyas opiniones o comportamiento te
interesan. Por ejemplo, una forma de obtener
una muestra es usar una “muestra aleatoria”,
en la que los encuestados se eligen
completamente al azar de entre la población
total del grupo objetivo.
Comprensión de los tamaños de las
muestras
 Estos son dos términos clave que deberás comprender para calcular el
tamaño de tu muestra y darle contexto:
 Tamaño de la población: La cantidad total de personas en el grupo que
deseas estudiar. Si estás tomando una muestra aleatoria de personas
en EE. UU., entonces el tamaño de tu población será aproximadamente
de 317 millones. De igual forma, si estás realizando una encuesta en tu
empresa, el tamaño de la población es la cantidad total de empleados.
 Margen de error: Un porcentaje que te dice en qué medida puedes
esperar que los resultados de tu encuesta reflejen la opinión de la
población general. Entre más pequeño sea el margen de error, más
cerca estarás de tener la respuesta correcta en un determinado nivel
de confianza.
Cómo calcular el tamaño de la muestra

Tamaño de la muestra =

N = tamaño de la población • e = margen de error (porcentaje


expresado con decimales ) • z = puntuación z
La puntuación z es la cantidad de desviaciones estándar que
una proporción determinada se aleja de la media. Para
encontrar la puntuación z adecuada, consulta la tabla a
continuación:
Nivel de confianza deseado Puntuación z

80 % 1.28

85 % 1.44

90 % 1.65

95 % 1.96

99 % 2.58
Cosas que debes tener en cuenta a
la hora de calcular el tamaño
Si deseas un margen de error más
de
tu muestra
pequeño, debes tener un tamaño de
muestra más grande para la misma
población.
Cuanto más alto desees que sea el nivel de
confianza, más grande tendrá que ser el
tamaño de la muestra.
¿Es importante tener un tamaño de muestra
estadísticamente significativo?
La regla general es que mientras más
grande sea el tamaño de la muestra, más
estadísticamente significativa será esta, lo
que significa que hay menos probabilidades
de que los resultados sean una
coincidencia.
EJEMPLOS ILUSTRATIVOS
1) Calcular el tamaño de la muestra de una población de 500 elementos con un nivel de confianza del 95%
Solución:
Realizando el gráfico que representa el 95% de confianza se obtiene:
 Se tiene N=500, para el 95% de confianza Z = 1,96, y como no se tiene los demás valores se tomará σ = 0,5 y
e=0,05.
 Reemplazando valores de la fórmula se tiene:
VARIABLE ESTADÍSTICA
ESCADA UNA DE LAS CARACTERÍSTICAS O
CUALIDADES QUE POSEEN LOS INDIVIDUOS DE
UNA POBLACION
TIPOS DE VARIABLES ESTADÍSTICAS
 CUALITATIVAS:
SE REFIERE A CARACTERISTICAS O
CUALIDADES QUE PUEDEN SER MEDIDAS CON NUMEROS.
1- CATEGÓRICA NOMINAL : NO ADMITE ORDEN.
EJEMPLO: ESTADO CIVIL, con las siguientes modalidades: soltero,
casado, separado, divorciado y viudo.
COLOR PREFERIDO.
2- ORDINAL: SI EXISTE ORDEN.
EJEMPLO:
NOTAS DE UN EXAMEN DE LA FORMA A,B,C,D.
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.
 CUANTITATIVAS:
SE EXPRESA MEDIANTE UN NUMERO, SE
PUEDE HACER OPERACIONES ENTRE ELLAS.
1- DISCRETA: TOMA UN NUMERO FINITO DE VALORES.
EJEMPLO:
EDAD, NUMERO DE HERMANOS.
2- CONTINUA: TOMA UN NUMERO INFINITO DE VALORES.
EJEMPLO:
TIEMPO QUE GASTA EN RRECORRER LOS 400 M
PLANOS, PESO DE UN BALON.
EJERCICIO 1.
DECIR LA CLASIFICACION DE LAS SIGUIENTES VARIABLES
EN NOMINAL, ORDINAL, DISCRETA O CONTINUA.
1. DEPORTE FAVORITO
CUALITATIVA NOMINAL
2. MEDALLAS GANADAS EN UNA COMPETENCIA.
CUALITATIVA ORDINAL
3. NUMERO DE PANTALONES DE MIS AMIGOS.
CUANTITATIVA DISCRETA
4. PRIMER APELLIDO.
CUALITATIVA ORDINAL
5. PESO DE LOS COMPAÑEROS DEL SALON.
CUANTITATIVA CONTINUA
EJERCICIO 2. DECIR LA CLASIFICACION DE LAS SIGUIENTES
VARIABLES EN NOMINAL, ORDINAL, DISCRETA O CONTINUA.
 TAMAÑO DE LA NARANJA(MEDIDA DEL DIAMETRO MAYOR).
CUANTATIVA CONTINUA.
 NUMERO DE HERMANOS.
CUANTITATIVA DISCRETA.
 COLOR PREFERIDO.
CUALITATIVA NOMINAL.
 ESTATURA.
CUANTITATIVA CONTINUA.
 VELOCIDAD.
CUANTITATIVA CONTINUA.
 NUMERO DE VIAJES REALIZADOS AL EXTRANJERO.
CUANTITATIVA DISCRETA.
EJERCICIO 3. DECIR LA CLASIFICACION DE LAS
SIGUIENTES VARIABLES EN NOMINAL, ORDINAL,
DISCRETA O CONTINUA.
 NUMERO DE TECLAS DE UNA CALCULADORA DE UN ALUMNO.
CUANTITATIVA DISCRETA
 NUMERO DE GOLES POR ENCUENTRO EN LA ULTIMA
JORNADA.
CUANTITATIVA DISCRETA
 MEDIA GOLEADORA DE LOS EQUIPOS DE PRIMERA DIVISION.
CUANTITATIVA CONTINUA
 PARTIDO POLITICO VOTADO POR ULTIMA VEZ.
CUALITATIVA NOMINAL.
EJERCICIO 4.
Indica que variables son cualitativas y cuales cuantitativas:
1- Comida Favorita.
Cualitativa
2- Profesión que te gusta.
Cualitativa
3- Número de goles marcados por tu equipo favorito en la última temporada.
Cuantitativa
4- Número de alumnos de tu Instituto.
Cuantitativa
5- El color de los ojos de tus compañeros de clase.
Cualitativa
6- Coeficiente intelectual de tus compañeros de clase.
Cuantitativa
EJERCICIO 5. De las siguientes variables indica
cuáles son discretas y cuales continuas.
1- Número de acciones vendidas cada día en la Bolsa.
Discreta
2- Temperaturas registradas cada hora en un
observatorio.
Continua
3- Período de duración de un automóvil.
Continua
4- El diámetro de las ruedas de varios coches.
Continua
5- Número de hijos de 50 familias.
EJERCICIO 6.
Clasificar las
siguientes variables en cualitativas y cuantitativas discretas o continuas
1- La nacionalidad de una persona.
Cualitativa
2- Número de litros de agua contenidos en un depósito.
Cuantitativa continua
3- Número de libro en un estante de librería.
Cuantitativa discreta
4- Suma de puntos tenidos en el lanzamiento de un par de dados.
Cuantitativa discreta
5- La profesión de una persona.
Cualitativa
6-El área de las distintas baldosas de un edificio.
Cuantitativa continua
Ejercicio 7: Escoge el tipo de variable estadística de
que se habla en cada caso:
 El deporte favorito.
Variable cualitativa nominal.
 Medalla de plata ganada en una competición deportiva.
Variable cualitativa ordinal.
 Peso de 5 amigos.
Variable Cuantitativa discreta.
 Color de ojos de 10 amigos.
Variable cualitativa nominal.
 Número de mascotas de 3 amigos.
Ejercicio 8: Escoge el tipo de variable estadística de
que se habla en cada caso:
 Lugar que ocupan 10 amigos en la cola del cine.
Variable cualitativa ordinal.
 Tiempo que se tarda en recorrer 1 Km.
Variable cuantitativa continua.
 Primer apellido de los habitantes de un pueblo.
Variable cualitativa nominal.
 Pluviosidad de una ciudad.
Variable cuantitativa continua.
TABLAS DE FRECUENCIAS.
La distribución de frecuencias o tabla de
frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a
cada dato su frecuencia correspondiente.
Tipos de frecuencias
1. Frecuencia absoluta: es el número de veces que
aparece un determinado valoren un estudio
estadístico.
EJEMPLO: Al tirar un dado 50 veces salen 35 caras
Se representa por fi, aunque otros autores la representan
como ni.
fcara = 35 fcruz = 15
La suma de las frecuencias absolutas es igual al número total
de datos, que se representa por N.
N = 35 + 15 = 50
Para indicar resumidamente estas sumas se
utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria.
2. Frecuencia relativa : es el cociente entre la frecuencia
absoluta de un determinado valor y el número total de datos.
Se puede expresar en tanto por ciento y se representa por ni.

La suma de las frecuencias relativas es


igual a 1.
RETOMANDO EL EJEMPLO ANTERIOR
3. Frecuencia acumulada: es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
4. Frecuencia relativa acumulada: es el cociente entre la frecuencia
acumulada de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento.
EJEMPLO. Durante el mes de julio, en una ciudad se han
registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30,
30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor.
En la segunda hacemos el recuento
En la tercera anotamos la frecuencia absoluta
En la cuarta anotamos la frecuencia acumulada:
En la primera casilla colocamos la primera frecuencia absoluta:
Fi = fi
En la segunda casilla sumamos el valor de la frecuencia
aculada anterior más la frecuencia absoluta
F En la tercera casilla sumamos el valor de la frecuencia
acumulada anterior más la frecuencia absoluta
correspondiente: F2 + f3 = 3 + 6 = 9
La última tiene que ser igual a N (sumatoria de fi). F8 = N = 31
En la quinta columna disponemos las frecuencias relativas (ni)
que son el resultado de dividir cada frecuencia absoluta por N
(31)
En la sexta anotamos la frecuencia relativa acumulada Ni. En la primera casilla
colocamos la primera frecuencia relativa acumulada. En la segunda casilla sumamos
el valor de la frecuencia relativa acumulada anterior más la frecuencia relativa
correspondiente y así sucesivamente hasta la última, que tiene que ser igual a 1.

xi Recuento fi Fi ni Ni
27 1 1 0.032 0.032
28 IIIIIIIII 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 IIII 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
31 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.


Distribución de frecuencias agrupadas
 La distribución de frecuencias agrupadas o tabla con
datos agrupados se emplea si las variables toman un
número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la
misma amplitud denominados clases. A cada clase
se le asigna su frecuencia correspondiente.
Límites de la clase: Cada clase está delimitada por
el límite
inferior de la clase y el límite superior de la clase.
Amplitud de la clase: es la diferencia entre el límite superior e inferior
de la clase.
Marca de clase: es el punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
La marca de clase se representa por ci

Construcción de una tabla de datos agrupados


3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,
36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28,
38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la
distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco
mayor que la diferencia y que sea divisible por el
número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y
15.

En este caso, 48 – 3 = 45, incrementamos el


número hasta 50, 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el
límite inferior de una clase pertenece al intervalo,
pero el límite superior no pertenece intervalo, se
cuenta en el siguiente intervalo.
ci es la marca de clase que es el punto medio de
cada intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.275
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
40 1
Ejercicios de frecuencias
1. Durante el mes de julio, en una ciudad se han registrado
las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31,
31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
1. En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor.
2. En la segunda anotamos la frecuencia absoluta.
3. En la tercera anotamos la frecuencia acumulada:
4. En la primera casilla colocamos la primera frecuencia
absoluta: Fi = fi.
5. En la segunda casilla sumamos el valor de la frecuencia
6. En la tercera casilla sumamos el valor de la frecuencia
acumulada anterior más la frecuencia absoluta
correspondiente: F2 + f3 = 3 + 6 = 9.
7. La última tiene que ser igual a N (sumatoria de fi). F8 = N
= 31.
8. En la cuarta columna disponemos las frecuencias relativas
(ni) que son el resultado de dividir cada frecuencia
absoluta por N (31).
9. En la quinta anotamos la frecuencia relativa acumulada
Ni. En la primera casilla colocamos la primera frecuencia
relativa acumulada. En la segunda casilla sumamos el
valor de la frecuencia relativa acumulada anterior más la
xi fi Fi ni Ni
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
31 1
2- Los pesos de los 65 empleados de una fábrica vienen dados por
la siguiente tabla:
Peso fi
[50, 60) 8
[60, 70) 10
[70, 80) 16
[80,90) 14
[90, 100) 10
[100, 110) 5
[110, 120) 2

Construir la tabla de frecuencias.


xi fi Fi ni Ni
[50, 60) 55 8 8 0.12 0.12
[60, 70) 65 10 18 0.15 0.27
[70, 80) 75 16 34 0.24 0.51
[80,90) 85 14 48 0.22 0.73
[90, 100) 95 10 58 0.15 0.88
[100, 110) 105 5 63 0.08 0.96
[110, 120) 115 2 65 0.03 0.99
65
3. Un dentista observa el número de caries en cada uno de
los 100 niños de cierto colegio. La información obtenida a
parecer resumida en la siguiente tabla:
Nº de caries fi ni
0 25 0.25
1 20 0.2
2 x z
3 15 0.15
4 y 0.05
Completar la tabla obteniendo los valores x, y, z.
La suma de las frecuencias relativas ha de ser igual a 1:
0.25 + 0.2 + z + 0.15 + 0.05 = 1
0.65 + z = 1 z = 0.35
La frecuencia relativa de un dato es igual su frecuencia absoluta
dividida entre 100, que es la suma de las frecuencias absolutas.

Nº de caries fi ni fi · ni
0 25 0.25 0
1 20 0.2 20
2 35 0.35 70
3 15 0.15 45
4 5 0.05 20
100 155
4. Completar los datos que faltan en la siguiente tabla
estadística:
xi fi Fi ni
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
1. Primera fila: La primera frecuencia acumulada coincide con la
primera frecuencia absoluta. F1 = 4
La primera frecuencia relativa acumulada es igual a la
primera frecuencia absoluta (4) dividida por N.

2. Segunda fila: La segunda frecuencia acumulada será igual a la


frecuencia acumulada anterior (4) más la frecuencia absoluta
correspondiente.
3. Tercera fila: Para hallar la frecuencia absoluta podemos
hacerlo de dos modos.
Por medio de la frecuencia relativa acumulada:

La frecuencia absoluta será la diferencia entre F3 y F2


f3 = 16 – 8 = 8
4. Cuarta fila: La frecuencia acumulada será igual a la frecuencia
acumulada anterior (16) más la frecuencia absoluta
correspondiente (7).
N4 = 16 + 7 = 23

5. Quinta fila:
6. Sexta fila: La frecuencia absoluta será igual a la frecuencia
acumulada (38) menos la frecuencia acumulada anterior (28).

f6 = 38 – 28 = 10

7. Séptima fila:
8. Octava fila: La ultima frecuencia acumulada coincide con N
N8 = N = 50

La frecuencia absoluta será igual a la frecuencia acumulada


menos la frecuencia acumulada anterior

f8 = 50 − 45 = 5
xi fi Fi ni
1 4 4 0.08
2 4 8 0.08
3 8 16 0.16
4 7 23 0.14
5 5 28 0.1
6 10 38 0.2
7 7 45 0.14
8 5 50 0.1
50
Diagrama de barras
 Undiagrama de barras se utiliza para de
presentar datos cualitativos o datos
cuantitativos de tipo discreto.
 Se representan sobre unos ejes de
coordenadas, en el eje de abscisas(x) se
colocan los valores de la variable, y sobre
el eje de ordenadas(y) las frecuencias
absolutas o relativas o acumuladas.
 Los
datos se representan mediante barras de
una altura proporcional a la frecuencia.
Ejemplo:
 Un estudio hecho al conjunto de los 20 alumnos de
una clase para determinar su grupo sanguíneo ha dado
el siguiente resultado:
Grupo
fi
sanguíneo

A 6

B 4

AB 1

0 9

20
Polígonos de frecuencia
 Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.
 También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos
mediante segmentos.

Ejemplo 1:
 Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
Ejemplo 2:
Para construir el polígono de frecuencia se toma
la marca de clase que coincide con el punto medio de
El peso
cada
 de 65 personas adultas viene dado por la
rectángulo.
siguiente tabla:
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90,
95 10 58
100)
[100,
105 5 63
110)
[110,
115 2 65
120)
65
Histograma
 Un histograma es una representación gráfica de
una variable en forma de barras.
 Se utilizan para variables continuas o
para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
 En el eje abscisas (x) se construyen
unos rectángulos que tienen por base la amplitud
del intervalo, y por altura, la frecuencia
absoluta de cada intervalo.
 La superficie de cada barra es proporcional a
la frecuencia de los valores representados.
Histograma y polígono de frecuencias acumuladas
 Sise representan las frecuencias acumuladas de
una tabla de datos agrupados se obtiene
el histograma de frecuencias acumuladas o su
correspondiente polígono.
Histogramas con intervalos de amplitud diferente
Para construir un histogramas con intervalo de
amplitud diferente tenemos
que calcular las alturas de
los rectángulos del histograma.
hi es la altura del intervalo.
fi es la frecuencia del intervalo.
ai es la amplitud del intervalo.
Ejemplo
En
1: la siguiente tabla se muestra las calificaciones
(suspenso, aprobado, notable y sobresaliente) obtenidas
por un grupo de 50 alumnos.
fi hi

[0, 5) 15 3

[5, 7) 20 10

[7, 9) 12 6

[9, 10) 3 3

50
Diagrama de sectores
 En un diagrama de sectores los datos se representan
en un círculo dividido en sectores, de modo que
el ángulo de cada sector es proporcional a
la frecuencia absoluta correspondiente.

El diagrama de sectores se construye con la ayuda de


un transportador de ángulos.
Un diagrama de sectores se puede utilizar para todo
tipo de variables, pero se usa frecuentemente para
las variables cualitativas.
Ejemplos
 En una clase de 30 alumnos, 12 juegan a baloncesto, 3
practican la natación, 9 juegan al fútbol y el resto no
Calculamos eldeporte.
practica ningún ángulo correspondiente
Alumnos Ángulo

Balonces
12 144°
to

Natación 3 36°

Fútbol 9 108°

Sin
6 72°
deporte

Total 30 360°
Parámetros estadísticos
 Un parámetro estadístico es un número que se
obtiene a partir de los datos de una distribución
estadística.
 Los parámetros estadísticos sirven para sintetizar la
información
Tipos dada por una estadísticos
de parámetros tabla o por una gráfica.
Hay tres tipos parámetros estadísticos:
De centralización
De posición
De dispersión
Medidas de centralización
 Nos indican en torno a qué valor (centro) se
distribuyen los datos.
La medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa
la mitad superior de la distribución y la inferior, es
decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una
distribución.
Medidas de posición
 Las medidas de posición dividen un conjunto de datos en grupos
con el mismo número de individuos.
 Para calcular las medidas de posición es necesario que
los datos estén ordenados de menor a mayor.
 La medidas de posición son:
 Cuartiles
 Los cuartiles dividen la serie de datos en cuatro partes iguales.
 Deciles
 Los deciles dividen la serie de datos en diez partes iguales.
 Percentiles
 Los percentiles dividen la serie de datos en cien partes iguales.
MEDIA
ARITMETICA
Media aritmética
es el símbolo de la media aritmética.
Para datos no agrupados Para datos agrupados

EJEMPLO: Para datos no agrupados


Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso
medio.
EJEMPLO:
En un test realizado a un grupo de 42 personas se han
obtenido las puntuaciones que muestra la
tabla. Calcula
x f
la
i
puntuación media.
i

[10,
15 1
20)
[20,
25 8
30)
[30,40
)
35 10
En primer lugar vamos a calcular la
[40,
50)
45 9 sumatoria de xi · fi, crearemos una
[50, 60 55 8 nueva columna para los productos
[60,70
)
65 4 de la variable por su frecuencia
[70,
75 2
absoluta y lo sumaremos todo.
80)
También tenemos que calcular N que es la sumatoria de las frecuencias absolutas

xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1820
Propiedades de la media aritmética
1. La suma de las desviaciones de todas las
puntuaciones de una distribución respecto a
la media de la misma igual a cero.

La suma de las desviaciones de los números 8, 3,


5, 12, 10 de su media aritmética 7.6 es igual a 0:

(8 − 7.6) + (3 − 7.6) + (5 − 7.6) + (12 − 7.6) +


(10 − 7.6) =0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los
valores de la variable con respecto a un número cualquiera
se hace mínima cuando dicho número coincide con la media
aritmética.

3. Si a todos los valores de la variable se les suma un


mismo número, media aritmética queda
aumentada en dicho número.

4. Si todos los valores de la variable


se multiplican por un mismo número la media
aritmética queda multiplicada por dicho número.
Observaciones sobre la media aritmética
1. La media se puede hallar sólo para variables
cuantitativas.
2. La media es independiente de las amplitudes de
los intervalos.
3. La media es muy sensible a las puntuaciones extremas.
Si tenemos una distribución con los siguientes pesos:
65 kg, 69 kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de
centralización poco representativa de la distribución.
4. La media no se puede calcular si hay un intervalo con
una amplitud indeterminada.
fi
xi

[60, 63) 61.5 5 En este caso no es posible


hallar la media porque no
[63, 66) 64.5 18
podemos calcular la marca
[66, 69) 67.5 42 de clase de último
intervalo.
[69, 72) 70.5 27

[72, ∞ ) 8

100
Ejercicios resueltos de la media aritmética
1.Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se
pide:
Calcular su media.

2. A un conjunto de 5 números cuya media es


7.31 se le añaden los números 4.47 y 10.15.
¿Cuál es la media del nuevo conjunto de
números?
3. Calcular la media de una distribución estadística
que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8

Completamos la tabla con el producto de la


variable por su frecuencia absoluta (xi · fi)
xi fi xi · fi
61 5 305
64 18 1152
67 42 2814
71 27 1890
73 8 584
100 6745
Calculamos la sumatoria de la variable por su frecuencia absoluta (xi · fi) que es
6745 y la dividimos por N (100)

4. Hallar la media de la distribución estadística


que viene dada por la siguiente tabla:
fi

[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
 Completamos la tabla con el producto de la variable por su frecuencia absoluta (xi · fi) para
calcular la media.

xi fi xi · fi
[10,
Calculamos la sumatoria
12.5 3 37.5
15) de la variable por su
[15,
20)
17.5 5 87.5 frecuencia absoluta (xi ·
[20,
25)
22.5 7 157.5 fi) que es 457.5 y la
[25,
27.5 4 110
dividimos por N (21)
30)
[30,
32.5 2 65
35)
21 457.5
Calcular la media de la distribución estadística:
fi
[0, 5) 3
[5, 10) 5
[10, 15) 7
[15, 20) 8
[20, 25) 2
[25, ∞) 6

No se puede calcular la media, porque no se puede


hallar la marca de clase del último intervalo.
6. Los resultados al lanzar un dado 200 veces vienen dados
por la siguiente tabla:
1 2 3 4 5 6
fi a 32 35 33 b 35
Determinar a y b sabiendo que la puntuación media es 3.6.

xi fi xi · fi
1 a a
2 32 64
3 35 125
4 33 132
5 b 5b
6 35 210
135 + a + b 511 + a + 5b
Σfi = 200

Σxi · fi = 3.6

Resolvemos el sistema de ecuaciones por


reducción

a = 29 b = 36
MEDIANA
Mediana
La mediana es el valor que ocupa
el lugar central de todos
los datos cuando éstos
están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar solo
para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de
medidas la mediana es la puntuación central de
la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
3. Si la serie tiene un número par de
puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me = 9.5
Cálculo de la mediana para datos agrupados
 La mediana se encuentra en el intervalo donde
la frecuencia acumulada llega hasta la mitad
de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el
Li es el límite inferior de la clase donde se
que se encuentreencuentra la mediana
es la semisuma de las frecuencias absolutas
fi es la frecuencia absoluta de la clase mediana
Fi–1 es la frecuencia acumulada anterior a la
clase mediana
ai es la amplitud de la clase
La mediana es independiente de
las amplitudes de los intervalos
Ejemplo:Calcular la mediana de una distribución
estadística que viene dada por la siguiente tabla:

[60, 5
63) En primer lugar crearemos una nueva
[63, 18 columna con los valores de la frecuencia
66)
acumulada:
[66, 42
69)
En la primera casilla colocamos la primera
[69,fˌ 27 Fˌ
72) frecuencia absoluta. En la segunda casilla
[60, 63) [72,𝟓 8 5 sumamos el valor de la frecuencia
75)
[63, 66) 𝟏𝟖 23 acumulada anterior más la frecuencia
[66, 69) 𝟒𝟐 65 absoluta correspondiente y así
[69, 72) 𝟐𝟕 92 sucesivamente hasta la última, que tiene
[72, 75) 𝟖 100
que se igual a N (100)
100
 Buscamos el intervalo donde se encuentra la mediana,
para ello dividimos la N por 2 porque la mediana es el
valor central
100/2 = 50
 Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 50
Clase de la mediana: [66, 69)
 Aplicaremos la fórmula para el cálculo de la mediana para datos agrupados, extrayendo los siguientes
datos:
 Li = 66
 100/2 = 50
 fi = 42
 Fi–1= 23
 ai = 3
Ejercicios resueltos de la mediana
1. Hallar la mediana de la siguientes series de números:
3, 5, 2, 6, 5, 9, 5, 2, 8.
En primer lugar ordenamos de menor a mayor
2, 2, 3, 5, 5, 5, 6, 8, 9.
Como la serie tiene un número impar de medidas la
mediana es la puntuación central de la misma
Me = 5
2. Hallar la mediana de la siguientes series de números:
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
Ordenamos de menor a mayor
2, 2, 3, 5, 5, 5, 6, 6, 8, 9.

Como la serie tiene un número par de puntuaciones la


mediana es la media entre las dos puntuaciones centrales
3- Hallar la mediana de la siguientes series de números:
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9,
4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
Se organiza de menor a mayor
3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10,
11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20
4- Tabular y calcular mediana de la siguiente serie de
números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2,
5, 4.
xi fi Fi Para calcular la mediana
2 2 2 dividimos N (20) entre 2 y
3 2 4 vemos que la casilla de las
Fi donde se encuentra 10
4 5 9
corresponde a 5
5 6 15
6 2 17 20/2 = 10 Me = 5
8 3 20
20
5- Hallar la mediana de la distribución estadística
que viene dada por la siguiente tabla:
fi En primer lugar añadimos otra columna
[10,
3 en la tabla con la frecuencia acumulada
15)
(Fi)
[15,
20)
5 En la primera casilla colocamos la primera
[20, frecuencia absoluta. En la segunda casilla
7
25) sumamos el valor de la frecuencia
[25,
4 acumulada anterior más la frecuencia
30)
[30,
absoluta correspondiente y así
2 sucesivamente hasta la última, que tiene
35)
que se igual a N (21)
Fi
fi
Buscamos el intervalo donde se
[10,
15)
3 3 encuentra la mediana, para ello
[15, dividimos la N por 2 porque la
5 8
20) mediana es el valor central
[20,
7 15 21/2 = 10.5
25)
[25,
4 19
30)
Buscamos
[30,
2 21 en la columna de las frecuencias
35)
acumuladas (Fi) el intervalo que contiene a 10.5
21
Clase de la mediana: [20, 25)
6- Calcular la mediana de las alturas de los jugadores de
un equipo de baloncesto, que vienen dadas por la tabla:
Nº de
Altura
jugadores
[1.70,
1
1.75)
[1.75,
3
1.80)
En primer lugar añadimos otra columna en la
[1.80,
4 tabla con la frecuencia acumulada (Fi)
1.85)
En la primera casilla colocamos la primera
[1.85,
1.90)
8 frecuencia absoluta. En la segunda casilla
[1.90, sumamos el valor de la frecuencia acumulada
5 anterior más la frecuencia absoluta
1.95)
[1.95, correspondiente y así sucesivamente hasta la
2
2.00) última, que tiene que se igual a N (23)
Buscamos el intervalo donde se encuentra la
mediana, para ello dividimos la N (23) por 2
Fi
fi porque la mediana es el valor central
[1.70,
1 1 23/2 = 11.5
1.75) Buscamos en la columna de las frecuencias
[1.75, acumuladas (Fi) el intervalo que contiene a
3 4
1.80)
11.5
[1.80,
1.85)
4 8 Clase de la mediana: [1.85, 1.90)
[1.85,
Aplicaremos la fórmula para el cálculo de la
8 16 mediana para datos agrupados, extrayendo los
1.90)
[1.90, siguientes datos:
5 21
1.95) Li = 1.85
[1.95, fi = 8
2 23
2.00) Fi–1= 8
23 ai = 0.05
MODA
Moda estadística
La moda es el valor que tiene mayor
frecuencia absoluta o el dato que más
se repite.
Se representa por Mo.
Se puede hallar la moda para variables
cualitativas y cuantitativas.
Ejemplos:Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con


la misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir,
tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen
la frecuencia máxima, la moda es el promedio de
las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos
 1º Todos los intervalos tienen la misma
agrupados
amplitud. Li es el límite inferior de la clase
modal
fi es la frecuencia absoluta de la
clase modal
fi–1 es la frecuencia absoluta
inmediatamente inferior a la clase
modal
fi+1 es la frecuencia absoluta
inmediatamente posterior a la clase
modal
ai es la amplitud de la clase
También se utiliza otra fórmula de la moda que da
un valor aproximado de ésta:

Ejemplo: Calcular la moda de una distribución estadística


que viene dada por la siguiente tabla:
fi En primer lugar buscamos el intervalo donde se
[60, encuentra la moda, que será el intervalo que tenga la
5
63) mayor frecuencia absoluta (fi)
[63,
18
La clase modal es: [66, 69)
66)
[66,
42 Aplicaremos la fórmula para el cálculo de la
69)
moda para datos agrupados, extrayendo los
[69,
72)
27 siguientes datos:
[72,
Aplicaremos la fórmula para el cálculo de la
moda para datos agrupados, extrayendo los
siguientes datos:
 Lïmite inferior: 66
 fi = 42
 fi–1 = 18
 fi+1 = 27
 ai
=3
2º Los intervalos tienen amplitudes distintas.
En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor


altura.
La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando


existen distintas amplitudes es:

Ejemplo: En la siguiente tabla se muestra las calificaciones


fi (suspenso, aprobado, notable y sobresaliente) obtenidas
[0, 5) 15 por un grupo de 50 alumnos. Calcular la moda.
[5, 7) 20
[7, 9) 12
[9, 10) 3
En primer lugar creamos una nueva columna con
las alturas, dividiendo las frecuenciasfi absolutas
hi
entre las amplitudes de los intervalos
[0, 5) 15 3

correspondientes: [5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50

La clase modal es [5, 7) porque es la que tiene


mayor altura Lïmite inferior: 5
hi = 10
hi–1 = 3
hi+1 = 6
ai = 2
EJERCICIOS SOBRE MODA

El número de horas que Carmen ha visto la


tele durante cada día de la semana pasada
es:
3, 2, 3, 3, 2, 6, 3
RESPUESTA.
3
2-Las veces que se cepilla María los dientes al día
durante seis días:
3, 5, 2, 1, 0, 4.

Respuesta.
No tiene moda
3- Las notas de los exámenes de matemáticas
realizados durante el curso por Pablo son:
7, 5, 6, 8, 7, 8, 8, 9, 10, 10.

Respuesta:
8
4- El número de horas que dedican los veintitrés
alumnos de una clase a realizar un trabajo de
investigación de Geometría son:
10, 20, 15, 15, 12, 12, 17, 20, 10, 5, 18, 15, 13, 14,
20, 15, 15, 11, 18, 15, 12, 23, 15

Respuesta:

15
5- Las estaturas en centímetros de un grupo de
quince amigos son:
150, 160, 164, 157, 163, 182, 170, 159, 157, 151,
161, 163, 178, 173, 172.
Respuesta:
163 y 157
6- El número de veces que va al cine en un mes
cada componente de un grupo de once amigos es:
2, 0, 2, 3, 1, 1, 2, 3, 1, 1, 3
Respuesta
1
7- Las puntuaciones obtenidas en un test para saber
el CI de dieciséis alumnos de una clase son:
110, 132, 90, 123, 110, 108, 97, 99, 93, 112, 125,
139, 90, 112, 112, 90
Respuesta:
90
8- Los números obtenidos al lanzar un dado 10 veces
son:
1, 2, 4, 2, 3, 3, 2, 6, 3, 1.
Respuesta:

2y3
9- Las notas de matemáticas de los 26 alumnos de
una clase son: 6, 2, 4, 4, 5, 5, 6, 3, 8, 6, 5, 3, 7, 6,
5, 6, 4, 4, 4, 3, 5, 5, 4, 6, 7, 4 . Calcula la moda:
Respuesta:
4
10- Las faltas de asistencia de los 26 alumnos de la
clase anterior: 0, 1, 1, 1, 3, 2, 2, 7, 1, 2, 1, 0, 0,
0, 1, 2, 1, 2, 1, 2, 0, 0, 4, 6, 7. Calcula la moda:
Respuesta:
1
Medidas de dispersión
 Las medidas de dispersión nos informan sobre cuanto se
alejan del centro los valores de la distribución.
Las medidas de dispersión son:
1. Rango o recorrido.
El rango es la diferencia entre el mayor y el menor de
los valores de una distribución estadística.
2. Desviación media.
La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
3. Varianza.
La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media.
4. Desviación Típica.
La desviación típica es la raíz cuadrada de la varianza.
Rango
El Rango es el intervalo entre el valor máximo
y el valor mínimo; por ello, comparte unidades
con los datos. Permite obtener una idea de la
dispersión de los datos, cuanto mayor es el
rango, más dispersos están los datos (sin
considerar la afectación de los valores
extremos).
Pasos para calcular el Rango.
1-Haz una lista con los elementos de tu conjunto de datos. Para
encontrar el rango de un conjunto, debes hacer una lista con
todos los elementos para que puedas identificar los números
más altos y los más bajos. Escribe todos los elementos. Los
números de este conjunto son 20, 24, 25, 19, 24, 28 y 14.
Puede ser más sencillo identificar el valor máximo y el valor
mínimo en el conjunto si pones los números en orden
ascendente. En este ejemplo, acomodaremos los números de
esta manera:
14, 19, 20, 24, 24, 25, 28.
Al poner los elementos en orden también se te facilitarán otro
tipo de cálculos, como encontrar la moda, la media o la
2- Identifica los valores mínimo y máximo del conjunto. En este
caso, el número más bajo del conjunto es 14 y el más grande es
25.
3- Réstale el valor mínimo del valor máximo. Ahora que has
identificado el número más grande y el número más chico en el
conjunto, lo único que debes hacer es restarlos. Resta 14 de 25
(25 - 14) para obtener 11, el rango del conjunto.
4- Etiqueta claramente tu rango. Una vez que hayas encontrado
el rango, etiquétalo con claridad. Esto te ayudará a evitar
confundirlo con algún otro cálculo estadístico que tengas que
hacer, como la media, la moda o la mediana.
Ejemplos:
1- El Índice de Desarrollo Humano (IDH) mide cuan desarrollado está un país en función
de varios parámetros. La siguiente tabla muestra el ranking de IDH de los países de la
Unión Europea:
P Al A B B C Di Es Es Es Es Fi Fr G H I It Le Lit L M P Po Po Re R R S
a e us él ul hi na lo lo pa to nl an re u r al to ua u alt a lo rt in e u u
í m tri gi ga pr m va ve ña ni an ci ci n l ia ni ni x a ís ni ug o p m e
s a a ca ri e ar q ni a di a a gr a a a e e a al Un ú an c
ni a ca ui a a ía n m s id bl ia i
a a d b B o ic a
a ur a a
go j C
o h
s e
ca
R 2 15 17 53 2 14 42 27 13 44 11 10 2 36 5 20 43 45 18 34 9 37 29 16 32 60 6
á 3 8 4
n
k
i
n
g
I
El país con una posición más alta en el ranking es Irlanda (el
quinto), mientras que el más bajo es Rumania en la posición
60.

Así pues, el rango de dicha puntuación es:


60-5= 55 posiciones.
2- Rellena los puntos de cada equipo de la siguiente
clasificación de los equipos de la Primera División del futbol
Eqespañol:
Bar Rea Sev Val Vill Atl Mál De Mal Al Ath Rac Bet Osa Get Spo Rec Vall Esp Nu
uip cel l illa enc are éti aga por lor me leti ing is sun afe rtin rea ado any ma
o ona Ma ia al co tiv ca ría c a g tiv lid ol nci
dri o o a
d

Pun 48 50 35 22 15 17 11 9 5 13 12 33 26 2 34 21 6 7 4 3
tos
Encuentra el rango de los puntos de los equipos
Mayor puntuación Real Madrid (50), menor puntuación Osasuna ( 2
Rango
50-2= 48 posiciones.
Varianza
para datos no agrupados
Varianza
 La varianza es la media aritmética del
cuadrado de las desviaciones respecto a la
media de una distribución estadística.
 La varianza se representa por σ².
Ejemplos:
1- Calcular la varianza de la distribución: 9, 3, 8, 8,
9, 8, 9, 18.
Calculamos la media aritmética

Calculamos la varianza
2- Calcular la varianza de la distribución: 12, 6, 7, 3, 15,
10, 18, 5.
Calculamos la media aritmética
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos
o utilizar las siguientes expresiones que son
equivalentes a las anteriores.
Ejemplos:
1- Calcular la varianza de la distribución de la tabla:
fi xi · fi xi² · fi Hemos añadido la columna xi · fi porque
xi
[10, 20) 15 1 15 225
queremos hallar su sumatoria (1820),
[20, 30) 25 8 200 5000 que después dividiremos por N (42)
[30,40) 35 10 350 12 250 para obtener la media
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250 Hemos añadido la columna x²i ·
42 1820 88050
fi porque queremos hallar su
sumatoria (88050), que después
dividiremos por N (42) y al
resultado le restaremos la media
aritmética al cuadrado (43.33²)
Propiedades de la varianza
1- La varianza será siempre un valor positivo o cero,
en el caso de que las puntuaciones sean iguales.
2- Si a todos los valores de la variable se
les suma un número la varianza no varía.
3- Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por
el cuadrado de dicho número.
4- Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular
la varianza total.
Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:


Observaciones sobre la varianza
1- La varianza, al igual que la media, es un índice
muy sensible a las puntuaciones extremas.

2- En los casos que no se pueda hallar la


media tampoco será posible hallar la varianza.

3- La varianza no viene expresada en las mismas


unidades que los datos, ya que las desviaciones
están elevadas al cuadrado.
Desviación típica
Desviación típica
La desviación típica es la raíz cuadrada de la
varianza.
Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
Ejemplos: Desviación típica para datos no agrupados
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calculamos la media aritmética
Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.
Ejemplos:
Calcular la desviación típica de la distribución de la tabla:
xi fi xi · fi xi² · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1820 88050

Hemos añadido la columna


xi · fi porque queremos hallar
su sumatoria (1820), que
después dividiremos por N
(42) para obtener la media
Hemos añadido la columna x²i · fi porque queremos
hallar su sumatoria (88050), que después dividiremos
por N (42) y al resultado le restaremos la media
aritmética al cuadrado (43.33²), y por último haremos
la raíz cuadrada del resultado obtenido
Propiedades de la desviación típica
1- La desviación típica será siempre un valor positivo
o cero, en el caso de que las puntuaciones sean iguales.
2- Si a todos los valores de la variable se
les suma un número la desviación típica no varía.
3- Si todos los valores de la variable se multiplican por
un número la desviación multiplicada por
dicho número.
4- Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.
Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:


Observaciones sobre la desviación típica
1- La desviación típica, al igual que la media y la
varianza, es un índice muy sensible a las puntuaciones
extremas.
2- En los casos que no se pueda hallar la
media tampoco será posible hallar la desviación típica.

3- Cuanta más pequeña sea la desviación típica mayor


será la concentración de datos alrededor de la media.
Ejemplos: VARIANZA
1- El número de veces que come pasta durante una
semana un grupo de tres amigos:
2, 4, 3
Respuesta:
a) 2/3
b) 0.67
c) 0.82
2- Los litros de agua que beben al día un grupo de cuatro
amigos:
2, 1, 3, 2

Respuesta:
a) 0.5
b) 0.71
c) 2
3- El número de horas que Carmen ha visto la tele
durante cada día de la semana pasada es:
3, 2, 3, 3, 2, 6, 3

Respuesta:

a) 1.25
b) 1.55
c) 2.25
4- Las veces que se cepilla María los dientes al día durante
una semana:
1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 2, 2, 5, 1.

Respuesta:

a) 1.3
b) 1.06
c) 1.03
5- Las notas de los exámenes de matemáticas realizados
durante el curso por Pablo son:
7, 5, 6, 8, 7, 8, 8, 9, 10, 10.

Respuesta:

a) 2.36
b) 1.54
c) 1.18
6- El número de horas que dedican diez grupos de alumnos
formados en una clase al realizar un trabajo de investigación
sobre de Geometría:
5, 5, 12, 13, 15, 15, 15, 20, 20, 23

Respuesta:
a) 6.80
b) 16.11
c) 32,21
7- Las estaturas en centímetros de un grupo de cinco amigos:
150, 160, 164, 158, 183.

Respuesta:
a) 120,8
b) 121,8
c) 115,5
8- El número de veces que va al cine en un mes cada
componente de un grupo de once amigos es:
2, 2, 2, 3, 1, 2, 1, 3, 1, 1, 4

Respuesta:
a) 1.2
b) 0.91
c) 0.81
9- Las notas de matemáticas de los 26 alumnos de una
clase son: 6, 2, 4, 4, 5, 5, 6, 3, 8, 6, 5, 3, 7, 6, 5, 6, 4,
4, 4, 3, 5, 5, 4, 6, 7, 4.
Calcula la desviación típica de las notas obtenidas,
redondeando a dos cifras decimales si fuese necesario:
Respuesta:
a) 2,54
b) 1,95
c) 1,99
xi² ·
xi fi xi · fi
fi
2 I 1 2 4
3 III 3 9 27
4 7 28 112
5 6 30 150
6 6 36 216
7 II 2 14 98
8 I 1 8 64
26 127 671
10- Las faltas de asistencia de 25 alumnos de otra clase son: 0,
1, 1, 1, 3, 2, 2, 7, 1, 2, 1, 0, 0, 0, 1, 2, 1, 2, 1, 2, 0, 0, 4, 6,
7
Calcula la desviación típica:

Respuesta:
a)1.35
b)4.55
c)4.11
x i² ·
xi fi x i · fi
fi
0 6 0 0
1 8 8 8
2 6 12 24
3 I 1 3 9
4 I 1 4 16
6 I 1 6 36
7 II 2 14 98
25 47 191
Ejemplos: Desviación Típica.
1-El número de veces que come pasta durante una
semana un grupo de tres amigos:
2, 4, 3

Respuesta:
a) 2/3
b) 0,67
c) 0,82
2- Los litros de agua que beben al día un grupo
de cuatro amigos:
2, 1, 3, 2

Respuestas.
a) 0,5
b) 0,71
c) 0,8
3- El número de horas que Carmen ha visto la
tele durante cada día de la semana pasada es:
3, 2, 3, 3, 2, 6, 3

Respuesta:
a) 1,25
b) 1,55
c) 2,25
4- Las veces que se cepilla María los dientes al día
durante una semana:
1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 2, 2, 5, 1.

Respuesta.
a) 1,3
b) 1,06
c) 1,03
5- Las notas de los exámenes de matemáticas
realizados durante el curso por Pablo son:
7, 5, 6, 8, 7, 8, 8, 9, 10, 10.

Respuesta
a) 2,36
b) 1,54
c) 1,18
6- El número de horas que dedican los grupos de
alumnos formados en una clase al realizar un trabajo
de investigación sobre de Geometría:
5, 5, 12, 13, 15, 15, 15, 20, 20, 23

Respuesta.

a) 6,80
b) 16,11
c) 5,68
7- Las estaturas en centímetros de un grupo de
cinco amigos:
150, 160, 164, 158, 183.

Respuesta.

a) 10,99
b) 60,4
c) 10,1
8- El número de veces que va al cine en un mes cada
componente de un grupo de once amigos es:
2, 2, 2, 3, 1, 2, 1, 3, 1, 1, 4

Respuesta.

a) 1
b) 0.91
c) 0.95
9- Las notas de matemáticas de los 26 alumnos de
una clase son:

6, 2, 4, 4, 5, 5, 6, 3, 8, 6, 5, 3, 7, 6, 5, 6, 4, 4, 4,
3, 5, 5, 4, 6, 7, 4

Calcula la desviación típica de las notas obtenidas,


redondeando a dos cifras decimales si fuese necesario:

Respuesta.

a) 1,41
b) 1,45
c) 1,51
xi fi xi · f i x i ² · fi
2 I 1 2 4
3 III 3 9 27
4 7 28 112
5 6 30 150
6 6 36 216
7 II 2 14 98
8 I 1 8 64
26 127 671
10- Las faltas de asistencia de 25 alumnos de otra
clase son:
0, 1, 1, 1, 3, 2, 2, 7, 1, 2, 1, 0, 0, 0, 1, 2, 1, 2, 1, 2, 0,
0, 4, 6, 7
Calcula la desviación típica:

Respuesta.

a) 2.05
b) 2.01
c) 2.03
xi fi xi · fi xi² · fi
0 6 0 0
1 8 8 8
2 6 12 24
3 I 1 3 9
4 I 1 4 16
6 I 1 6 36
7 II 2 14 98
25 47 191

Вам также может понравиться