Вы находитесь на странице: 1из 31

CLASE N º 3

Tablas de frecuencias con datos


agrupados en intervalos de clase

Mónica S. Blazquez 1
ARREGLO DISTRIBUCIONAL DE FRECUENCIAS
• Este tipo de arreglo se utiliza cuando hay una cantidad muy
grande de datos , con baja repetición, es decir, con baja
frecuencia, o cuando la variable es cuantitativa continua.

• Llamaremos intervalo al conjunto (𝑎, 𝑏ሿ que toma a todos los


números reales comprendidos entre a y b, sin tomar el valor de
a pero tomando el valor de b. Se puede usar este intervalo o
este otro ሾ𝑎, 𝑏)

• Llamaremos amplitud de un intervalo ( i) a la distancia existente


entre sus extremos, es decir, i=b-a. Para algunos cálculos será
necesario usar un representante de cada intervalo, a ese
representante lo llamaremos marca de clase y será el punto
medio del intervalo, esto es, a+b
2
Mónica S. Blazquez 2
Ejemplo 1:
• A 40 estudiantes se les pidió que estimen el número de horas que
dedicaron a estudiar la semana pasada (tanto en clase como fuera de
ella), obteniéndose los siguientes resultados:

Mónica S. Blazquez 3
Resolvemos paso a paso…
1) Si pensamos en los datos el menor es 30 y el mayor 65
2) Calculamos el rango que es la diferencia entre el mayor y el menor valor de
dato R=65-30=35
3) Tomamos entonces, por ejemplo 6 intervalos de amplitud 6 que
encerrarían un total de 36 datos, comenzando por el menor valor.
4) Construimos la tabla

Mónica S. Blazquez 4
Algunas interpretaciones de la tabla
• El valor de f =9: Significa que 9 estudiantes dedicaron a estudiar
la semana pasada entre 30 y 36 horas.

• El valor de xm =45 : Significa que 7 estudiantes dedicaron en


promedio a estudiar la semana pasada 45 horas.

• El valor de fr = 0,125 y f% = 12,5%: Significa que el 0,125 o el


12,5% de los estudiantes dedicaron a estudiar la semana pasada
más de 36 y hasta 41 horas.

• El valor de fa = 21: Significa que 21 estudiantes dedicaron a


estudiar la semana pasada entre 30 y 48 horas.

• El valor de fra = 0,525 y fra% = 52,5%: Significa que el 0,525 o el


52,5% de los estudiantes dedicaron a estudiar la semana pasada
entre 30 y 48 horas.
Mónica S. Blazquez 5
Gráfico para variables cuantitativas continuas:
Histograma de frecuencias
• Se construyen rectángulos sobre cada una de las clases, con alturas
proporcionales al número de elementos que caen en la clase (frecuencia
absoluta). El histograma de frecuencias es una representación visual de los
datos en donde se evidencian fundamentalmente tres características:
forma, acumulación o tendencia posicional y dispersión o variabilidad.Por
ejemplo:

Mónica S. Blazquez 6
Ejercicio 1: Efectúa el Histograma de frecuencias del ejemplo 1

Polígono de frecuencias:
Se obtiene uniendo los puntos medios de los techos de los rectángulos del
histograma. Se acostumbra prolongar el polígono hasta las marcas de clase
superior e inferior para que el área completa de dicha poligonal sea igual
al área cubierta por el histograma.

Mónica S. Blazquez 7
Ejercicio 2 : Efectúa el polígono de frecuencias
correspondiente al ejercicio 1.

OJIVA
• Marcamos el extremo superior de cada intervalo en el eje
horizontal y la frecuencia acumulada relativa (o acumulada
absoluta) en el eje vertical. Se suele considerar a un punto del
eje horizontal como el origen de la ojiva, este punto es el límite
inferior del primer intervalo de clase. Se supone que el
incremento dentro de los intervalos es lineal, por lo tanto los
puntos se unen mediante trazos rectos, obteniendo la poligonal
denominada ojiva. Aquí se graficó también el histograma de
frecuencias acumuladas para visualizar mejor la ojiva.

Mónica S. Blazquez 8
Ejercicio 3: Realiza la ojiva correspondiente al ejercicio 1

Mónica S. Blazquez 9
Ejercicio 4: La siguiente tabla de distribución de frecuencias
representa los sueldos de los empleados de una consultora “Y”
en pesos. Grafique el histograma , el polígono de frecuencias y la
ojiva.

Mónica S. Blazquez 10
MEDIA ARITMÉTICA O PROMEDIO
Para datos agrupados en un arreglo distribucional de
frecuencias en clases

Mónica S. Blazquez 11
Cálculo del modo para datos agrupados en intervalos

Li: es el límite inferior del intervalo modal, es decir el intervalo que tiene
mayor frecuencia absoluta.
El delta sub. 1 significa la frecuencia absoluta modal menos la frecuencia
anterior.
El delta sub. 2 es la frecuencia absoluta modal menos la frecuencia posterior.
i: es la amplitud del intervalo

Mónica S. Blazquez 12
Cálculo de la mediana para datos agrupados en
intervalos

Li : es el límite inferior del intervalo


n/2: es la posición de la mediana (se busca el primer valor que la supere en la
F. acumulada)
Fi-1: es la frecuencia acumulada anterior al intervalo mediano
fi: es la frecuencia del intervalo mediano
i: es la amplitud del intervalo
Observación:
Si el orden o posición de la mediana coincide con algún valor de la frecuencia
acumulada, entonces el límite superior del intervalo es la mediana

Mónica S. Blazquez 13
EJERCICIO DE APLICACIÓN N°5
Volviendo al ejemplo 1:
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada
a) Calcule el promedio de tiempo que usaron para estudiar. Interprete.
b) Calcule el modo. Interprete.
c) Calcule la mediana. Interprete.

Mónica S. Blazquez 14
Respuestas:
a) El promedio muestral es: c) Para calcular la mediana
buscamos primero el orden
mediano n/2=40/2=20
Luego el intervalo donde la
frecuencia acumulada
b) Para calcular el Modo
supera ese valor: (42,48] y
buscamos el intervalo modal
usamos la fórmula:
que es el que presenta la
mayor frecuencia: (54,60]
f=12 y usamos la fórmula:

Mónica S. Blazquez 15
Interpretación
a) Los estudiantes dedicaron, en promedio,
46,5hs de estudio la semana pasada.
b) La mayor parte de los estudiantes dedicaron
56,12 hs a estudiar la semana pasada.
c) La mitad de los estudiantes dedicaron 47,14
hs de estudio, como máximo, la semana
pasada.

Mónica S. Blazquez 16
MEDIDAS DE VARIABILIDAD O DISPERSIÓN para
datos agrupados en intervalos

Varianza

Desviación estándar

El coeficiente de variación se calcula igual que para datos sueltos.

Mónica S. Blazquez 17
Ejercicio 6 :
a) Calcule las medidas de dispersión del ejercicio 5.
b) La media es representativa de la muestra? Los datos de la
muestra son homogéneos?
a) Usando la calculadora en modo estadístico:
S= 9,68 hs es el desvío estándar
Luego la varianza es 93.70 hs al cuadrado.
Calculamos el cv= 9,68hs/46,5hs=0,208
Lo multiplicamos por 100 y obtenemos el 20,8%

b) Como el cv=20,8%>10%, los datos no son homogéneos y el


promedio no es representativo de la muestra.

Mónica S. Blazquez 18
Medidas de posición:
• Son aquellas medidas con las cuales se puede establecer el porcentaje de
datos que están concentrados dentro de un determinado intervalo; o un
intervalo que contenga una determinada concentración porcentual de
datos.

• La medida que vamos a utilizar en este curso son los percentiles (p) son 99 y
dividen a la distribución en 100 partes iguales

Ejemplos:
• “El 75% de los jubilados cobra menos de $ 9000” Esto quiere decir que el
percentil 75 es 9000 pesos
• “En una Universidad el 30% de los alumnos obtiene calificaciones mayores
que 7” , quiere decir que el percentil 70 es 7.

Mónica S. Blazquez 19
• Percentiles: sean x , x ,…,x , un conjunto de n
observaciones ordenadas por orden de
magnitud, el percentil 𝑃𝑘 (p sub k ) es un valor
tal que el k % de las observaciones es menor
que él y el (100 - k ) % de las observaciones
son mayores, es decir, es el valor de la variable
que supera al k % de los datos y es superado
por el (100- k) % de los mismos.

Mónica S. Blazquez 20
•La mediana es el percentil 50
•En el cálculo del percentil abarcamos todas las medidas de
posición por lo tanto trabajaremos solamente con la fórmula de
éste.
•El percentil k es igual a :

Ejercicio N°7:
A partir de la tabla del ejercicio 1 hallar:
a) El percentil 25. Interpretar.
b) Qué porcentaje de alumnos estudió entre 30 y 57 horas la semana
pasada?

Mónica S. Blazquez 21
Solución:
a) Para calcular el percentil 25 buscamos primero el intervalo
donde se encuentra:

Luego buscamos el primer valor que supere a 10 en la frecuencia


acumulada: (36,42] ; F=14 ; f=5 y usamos la fórmula:

Interpretamos que el 25% de los alumnos estudió entre 30 y 37,2 hs


la semana pasada o que el 75% de los alumnos estudió entre 37,2 y 66 hs
la semana pasada

Mónica S. Blazquez 22
b)Vamos a graficar la situación para comprenderla mejor:

Quiere decir que no sabemos el valor de k pero si el del percentil


K . Usamos entonces la fórmula y despejamos k sabiendo que 57
está en el intervalo (54,60] que es el que usaremos:

Es decir que el 82,5% de los alumnos estudiaron entre 30 y 57 horas la


semana pasada.

Mónica S. Blazquez 23
Ejercicio de aplicación N° 8
En una clase de UADE hemos medido la altura de 25 alumnos. Sus medidas, en
cm, se reflejan en la siguiente tabla agrupados en intervalos:

Se pide:
1) ¿El promedio es representativo de nuestro conjunto de datos?
2) Indicar cuál es la altura máxima del 15% de los alumnos de menor altura.
3) ¿Qué porcentaje de alumnos supera los 163cm de altura?
4) Calcular la altura más habitual.

Mónica S. Blazquez 24
Respuestas:
1) Promedio de la muestra 162,7cm
s =6 ,69cm. CV=6,69cm/162,7cm=0,04
CV=4%<10%. La media es representativa de la muestra y los datos
son homogéneos.

2) La altura máxima del 15% de los alumnos de menor altura es el


percentil 15 y es de 155,54cm

3) El 45,6% de los alumnos supera los 163cm de altura.

4) La altura más habitual es el modo y es de 159 cm.

Mónica S. Blazquez 25
Medidas de forma:
• Otra característica importante a tener en cuenta al analizar los
valores observados de una variable es la forma que presenta la
distribución de frecuencias correspondiente ya que ello permite
visualizar aproximadamente cuál podría ser el modelo
matemático que mejor se ajusta para describir el
comportamiento de una variable.

• Una medida de forma es un indicador estadístico que nos


permite identificar si una distribución de frecuencia presenta
uniformidad. Entre las medidas de forma están la Asimetría .

Mónica S. Blazquez 26
Asimetría:
• La asimetría nos permite identificar la forma en que
los datos de una distribución de frecuencia se
distribuyen, es decir en donde tienden a
concentrarse. Una de las mejores formas para
determinar la asimetría es usando como punto de
referencia la media aritmética o promedio, esta es
recomendada debido a que divide el histograma de
frecuencias en dos partes iguales y se puede ver
cuando los valores se concentran a la izquierda o
derecha de este.

Mónica S. Blazquez 27
TIPOS DE ASIMETRÍA

• Asimetría positiva (o hacia la derecha): Una distribución es


asimétrica positiva cuando a los menores valores de la variable,
les corresponden las mayores frecuencias. Modo menor al
promedio
• Asimetría negativa (o hacia la izquierda): Una distribución es
asimétrica negativa cuando a los mayores valores de la variable,
les corresponden las mayores frecuencias. Modo mayor al
promedio
• Simétrica: Una distribución es simétrica cuando tiene la misma
forma a ambos lados de la mediana.

Mónica S. Blazquez 28
Sesgo negativo Sesgo positivo

Si comparas el modo y la media aritmética del ejercicio 8 y


observas la forma entonces podemos concluir que el promedio
es 162,7cm y es mayor que el valor más habitual que es de
159cm, entonces la distribución es asimétrica hacia la derecha
o tiene sesgo positivo.
Mónica S. Blazquez 29
HUMOR ESTADÍSTICO DESCRIPTIVO JAJAJAJA

Mónica S. Blazquez 30
FINALIZAMOS LA CLASE 3

YA ESTÁS EN CONDICIONES

DE RESOLVER

LA GUÍA DE TP N°1 COMPLETA

Mónica S. Blazquez 31

Вам также может понравиться