Вы находитесь на странице: 1из 41

ESTADÍSTICA

Facultad de Ingeniería Geológica, Minera y Metalúrgica


Área de Ciencias Básicas

Medidas de tendencia central


Medidas de asimetría
Medidas de posición
Medidas de dispersión

Docente: Mg. Halley Limaymanta Álvarez


Logro de la sesión

• Al término de la sesión, el estudiante analiza


los datos usando las medidas de tendencia
central, asimetría, posición y dispersión siendo
riguroso en el cálculo.
Producción diaria de atún

Local A Local B

𝒙𝑨 = 2500 unids. 𝒙𝑩 = 2500 unids.

Conservas de atún producidas diariamente según local de producción.

Local A

Local B

Producción de atún

¿En cuál de los dos locales la producción promedio


es más representativa?
MEDIDAS DE TENDENCIA CENTRAL
Medidas de Tendencia Central
Resume los valores que toma la variable,
alrededor de los cuales tienden a agruparse las observaciones.

Media Mediana Moda

Posición Frecuencia

X 
x i El valor que se presenta con
n mayor frecuencia según:

fi, hi o pi
Media o Promedio
Datos

No agrupados Agrupados

n
V. Discreta V. Continua
x i
x i 1

n k k
x f i i k  i fi
x '

  xi hi
k
x   xi' hi
i 1
n x i 1
i 1 n i 1
Ejemplo 1

Sobre las siguientes situaciones encuentre el valor medio o promedio.

Distribución de computadoras según


número de monitores con falla

Número de fi hi%
monitores
con falla
0 30 60%
1 10 20%
2 5 10%
3 3 6%
4 2 4%
Total 50 100.00%

Fuente: Área de mantenimiento


Mediana (datos no agrupados)

Datos: Ordenados de forma ascendente


Notación ordenada X(i)

Número de datos (n o N)

es par es impar

𝑿 𝒏 + 𝑿(𝒏+𝟏) 𝑴𝒆 = 𝑿 𝒏+𝟏
𝟐 𝟐 ( 𝟐 )
𝑴𝒆 =
𝟐
Ejemplo 2 Halle la mediana para los siguientes datos:
Elemento: 1 trabajador de la empresa Sanyo
Variables: Número de piezas ensambladas por día
Datos: 2, 2, 2, 2, 2, 2, 3, 3, ….., 5, 5, 6 Datos no agrupados

Distribución de trabajadores según


número de piezas ensambladas
Número de
piezas fi hi%
ensambladas
2 6 20.00%
3 8 26.67%
4 12 40.00%
Datos
5 3 10.00%
agrupados
6 1 3.33%
Total 30 100.00%
Fuente: Sanyo – Área de producción
Moda
Ejemplo 3
Xi : Número de tardanzas de los trabajadores.

Xi fi
0 5

1 3 Es el dato que se
repite con mayor
2 12
frecuencia.
3 1
4 2

Interpretación
El número de tardanzas más frecuente de los trabajadores es 2 veces al mes.
Ejemplo 4

Interpretación
 El servicio solicitado con mayor frecuencia en la empresa de telefonía Movilnet es la
internet.
 En servicio menos solicitado en la empresa de telefonía Movilnet es promociones.
Ejemplo 5 Halle la moda para los siguientes datos:
Elemento: 1 trabajador de la empresa Sanyo
Variables: Número de piezas ensambladas por día
Datos: 2, 2, 2, 2, 2, 2, 3, 3, ….., 5, 5, 6 Datos no agrupados

Distribución de trabajadores según


número de piezas ensambladas
Número de fi hi%
piezas
ensambladas
2 6 20.00%
3 8 26.67%
4 12 40.00% Datos agrupados
5 3 10.00%
6 1 3.33%
Total 30 100.00%
Fuente: Sanyo – Área de producción
Características:

Media Mediana Moda

Fácil de Calcular Usa ordenación No siempre es


ascendente único valor
(subjetiva)
Afectada por los No se ve No se ve afectada
valores extremos afectada por los valores
Se calcula en por los valores extremos
variables extremos Se calcula para
cuantitativas Se calcula en cualquier tipo
variables variable
cuantitativas, y
cualitativas
escala ordinal.
Media ponderada

Donde:

Característica principal: las observaciones no


tienen la misma importancia.
Ejemplo 6

• Una fábrica produce pernos en tres turnos diarios: En el turno de la


mañana trabajan 18 máquinas, en el turno tarde 15 máquinas y en el
turno noche 12 máquinas. Las máquinas que están en mantenimiento
en un turno trabajan en forma alternada en los otros turnos. Las
máquinas del turno mañana produce en promedio 435 pernos, las de la
tarde 418,6 y de noche 396,7 pernos. ¿Cuántos pernos en promedio
produce una máquina de esta fábrica en un día?
Conclusiones:

• Las medidas de tendencia central permiten resumir en un valor la


tendencia de las observaciones.
• Las medidas de tendencia central son media, mediana y moda.
• La ventaja de la mediana sobre la media es que es más representativa
cuando hay puntos discordantes (valores extremos).
• Sólo la moda puede ser calculada para variables cualitativas y variables
cuantitativas.
• La mediana puede calcularse para variables cuantitativas y variables
cualitativas medidas en escala ordinal.
• La media ponderada es usada para resumir datos de una variable,
cuando esta es afectada por pesos o ponderaciones.
• La interpretación de la moda implica la expresión de “el valor más
frecuente” no el uso de “la mayoría de los casos”.
Medidas de asimetría
Formas de una distribución:

Datos
Simétrica o sesgo nulo concentrados en
el centro.
Media = Mediana = Moda

Datos
Asimétrica negativa o concentrados en
sesgo izquierdo los valores más
grandes.
Media < Mediana < Moda

Datos
Asimétrica positivo o
sesgo derecho concentrados en
los valores más
Media > Mediana > Moda
pequeños.
Ejemplo 7:

• Se tomo una muestra de 18 estudiantes de colegios públicos y se


calculó las medidas de tendencia central sobre la variable edad.
Los resultados fueron los siguientes:
𝒙 = 16,25 años me = 16 años mo = 15 años
¿Qué tipo de asimetría presenta la variable edad?
¿Qué significa?
• Se tomó una muestra de 17 estudiantes de colegios privados y
se calculó las medidas de tendencia central sobre la variable
edad. Los resultados fueron los siguientes:
𝒙 = 15,7 años me = 16 años mo = 16,25 años
¿Qué tipo de asimetría presenta variable edad? ¿Qué significa?
Autoevaluación

Decir si es Verdadero o Falso las siguientes afirmaciones:

• Cuando existen valores extremos, la moda se ve


afectada por estos valores.
• La moda se interpreta como la mayoría de los individuos
que presentan una característica.
• Cuando los datos no tienen la misma relevancia se hace
uso de un promedio aritmético.
• Cuando hay una sola moda, la distribución de datos se
denomina unimodal.
Medidas de posición
Estaturas de jugadores:

¿Cuál es la estatura mínima a partir del cual se encuentra el 20% de los


jugadores con mayores estaturas?

20%

estatura mínima
¿Qué medida estadística debemos utilizar?
Medidas de Posición

Los percentiles dividen un


conjunto de datos en 100 partes
porcentualmente iguales.

Dado un percentil Pk, el K% de los datos son menores o iguales


al valor de Pk y el otro (100-k)% superiores al valor de Pk
Cuartiles dividen un conjunto de datos
en 4 partes porcentualmente iguales.
Se denotan por Q1, Q2 , Q3.

Deciles dividen un conjunto de datos


en 10 partes porcentualmente iguales.
Se denotan por D1, D2, ... , D8 , D9.
Percentiles para datos no agrupados:

• Ordene los datos de manera ascendente: X1, X2, X3, …..Xn


• Calcule la posición i del percentil k:

k n  1 E: parte entera
i  E, d d: parte decimal
100
• Calcule el percentil k:

Pk  X ( E )  0, d * ( X ( E 1)  X ( E ) )
Ejemplo 8:

Se eligió a 11 alumnos del salón y se les preguntó sobre la nota que


obtuvieron en la 1° práctica calificada del curso:
12; 15; 20; 12; 10; 18; 17; 15; 15; 08; 10
Halle:
a) Q1 y D7
b) P85 y P15
c) La nota mínima que debe tener el alumno para pertenecer al tercio
superior.
d) La nota máxima para pertenecer al 28% de los alumnos que tienen
las menores notas.
Autoevaluación
• Indique si el enunciado es V ó F

• El sueldo mínimo para que un trabajador de una empresa esté


considerado dentro del 15% de los que tienen mayores sueldos
es el percentil P85.

• El sueldo máximo para que un trabajador de una empresa este


considerado dentro del 25% de los que tienen menores sueldos
es el percentil P25.
Medidas de Dispersión
Medidas de dispersión
Es la medida de dispersión más simple usada
especialmente para pocos datos no
1. Rango: R = Xmáx - Xmín agrupados. Mide la dispersión del 100% de
datos

Usado especialmente en el caso de datos con


2. Rango Intercuartílico:
valores extremos. Mide la dispersión del 50%
RIC = P75 – P25 de datos centrales.

3. Varianza: 𝜎 2 o S2 y Es el más conocido con propiedades usadas


Desviación Estándar:  o S en Estadística Inferencial.

4. Coeficiente de variación: Mide la dispersión relativa respecto a la


CV. media aritmética.
Rango ( R ) R = x (máximo) - x (mínimo )

Ejemplo 9:

Se ha medido la resistencia a la deformación de tubos circulares de dos


marcas A y B. Las primeras mediciones obtenidas son las siguientes:

Marca Resistencia a la deformación (kN)


Marca A 96 102 104 108 126 128 150 156
Marca B 114 111 128 114 83 125 121 121

Descriptivo Marca A Marca B


Mínimo
Máximo
Rango

Interpretación : El 100% de las observaciones presenta una variación de …..


RANGO INTERCUARTÍLICO (RIC)

Es la diferencia entre el Cuartil 3 (Q3 = P75 ) y el Cuartil 1 (Q1= P25).

RIC = Q3 – Q1

Como se puede observar este valor considera la variación del 50% de las
observaciones centrales.
La Varianza:
Esta medida es la más utilizada porque considera al total de datos de la
muestra.
Se define como el promedio de los cuadrados de las distancias de cada dato a
la media aritmética.

PARA DATOS SIN AGRUPAR:


Parámetro: N

 Xi   
2
Varianza Poblacional: σ2
V X  2  i 1

PARA DATOS SIN AGRUPAR:


Estadístico: n

 X i  X
2
Varianza Muestral: S2
S2  i 1

n 1
Varianza y desviación estándar para datos agrupados

Datos cuantitativos
Datos discretos continuos o agrupados en
intervalos
𝑛 / 2
𝑖=1 𝑥𝑖 − 𝑥 2 𝑓𝑖 𝑛
𝑥î −𝑥 𝑓𝑖
Muestral 𝑆2 = 𝑆2 =
𝑖=1
𝑛−1 𝑛−1

𝑁 / 2
2𝑓 𝑁
𝑖=1 𝑥𝑖 − 𝜇 𝑖 𝑖=1 𝑥î −𝜇 𝑓𝑖
Poblacional 𝜎2 = 𝜎2 =
𝑁 𝑁
Ejemplo 10:
Para la siguiente tabla de frecuencias calcule: varianza, desviación
estándar y coeficiente de variación:
X : Tiempo utilizado para ensamblar un componente
electrónico (hrs)
Use la calculadora científica Casio - Natural

HORAS Xi fi
2,8 – 3,3 3,05 2
3,3 – 3,8 3,55 6
3,8 – 4,3 4,05 10
4,3 – 4,8 4,55 17
4,8 – 5,3 5,05 8
5,3 – 5,8 5,55 5
5,8 – 6,3 6,05 2
TOTAL 50

https://www.youtube.com/watch?v=9ql-vTM6gq0
Propiedades de la varianza

Si K es una constante, X e Y son variables:

1. V(X)  0

2. V(K ) = 0

3. V(K X ) = K2 V(X)

4. V(K ± X) = V(X)

5. V( X + Y) = V(X) + V(Y) Si X e Y son variables


V( X - Y) = V(X) + V(Y) independientes
COEFICIENTE DE VARIACIÓN:

Es una medida de dispersión relativa, sirve para comparar las


dispersiones de dos o más grupos de datos. Es un número
expresado en porcentaje.

S
CV(X)  x100%
X

El C.V. es útil para comparar dos o más grupos de datos con


diferente media e inclusive con diferentes unidades de medida,
como ejemplo valores monetarios en soles y dólares.
Aplicación del Coeficiente de Variación

Analizar comparativamente los sueldos de los trabajadores de


una empresa de según su categoría.

Desv. Estándar
Categoría Media X C.V
(S)
Directivos 820 3500,0
Empleados 630 2100,0
Operarios 980 1050,0

Analizando:
CV(directivos) < CV(empleados) < CV (operarios)
Los sueldos de los operarios son los más heterogéneos.
Ejemplo 11:
Se tiene cuatro marcas de bombillas A, B, C y D. Se presenta a
continuación la duración (en días) registrada de cierto número de
bombillas de cada marca.

Marca A: duración registrada en días: 5; 10; 12; 13; 18

Marca B Marca C
Duración No. de Duración No. De
(días) bombillas (días) bombillas
3 2 0–5 4
11 4 5 – 10 8
15 3 10 – 15 12
20 1 15 – 20 2

Marca D: duración registrada en días: 11; 12; 12; 13; 14; 15; 15; 15; 15; 16

a. ¿Qué marca compraría usted y por qué? Sustente su respuesta a


base del análisis de las medidas de tendencia central y de
dispersión de los datos presentados.
b. Calcule para las marcas B y D: P25 P75. Interprete estos valores
Ejercicio:
La siguiente tabla corresponde a los pesos en gramos de dos muestras tomadas
aleatoriamente de cierto embutido que es elaborado por dos máquinas distintas (1 y
2). El muestreo se realizó dado que últimamente se han detectado ciertos problemas
por la diferencia del peso de los embutidos entre las dos máquinas, lo que ha
causado malestar entre los consumidores del producto.
Pesos (g) x´ f máquina A f máquina B
208,0 - 210,7 209,4 0 4
210,7 - 213,4 212,1 1 13
213,4 - 216,1 214,8 8 19
216,1 - 218,8 217,5 17 26
218,8 - 221,5 220,2 30 14
221,5 - 224,2 222,9 17 4
224,2 - 226,9 225,6 7 0
a. Calcule las medidas de dispersión de cada muestra.
b. Se considera que el peso de los embutidos es aceptable si su promedio es de 220
gramos y si la desviación estándar no supera los 3,1 gramos. Si sólo hay discrepancias
con el peso promedio se puede solucionar fácilmente pues las máquinas pueden
regularse desde su tablero de control. En cambio, si los pesos tienen valores muy
dispersos, es necesario reparar la máquina pues la causa es un excesivo desgaste. Con
estos criterios y los datos de las muestras, ¿qué le recomendaría hacer?
Autoevaluación:

Enunciado Verdadero Falso

Cuando el número de datos es grande se usa el


Rango.

La medida estadística que permite comparar la


dispersión de dos o mas grupos de datos es el
coeficiente de variación.

La varianza poblacional se define como la suma de las


diferencias al cuadrado de cada valor respecto a su
media entre el número de datos.

Dispersión es equivalente a valores extremos.


BIBLIOGRAFÍA
BÁSICA
o Montgomery, D. (2005). Probabilidad y estadística aplicada a la
ingeniería. Segunda edición. México, D.F.: Limusa Wiley.

o Córdova, M. (2009). Estadística descriptiva e Inferencial. Quinta


edición. Perú: MOSHERA S.R.L.

o Devore, J. (2008). Probabilidad y estadística para Ingeniería y Ciencias.


Séptima edición. México D.F.: Cengage Learning, Inc.

COMPLEMENTARIA

o Mendenhall, W. (1997). Probabilidad y estadística para ingeniería y


ciencias. Cuarta edición. México, D.F. Prentice-Hall Hispanoamericana.