Вы находитесь на странице: 1из 53

MEDIDAS DE TENDENCIA

CENTRAL
- MEDIA ARITMETICA
- MEDIANA
- MODA

Estadstica I
Ingeniera en Sistemas de Informacin
Medidas de tendencia central: Son
indicadores estadsticos que muestran hacia
que valor (o valores) se agrupan los datos.

Existen varios procedimientos para expresar


matemticamente las medidas de tendencia
central, de los cuales, los ms conocidos son:

La media aritmtica
La mediana
La moda
MEDIA ARITMTICA PARA DATOS NO
AGRUPADOS
Podemos diferenciar la frmula del promedio
simple para datos poblaciones y muestrales:
MEDIA :
Es la suma de todas la puntuaciones divida
entre el nmero de puntuaciones observadas
(es decir, el tamao de la muestra)
Ejemplo: Hallar la media aritmtica de los
nmeros :

3, 4, 6, 8, 10, 12, 15 y 16.


=
3+4+6+8+10+12+15+16/8 =
9.25
Ejemplo:
Media Aritmtica para datos agrupados en tablas tipo A
La siguiente tabla de frecuencia muestra el nmero de
preguntas de 81 encuestados sobre un Test que consta de solo
seis preguntas.

PASO 1: Para efectos del clculo de la media, deberamos


sumar 15 veces el valor 1, 13 veces el valor 2, 8 veces el valor
3, hasta llegar a la ltima clase:

PASO 2: Dividir la sumatoria sobre el nmero


total de datos.
Ejemplo: media aritmtica para datos agrupados en intervalos
(tablas tipo B)

Calcular la media para los datos distribuidos en la siguiente tabla de


frecuencia:
Xi 108 f Marca de 7890.6
Mcf i
Clase
40.0 - 3 44.1 132.3 Formula
48.1
48.1 8 52.1 416.8
56.1
56.1 11 60.1 661.1
64.1
64.1 32 68.1 2,179.2
72.1
72.1 21 76.1 1,598.1
80.1
= =
80.1 18 84.1 1,513.8
88.1
PASO
88.1 1: Realizar
14 la sumatoria
92.1 del
1,289.4 producto resultante entre las marcas de
clase
96.1 por su frecuencia absoluta.
96.1 1 100.1 100.1
104.1

PASO 2: Dividir la sumatoria sobre el nmero total de


datos.
Mediana (Me): valor que divide una serie de datos en dos
partes iguales.
La cantidad de datos que queda por debajo y por arriba de la
mediana son iguales
l nmero es impar se toman el valor que esta en El Seis (n + 1)/2 = (11
anto la mediana del conjunto dado Me = 3
Como el nmero de magnitudes es par, entonces el lugar
(10+1)/2 =5.5; esto quiere decir que el lugar esta entre el
quinto y sexto lugar, por lo que obtenemos la media
aritmtica de 2 y 3, que ser 2 + 3/2 = 2.5
En una serie de datos agrupados en
una distribucin de frecuencias simple.

La mediana estar determinada por el


nmero que representa a la clase que
contiene el valor que ocupa el lugar
(N +1)/2, en la columna de frecuencias
acumuladas.
Ejemplo:
Hallar la mediana de las notas finales de un
curso de Matemtica Comercial
x f fa
65 3 3
66 4 7
67 2 9
68 4 13
69 3 16
70 2 18
71 5 23
72 6 29 Solucin:
73 4 33
74 3 36 Lugar = (40 + 1)/2=
75 2 38 20.5
76 2 40
Me = 71
PARA DATOS AGRUPADOS EN
INTERVALOS
La mediana se calcula en la forma siguiente:
1. Se determina el intervalo que contiene a la mediana
y ser el valor que ocupa el lugar N/2, donde N es el
nmero total de datos.
2. Se calcula la frecuencia acumulada que corresponde
al intervalo inmediato inferior al intervalo de la
mediana.
3. Se determina la frecuencia del intervalo en donde se
encuentra la mediana
4. Se determina la amplitud del intervalo
5. Se determina el lmite real del intervalo en donde
est la mediana.
6. Se aplica la frmula, para determinar el valor de la
mediana.
En donde:
Li = Lmite real inferior del intervalo en donde est la
mediana.
N = Nmero total de los datos.
faa = Frecuencia acumulada del intervalo inmediato
inferior al intervalo en donde este la mediana
fm= Frecuencia del intervalo en donde est la mediana
i = Amplitud del intervalo en donde est la mediana
Ejemplo:
Calcular la mediana de las velocidades en Km/h de varios
automviles, dadas en la siguiente tabla.
Solucin:
x f fa 1. Obtenemos N/2 = 35/2 = 17.5 y observemos
60 69 5 5 que el intervalo que contiene la mediana es 80
90. Este intervalo contiene aquellos valores que
70 79 6 11 ocupan desde inmediato
el lugar 12 inferior
hasta el 25.
2. El intervalo en donde se
80 89 1 25 encuentra la mediana es 70 79 y tiene la
4 frecuencia acumulada de 11, o sea que faa = 11
33
90 99 8 3. La frecuencia del intervalo en donde se
34 encuentra la mediana es 14, o sea que fm = 14
100 1 4. La amplitud de los intervalos es de 10, luego i =
109 35
10.
110 1 5. El lmite real inferior del intervalo en donde se
119 encuentra la mediana es de L = 79.5

Aplicando la formula

Me = 79.5 + (17.5 11)/14 * 10 = 79.5 + 4.64 = 84.14

Respuesta: la mediana de los 35 automviles es de 84.14


Moda (Mo): indica el valor que ms
se repite, o la clase que posee
mayor frecuencia.
En el caso de que dos valores
presenten la misma frecuencia,
decimos que existe
un conjunto de datos bimodal.
Para ms de dos modas
hablaremos de un
conjunto de datos multimodal.
Ventajas:

La moda puede calcularse con cualquier tipo de


datos.

Inconvenientes:

La moda es la ms inestable de las medidas de


tendencia central, ya que puede variar mucho de
una a otra muestra extrada de una misma
poblacin.

Podemos encontrarnos con que no existe una


nica moda, a lo que llamaramos distribuciones
bimodales o multimodales.
MODA PARA DATOS NO
AGRUPADOS (SIMPLES)
Ejemplo 1: Los siguientes datos provienen del resultado de
entrevistar a 30 personas sobre la marca de gaseosa que ms
consume a la semana:

Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3


Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

SOLUCIN
PASO 1: Determinar las frecuencias de cada valor de la
variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
PASO 2: la moda representa el valor que ms se repite.
En este caso es la
Ejemplo 2:

Si tenemos el conjunto de mediciones


1,2,4,4,3,7,2,4,3,2,5 y 2.

Al ordenarlos tenemos: 1,2,2,2,2,3,3,4,4,4,5 y 7


y observemos que el valor que ms se repite es 2,
por lo que la

Mo = 2

Ejemplo 3:

Cuando todas laspuntuacionesde un grupo tienen


lamisma frecuencia,nohaymoda.
2, 2, 3, 3, 6, 6, 9, 9
Ejemplo 4 : Cuando en las puntuaciones de una distribucin
vemos que dos de ellas tienen la misma frecuencia, y adems es
mayor que el resto de las frecuencias de las dems puntuaciones,
consideramos que la moda es el promedio de estas dos puntuaciones
adyacentes.
Ejemplo: Puntuaciones: 1, 1, 4, 6, 6, 6, 6, 7, 7, 7, 7, 9, 10
En este caso la moda sera el promedio de los valores 6 y 7 ya que se
repiten con la misma frecuencia.

Ejemplo 5: Estaramos ante una distribucin bimodal en el caso


de encontrarnos con dos puntuaciones que sin ser adyacentes
tienen la misma frecuencia y adems es mayor que la de otra
puntuacin cualquiera. Ejemplo:

Puntuaciones: 1, 1, 3, 3, 3, 3, 4, 4, 5, 6, 6, 6, 6, 7

Nos encontramos con que tanto el valor 3 como el valor 6, tienen


una frecuencia de 4, por lo que ambos valores determinarn la
moda.
EN UNA SERIE DE DATOS AGRUPADOS
POR INTERVALOS
En este caso la moda es el Punto Medio o Marca de Clase
del intervalo que registra la mayor frecuencia, a lo que llamamos
intervalo modal. Tambin disponemos de expresiones de clculo
que nos permiten calcular la moda.

Calcular la moda a partir de la siguiente tabla de frecuencia:


x f Mc
46 2 5
68 4 7
8 10 4 9
10 6 11 Mo1 = 11
12 13 Mo2 = 13
12 6
14
SOLUCIN
=
Las marcas de clase que ms frecuencias tienen son 11 y 13, por
22
tanto decimos
que es un caso donde aparecen dos modas (bimodal).
Mo1 = 11
Mo2 = 13
Calculo de la moda mediante frmula

Algunos autores suelen aplicar una frmula para


determinar la moda para tablas de frecuencia.

Mo = Li + fi - fi -1 * i
(fi - fi -1) + (fi - fi +1 )

En donde:
L i = Limite inferior del intervalo en donde se encuentra la
moda
fi = frecuencia del intervalo donde se encuentra la moda
fi -1 = Frecuencia del intervalo inferior a donde se encuentra la
moda
fi +1 = frecuencia del intervalo superior a donde se encuentra
la moda
i = Amplitud del intervalo
Ejemplo:
Calcular la moda de las velocidades en Km/h de varios automviles, dadas e
En las siguiente tabla:

x f McObservemos que la moda de la distribucin es de 85,


porque el intervalo 80 90 tiene la mayor
60 70 5 65
frecuencia que es 14
70 80 6 75
80 90 14 85
90 8 95
100
100 1 105
110
110 1 115
La
120moda de la distribucin anterior la obtendremos
utilizando
La frmula para que el resultado sea lo ms exacto
posible.
Procedimiento:

1. Determinar las diferencias entre las frecuencias del intervalo en donde est la
moda y las frecuencias de los intervalos inferior y superior.
fi - fi -1 = 14 6 = 8
fi - fi +1 = 14 8 = 6
2. Determine el lmite inferior del intervalo en donde se encuentra la moda y
observamos que es:
L i = 80

3. Encontramos la amplitud del intervalo que es:


i = 10
4. utilizando la frmula

Nota: Observe que hay diferencia en


el clculo.
CURVAS
CURVAS DE DE DISTRBUCION
DISTRBUCION DEDE FRECUENCIAS:
FRECUENCIAS:
Relaciones
Relaciones entre
entre la
la media,
media, la
la mediana
mediana yy la
la
moda.
moda.
Curva de distribucin de frecuencias: es un
sustituto de un histograma de frecuencias o
polgono donde reemplazamos estos grficos con
una curva suavizadas.

El rea bajo una curva de distribucin de


frecuencias representa el nmero total de sujetos
en la poblacin y es igual a una proporcin de 1 o
100%.
La
La distribucin
distribucin normal:
normal: EsEs aquella
aquella donde
donde lala media,
media, la la
mediana
mediana yy la
la moda
moda dede una
una variable
variable son
son iguales
iguales entre
entre si
si yy la
la
distribucin
distribucin de
de las
las puntuaciones
puntuaciones tiene
tiene forma
forma de
de campana.
campana.
Tambin
Tambin nos
nos referimos
referimos aa esto
esto como
como una
una curva
curva normal.
normal.

Media = Mediana = Moda


Distribucin sesgada: Curva de distribucin de frecuencias en
la cual la media, la mediana y la moda de una variable son
desiguales y algunos de sus sujetos tienen puntuaciones
sumamente altas o bajas.
Distribucin sesgada a la derecha o positiva: tiene
puntuaciones extremas en el extremo positivo de la distribucin
de puntuaciones.

58 67 85 86 46
86 86 86 86 38
26 26 26 26 26
26 26 26 26 26 > Mediana
26 34 36 34 36

Por ejemplo: el ingreso familiar en Estados Unidos est sesgado


positivamente; la mayora de las familias ganan bastante
dinero, pero pocas son sumamente ricas. Las puntuaciones
extremas altas inflan la media, jalndolas en direccin positiva.
La moda es la medida de tendencia central con la menor
puntuacin calculada. La mediana ser igual a la media o a la
moda o, ms probablemente, caer entre stas.
Distribucin sesgada a la izquierda o negativo: tiene
puntuaciones extremas en el final bajo o negativo de la
distribucin de puntuaciones.

60 60 64 65
64 78 86 86
64 86 86 86
70 86 86 86 < Mediana

Por ejemplo: las puntuaciones del examen en un curso de la


Universidad tienden a estar sesgadas a la izquierda. La mayora
de los estudiantes de Ultimo ao obtienen altas puntuaciones,
pero pocos se quedan en la direccin negativa. Estas pocas
puntuaciones extremas bajas desinflan a la media, jalndola en
la direccin negativa. La moda es la mayor puntuacin
calculada, y la mediana cae entre la media y la moda.
Ejemplo:
De las 283 personas encuestadas en 2015 sobre
si se encontraban afiliados a algn sindicato, 86
contestaron afirmativamente. Con los resultados
afirmativos y clasificados segn la edad
obtenemos la siguiente tabla:
Edad 25-35 35-45 45-55 55-65 Totales
N
personas 45 23 15 3 86
(f)
Marca de
clase (Mc 30 40 50 60
f)
Hallar: Media aritmtica. Mediana, la Moda y determinar
el tipo de distribucin que presentan sus datos.
FORMULAS

Media
MEDIA : Mediana
Es la suma de todas la
puntuaciones divida entre el Mediana: valor que divide una
nmero de puntuaciones serie de datos en dos partes
observadas (es decir, el tamao iguales.
de la muestra)

Moda
MODA :
Indica el valor que ms se repite,
o la clase que posee mayor
frecuencia.
ocedimiento para el clculo de la Media Aritmtica

Edad 25-35 35-45 45-55 55-65 Totales


N
personas 45 23 15 3 86
(f) de
Marca
clase (Mc 30 40 50 60
) f
Mc 1350 920 750 180 3200
Procedimiento para el calculo de la
Mediana (Me)
Edad 25-35 35-45 45-55 55-65 Totales
N
personas 45 23 15 3 86
(f)
Frecuenc
ia
45 68 83 86
acumula
da (fa)

Mediana = Me Intervalo mediano es el intervalo


que contiene a la mediana, como N/2 es 86/2 =
43, el intervalo mediano es aquel que contiene
a los valores que ocupan los lugares 43 y 44 en la
fila de la fa, es decir el intervalo (25 - 35)
Procedimiento para calcular la Moda (Mo)

Edad 25-35 35-45 45-55 55-65 Totales


N
personas 45 23 15 3 86
(f) de
Marca
clase 30 40 50 60
(Mc)
Moda = Mo Intervalo modal es aquel que
contiene la moda, la moda se encuentra
en el intervalo que presenta mayor
densidad de frecuencia, en este caso
como los intervalos son de igual
amplitud, el de mayor densidad de
frecuencia coincide con el de mayor
frecuencia, es decir el intervalo (25 - 35),
y dentro de l consideramos como la
moda, la marca de clase, es decir Moda
= 30.
CURVAS
CURVAS DE
DE DISTRBUCION
DISTRBUCION DEDE FRECUENCIAS:
FRECUENCIAS:
Relaciones
Relaciones entre
entre la
la media,
media, la
la mediana
mediana y
y la
la
moda.
moda.

> Mediana

stribucin sesgada positivamente o sesgada a la derecha

Mo= 31.72 Me= 34.55 = 37.2


MEDIDAS DE DISPERSIN
- RANGO
- DESVIACION MEDIA
- DESVIACION
ESTANDAR

Estadstica I
Ingeniera en Sistemas de Informacin
Rango: es una expresin de
cmo las puntuaciones de una
variable de intervalo se
distribuyen de menor a mayor,
es decir, es la distancia entre
las puntuaciones mnima y
mxima de una muestra.
Clculo del rango de una variable x
de intervalo
Ordenar las puntuaciones de la
distribucin de menor a mayor
Identificar las puntuaciones mnima y
mxima
Calcular el rango:
Rango = (puntuacin mxima puntuacin
mnima)
Calculemos el rango en un ejemplo:
Supongamos que X = edad y tenemos la
siguiente distribucin de puntuaciones:
1. 21, 23, 43, 26, 20, 21, 25
2. Empezar por ordenar las puntuaciones:
3. 20, 21, 21, 23, 25, 26, 43
4. Identificar las puntuaciones mnima y
mxima de 20 y 43, respectivamente.
5. Calcula el rango: Rango = (43 20) = 23
DEFINICIONES
Desviacin respecto a la media:

Ladesviacin respecto a la media:es


ladiferenciaen valor absoluto entre
cadavalorde la variable estadstica y lamedia
aritmtica.
Desviacin estndar:

Describe la forma en que las puntuaciones de


una variable de intervalo se dispersan por la
distribucin en relacin con al puntuacin
media.
Varianza:

Es la variacin promedio de las puntuaciones en


un distribucin (es decir, la media de la suma
de cuadrados).
Entonces, la desviacin estndar (s ) es una medida
(cuadrtica) que informa de la media de distancias que tienen
los datos respecto de su media aritmtica, expresada en las
mismas unidades que la variable. Es decir mide cunto se
separan los datos.
La frmula es fcil: es la raz cuadrada de la varianza. As
que, "qu es la varianza?"

Varianza

La varianza (que es el cuadrado de la desviacin estndar: s2


o 2) se define as:
Es la media de las diferencias con la media elevadas al
cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los nmeros)
2. Ahora, por cada nmero resta la media y eleva el resultado
al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.
Ejemplo
Los estudiantes de trabajo social de la UMG han medido
las alturas de unos perros (en milmetros):

Las alturas (de los hombros) son:


600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviacin estndar.

Respuesta:

as que la altura media es 394 mm. Vamos a dibujar esto en el


grfico:
Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz


la media:

As que la varianza es 21,704.


Y la desviacin estndar es la raz de la varianza, as que:

Desviacin estndar: = 21,704 = 147


y lo bueno de la desviacin estndar es que es til:
ahora veremos qu alturas estn a distancia menos
de la desviacin estndar (147mm) de la media:

As que usando la desviacin estndar tenemos una manera


"estndar" de saber qu es normal, o extra grande o extra
pequeo.
Los Rottweilers son perros grandes. Y los Dachsunds son un
poco menudos...
Desviacin estndar para datos no
agrupados

EJEMPLO 2: Calcular la desviacin media y


estndar de las calificaciones obtenidas por los
estudiantes de estadstica del tercer ciclo de la
carrera Ingeniera en Sistemas, de la UMG.

=6
DESVIACION ESTANDAR CON DATOS
AGRUPADOS

EJEMPLO:
Una muestra de las cantidades que los
empleados de la COCA-COLA invierten
Quincenalmente en el plan de participacin
de utilidades, se organizo en una
distribucin de frecuencia para su estudio.
Cul es el desplazamiento medio y
estndar de estos datos?
Formula para el clculo de la desviacin media y
estndar,
datos agrupados

= Media
S2 = Varianza
S = Desviacin estndar
D = Desviacin media
x = punto medio de una clase o marca de clase
f = frecuencia de clase
n = nmero total de observaciones en la muestra

Media
Desviacin Media

Varianza Desviacin estndar


DISTRIBUCION DE FRECUENCIAS DEL EJEMPLO

Cantidad Nmero de
Invertida en $ Empleados
30 35 3
35 40 7
40 45 11
45 50 22
50 55 40
PASO 1: Cada frecuencia de clase se multiplica por su punto
medio. Esto es, se multiplica f por Mc. De esta forma se tiene para
la primer clase, 3 x $32.50 = $ 97.50, para la segunda clase 7 x
$37.50 = 262.50, y as sucesivamente.
Cantidad Nmero de Mc Mcf
Invertida en $ Empleados
(f) (30 + 35)/2 3*32.50=97.
30 35 3 =32.50 50
35 40 7 37.50 262.50
40 45 11 42.50 467.50
45 50 22 47.50 1045.00
50 55 40 52.50 2100.00
Total 83 = 3,972.5

Media
PASO 2: Se calcula la desviacin media. Para la primera clase seria
$32.50 - $47.86 = 15.36. para la segunda, $37.5 - $47.86= $10.36 y
as sucesivamente.
Nota: se colocan nmeros positivos ya que los clculos corresponden a
valores absolutos.
Cantidad Nmero de Marca de Clase
Invertida en Empleados (xi)
$ (fi) 15.36*3=46
(30 + 35)/2 32.50- .08
30 35 3 =32.50 47.86= 15.36
72.52
35 40 7 37.50 10.36
58.96
40 45 11 42.50 5.36
7.92
45 50 22 47.50 0.36
185.6
50 55 40 52.50 4.64
= 371.12
Total 83 = 36.08

= 47.86

Desviacin Media
Paso 3: La varianza se calcula elevando al cuadro el valor de
(x - ). Para la primer clase serian $-15.36 x $-15.36 =
$235.97. para la segunda, $-10.6 x $-10.36 = $107.36, y as
sucesivamente.
Cantidad Nmero de Marca de
Invertida en Empleados Clase (x) (x - ) (x - )2
$ (f) (30 + 35)/2
32.5 47.86 = 15.36*15.36=
=32.50
30 35 3 -15.36 235.97
35 40 7 37.50 -10.36 107.36
40 45 11 42.50 -5.36 28.75
45 50 22 47.50 -0.36 0.13
50 55 4 52.50 4.64 21.52
Total 83 =393.73

= 47.86

Varianza
Resultado

Desviacin estndar

La desviacin estndar es de $ 2.19


= 47.86

Con lo que concluiramos que los empleados


invierten quincenalmente en el plan de
participacin de utilidades, un promedio de $
47.86, con unatendenciaa variar por debajo o
porencimade dicha inversin $ 2.19.
Desviacin estndar para datos no agrupado en una
distribucin de frecuencia simple

EJEMPLO: Calcular la desviacin estndar para el conjunto de


calificaciones obtenidas por los 54 estudiantes de la carrera
de Ingeniera en Sistemas de Informacin de la UMG.
(x - ) (x - ) v = f(x - x )2/n
x f (x * f)/n
5 12 5*12=60 5-7.31=-2.31 (-2.31)2 = (12)(5.33)=63.90
5.33
6 10 60 -1.31 1.71 17.1
7 4 28 -0.31 0.09 0.36
8 14 112 0.69 0.47 6.58
9 5 45 1.69 2.85 14.25
10 9 90 2.69 7.23 65.07
= =167.26/54=3.0
54 9

Desviacin
estndar s = 3.09 =
s=v 1.75

Вам также может понравиться