Вы находитесь на странице: 1из 63

MEDIDAS DE POSICIN Y DISPERSION

(Dagoberto Salgado Horta Especialista en Estadstica)


CAPITULO 3

El anlisis estadstico de una serie de datos se elabora mediante el clculo de diferentes parmetros y / o
estadsticos. Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Por lo general, las frecuencias de los
intervalos centrales de una serie de datos son mayores que el resto, ese nmero se le denomina medida
de posicin.
Las medidas de posicin forman parte del conjunto de medidas descriptivas numricas, entre las que se
encuentran los parmetros y los estadgrafos. Una medida de posicin es un nmero que se escoge como
orientacin para hacer mencin a un grupo de datos.
Uno de los problemas fundamentales que presenta un anlisis estadstica, es el de buscar el valor ms
representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una larga
serie de valores u observaciones, es el de resumir los datos en una distribucin de frecuencia; esto no es
suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en
especial cuando se requiere comparar dos o ms serie estadsticas. Es necesario continuar el proceso de
reduccin hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma
que permita una interpretacin global del fenmeno en estudio; para que ese valor sea representativo
debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie con
estas caractersticas recibe el nombre de promedio, media o medida de posicin, esto es debido a su
ubicacin en la zona central de la distribucin. Las medidas de posicin son de gran importancia en el
resumen estadstico, ya que representan un gran nmero de valores individuales por uno solo.
El valor ms representativo de un conjunto de datos por lo general no es el valor ms pequeo ni el ms
grande, es un nmero cuyo valor se encuentra en un punto intermedio de la serie de datos. Por lo tanto un
promedio es con frecuencia un valor referido que representar la medida de posicin de la serie de
valores. Las medidas de posicin se emplean con frecuencia como mecanismo para resumir un gran
nmero de datos o cantidades con la finalidad de obtener un valor que sea representativo de la serie.
Las Principales Medidas de Posicin son:
a) La Media Aritmtica, b) La Mediana, c) La Moda, d) Los cuartiles, e) Los Deciles y f) Los
Percentiles.
CARACTERSTICAS DE LAS MEDIDAS DE POSICIN
1. Deben ser definidas rigurosamente y no ser susceptibles de diversas interpretaciones.
2. Deben depender de todas las observaciones de la serie, de lo contrario no seria una caracterstica
de la distribucin.
3. No deben tener un carcter matemtico demasiado abstracto.
4. Deben ser susceptibles de clculo algebraico, rpido y fcil.

83

SUMATORIA
En esta unidad y en las siguientes se utilizaran sumas de muchos trminos, por lo cual es necesario
introducir una notacin denominada sumatoria, para facilitar las sumas. La notacin sumatoria implica el
uso del smbolo, que no es otra cosa que la letra sigma mayscula del alfabeto griego y que
corresponde a la letra S de nuestro alfabeto. Siempre que se utilice el signo se leer suma de o
sumatoria de .
Segn, Leithold sumatoria se define as:
n

F
i =m

= F (m). + .F (m + 1). + .F (m + 2). + ..... + F (n 1). + .F (n),.donde..m. y.n..son..enteros. y.m n.

La ecuacin de definicin consiste de la suma de (n-m + 1) trminos, donde el primer trmino se obtiene
sustituyendo i por m en Fi, el segundo se obtiene remplazando i por (m+1) en Fi, y as sucesivamente,
hasta alcanzar l ultimo trmino al sustituir i por n en Fi. En la ecuacin de sumatoria la letra m se
le denomina lmite inferior de la sumatoria y n se le llama lmite superior de la sumatoria. El smbolo i se
le denomina ndice de la sumatoria. Ejemplos:
4

X
i =1

= X 1 + X 2 + X 3 + X 4 . Observe que las notaciones colocadas arriba y abajo del signo sumatoria

indican que solo deben ser sumados sucesivamente las primeras cuatro observaciones. Tambin puede
darse el siguiente caso:
7

X
i =3

= X 3 + X 4 + X 5 + X 6 + X 7 . Se puede observar que las notaciones colocadas arriba y abajo del

signo sumatoria indican que solo deben ser sumados sucesivamente desde la tercera hasta la sptima
observacin
Generalmente, con el objeto de simplificar ms aun las formulas que permiten utilizar el smbolo sigma,
se pueden suprimir los subndices, quedando el smbolo de sumatoria expresado de la siguiente manera:
X. Esto se puede hacer cuando no hay ambigedad al referirse a los diferentes valores que toma la
variable X.
PROPIEDADES DE LA SUMATORIA

1. La sumatoria de la suma de dos o ms trminos, es igual a La suma de las sumatorias separadas de


los trminos.
n

i =1

i =1

i =1

i =1

( X i + Yi + Z i ) = X i + Yi + Z i .
2. L a sumatoria de la diferencia de dos o ms trminos, es igual a la diferencia de las sumatorias
separadas de los trminos.
n

(X i
i =1

Yi Z i ) =

i =1

Xi

i =1

Yi

i =1

Z i.

La sumatoria de una constante multiplicada por una variable, es igual a la constante multiplicada
por la sumatoria de la variable.
n

i =1

KX

= K

i =1

X i ... donde .. K .. es .. una .. constante

.. cualquira

84

4. La sumatoria de una constante es igual a la constante multiplicada por el nmero de casos que
indique el limite superior de la sumatoria.
n

K = nK ., donde..K ..es..una..constante..cualquiera.
i =1

Cuando se trabaja con el trmino sumatoria es bueno recomendar lo siguiente:


2

n
n
n
n

X
X
.,..
y
...
X
Y

X
.

i i
i Yi . Ejemplos:
i
i =1
i =1
i =1
i =1
i =1
1.- Resolver las siguientes sumatorias, tomando en cuenta que: X i2 = {X 1 = 1,.. X 2 = 1,.. X 3 = 2}
n

2
i

a )... X ,...b).. X i , c)
i =1
i =1
3

2
i

a)

X
i =1

2
i

(X
i =2

+ 1) 2

2
i

= (1) 2 + (1) 2 + (2) 2 = 1 + 1 + 4 = 6.


2

b)

2
2
2
X i = [(1) + (1) + (2)] = [ 1 + 1 + 2] = (2) = 4.
i =1

c)

(X
i=2

2
i

] [

+ 1) 2 = (1) 2 + 1 + ( 2) 2 + 1 = ( 2) 2 + (5) 2 = 4 + 25 = 29 .

2. Exprese las siguientes operaciones utilizando la notacin sumatoria: a) X1+ X2 + X3 +X4.


X 52 + X 62 + X 72 + ...... + X n2 .
b)
4

Estos problemas se resuelven as: a)...... X i .


i =1

b)

X
i =5

2
i

MEDIA ARITMTICA

La media aritmtica ( X ) o simplemente la media es el parmetro de posicin de ms importancia en las


aplicaciones estadsticas. Se trata del valor medio de todos los valores que toma la variable estadstica de
una serie de datos. Por lo tanto, la medida posicional ms utilizada en los estudios estadsticos viene a ser
la media. Por su fcil clculo e interpretacin, es la medida de posicin ms conocida y ms utilizada en
los clculos estadsticos. La media es el valor ms representativo de la serie de valores, es el punto de
equilibrio, es el centro de gravedad de la serie de datos. La media aritmtica por lo general se le designa
con X .
La media aritmtica de una serie de N valores de una variable X1, X2, X3; X4,.........Xn, es el cociente de
dividir la sumatoria de todos los valores que toma la variable Xi, entre el nmero total de ellos. La

X
n

formula se puede expresar as: X =

i =1

.
N
Desviaciones o desvos.- Son diferencias algebraicas entre cada valor de la serie o cada punto medio
y la media aritmtica de dicha serie, o un valor cualquiera tomado arbitrariamente. Los desvos o
desviacin se designan con la letra di.
Dado una serie de valores X1, X2, X3, .......Xn , se llama desvo a la diferencia entre un valor cualquiera
Xi de la serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde
85

precisamente a la media aritmtica de esos valores dados, se dice entonces que los desvos son con
respecto a la media aritmtica. En smbolo: d i = ( X i X ).
PROPIEDADES DE LA MEDIA ARITMTICA

1. La suma de las desviaciones con respecto a la media aritmtica es igual a cero. d i = 0.


2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmtica
es menor que la suma de las desviaciones al cuadrado de los diversos valores con respecto a cualquier
2
2
punto K, que no sea la media aritmtica. (X i X ) < ( X i K ) .
3. La media aritmtica total o conjunta de dos o ms serie de datos, se puede calcular en funcin de las
medias aritmticas parciales y del nmero de datos de cada una de ellas, mediante la siguiente formula:
n X + n2 X 2 + n3 X 3 + ........ + nk X k X 1 X 2 X 3
X k , Donde:
=
+
+
+ .......
Xt = 1 1
N
n1
n2
n3
nk
N = n1 + n2 + n3 + ...... + nk , en esta n1, n2, n3 y nk es el nmero de datos de cada serie.
Adems, X 1 ..,. X 2., .,.. X 3 .,., y.. X k .,..son las medias de cada una de las series.
4 La media del producto de una constante por una variable, es igual al producto de la constante por la
media de la variable.
KX i K X i
X=
=
= KX.
N
N

5 La media de la suma de una constante ms una variable, es igual a la media de la variable ms la


( X i + K ) = X i + K = X + K . ., de la misma forma se cumple
constante. X ( X i + K ) =
n
n
n
esta propiedad para la resta.

CARACTERSTICAS PRINCIPALES DE LA MEDIA ARITMTICA

1. El valor de la media depende de cada una de las medidas que forman la serie de datos, y se halla
afectada excesivamente por los valores extremos de la serie de datos.
2. La media se calcula con facilidad y es nica para cada caso y permite representar mediante un solo
valor la posicin de la serie de valores.
3. La media es una medida de posicin que se calcula con todos los datos de la serie de valores y es
susceptible de operaciones algebraicas.
CLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS

Para calcular la media de datos no agrupados en clases se aplica la siguiente formula:


Xi
X=
. En donde N es el nmero total de datos y X i son los valores de la variable.
N

86

Ejemplo:
1. Calcule la media aritmtica de los siguientes valores: X i = {5,.7,.8,.9.,11.,.14}

5 + 7 + 8 + 9 + 11 + 14 54
=
= 9. Por lo tanto la media es 9.
N
6
6
CLCULO DE LA MEDIA PARA DATOS AGRUPADOS
X=

Cuando se construye una distribucin de frecuencia, los datos se agrupan en clases definidas por unos
lmites. Cuando se trabaja con la distribucin de frecuencia se parte del supuesto de que todos los datos
comprendidos en un intervalo de clase se distribuyen uniformemente a lo largo de este, entonces se puede
 ) del intervalo como adecuada representacin de los valores
tomar la marca de clase o punto medio ( X
que conforman el mencionado intervalo. El punto medio se designa con la letra X . Para calcular la
media en estas condiciones se pueden utilizar tres mtodos: El mtodo directo o largo y dos mtodos
abreviados.
MTODO DIRECTO

Este mtodo se le conoce tambin como mtodo largo; el mismo resulta demasiado engorroso cuando las
magnitudes de los puntos medios o de las frecuencias de clase son muy grandes, debido a que los
clculos son demasiados extensos. Los pasos a seguir para calcular la media con este mtodo son los
siguientes:
1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos medios de cada
clase y se colocan en sus respectivas columnas, se determinan las frecuencias de cada clase y se
ubican en sus respectivas columnas.
2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias, luego se obtiene la
sumatoria de las frecuencias (fi) multiplicadas por el punto medio ( X ) as: f i X i .
3. Luego se calcula la media aritmtica aplicando la formula:
f X i
f i X i

X =
=
...Donde..N es igual al nmero total de datos. Ejemplo:
N
fi = N
1.-Calcule la media de la siguiente distribucin de frecuencia correspondiente al peso en Kg de un grupo
de obreros. Realice los clculos respectivos para completar el siguiente cuadro.
CLASES

fi

75-------79
80-------84
85-------89
90-------94
95 ------99

20
40
60
100
140

CLASES

X

fi

f i X

75-------79
80-------84

77
82

20
40

1540
3280

= N =360

87

85-------89
90-------94
95 ------99
TOTAL

87
92
97

60
100
140
i

5220
9200
13580

= N =360

f X
i

= 32820

Aplicando la formula se tiene:


f i X i = 32820 = 91.17.
X =
N
360
MTODOS ABREVIADOS

Los mtodos abreviados para calcular la media son preferibles en la mayora de los casos, especialmente
cuando el nmero de clases de las distribuciones de frecuencias son grandes. Es un mtodo fcil de
aplicar. Existe un mtodo abreviado que se utiliza para cualquier tipo de distribucin de frecuencia sin
importar si tiene o no intervalos constantes de clase y hay otro que se utiliza solamente cuando en la
distribucin el intervalo de clase es constante, en esta ctedra se analizar el primero.
Si se selecciona un punto medio ( X ) de la distribucin de frecuencia que sea diferente de la media
aritmtica de esa, entonces la suma algebraica de las desviaciones ( d i ) con respecto al valor
seleccionado ser diferente de cero. Si la suma algebraica de las desviaciones es dividida por el nmero
de datos totales (N) de la serie y el cociente resultante es sumado al valor seleccionado, el resultado final
ser igual al de la media aritmtica de la serie. Este mtodo permite ahorrar una considerable cantidad de
tiempo cuando en una serie de valores el conjunto de datos es grande. La media seleccionada
arbitrariamente o media imaginaria se le designar con la letra A y los desvos di vendrn a ser la
desviacin de cada valor de la serie con respecto a la media imaginaria A. La formula para este caso ser:
f i ( X i A)

fidi
X = A+
...o.... X = A +
N
N
f i d i se le denomina factor de correccin, A es la media arbitraria o supuesta.
La fraccin
N
El factor de correccin, ser positivo o negativo segn que A sea menor o mayor que la media
aritmtica de la serie de valores.
PASOS PARA APLICAR EL MTODO ABREVIADO

1. Se organizan los datos de la serie en clases con sus respectivas frecuencias (fi), los mismos se
colocan en columnas con sus respectivos puntos medios ( X i ).
1. Se escoge un punto medio cualquiera de la distribucin, el cual ser una media imaginaria que se le
denominara A, esta deber ser lo ms central posible para que los clculos se hagan ms fcil, se
calculan los di de los puntos medios de la distribucin con respecto a esa media imaginaria,
aplicando la formula: d i = ( X i A) , los mismo se colocan en su columna respectiva.
3 S efectan los productos f i d i de cada clase y al final se calcula la sumatoria de estos productos
aplicando la formula:

fd .
i

4 Finalmente se calcula la media aplicando la formula: X = A +

fd
i

88

1.-Dada la siguiente distribucin de frecuencia, correspondiente al peso en Kg de un grupo de obreros,


calcule la media aritmtica, aplicando el mtodo abreviado.Realice los clculos respectivos para
completar el siguiente cuadro.
En este caso se tomar como media arbitraria el punto medio, A =87.0.

CLASES
75------79
80------84
85------89
90------94
95------99

X i
77
82
87
92
97

CLASES

fi

75------79
80------84
85------89
90------94
95------99
TOTAL

20
40
60
100
140
N = 360

( X i A) = di
87 77 = - 10
87 82 = - 5
87 87 = 0
87 92 = 5
87 97 = 10

fi
20
40
60
100
140
N = 360

fd

fi di

- 200
- 200
0
500
1400
f i d i = 1500

1500
= 91.17. Como se puede observar la media
360
N
obtenida es idntica a la obtenida por el mtodo largo. El estudiante puede realizar este problema
utilizando cualquier punto medio de la distribucin, se le deja como practica para que se ejercite con este
mtodo, siempre obtendr el mismo resultado utilizando cualquiera media imaginaria diferente a la
utilizada en la resolucin de este problema.

Ahora se aplica la formula as: X = A +

= 87 +

2 Calcule la media aritmtica de la siguiente distribucin aplicando el mtodo abreviado. Realice los
clculos respectivos para completar el siguiente cuadro.
CLASES

fi

50------54
55-----59
60-----64
65-----69
70-----74
75-----79
80-----84
85-----89
90-----94
Totales

5
10
20
40
100
38
22
9
6
N = 250

Para calcular la media en este caso s escogi como media imaginaria A = 72, por ser este el punto medio
ms cntrico de la serie, se pudo haber tomado otro punto medio diferente de este y el resultado hubiese
sido el mismo. Ahora se aplica la formula:
89

CLASES

X i

fi

50------54
55-----59
60-----64
65-----69
70-----74
75-----79
80-----84
85-----89
90-----94

52
57
62
67
72
77
82
87
92

5
10
20
40
100
38
22
9
6
N = 250

TOTALES

fd

( X i A) = di
72 52 = - 20
72 57 = -15
72 62 = -10
72 67 = -5
72 72 = 0
72 77 = 5
72 82 = 10
72 87 = 15
72 92 = 20

fi di
- 100
- 150
- 200
- 200
0
190
220
135
120

fd
i

= 15 .

15
= 72 + 0.06 = 72.06 . El estudiante har como ejercicio el clculo de la
250
N
media con los restantes puntos medios de la distribucin de frecuencia.
X = A+

= 72 +

LA MEDIANA

La mediana (Md) es una medida de posicin que divide a la serie de valores en dos partes iguales, un
cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella.
Es por lo tanto, un parmetro que esta en el medio del ordenamiento o arreglo de los datos organizados,
entonces, la mediana divide la distribucin en una forma tal que a cada lado de la misma queda un
nmero igual de datos.
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los
datos en una forma creciente o decreciente y luego se ubica la posicin que esta ocupa en esa serie de
datos; para ello hay que determinar si la serie de datos es par o impar. Si el nmero N de datos es impar,
N +1
entonces la posicin de la mediana se determina por la formula: p Md =
, luego el nmero que se
2
obtiene indica el lugar o posicin que ocupa la mediana en la serie de valores, luego la mediana ser el
nmero que ocupe el lugar de lo posicin encontrada. Para obtener la posicin de la mediana en una serie
N
El
de datos no agrupados, en donde el nmero N de datos es par, se aplica la formula PMd =
2
resultado obtenido, es la posicin que ocupara la mediana, pero en este caso se ubica la posicin de la
mediana por ambos extremos de la serie de valores y los dos valores que se obtengan se le saca la media
y esta ser la mediana buscada, por lo tanto la mediana, en este caso, es un nmero que no se encuentra
dentro de la serie de datos dados. Ejemplos:
1 Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un grupo de trabajadores.
Determine la mediana. Lo primero que se hace es ordenar los datos en forma creciente o decreciente;
N +1
luego se aplica la formula PMd =
, para ubicar la posicin de la mediana. Los datos ordenados
2
7 +1
quedaran as: 5, 6, 7, 8, 9, 10, 12. La posicin p Md =
= 4. Esto indica que la mediana ocupa la
2
posicin 4 en la serie de valores y por lo tanto esa posicin corresponde a los nmeros 8 y 9 que en este
caso ocupan la posicin por la izquierda y por la derecha, por lo tanto la Md viene a ser la semisuma de
8+9

ambas posiciones
= 8.5 en este caso 8.5 es la mediana buscad, y esto es as, ya que el nmero
2

90

8.5 divide la serie de valores en dos partes iguales, una mitad que es mayor que la mediana y otra mitad
que es menor que esta.
Cuando los valores de los datos brutos de un conjunto de datos se agrupan en una distribucin de
frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida de una
distribucin de frecuencia de datos puede no ser la misma que la mediana obtenida de los datos sin
arreglar en clases, pero el resultado ser una aproximacin. Cuando se obtiene la mediana para datos
agrupados se utiliza el mtodo de interpolacin. La interpolacin parte del supuesto de que los datos de
cada intervalo de la distribucin estn igualmente distribuidos.
PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS

1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se ubican las
frecuencias fi y se calculan las frecuencias acumuladas Fa de esa distribucin.
2. Se determina la ubicacin o posicin de la mediana en el intervalo de la distribucin de frecuencia,
N
mediante la formula PMd = . El resultado obtenido determinar la clase donde se encuentra ubicada
2
la mediana, lo cual se conseguir en la clase donde la frecuencia acumulada Fa sea igual o superior a

N
2 Faa
este resultado. Luego se aplica la formula: Md = Li +
Ic, en esta formula Md es la mediana,
fm

Li es el limite real inferior de la clase donde se encuentra ubicada la mediana, Faa es el valor de la
frecuencia acumulada anterior a la clase donde se encuentra la mediana, fm es el valor de la frecuencia fi
de la clase donde se encuentra la mediana, Ic es el valor o longitud del intervalo de clase y N es el
nmero total de datos de la distribucin en estudio.
1.- Dada la siguiente distribucin de frecuencia referida a las horas extras laboradas por un grupo de
obreros. Calcule la mediana. Realice los clculos respectivos para completar el siguiente cuadro.
N de horas Extras
CLASES
55------59
60------64
65------69
70------74
75------79
80------84
85------89

Obreros
fi
6
20
18
50
17
16
5
N = 132

Cuadro con las frecuencias acumuladas:


N de horas Extras
CLASES
55------59
60------64
65------69

Obreros
fi
6
20
18

Obreros
fa
6
26
44

91

70------74
75------79
80------84
85------89

50
17
16
5
N = 132

94
111
127
132

N
2 Faa
Ahora se aplica la formula: Md = Li +
Ic
fm

N 132
=
= 66, luego la mediana se encuentra en la clase 70----74, por lo tanto el limite real
N = 132,
2
2
inferior de esa clase es 69.5 = Li. La frecuencia fi de esa clase es 50 = fm , Faa = 44 y el
Ic = 5. Aplicando la formula se tiene:
22
66 44
Md = 69.5 +
5 = 69.5 + .5 = 69.5 + 2.2 = 71.70.

50
50
Luego la mediana de esa distribucin es 71.70. Esto quiere decir que un 50 % de los obreros trabajaron
horas extras por debajo de 71.70 horas y el otro 50 % trabajaron horas extras por encima de 71.70
horas.

CARACTERSTICAS DE LA MEDIANA

* La mediana no es afectada por los valores extremos de una serie de valores, puesto que la misma no es
calculada con todos los valores de la serie.
* La mediana no esta definida algebraicamente, ya que para su clculo no intervienen todos los valores
de la serie.
* La mediana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una serie de
valores para datos no agrupados el nmero de datos es par, en este caso la mediana se calcula
aproximadamente.
* La mediana se puede calcular en aquellas distribuciones de frecuencia de clases abierta, siempre y
cuando los elementos centrales puedan ser determinados.
* La suma de los valores absolutos de las desviaciones de los datos individuales con respecto a la
mediana siempre es mnima.

LA MODA

La moda es la medida de posicin que indica la magnitud del valor que se presenta con ms frecuencia en
una serie de datos; es pues, el valor de la variable que ms se repite en un conjunto de datos. De las
medias de posicin la moda es la que se determina con mayor facilidad, ya que se puede obtener por una
simple observacin de los datos en estudio, puesto que la moda es el dato que se observa con mayor
frecuencia. La moda se designa con las letras Mo.
92

En las representaciones grficas la moda es el punto ms alto de la grfica. La obtencin de la moda para
datos agrupados no es un valor exacto, ya que vara con las diferentes formas de agrupar una distribucin
de frecuencia.
En algunas distribuciones de frecuencias o serie de datos no agrupados o agrupados se presentan dos o
ms modas, en estos casa se habla de serie de datos bimodales o multimodales, segn sea el caso. Estos
tipos de distribuciones o series de valores se deben a la falta de homogeneidad de los datos.
Cuando una serie de valores es simtrica, la media, la mediana y el modo coinciden, y si la asimetra de
la serie es moderada, la mediana estar situada entre la media y el modo con una separacin de un tercio
entre ambas. Tomando en cuenta esta relacin, cuando se tengan dos de esta medidas se puede
determinar la tercera; sin embargo es conveniente utilizar esta relacin para calcular solamente la moda
ya que para calcular la media y la mediana existen formulas matemticas que dan resultados ms exactos;
la formula matemtica para calcular la moda por medio de la relacin antes mencionada es:
Mo = X 3(X Md ) .
Para calcular la moda en datos agrupados existen varios mtodos; cada uno de los mtodos puede dar un
valor diferente de la moda: En este curso se dar un mtodo el cual se puede considerar uno de los ms
precisos en el clculo de esta. Es un mtodo matemtico que consiste en la interpolacin mediante la
siguiente formula:
1
.Ic , en donde Mo es la moda, Li es el limite real de la clase que presenta el
Mo = Li +
1 + 2
mayor nmero de frecuencia; la clase que presenta el mayor nmero de frecuencias fi se le denomina
clase modal y a las frecuencias de esa clases se les denomina frecuencia modal fm, 1 es la diferencia
entre la frecuencia de la clase modal ( fm) y la frecuencia de la clase anterior a la modal, la cual se
designa con fa , entonces, 1 = ( fm fa ) ; 2 es la diferencia entre la frecuencia de la clase modal
(fm) y la frecuencia de la clase siguiente a la modal, esta se designa con fs , entonces, 2 = ( fm fs ).
1. Dada la siguiente distribucin de frecuencia correspondiente al peso en Kg de un grupo de
trabajadores de una empresa, calcule la moda.
CLASES
30-----39
40-----49
50-----59
60-----69
70-----79
80-----89
90-----99
TOTAL

fi
2
2
7
11
12
16
2

La clase modal es 80----89, entonces Li = 79.5 y su fm = 16, fa = 12 y fs = 2, Ic = 10 , entonces:


1 = f m f a 1 = 16 12 = 4;.. 2 = f m f s = 16 2 = 14
Aplicando la formula se tiene:

93

1
40
4
Mo = 79.5 +
Mo = L i +
= 79.5 + 2.22 = 81.71.
.10 = 79.5 +
18
4 + 14
1 + 2
Este resultado de la moda se interpreta as: La mayora de los trabajadores tiene un peso
aproximadamente de 81.71 Kg .

CARACTERSTICAS DE LA MODA

* El valor de la moda puede ser afectado grandemente por el mtodo de elaboracin de los intervalos de
clases.
* El valor de la moda no se halla afectado por la magnitud de los valores extremos de una serie de valores,
como sucede en la media aritmtica.
* La moda se puede obtener en una forma aproximada muy fcilmente, puesto que la obtencin exacta es
algo complicado.
* La moda tiene poca utilidad en una distribucin de frecuencia que no posea suficientes datos
y que no ofrezcan una marcada tendencia central.
* No es susceptible de operaciones algebraicas posteriores.
* La moda se utiliza cuando se trabaja con escalas nominales aunque se puede utilizar con las otras
escalas.
* La moda es til cuando se esta interesado en tener una idea aproximada de la mayor concentracin de
una serie de datos.
OTRAS MEDIDAS POSICINALES

Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en dos partes iguales,
una generalizacin de esta medida da origen a unas nuevas medidas de posicin denominadas:
Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posicin surgen por la necesidad de requerir
de otras medidas que expresen diferentes situaciones de orden, aparte de las sealadas por la mediana.
Por lo tanto es interesante ubicar otras medidas que fraccionen una serie de datos en diferentes partes. Es
bueno destacar que los cuarteles, los Deciles y los Percentiles son unas variantes de la mediana: De la
misma forma los percentiles abarcan tanto a los cuarteles como a los Deciles.
LOS CUARTILES.- Son medidas posicinales que dividen la distribucin de frecuencia en cuatro
partes iguales. Se designa por el smbolo Qa en la que a corresponde a los valores 1, 2 y 3., que viene
a ser el nmero de Qa que posee una distribucin de frecuencia de clase. El Q1 divide la distribucin de
frecuencia en dos partes, una corresponde a 25 % que esta por debajo de Q1 y el otro 75 % por encima de
Q1. El Q2 divide la distribucin de frecuencia en dos partes iguales, un 50 % que esta por debajo de los
valores de Q2 y otro 50 % que esta por encima del valor de Q2. El Q2 es igual a la mediana.
CLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad practica
calcular los cuartiles. Para el clculo de los cuartiles en datos agrupados en una distribucin de
94

frecuencia existe un mtodo por anlisis grfico y otro por determinacin numrica, por fines prcticos
en esta ctedra se utilizara l ltimo mtodo. Para calcular los cuartiles por el mtodo numrico se
procede de la siguiente manera:
aN
1 Se localiza la posicin del cuartil solicitado aplicando la formula de posicin: PQa =
, en donde a
4
viene a ser el nmero del cuartil solicitado, N corresponde al nmero total de datos de la distribucin y
4 corresponde al nmero de cuartiles que presenta una distribucin de frecuencia.
2 Luego se aplica la formula para determinar un cuartil determinado, as:
aN

4 Faa
Qa = Li +
.Ic. En esta formula, Qa = El cuartil solicitado, en esta a corresponde al
fm

nmero del cuartil solicitado; Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil;
Faa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil; fm = Frecuencia fi que
aN
posee el intervalo de clase donde se encuentra el cuartil; PQa =
= Posicin que ocupa el cuartil en la
4
distribucin de frecuencia, este resultado obtenido determinar la clase donde se encuentra ubicado el
cuartil, el mismo se encontrar en la clase donde la frecuencia acumulada Fa sea igual o superior a este
resultado.
DECILES. Son medidas de posicin que dividen la distribucin de frecuencia en diez partes iguales y
estas van desde el nmero uno hasta el nmero nueve. Los deciles se les designa con las letras Da, siendo
a, el nmero de los diferentes deciles, que en este caso son nueve. El D2 es el punto debajo del cual se
encuentran ubicados el 20 % de los valores de la distribucin o tambin el punto por sobre el cual se
encuentra el 80 % de los valores de la serie de datos. La mediana es igual al D5, puesto que este decil
divide la distribucin en dos partes iguale tal como lo hace la mediana, de la misma forma el decil cinco
es igual al cuartil dos.
CLCULO DE LOS DECILES El clculo de los deciles es similar al clculo de los cuartiles, solo
que en estos vara la posicin, la misma se calcula con la formula:
aN
, en esta a corresponde al nmero del decil que se desea calcular, N equivale al nmero de
PDa =
10
datos de la distribucin y 10 corresponde a las diez partes en la que se divide la serie de valores de la
distribucin.
aN

10 Faa
La formula para su clculo es: Da = Li +
.Ic . En este caso se aplica la formula de la
fm

misma manera que se hizo para calcular los cuartiles, solo que en esta formula varia la posicin de
ubicacin de la clase donde se encuentra ubicado el decil.
LOS PERCENTILES Son medidas posicineles que dividen la distribucin de frecuencia en 100
partes iguales. Con estos se puede calcular cualquier porcentaje de datos de la distribucin de frecuencia.
Los percentiles son las medidas ms utilizadas para propsitos de ubicacin de valor de una serie de
95

datos ubicados en una distribucin de frecuencia. El nmero de percentiles de una distribucin de


frecuencia es de 99. El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir:
Md = Q2 = D5 = P50 . = 50% por encima y 50 % por de bajo de los datos de la distribucin.
El clculo de los percentiles es similar al clculo de los cuartiles y los deciles con una variante en la
posicin de ubicacin de estos, que viene expresada por la siguiente formula:
aN

Faa

aN
. Con esta posicin se aplica la formula: Pa = Li + 100
PPa =
.Ic .
100
fm

1. Dada la siguiente distribucin correspondiente al salario semanal en dlares de un grupo de obreros


de una empresa petrolera trasnacional. Calcule: a) Q1, b) Q2, c) Compare los resultados con la mediana
D3, d) D5, e) P25, f) P50, g) P7
SALARIO EN $
200-----299
300-----399
400-----499
500-----599
600-----699
700-----799
Totales = N

fi
85
90
120
70
62
36
463

Fa
85
175
295
365
427
463

1x 463 463
=
= 115.75.
4
4
PQ1 = 115.75. Con ese valor de la posicin encontrado se busca en las frecuencias acumuladas para
ver cual de esas contiene ese valor. Observando las frecuencias acumuladas se puede detectar que la
posicin 115.75 se encuentra en la clase 300------399, por lo tanto el Li = 299.5,
fm = 90, y la Faa = 85 y Ic = 100, aplicando la formula se tiene:
a) Para calcular Q1, se determina primero la posicin as: PQ1 =

3075
115.75 85
.100 = 299.5 +
= 299.5 + 34.17 = 333.67.
Q1 = 299.5 +

90
90

Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario semanal por debajo
de 333.67 $ y el 75 % restante gana un salario por encima de 333.67 $.
2 x 463
b) Para calcular Q2=Md se determina primero la posicin de este as. PQ 2 =
= 231.5 , ahora se
4
ubica esta posicin en las frecuencias acumulados para determinar la posicin de Q2, se puede observar
en la distribucin que esta posicin de Q2 esta ubicada en la clase 400----499, entonces, Li = 399.5,
fm = 120, Faa = 175 y Ic = 100, aplicando la formula se tiene:

96

5650
231.5 175
.100 = 399.5 +
399.5 + 47.08 = 446.58.
Q2 = 399.5 +

120
120

Este resultado de Q2 establece que el 50 % de los obreros de este estudio, devengan un salario semanal
por debajo de 446.58 $ y el otro 50 % devenga un sueldo por encima de 446.58 $. Calcule la mediana
y comprela con este resultado.
3 x 463
c) Para determinar D3 = P30 hay primero que calcular la posicin de este as: PD 3 =
= 138.9 ,
10
ahora se ubica esta posicin en las frecuencias acumuladas para determinar la posicin de D3, en la tabla
de la distribucin de frecuencia se observa que D3 se encuentra en la clase 300----399, luego, Li =
299.5, fm = 90, Faa = 85 y Ic = 100, aplicando la formula se tiene:
138.9 85
D3 = 299.5 +
.100 = 299.5 + 59.89 = 359.39 . Esto indica que un 30 % de los obreros ganan
90

un salario semanal por debajo de 359.39 $ y el 70 % restante devenga un sueldo por encima de 359.39 $.
d) Calcular, D5 = Q2 = P50, adems P25 = Q1, la comprobacin de estos resultados se le deja como
practica al estudiante.
70 x 463
g) Para calcular P70 lo primero que se hace es determinar la posicin, PP 70 =
= 324.10 .
100'
Ahora se ubica este resultado en la columna de frecuencias acumuladas para encontrar la posicin de
P70 en la distribucin de frecuencia. Como se puede observar en la tabla de distribucin de frecuencia, P70
se encuentra ubicado en la clase 500-------599, entonces, Li = 499.5, fm = 70, Faa = 295 y Ic = 100,
aplicando la formula se tiene:
2910
324.10 295
.100 = 499.5 +
= 499.5 + 41.57 = 541.07.
P70 = 499.5 +

70
70

Esto indica que el 70 % de los obreros devengan un sueldo semanal que esta por debajo de 541.07 $ y
que el 30 % de los restantes obreros, ganan un salario por encima de 541.07 $.
PORCENTAJES DE VALORES QUE ESTN POR DEBAJO O POR ENCIMA DE UN VALOR
DETERMINADO

Muchas veces necesitamos conocer el porcentaje de valores que estn por debajo o por encima de un
valor determinado; lo que representa un tipo de problema contrario al estudiado anteriormente, esto es,
dado un cierto valor en el eje de abscisa (X) del plano cartesiano, determinar en la ordenada (Y) el tanto
por ciento de valores inferiores y superiores al valor dado. Operacin que se resuelve utilizando la
siguiente frmula matemtica:

f ( P Li 100
, donde:
p = faa + i

Ic

N
p = porcentaje que se quiere buscar.
P = Valor dado en el eje de las X (valor que se ubica en las clases).
faa = Frecuencia acumulada de la clase anterior a la clase donde se encuentra ubicado P.

97

f i = Frecuencia de la clase donde se encuentra ubicada P.


Li = Limite inferior de la clase donde se encuentra ubicada P.
I c = Intervalo de clase.
N = Nmero total de datos o total de frecuencias.

EJEMPLO: Utilizando los datos de la distribucin de frecuencia anterior, Determine que porcentaje de
obreros ganan un salario semanal inferior a 450 $.
Solucin:
Datos:
p=?
P = 450
faa = 175
Li = 400
I c = 100
N = 463
Ahora se aplica la formula:

f ( P Li 100
, Sustituyendo valores se tiene:
p = faa + i

Ic

120(450 400 100

p = 175 +
463 p = 50.75
100

De acuerdo con el resultado se puede afirmar que el 50.75 % de los obreros devengan un salario inferior
a 450 $ y el 49.25 % de los obreros ganan un salario superior a 450 $.

MEDIDAS DE DISPERSIN
Las medidas de posicin central son los valores que de una manera condensada representan una serie
de datos, pero realmente no son suficientes para caracterizar una distribucin de frecuencia. Para
describir una distribucin de frecuencia o serie de datos es necesario, por lo menos otra medida que
indique la dispersin o variabilidad de los datos, es decir, su alejamiento de las medidas de posicin
central. Estas medidas de posicin central no tienen ningn valor si no se conoce como se acercan o se
alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varan
esos valores con respecto al promedio de una distribucin de frecuencia.
La dispersin o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de
otro, es decir, como se estn dispersando o distribuyendo en la distribucin. De acuerdo con esto es
necesario encontrar una medida que indique hasta que punto los valores de una variable estn dispersos
en relacin con el valor tpico. Las medidas de variabilidad son nmeros que expresan la forma en que los
valores de una serie de datos cambian alrededor de una medida de posicin central la cual por lo general
es la media aritmtica.

98

La dispersin puede ser mayor o menor, tomando en cuenta esas diferencias.


La variabilidad es la
esencia de la estadstica, puesto que las variables y atributos se caracterizan siempre por diferencias de
valores entre observaciones individuales. Casi siempre en una distribucin de frecuencia el promedio
obtenido difiere de los datos de la serie; por esto es importante determinar el grado de variacin o
dispersin de los datos de una serie de valores con respecto al promedio. Las medidas de dispersin se
clasifican en dos grandes grupos: a).- Las Medidas de Dispersin Absolutas y las Relativas; las
Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos, las mismas son:
1).- El Recorrido, 2) La Desviacin cuartilica, 3) La Desviacin Semicuartilica, 4) La desviacin Media,
5) La Desviacin Tpica o Estndar 6) La varianza.
Las Medidas de Dispersin relativa. Son relaciones entre medidas de dispersin absolutas y medidas de
tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su funcin es la de
encontrar entre varias distribuciones la dispersin existente entre ellas. La medida de dispersin relativa
de mayor importancia es el Coeficiente de Variacin.
Se llama Variacin o Dispersin de los datos, el grado en que los valores de una distribucin o serie
numrica tiende a acercarse o alejarse alrededor de un promedio. Cuando la dispersin es baja indica
que la serie de valores es relativamente homognea mientras que una variabilidad alta indica una serie de
valores heterognea.
Cuando los valores observados de una serie estn muy concentrados alrededor del promedio, se dice que
ese promedio es o ser muy representativo; pero si estn muy dispersos con relacin al promedio, es
decir muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie
o distribucin, puesto que no representan adecuadamente los datos individuales de esa distribucin. Es
importante obtener una medida que indique hasta qu punto las observaciones de una serie de valores
estn variando en relacin con el valor tpico de la serie.
RANGO O RECORRIDO(R) -. Es la primera medida de dispersin, no esta relacionada con ningn
promedio en particular, ya que este se relaciona con los datos mismos, puesto que su clculo se
determina restndole al dato mayor de una serie el dato menor de la misma, ms una unidad de medida
(UM). El rango es el nmero de variables diferentes que posee una serie de valores. Su formula se
calcula as:

Rango(R) = Dato mayor (XM)Dato Menor (Xm) + Una unidad de medida (1UM):
R = XM Xm + 1 UM. El rango es la medida de dispersin ms sencilla e inexacta dentro de las medidas
de dispersin absoluta. Esta medida tiene bastante uso en el control de calidad de los productos
manufacturados.
DESVIACIN NTERCUARTILICA (DC). - La desviacin ntercuartilica es la diferencia que
existe entre el cuartil tres(Q3) y el cuartil uno(Q1) de una distribucin de frecuencia y se expresa as: DC
= Q3 Q1.
DESVIACIN SEMI-NTERCUARTILICA (DSC). diferencia entre el Q3 y el Q1 dividido entre dos:

La desviacin semi-ntercuartilica es la

99

DSC =

Q3 Q1
.
2

Si los valores de la DC o DSC son pequeos indica una alta concentracin de los datos de la distribucin
en los valores centrales de la serie de datos. Estas medidas se utilizan para comparar los grados de
variacin de los valores centrales en diferentes distribuciones de frecuencias. Los mismos no son
afectados por los valores extremos, no se adaptan a la manipulacin algebraica, por tal motivo son de
poco utilidad.

DESVIACIN MEDIA.- La desviacin media de un conjunto de N observaciones x1, x2, x3,.............xn,


es el promedio de los valores absolutos de las desviaciones (di) con respecto a la media aritmtica o la
mediana. Si se denomina como DM a la desviacin media, entonces su formula matemtica ser la
siguiente:
N

DM =

i =1

Xi X
N

d
i =1

Esta formula es para datos no agrupados. Se toma el valor absoluto en la ecuacin, debido a que la
primera propiedad de la media aritmtica establece que los desvos (di) de una serie con respecto a la
media aritmtica siempre son iguales a cero, es decir: di = 0.
Cuando los datos estn en una distribucin de clases o agrupados se aplica la siguiente formula:

DM =

i =1

f
N

X i X f i
=

di

i =1

En esta formula X es el punto medio de cada clase y fi es la frecuencia de cada clase. La Desviacin
Media a pesar de que para su clculo se toman todas las observaciones de la serie, por el motivo de no
tomar en cuenta los signos de las desviaciones (di), es de difcil manejo algebraico. Su utilizacin en
estadstica es muy reducida o casi nula, su importancia es meramente histrica, ya que de esta formula
es la que da origen a la desviacin tpica o estndar.
DESVIACIN TPICA O ESTNDAR

Es la medida de dispersin ms utilizada en las investigaciones por ser la ms estable de todas, ya que
para su calculo se utilizan todos los desvos con respecto a la media aritmtica de las observaciones, y
adems, se toman en cuenta los signos de esos desvos. Se le designa con la letra castellana S cuando se
trabaja con una muestra y con la letra griega minscula (Sigma) cuando se trabaja con una poblacin.
Es importante destacar que cuando se hace referencia a la poblacin l nmero de datos se expresa con N
y cuando se refiere a la muestra l nmero de datos se expresa con n. La desviacin tpica se define como:
La raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos de las
observaciones con respecto a su media aritmtica. La desviacin tpica es una forma refinada de la
desviacin media.
Caractersticas de la Desviacin Tpica:
100

* La desviacin tpica se calcula con cada uno de los valores de una serie de datos.
* La desviacin tpica se calcula con respecto a la media aritmtica de las observaciones de una serie de
datos, y mide la variacin alrededor de la media.
* La desviacin tpica es susceptible de operaciones algebraicas, puesto que para su calculo se utilizan
los signos positivos y negativos de los desvos de todas las observaciones de una serie de valores, por lo
tanto es una medida completamente matemtica.
* Es una medida de bastante precisin, que se encarga de medir el promedio de la dispersin de las
observaciones de una muestra estadstica. Las influencias de las fluctuaciones del azar, al momento de
seleccionar la muestra la afectan muy poco. Le da gran significacin a la media aritmtica de la serie de
valores.
* Es siempre una cantidad positiva.

INTERPRETACIN DE LA DESVIACIN TPICA

La desviacin tpica como medida absoluta de dispersin, es la que mejor nos proporciona la variacin de
los datos con respecto a la media aritmtica, su valor se encuentra en relacin directa con la dispersin de
los datos, a mayor dispersin de ellos, mayor desviacin tpica, y a menor dispersin, menor desviacin
tpica.
Su mayor utilidad se presenta en una distribucin normal, ya que en dicha distribucin en el intervalo
determinado por X se encuentra el 68. 27% de los datos de la serie; en el intervalo determinado por
la X 2 se encuentra el 95,45% de los datos y entre la X 3 se encuentra la casi totalidad de los
datos, es decir, el 99,73% de los datos; adems, existe una regla general de gran utilidad para la
comprobacin de los clculos que dice: una oscilacin igual a seis veces la , centrada en la media
comprende aproximadamente el 99% de los datos. Ver grfica.

101

68,27%

95,45%

99,73%

2,14% 13,59 34,14% 34,14%13,59% 2,14%


Media

A la zona limitada por la X conoce bajo el nombre de zona normal, ya que se considera a los datos
que caen dentro de esa zona, datos normales en relacin con el grupo estudiado; los datos que estn por
encima o por debajo de dicho intervalo se consideran supranormales e infranormales.
Una regla emprica indica que en cualquier distribucin normal las probabilidades delimitadas entre 1
desviacin tpica, 2 desviaciones tpicas y 3 desviaciones tpicas son el 68%, 95% y 99%
respectivamente. Ver las graficas siguientes:

102

103

Clculo de la Desviacin Tpica.- La desviacin tpica para calcularla se procede de dos formas: A).Para datos no agrupados en clases, B). - Para datos agrupados en clases.

A). - Para datos no Agrupados.- Las formulas para determinar la desviacin tpica de una S y de una
son:
1 . .S =

(X

X )2

n 1

2
i

n 1

2 . .d i2 = ( X i X ) 2

3 . .S =

X i2

( X i ) 2

n 1

N X i2 ( X i ) 2

n ( n 1)

Es importante recordar que cuando se trabaja con la formula para datos no agrupados y se trata de una
muestra se utilizar como denominador n1, para corregir el sesgo, pero si en la muestra n 50
,entonces se utilizar n, simplemente.
Para caular la desviacin tipica de una poblacin para datos no agrupados, se utilizan las siguientes
formulas:

4 . . =

5 . . =

(X

X )2

X
N

2
i

X
i
N

2
i

X
N

2
i

X2

Mtodo para calcular la Desviacin Tpica en datos no agrupados:

* Se calcula la media aritmtica.


* Se calculan los desvos (di) de la serie de valores Xi, con respecto a la media aritmtica.
* Se elevan al cuadrado cada una de las desviaciones (di)2 , y se determina la sumatoria de esos. De la
misma forma se elevan al cuadrado cada uno de los Xi y se calcula la sumatoria de estos; de igual manera
104

se calcula la sumatoria de los Xi y se elevan al cuadrado. Despues de hacer todos estos clculos se elabora
un cuadro estadstico con estos clculos.
* Finalmente se aplica la formula de la desviacin tpica para datos no agrupados de la muestra o de la
poblacin, segn el caso.
Ej.1 Los siguientes valores corresponden a la edad de ios de una muestra tomada de una poblacin:
Xi = 3, 4, 5, 6, 7. Determine la desviacin tpica.

X=

X
n

25
=5
5

Xi
3
4
5
6
7
X i = 25

(X i X ) = d i
35
=-2
45
=-1
55
= 0
65
= 1
75
= 2
di = 0

Este problema se resolver utilizando la media aritmtica y

d i2
4
1
0
1
4
d i = 10

sin utilizar la media, para ello se

utilizarn las formulas 1 y 3

1 . .S =

d i2

n 1

10
=
4

2 . 5 = 1 . 58

3. .S =

n X i2 (

X )

n(n 1)

5(135 625
50
=
= 1.58
5(4)
20

105

Interpretacin.- El resultado obtenido con las formulas 1 y 3 indican que en promedio, las edades de los
ios de esa muestra se desvian o varian con respecto a la media aritmticaen una cantidad igual a 1.58
aos.

Si este problema se resuelve ahora, considerando los datos como si fueran de una poblacin y se aplica
la formula 4 y 5, entonces se tiene:

4 . . =

5. . =

d i2

2
i

10
=
5

2 = 1 . 41 .

X
135 625

= 27 25 = 2 = 1.41.
i =
N
5
5

60 . 83 56 . 25 =

4 . 58 = 2 . 14

En la solucin del problema con las formula 4 y 5 de la poblacin se observa que la de la poblacin es
menor que la S de la muestra, esto es debido a que la S de la muestra utiliz n-1, para corregir el error
producto del sesgo, y la de la poblacin no lo utiliz.
2 Los aos de sevicio de 6 obreros son 5, 5, 8, 7, 9, y 11, los mismos corresponde a una muestra
tomada de una empresa. Clcule la desviacin tpica (S y ).
Se calcula la media

X =

5 + 5 + 7 + 8 + 9 + 11 45
=
= 7 .5
6
6

106

(X i X ) = d i
5 7.5 = - 2.5
5 7.5 = - 2.5
7 7.5 = - 0.5
8 7.5 = 0.5
9 7.5 = 1.5
11 7.5 = 3.5
di = 0

Xi
5
5
7
8
9
11
Xi = 45

d i2
6.25
6.25
0.25
0.25
2.25
12.25
d i = 27.50

X i2
25
25
49
64
81
121
X i2 = 365

Con esto datos se aplican las formulas 1, 4 y 5 para calcular la muestra, se deja la formula 3 para que sea
aplicada por el participante, el resultado ser igual al de la formula 1. Calculos:

1 . .S =

d i2

n 1

27 . 5
=
6 1

27 . 5
=
5

5 . 5 = 2 . 35 .

Ahora se calcular la para la poblacin (considerado los datos como de una poblacin).

4 . . =

5. . =

2
i

X i2

27 . 5
=
6

4 . 58 = 2 . 14 .

2
X i
365 45
365 2025
=
=

= 4.58 = 2.14.

N
6 6
6 36

Interpretacin.- El resultado obtenido al aplicar la formula 1, 2, 3, 4 y 5 indica que en promedio, los


aos de servicios de los trabajadores de la empresa se desvian o dispersan con respecto a su media
aritmtica en una cantidad igual a 2.35 ao segn la muestra y de 2.14 aos en la poblacion.
B) Para datos Agrupados en Clases.- Para calcular la desviacin tpica en datos agrupado existen
varios criterios en relacion a la correccin del sesgo que se produce al tomar una muestra, en este estudio
se considerar la formula que corrige el sesgo de aquellas muestras en estudio; sin embargo, cuando n sea
mayor que 50, no es necesario tal correccin. . Existen muchas formulas matemticas para calcular la
desvicin tpica, queda a juicio del estudiante utilizar la formula que l considere ms fcil, siempre y
cuando su aplicacin sea valedera.
B).- Formulas Para calcular la muestra y la poblacin de una desviacin tpica con datos
agrupados en clases:

107

1. .S =

2 . .S =

3 . .S =

( X

X )2 fi

n 1

X i2 f i

fi

n 1

( X

fi )

n 1

f ( X

2
i

X a )2

[
f ( X

n 1

Xa)

( f K )

fK
i

2
i

n 1

Para calcular la S de la formula 1 es necesario calcular el punto medio de cada una de las clases de la
distribucin, calcular la media aritmtica y luego calcular los desvos de los puntos medios con respecto
a la media aritmtica. En la formula 2 no es necesario calcular la media.

 de la distribucin, es recomrndable
En la formula 3, X a es un valor arbitrario que se toma de los X
i

que se escoja el X lo ms central posible para as facilitar los calculos posteriores.
i

El trmino Ki , en esta formula, viene a ser un desvo arbitrario con respecto a una mdia arbitraria
 X ) . Este mtodo para calcular S en datos agrupados, se fundamenta en la
X a .Entonces, K i = (X
a
propiedad de la desviacin tpica que establece: si a cada una de los valores de una serie de datos se le
suma una constante, la desviacin tpica no se altera en sus resultados.

4 . . =

f i ( X i X ) 2
=
N

5 . . =

f i X i2
N

f i d i2
N

108

6 . . =

7 . . =

f ( X

f i X i2

2
f i X i

( f K )

X a )2

f X
i

fK

2
i

Mtodo para calcular la Desviacin Tpica en datos Agrupados:


* Se calcula la X
* Se calcula el X i de cada una de las clases que integran la distribucin de frecuencia, se determinan
los desvos di de los X con respecto a la X , luego se elevan al cuadrado los di y se multiplican por
i

fi, y se calcula la
* Se calcula la

f d
i

2
i

f X , luego se determina la [ f X
i

2
i

]2 .

* Se elabora un cuadro estadstico y se llevan a este todas los datos calculados.


* Se aplica la formula necesaria para calcular la desviacin tpica.
Ejemplos: 3 Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la
empresa RINACA, en un mes (se resolver considerando los datos como de una S y ).
X i

f i X

42

42

6
21
75
23
7
2
135

47
52
57
62
67
72

282
1092
4275
1426
469
144

fi
CLASES
40 44
45 49
50 54
55 59
60 64
65 69
70 74

f X
i

=7730

di =

(X

f i d i2

2
f i (X i )

- 15.26

232.87

1764

- 10.26
- 5.26
- 0.26
4.74
9.74
14.74

631.60
581.02
5.07
516.75
664.07
434.54

13254
56784
243675
88412
31423
10368

= 1.82

f d
i

2
i

=3065.92

f X
i

2
i

=445680

Para resolver el problema lo primero que se debe hacer es calcular la media aritmtica as:
109

X =

X i

7730
= 57.26
135

Ahora se calculan los diferentes X i , para determinar los otro parmetros necesarios (es recomendable
que el estudiante realice todos los clculos) para resolver el problema planteado, en el cuadro de arriba
se colocaron los clculos realizados que son necesarios para resolver el mismo; este se resolver
aplicando las formulas 1, 2, y 3 de la S, considerando los datos como los de una muestra, ya que esta
claro que estos pertenecen a una poblacin determinada, luego se calcular la de la distribucin
aplicando:

1. S =

fd
i

n 1

2
i

3065 .92
=
135 1

3065 .92
=
134

(
f X )

22 .88 = 4 .78

2 . .S =

f i X i2

n 1

(7730 )

445680

135
135 1

3065 . 93
=
134

22 . 88 = 4 . 78 .

Para aplicar la formula 3 se toma una media arbitraria X a que en este caso la ms cntrica es 57, luego
se calculan los desvos de los puntos medios con respecto a la X a as:
Ki = ( X i X a ) se elabora un cuadro estadstico para resumir los datos y finalmente se procede a buscar
la desviacin
X i
42
47
52
57
62
67
72

fi

1
6
21
75
23
7
2
f i = 135

3 . . =

fiK

2
i

( X i X a ) =Ki
- 15
- 10
- 5
0
5
10
15

fiK
N

fi (ki)2

fi . Ki

3075
135

- 15
- 60
- 105
0
115
70
30
f i K i = 35

225
600
525
0
575
700
450
f i K i2 = 3075

(35 )2
135

110

Interpretacin.- Los resultados obtenidos con las formulas 1, 2, y 3, indican que el promedio de las
horas extras laboradas por los trabajadores se desvan o varan con respecto a su media aritmtica en
una cantidad igual a 4.78 y 4.76 respectivamente. La misma interpretacin se obtiene con los resultados
obtenidos con las formulas 4, 5 y 6.
1225
135 = 3075 9.07 = 3065.93 = 22.71 = 4.76.
135
135
135

3075
=

4 . . =

5 . . =

6. . =

f i d i2
N

f i X i2
N

X i2

3065 . 92
=
135

22 . 71 = 4 . 76

445680
3278 . 62 =
135

22 , 71 = 4 . 76 .

2
2
f i X i
445680 7730

= 4.76.
N
135 135

La aplicacin de la formula 7 se deja para que el participante la aplique y resuelva el mismo problema,
el cual tendr resultados idnticos a los anteriores.
1 Los siguientes datos corresponden al nmero de panes consumidos por un grupo de familia de una
urbanizacin de la ciudad, durante una semana determinada.
Para resolver el problema se calcula la media y se procede a llenar el cuadro estadstico .siguiente(el
estudiante debe realizar los clculos):
Clases
3032
3335
3638
3941
4244
4547
4850

fi
10
18
60
100
80
14
6
288
111

X =

f X
i

11520
= 40.0.
288

Clases

fi

3032
3335
3638
3941
4244
4547
4850

10
18
60
100
80
14
6
288

6 . . =

X i
31
34
37
40
43
46
49

X 12

f i X i
310
612
2220
4000
3440
644
294
11520

f i X i

f i X i2
9610
20808
82140
160000
147920
29624
14404
464508

d i = (X i X )
-9
-6
-3
0
3
6
9

f i d i2
810
648
540
0
720
504
486
3708

464508 11520

=
288
288

= 1612 .88 1600 = 12 .88 = 3.59 .

fd

1. .S =

2
i

n 1

3708
=
288 1

3708
= 12 .92 = 3.59 .
287

Interpretacin.- Los resultados obtenido con las formulas 1 y 6 indican que en promedio, el consumo de
pan de trigo del grupo de familias de esa urbanizacin se dispersa con respecto a su media aritmtica en
una cantidad igual a 3.59.

La aplicacin de las formulas 2, 3, 4, 5 y 7 quedan como ejercicios de practica para el participante, los
resultados tienen que ser idnticos a los obtenidos con las formulas 1 y 6. Es muy importante que observe
el resultado obtenido con la formula 1 para l clculo de S y el obtenido con la formula 6 para calcular la
, ambos resultados son idnticos, lo que indica que cuando la muestra es grande tanto la formula para
calcular S como la utilizada para calcular la poblacin produce al final el mismo resultado.
Es importante sealar que expertos en la materia consideran que cuando las muestras son superiores a
50 datos el error de sesgo ya no se produce o es insignificante y en consecuencia no es necesario utilizar
la formula que se encarga de corregir el mismo, por tal razn es conveniente utilizar n y no, n-1.

VARIANZA Es otra de las variaciones absolutas y la misma se define como el cuadrado de la


desviacin tpica; viene expresada con las mismas letras de la desviacin tpica pero elevadas al

1 . .

(X i )
N

112
2

.., para . datos . no . agrupados

cuadrado, as S2 y 2. Las formulas para calcular la varianza son las mismas utilizadas por la desviacin
tpica, exceptuando las respectivas races, las cuales desaparecen al estar elevados el primer miembro al
cuadrado. La varianza general de la poblacin se expresa de la forma siguiente:

La varianza general de la muestra se expresa as:

2 . .
3 . .S

2
2

4 . .S

f ( X )

= (X X )
=
N
i

n 1

2
2

..,. para .datos .agrupados .


..,. para .datos .no .agrupados .

f i ( X i X )
n 1

..,. para .datos .agrupados .

La mayor utilidad de la varianza se presenta en la estadstica inferencial.

Propiedades de la Desviacin Tpica:

1 La desviacin tpica de una constante k es cero. Si se parte de que la media aritmtica de una
constante es igual a la constante, esto es as, debida a que al ser todos los datos iguales no habr
dispersin en la serie de datos con respecto a la media aritmtica, por lo tanto (k) = 0.
2 Si a cada uno de los valores de una serie de variables se le suma o se le resta una constante K, la
desviacin tpica no se altera. Esta se apoya en la propiedad de la media aritmtica que establece si a
cada valor de la serie se le suma una constante, la media de la nueva serie es igual a la media de la serie
original ms la constante, igual sucede con la resta, la nueva media vendr disminuida en el valor de
dicha constante.

(XiK )

(Xi)

3 Si a cada uno de los trminos de la serie de valores se le multiplica por una constante K, la desviacin
tpica de la serie quedar multiplicada por K, y la nueva desviacin tpica ser igual a la constante K
tomada en valor absoluto por la desviacin tpica original. Esta propiedad se apoya en la propiedad del
producto de la media aritmtica

113

(X

.K )

= . K ..

(X

2 Para distribuciones normales siempre se cumple que:


68.27 % de los datos se encuentran en el intervalo ( X ).
95.45 % de los datos se encuentran en el intervalo ( X 2).
99.73 % de los datos se encuentran en el intervalo ( X 3).
Estos valores se cumplen con bastante aproximacin, para distribuciones que son Normales y para
las que son ligeramente asimtricas
5 Para dos series de valores, de tamao n1 y n2, con variaciones S21 y S22, respectivamente, la varianza
combinada S2T de ambas series ser

n1S12 + n2 S 22
S =
n1 + n2
2
T

DISPERSIN RELATIVA.

Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las dispersiones absolutas de
los trminos de la muestra. Las medidas, tomadas en esas condiciones, sern de utilidad, solo cuando se
trata de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas
muestras, ser necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Las medidas de dispersin relativas permiten comparar grupos de series distintas en cuanto a su
variacin, independientemente de las unidades en que se midan las diferentes caractersticas en
consideracin. Generalmente las medidas de dispersin relativas se expresan en porcentajes, facilitando
as el estudio con medidas procedentes de otras series de valores La dispersin relativa viene a ser igual
a la dispersin absoluta dividida entre el promedio.
Existen varias medidas de dispersin relativa, pero, la ms usada es el coeficiente de variacin de
Pearson, este es un ndice de variabilidad sin dimensiones, lo que permite la comparacin entre
diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variacin de
Pearson se designa con las letras CV. La formula matemtica es:

CV =

x100 .

114

El CV pierde utilidad, cuando la [ es muy cercana a cero. Una serie de valores ser ms dispersa que
otra respecto a su [ mientras que su CV sea mayor.

5 La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro. Determine el CV de


cada uno y diga cul de ellos presenta mayor variacin y cul la menor.

Producto
1
2
3

X
45
450
4500

S
5
40
350

Unidades
Bs.
Bs.
Bs.

CV
11.11 %
8.87 %
7.78 %

Para resolver el problema se calcula el CV de cada producto y luego s determina cul presenta mayor o
menor variacin
CV = Sx100/ X
CV1 = 5x100/45 = 11.11 %.
CV2 = 40x100/450 = 8.87 %.
CV3 = 350x100/4500 = 7.78 %.
Se puede observar que la menor dispersin la presenta el producto 3, por lo tanto, de los 3 productos el
que menos varia es ese; por otro lado el de mayor dispersin o variabilidad es el producto 1.

TEORA DE LOS MOMENTOS.- Los momentos son indicadores matemticos de diversos valores.
Los diversos valores, estn es funcin del parmetro estadstico o valor que se tome, para ser fijado como
punto de referencia.

Sean X1, X2, X3, ..........Xn, los valores que toma la variable Xi; se define entonces, momento mi de orden r
con respecto al promedio aritmtico ( X ) de los valores de la variable Xi elevados a la potencia r;
siendo r cualquier valor comprendido entre,1 , 2, 3,....,n. Matemticamente:

(X X) = d
=
r

mi

r
i

Los momentos se pueden definir tambin como las potencias de los desvos di con respecto a un
determinado valor, que puede ser la media aritmtica, el origen cero o una media arbitraria.En estadstica
son importantes los momentos 1, 2, 3 y 4 con respecto a la media aritmtica y el momento 1 con respecto
al origen que viene a ser igual a la media aritmtica
Formulas para determinar los momentos con respecto a la media aritmtica

115

A) Para datos no agrupados

1. .m1

(X
=

2. .m2

(X
=

3. .m3

(X
=

4 . .m 4 =

X )1

1
i

d
=

2
i

=0

_ X )2

(X

d
=

X )3

d
=

3
i

4
i

= S2

X )4

B) Para datos agrupados

1 . .m 1 =

2 . .m 2 =

f i ( X i X ) 1
n

f i ( X i X ) 2
n

.3 . .m 3

.4 . .m 4

f ( X
=

f i ( X i X ) 3
n

X )4

f i d i1
n

f i d i2
n

= 0

= S2

f i d i3
n

fd
=
i

4
i

Descripcin de los Momentos:


116

1. - El primer momento con respecto a la


primera propiedad de la X .

X es siempre igual a cero, este momento es similar a la

2. El segundo momento con respecto a la X es siempre igual a la varianza.


3 El tercer momento con respecto a la media aritmtica se utiliza para determinar el coeficiente de
asimetra SKm.
3 E l cuarto momento con respecto a la media aritmtica es un valor que se utiliza para determinar el
coeficiente de kurtosis, de una serie de valores.
Formula de los momentos con respecto al origen cero:

5 . .m 1

(X
=

6 . .m 1 =

0)1

f i ( X i 0 ) 1
n

= X .,.en .datos .no .agrupados .

f i X i
n

= X .. para ,. datos .agrupados

Procedimiento para Calcular los mi de una serie de datos:

1 Se calcula la media aritmtica.


2 Se determinan los mi de los Xi y de los X i
aritmtica.

de la serie de valores con respecto a la media

3 Se determinan las di con respecto X para los datos no agrupados y la fidi para los datos
agrupados segn el caso.
4 Se elabora un cuadro estadstico con los datos calculados.
5 Se aplican las formulas para calcular los momentos segn el caso.

1 Sean los siguientes datos los aos de servicio de un grupo de trabajadores. Determine el m1, m2, m3 y
m4 con respecto a la media aritmtica.
Solucin.- Lo primero que se hace es calcular la X y luego se procede a calcular los d1, d2, d3 y d4 con
respecto a la X despus se aplica la formula para calcular los momentos de datos no agrupados.

117

(Xi- X ) = d1
(5 8) = -3
(6 8) = -2
(7 8) = -1
(9 8) = 1
(13 8) = 5
d = 0

Xi
5
6
7
9
13
Xi =40

X =

m1 =

(X

m2

m4

(X
=

X )1

X )2

d i1
n

d i2

X )4

(Xi- X )3 = d3
-27
-8
-1
1
125
d3 =90

(Xi- X )4 = d4
81
16
1
1
625
d4 = 724

40
=8
5

(X
=

(Xi- X )2 = d2
9
4
1
1
25
d2 = 40

d
=
n

4
i

0
= 0.
5

40
=
=8
5

m3

(X
=

X )3

d
=
n

3
i

90
= 18 .
5

724
= 144.8.
5

2 La siguiente distribucin de frecuencia corresponde al consumo de azcar trimestral de un grupo de


familias. Determine el m1, m2, m3 y el m4 con respecto a la media aritmtica.

CLASES
5 7
8 10
11 13
14 16
17 19
20 22
23 25

fi
5
10
15
30
15
10
5
90

118

Solucin.- Lo primero que se hace es elaborar un cuadro estadstico, luego se calcula la X y


posteriormente se determinan los desvos d1, d2, d3 y d4 con respecto a la media y finalmente con los
datos obtenidos en el cuadro se aplica la formula para obtener los momentos en datos agrupados.

X =

X

m1

m2

X i

f i X i fi .

di

fi .di

fi .d2

fi .d3

fi .d4

5 7
8 10
11 13
14 16
17 19
20 22
23 25

5
10
15
30
15
10
5
90

6
9
12
15
18
21
24

30
90
180
450
270
210
120
1350

-9
-6
-3
0
3
6
9
0

-45
-60
-45
0
45
60
45
0

405
360
135
0
135
360
405
1800

-3645
-2160
-405
0
405
2160
3645
0

32805
12960
1215
0
1215
12960
32805
93960

1350
= 15 .0 .
90

X )1

m3

m4

fi

f ( X
=
i

CLASES

f i ( X i X ) 3
n

f i ( X i X ) 4
n

1
i

f i ( X i X ) 2

fd
=

f i d i2
n

f i d i3
n

f i d i4
n

0
= 0.
90

1800
= 20 .
90

0
=0
90

93960
= 1044 .
90

4.- La siguiente distribucin de frecuencia corresponde al consumo de azcar de un grupo de familias.


Determine el m1 con respecto al origen.

CLASES
57
810
1113

fi
5
10
15
119

1416
1719
2022
2325

30
10
15
5
90

Cuadro resumen
fi

X i

X i 0 = X i

f i X i

57

6-0 = 6

30

810

10

9-0 = 9

90

1113

15

12

12-0 =12

1 80

1416

30

15

15-0 = 15

450

1719

15

18

18-0 = 18

270

2022

10

21

21-0 = 21

210

2325

24

24-0 = 24

120

90

CLASES

f ( X

0) 1

f X

1350

1350
= 15.0.
n
n
90
El momento m1 con respecto al origen cero (0), siempre es igual a la media aritmtica.
m1 =

=X =

Medidas de Asimetra y Kurtosis


Simetra.- Segn el Diccionario de la Real Academia Espaola es la Regularidad en la disposicin de
las partes o puntos de un cuerpo o figura, de modo que posea un centro, un eje o un plano de referencia.
Es por lo tanto la armona de posicin de las partes o puntos similares uno respecto de otros y con
referencia a puntos, lneas o planos determinados. Se puede generalizar diciendo que es una proporcin
de las partes entre s y con el todo.
120

En estadstica se dice que una distribucin de datos es simtrica si se le puede doblar a lo largo de un eje
vertical de una manera tal que coincidan los dos lados de la distribucin. Las distribuciones que no
tienen simetra con respecto al eje vertical se les llama sesgada o asimtrica. Una distribucin sesgada a
la derecha tiene una cola prolongada del lado derecho de la distribucin y una cola ms corta del lado
izquierdo de la misma; esta asimetra se le denomina positiva, cuando la cola de la distribucin del lado
izquierdo es ms larga que la del lado derecho, entonces la asimetra es negativa.
En una distribucin simtrica la media, la mediana y la moda son iguales. La simetra se mide por medio
del coeficiente de asimetra. Una distribucin simtrica tiene un coeficiente de asimetra igual a cero.
Cuando una distribucin de frecuencia es asimtrica, la media, la mediana y la moda se alejan una de
otra, es decir, las tres medidas de posicin son diferente; mientras ms se separe la media de la moda,
mayor es la asimetra. Si la distribucin de frecuencia es asimtricamente negativa, la cola de la curva de
distribucin se encuentra hacia los valores ms pequeos de la escala de las X y si la distribucin es
asimtricamente positiva la cola de la distribucin se ubica hacia los valores ms grandes de la escala de
las X.
Karl Pearson un estudioso de la estadstica designo el coeficiente de asimetra con las letras SK y
determin la formula para su clculo, al cual se le denomin primer coeficiente de asimetra de Pearson

SK 1 =

( X Mo )
S

Esta formula se puede transformar por medio de la relacin:


Mo = X 3(X Md ) Mo X = 3(X Md ) X Mo = 3(X Md ).
X Mo = 3(X Md ) , si ahora se sustituye 3( X - Md) en el primer coeficiente de asimetra de Pearson,
se tiene otro coeficiente de asimetra utilizando la mediana que se le denomina segundo coeficiente de
asimetra de Pearson, este es ms preciso que el primero

SK

3 ( X Md )
S

Arthur Bowley otro estudioso de la estadstica determin que el coeficiente de asimetra se poda
calcular por medio de los cuartiles y utiliz el coeficiente de asimetra por medio de cuartiles (skq), y la
formula es

SK

Q1 + Q 3 2Q 2
Q 3 Q1

En donde, Q1, Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq varia entre 1 y 1;
segn Bowley una distribucin de frecuencia con un coeficiente de asimetra igual a 0.1, se considera
como ligeramente asimtrica y con un valor mayor 0.3 se le considera marcadamente asimtrica.

121

El coeficiente de asimetra se puede calcular tambin en funcin de los momentos, siendo el momento m3
el parmetro utilizado para tal efecto. El coeficiente de asimetra segn los momentos se designa con las
letras SKm y s calcula mediante la formula

SK m =

m3
S

En esta formula m3 es el momento tres con respecto a la media aritmtica y S3 es la desviacin tpica
elevada a la potencia tres. Este coeficiente es el ms confiable de todos los antes descritos, asi que para
cualquier calculo se debera utilizar este, ya que es un parmetro que utiliza todos los datos de la serie de
valores.
Si en una serie de valores la X > Md > Mo, entonces la distribucin de frecuencia presenta una curva
asimtrica positiva; si la X =Md = Mo = 0 , la curva de la distribucin es simtrica y si la distribucin
presenta una curva en la que el Mo > Md > X , entonces se dice que la curva de la distribucin
asimtrica negativa.
S la curva de una distribucin de frecuencia es sesgada, la media tratara de ubicarse hacia el extremo o
lado opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una
asimetra positiva la X > Md y en una asimetra negativa la X < Md.
Si en una distribucin de frecuencia, los intervalos de las clases que la conforman presentan frecuencias
balanceadas en cada uno de ellos y no presentan ninguna aglomeracin especial en los extremos y,
adems, presenta una concentracin de los datos en el centro de la distribucin, entonces se dice que la
distribucin de frecuencia es simtrica. Cuando la curva de una distribucin de datos es simtrica el SK
= 0, esta es una de las caractersticas de la curva Normal o Campana de Gauss.
Si la mayora de los datos de una serie de valores estn ubicados en el centro de la distribucin y, adems
existe una dispersin medianamente hacia los extremos mayores o menores de las variables, entonces se
afirma que la curva de la distribucin es Ligeramente Asimtrica. Ejemplo

CLASES 1

f1

35
68
911
1214
1517
1820
2123
TOTAL

5
10
25
40
20
12
8
120

CLASES
2
35
68
911
1214
1517
1820
2123
TOTAL

f2
8
12
20
40
25
10
5
120

122

En este ejemplo la distribucin 1 es ligeramente asimtrica positiva y la distribucin 2 es ligeramente


asimtrica negativa. La mayora de las distribuciones de casos reales por lo general son ligeramente
asimtricas.
Una distribucin de datos es marcadamente asimtrica si la mayora de los datos de la misma se
encuentran ubicados en los extremos mayores o menores de las variables que conforman la distribucin.
Si la mayora de los de los datos de una serie de valores se encuentra situados en el extremo de las clases
menores de la distribucin, entonces la curva de la distribucin de frecuencia presenta una asimetra
positiva, siendo en este caso el SK > 0; y si por el contrario esa mayora se encuentra en los extremos de
las clases mayores de las variables, entonces la serie de valores presenta una curva con una asimetra
negativa, luego el Coeficiente de asimetra ser mayor que cero, es decir, SK>0 Ejemplos:

CLASES 3
35
68
911
1214
1517
1820
2123
TOTAL

f3
15
25
40
60
15
10
5
170

CLASES 4
35
68
911
1214
1517
1820
2123
TOTAL

f4
5
10
15
60
40
25
15
170

En la distribucin 3 los datos presentan una curva marcadamente asimtrica positiva y el caso 4 la curva
de la distribucin es marcadamente asimtrica negativa.
Existen distribuciones de frecuencias que presentan curvas fuertemente marcadamente asimtricas y
otras que las curvas son ligeramente asimtricas. Considerar la asimetra de una curva de frecuencia
marcadamente o ligeramente asimtrica, es un asunto de criterio del investigador, puesto que no
existen reglas rgidas establecidas que determinen las lneas divisorias o parmetros entre ligeramente o
marcadamente asimtrica; Sin embargo cuando la mayora de los datos de una distribucin de
frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza
que la curva de la distribucin es marcadamente asimtrica.
Algunos investigadores como Arthur Bowley determinaron que si se aplica el SKq y ese coeficiente de
asimetra obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la
distribucin es ligeramente asimtrica, en caso contrario la curva de la distribucin sera marcadamente
asimtrica. Otros investigadores utilizan el coeficiente de asimetra segn los momentos (SKm) para tales
efectos, pero no existe criterio en cual ha de ser el coeficiente especifico que marque l limite entre ligera
y marcadamente. Sin embargo, en este estudio se considerar que un coeficiente de asimetra segn los
momentos comprendido entre 0.30 SKm 0.30, seria un buen limite para considerar una curva de
distribucin como ligeramente asimtrica, de lo contrario seria marcadamente asimtrica. El SKm es el
coeficiente de asimetra de mayor precisin y confiabilidad, puesto que este, utiliza para su clculo todos
los valores de la serie de datos.
Es bueno afirmar que cuando el coeficiente de asimetra de una curva de distribucin es marcadamente
asimtrico no se puede utilizar la media aritmtica como medida de tendencia central, puesto que esta es
123

afectada altamente por los valores extremos de una serie de datos, en su lugar es recomendable utilizar
la mediana como medida de posicin.
KURTOSIS8 (CURTOSIS).- Es el grado de apuntamiento o altura de la curva de una distribucin de
frecuencia. La finalidad de la Kurtosis es determinar si la distribucin de los trminos de una serie de
valores responde a una curva normal o no. Se utiliza para observar el promedio o posicin de la
distribucin, as como la media, la mediana y la moda, se puede en esta observar la asimetra, el grado de
concentracin de los datos, en fin, para observar en forma general el comportamiento de una serie de
datos en una distribucin de frecuencia. Por medio de la Kurtosis se determinar si la distribucin de
frecuencia es demasiado puntiaguda, normal o muy achatada.
El grado de apuntamiento o altura de una curva de distribucin se determina por medio del
coeficiente de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie de valores con
respecto a su media aritmtica. La Kurtosis se designa con la letra K4 y la formula de clculo es:

m4
S4
En esta formula m4 es el momento cuatro con respecto a la media aritmtica y S4 es la desviacin tpica
elevada a la cuarta potencia, K4 es el coeficiente de Kurtosis. Tomando en cuenta la Kurtosis el k4 de una
curva de distribucin puede ser: Mesocurtica, Platicurtica y Leptocurtica.
K

Mesocurticas.- Es aquella curva de una distribucin de frecuencia que no es ni muy alta ni muy
achatada, es la llamada curva normal. La curva Mesocurtica tiene un coeficiente de Kurtosis igual a tres,
es decir, K4 = 3.
Leptocurtica.- Es aquella curva de la distribucin que presenta un apuntamiento o altura relativamente
ms alta que la curva Mesocurtica, en esta los datos se encuentran ms concentrados alrededor del
mximo valor. El coeficiente de Kurtosis para curva Leptocurtica es mayor de tres, es decir, K4 > 3.
Platicurtica.- Es la curva de una distribucin de frecuencia que presenta un achatamiento ms
pronunciado que la Mesocurtica, encontrndose los datos ms dispersos alrededor del mximo valor de
la distribucin. En esta curva el coeficiente de Kurtosis es menor de tres, es decir, K4 < 3.

En la grfica 1 de Kurtosis se pueden observar los tres tipos de Kurtosis antes descritos, siendo la primera
curva Platicurtica (azul), la segunda Mesocurtica (roja) y la ltima es Leptocurtica(amarilla):

124

GRAFICO I

KURTOSIS

1 PLATIKURTICA
2 MESOKURTICA
3 LEPTOKURTICA

Problemas Relacionados con la asimetra y la (Kurtosis) curtosis


1 En la siguiente distribucin de frecuencia, determine el coeficiente de asimetra utilizando los
mtodos de Pearson, de Bowley y el de los momentos, interprete los resultados y haga un anlisis de los
diferentes resultados y diga cual es el resultado ms recomendado en este caso; encuentre la Kurtosis e
interprete los resultados.

CLASES
1012
1315
1618
1921
2224

fi
1
5
15
40
15
125

2527
28---30

10
9
95

Solucin.- Para resolver el problema lo primero que hay que hacer es calcular la X y determinar los
desvos di con respecto a la media, luego se elabora un cuadro estadstico con el resumen de los clculos
necesarios para determinar la asimetra y la curtosis. Adems, se tendr que calcular la mediana, la
moda, el Q1 el Q3, y despus de realizar todos esos clculos se procede a buscar la asimetra y la curtosis
con las formulas respectivas. En el siguiente cuadro se encuentran resumidos la mayora de los clculos
necesarios, el resto se calcularan aparte.

CLASES

fi

1012
1315
1618
1921
2224
2527
28---30

1
5
15
40
15
10
9
95

X i
11
14
17
20
23
26
29

f i X i
11
70
255
800
345
260
261
2002

di

fi.di

fi.d2

fi.d3

fi.d4

-10.07
-7.07
-4.07
-1.07
1.93
4.93
7.93

-10.07
-35.35
-61.05
-42.80
28.95
49.30
71.37
0.38

101.40
249.92
248.47
45.80
55.87
243.05
565.96
1510.40

-1021.15
-1766.97
-1011.29
-49.00
107.84
1198.23
4488.10
1945.76

10282.95
12492.45
4115.94
52.43
208.12
5907.28
35590.60
68649.77

Se recomienda al participante que debe realizar los clculos de los parmetros que solo aparecen sus
resultados

X = 21.07, Mo = 20.0, Q1 = 18.71, Q2 = Md = 20.49,


Q3 = 23.55, S = 4.41, S2 = 19.46, S3 = 85.82, S4 = 378,82.
SK 1 =

X Mo 21.07 20.0 1.07


=
=
= 0.27
S
3.99
3.99

El resultado indica que la curva de distribucin es ligeramente asimtrica positiva.

SK 2 =

3( X Md ) 3(21.07 20.49) 1.74


=
=
= 0.44
S
3.99
3.99

El resultado indica que la curva de la distribucin es marcadamente asimtrica positiva.

126

SK q =

Q1 + Q2 2Q2 18.71 + 23.55 2(20.49) 1.28


=
=
= o.26.
Q3 Q1
23.55 18.71
4.84

El resultado indica que la curva es ligeramente asimtrica positiva.


Para calcular el coeficiente de asimetra segn los SKm se clcula primero el m3 as:
m3 =

fd
i

3
i

SK m =

1945.76
= 20.48
95

m 3 20 .48
=
= 0.32
S 3 63 .40

El coeficiente SKm indica que la curva de la distribucin es marcadamente asimtrica positiva. Si se


observan los diferentes coeficientes de asimetra se puede notar que el SK2 y el SKm son marcadamente
asimtricos y los otros son ligeramente asimtricos, esto es as por cuanto l valor obtenido con el SK2
y el SKm son ms precisos que los otros, lo que indica que se debe preferir el resultado de estos ltimos
por razones obvias. Siempre el SKm ser ms preciso que cualquier otro coeficiente de asimetra, Por
qu? Los resultados obtenidos con los diferentes coeficientes de asimetra indican que esta es positiva, es
decir, con un sesgo hacia la cola de la derecha.
Para calcular el K4 se calcula el m4 as:

m4

fd
=
i

4
i

68649.77
= 722.63
95

Ahora se procede a calcular el K4 aplicando la formula

K4 =

m4
722 . 63
=
= 2 . 86 .
4
252 . 8
S

El resultado indica que el apuntamiento de la curva es achatado, esto se observa en el grafico 2 la


primera curva (de color verde), es decir, la curva es platicurtica. Observe la grfica 1 donde se puede
ver la curva normal (de color rojo) y se puede observar la kurtosis y la simetra. La asimetra positiva se
puede observar en la parte derecha de la grfica.

GRAFICO 2

127

KURTOSIS Y ASIMETRA

60
50
40
30
20
10
0

11

14

17

20

23

26

29

1d ASIMETRA +

15

40

15

10

CURVA NORMAL

15

50

15

2.- En la siguiente distribucin de frecuencia determine el SK1, SK2, SKq y el skm, interprete los
resultados y diga cual es el ms recomendado; encuentre la curtosis e interprete el resultado.

CLASES

fi

1012

1315

10

1618

15

1921

40

2224

15

2527

2830

95

Solucin.- Para resolver este problema se debe calcular la X y los desvos di con respecto a esta,
tambin es necesario calcular la Md, el Mo, el Q1, el Q3, la S, el m3, el m4, elaborar un cuadro estadstico
y finalmente aplicar las formulas respectivas. En el siguiente cuadro se resumen los clculos para tales
efectos. Se recomienda al estudiante realizar todos los clculos pertinentes.
CLASES

fi

X i

f i X i

di

fi.di

fi.d2

fi.d

fi.d4
128

1012

11

99

-7.93

1315

10

14

140

-4.93

1618

15

17

255

-1.93

1921

40

20

800

1.07

2224

15

23

345

2527

26

2830

29

95

565.96

-4488.10

35590.60

-49.30

243.05

-1198.23

5907.28

-28.95

55.87

-107.84

208.12

42.80

45.80

49.00

52.43

4.07

61.05

248.47

1011.29

4115.94

130

7.07

35.35

249.92

1766.97

12492.45

29

10.07

10.07

101.40

1021.15

10282.95

-0.35

1510.47

-1945.76

68649.77

1798

-71.37

Los resultados obtenidos de los diferentes clculos son:


X = 18.93, Mo = 20.0, Q1 = 16.45, Q2 = Md = 19.91.
S = 3.99, S3 = 63.40, S4 = 252.80, m3 = 20.48, m4 = 722.63
Ahora se proceder a calcular los diferentes coeficientes de asimetra as:

SK 1 =

SK 2 =

X Mo 18 .93 20 .0 1 .07
=
=
= 0 .27
S
3 .99
3 .99

3( X Md ) 3(18 .93 19 .51) 1 .74


=
=
= 0 .44 .
S
3,99
3 .99

SK m =

m 3 20 .48
=
= 0 .32
63 .40
S3

SK q =

Q1 + Q 3 2 Q 2 16 .45 + 21 .29 2 (19 .51) 1 .28


=
=
= 0 .26
Q 3 Q1
21 .29 16 .45
4 .84

Si observa puede ver que este problema es casi idntico al anterior, solo las frecuencias fueron
cambiadas de la parte alta de las variables hacia la parte baja de las mismas, por tal razn todos sus
clculos son idnticos en valor absoluto al anterior, lo que indica que ahora la asimetras obtenidas es
negativas, es decir, con sesgo hacia la izquierda; si observa la grfica 3 de asimetra y Kurtosis podr
notar las variaciones que hay en ambas curvas. La Kurtosis es idntica a la anterior y la simetra tiene un
sesgo a la izquierda, es decir, asimetra negativa.
129

Para calcular la Kurtosis se procede as:

K4 =

m4 722.63
=
= 2.86.
S 4 252.80

La curva de la distribucin es platikurtica. La interpretacin es idntica a la del problema anterior. Se


puede ver que la curva ms alta es la normal (roja) o Mesocurtica y la ms achatada es la curva de la
distribucin en estudio, y en este caso es platikurtica.

GRAFICO

KURTOSIS Y ASIMETRA

60
50
40
30
20
10
0

11

14

17

20

23

26

29

1i ASIMETRIA -

10

15

40

15

CURA NORMAL

15

50

15

3.- Dada la siguiente distribucin de frecuencia determine el SK1, SK2, SKq, SKm e interprete los
resultados y diga cual de esos coeficientes es el ms recomendado para este caso; calcule el K4 e
interprete su resultado.
CLASES

fi

1014

1519

10

130

2024

25

2529

60

3034

25

3539

10

4044

140

Solucin.- Para resolver el problema primeramente se debe calcular la X , los desvos di con respecto
a la X , la Md, el Mo, el Q1, el Q2, la S, el m3, el m4. Para trabajar mejor se debe elaborar un cuadro
estadstico con todos los clculos necesarios para resolver el problema. Se recomienda al estudiante
realizar todos los clculos.
Los siguientes son los diferentes clculos necesarios para resolver el problema. Se recomienda al
participante efectuar los diferentes clculos de todos los parmetros utilizados.
X = 27.00, Mo = 27.00, Q1 = 23.50, Q2 = Md = 27.00.
Q3 = 30.50, S = 6.27, S3 = 246.24, S4 = 1543.37, m3 = 0, m4 = 5267.86.
CLASES

fi

X i

f i X i

di

fi.di

fi.d2

fi.d3

fi.d4

1014

12

60

-15

-75

1125

-16875

253125

1519

10

17

170

-10

-100-

1000

-10000

100000

2024

25

22

550

-5

-125

625

-3125

15625

2529

60

27

1620

3034

25

32

800

125

625

3125

15625

3539

10

37

370

10

100

1000

10000

100000

4044

42

210

15

75

1125

16875

253125

140

5500

736500

3780

131

SK 1 =

X Mo 27 .0 27 .0
0 .0
=
=
= 0 .0
S
6 .27
6 .27

3 ( X Md )
3 ( 27 . 0 27 . 0
0 .0
=
=
= 0 .0
6 . 27
6 . 27
S

SK

SK

Q1 + Q 3 2Q 2
23 . 5 + 30 . 5 54 . 0
0 .0
=
=
. = 0 .0
Q 3 Q1
30 . 5 23 . 5
7

SK

m3
0 .0
=
= 0 .0
3
246 . 24
S

El resultado obtenido con los diferentes coeficientes de asimetra indica que la curva de la distribucin es
simtrica. Se puede observar que cuando una curva de distribucin es simtrica, con todos los mtodos se
logra el mismo resultado, cualquiera de ellos es valedero, pero si se tuviese que escoger uno en especial
el ms recomendado seria el SKm , ya que para su clculo toma en cuenta todos los datos de la serie de
valores.
Para l clculo de la Kurtosis se procede as:

K4 =

m4
5267 .86
=
= 3 . 41 .
1543 . 37
S4

El resultado indica que la curva de la distribucin de frecuencia es leptocurtica (Roja), es decir, la gran
mayora de los datos se encuentran ubicados alrededor de las medidas de tendencia central, adems, la
curva de la serie de valores es ms alta que la curva normal (Azul). Observe que la grfica de la curva
leptokurtica, es ms alta que la otra curva la normal. De la misma forma se puede observar que ambas
curvas son simtricas, es decir, parten del mismo punto y no presentan sesgo en todo su recorrido y esto
es as debido a que su coeficiente de asimetra es igual acero. Lo nico que varia entre ellas es la Kurtosis.

132

CURVA LEPTOKURTICA
70
60
50
40
30
20
10
0
12

17

1 CURVA NORMAL

22

27

32

37

42

2 CURVA LEPTOKURTICA

2 Dada la siguiente distribucin de frecuencia determine el SK1, el SK2, el SKq, el SKm, haga un
anlisis cada uno de estos y diga cual es el ms recomendado, tomando en cuenta la precisin de
cada uno. Determine, adems, el K4 e interprete el resultado. Se desea tomar una medida de
posicin central, cul seria la ms adecuada?
CLASES

fi

4044

4549

5054

23

5559

75

6064

21

6569

7074

135

Solucin.- Para resolver el problema se debe calcular primero la X luego se determinan los desvos
con respecto a la X , se calcula la Md, el Mo., el Q1, el Q3, la S, el m3 y el m4. Para facilitar el estudio
es conveniente elaborar un cuadro estadstico con todos los parmetros necesarios. En el siguiente cuadro
se resumen gran parte los parmetros necesarios para resolver el problema.

133

X i

f i X i

di

fi.di

fi.d2

fi.d3

fi.d4

84

-14.74

-29.84

434.54

-6405.05

94410.42

47

329

-9.74

-68.18

664.07

-6468.07

62999.03

23

52

1196

-4.74

-109.02

516.75

-2449.42

11610.24

5559

75

57

4275

0.26

19.50

5.07

1.32

0.34

6064

21

62

1302

5.26

110.46

581.02

3056.16

16075.42

6569

67

402

10.26

61.56

631.60

6480.27

66487.60

7074

72

72

15.26

15.26

232.87

3553.56

54227.32

135

-0.26

3065.92

-2231.23

305810.37

CLASES

fi

4044

42

4549

5054

7660

Se recomienda al participante realizar los clculos de los parmetros aqu utilizados:


X = 56.74, Md = 56.87, Mo = 56.95,
S4 = 515.77,

a )........ SK 1 =

Q1 = 54.62, Q3 = 59.12, S = 4.76, S3 = 108.23,

m3 =-16.53, m4 = 2265.26.
X Mo 56.74 56.95 0.21
=
=
= 0.04.
S
4.76
4.76

Este coeficiente indica que la curva de la distribucin es ligeramente asimtrica positiva. Con este
resultado se observa que la curva de la serie de valores es casi simtrica.

b )....... SK 2 =

3 ( X Md ) 3 ( 56 . 74 56 . 8 ) 3 ( 0 . 16 )
=
=
= 0 . 10 .
S
4 . 76
4 . 76

Se puede observar que este resultado es un poco mayor que el obtenido con SK1; la curva de acuerdo con
este, es ligeramente asimtrica positiva.

134

c )..... SK q =

Q1 + Q 3 2 Q 2
54 . 62 + 59 . 12 2 ( 56 . 87 ) 0 . 0
=
=
= 0 .0 .
59 . 12 54 . 62
4 .5
Q 3 Q1

Con este coeficiente se observa que la curva es simtrica ya que su coeficiente de asimetra es igual a
cero. Se puede concluir que este coeficiente no es lo suficiente preciso, puesto que esa curva de
distribucin no es simtrica, como se puede observar en la distribucin de la serie de valores.

d )..... SK

m3
16 . 53
=
= 0 . 15
3
S
108 . 23

Este resultado indica que la curva de la distribucin es ligeramente asimtrica negativa, este es bastante
parecido al obtenido con el SK2, los cuales se acercan bastante a la realidad, por lo tanto, el resultado ms
recomendado para tomar una decisin seria el SKm, por cuanto en el clculo del mismo intervienen
todos los valores de la serie de datos. Se pudo detectar que en el orden de prioridades referente al
coeficiente de asimetra los ms indicados serian el SKm, luego el SK2 y el menos recomendado seria el
SKq por no adaptarse a la realidad.

Para calcular el K4 se procede de la siguiente manera:

K4 =

m4 2265.26
=
= 4.39.
515.95
S4

De acuerdo con este resultado la curva de la distribucin es Leptocurtica, por ser mayor que el
coeficiente de Kurtosis de la curva normal. Este resultado indica que la mayora de los datos se
encuentran ubicados alrededor de la moda y por lo tanto la curva en cuestin presenta un apuntamiento
bastante alto.
La medida de posicin central ms adecuada es la media aritmtica puesto que en este caso no es
afectada por valores extremos por ser la curva de distribucin ligeramente asimtrica negativa como se
puede observar en la siguiente grafica. Observe la grfica de ASIMETRA Y Kurtosis

135

80
70
60
50
40
Curva Leptocurtica
Curva Normal

30
20
10
0
37

42

47

52

57

62

67

72

77

3.- Los aos de servicio de un grupo de trabajadores son 9, x, 10, 8, 6 y 7. El primer momento con
respecto al origen de esa serie de valores es de 7.5 y el m2 con respecto a la X es de 2.92. Determine el
SK2 y el SKm; de esos valores. Se desea tomar una medida de posicin central, cul es la ms indicada
para el caso?. Explique brevemente.

Solucin.- Lo primero que se debe hacer es calcular el valor de x, para ello se procede as:

La X es igual al primer momento con respecto al origen, entonces, X = 7.5. El nmero de datos n
= 6, m2 = S2 = 2.92, ahora se aplica la formula de la media as:

X=

X
n

nX = X i X i = 9 + X + 10 + 8 + 6 + 7 = 40 + X X i . = 40 + X .

nX = X i .6 x7.5 = 40 + X X = 45 40 X = 5.

Ahora se calcula la Md de la siguiente serie de valores, los cuales se han ordenado: 5, 6, 7, 8, 9 y 10, la
mediana en este caso ser: Md
7+8
Md =
= 7.5. ( Esto es as, por ser n un nmero par). Con estos datos se puede calcular el SK2.
2
SK 2 =

3( X Md ) 3( 7 .5 7 .5) 0
=
= =0
n
6
6

136

De acuerdo con el SK2 la curva de la serie de valores es simtrica y esto es as, debido a que la X = Md
= 7.5. La medida de tendencia central ms recomendada seria la media debido a que este promedio para
su clculo utiliza todos los valores de la serie de datos. Para calculr el SKm se calcula S y los desvos
con respecto a la media de la serie de valores.
S2 = 2.92. S3 = 4.99.

S =

SK m =

2 .92 = 1 .70 .

CLASES

di

d3

-2.5

-15.62

-1.5

-3.38

-0.5

-0.12

0.5

0.12

1.5

3.38

10

2.5

15.62

m3
0
=
= 0.
3
S
4.99

Cuando la curva de una serie de valores es simtrica siempre el coeficiente de asimetra ser igual a
cero usando cualquiera de los coeficientes de asimetra. Cuando la curva de una serie de valores se le
calcula el SKm, el resultado obtenido es el ms adecuado y preciso de los coeficientes en cuestin.

La medida de tendencia central ms recomendada en este caso es la media aritmtica a pesar de que esta
es igual a la mediana, pero la X es ms confiable por utilizar esta todos los datos de la serie para su
clculo
3.- Los pesos en Kg, de una familia son 4, 35, 39, 40, 42, 48 y 58. Para realizar una investigacin se requiere
tomar una medida de posicin. Cul es la ms adecuada?. Explique brevemente.

Solucin. Para tomar la decisin es necesario calcular el SKm .


Para calcular el SKm se determina la X de los valores y los desvos di con respecto a esta, se determina la
S, la S3,el di, el d2 y el d3 de los datos y la sumatoria de estos, luego se calcula el m3 y se procede a
137

determinar el SKm, se elabora un cuadro estadstico con el resumen de los datos requeridos; y se aplica la
formula respectiva para este caso. El siguiente cuadro resume los datos necesarios para los clculos

X =

S=

m3 =

2
i

Xi

di

d2

d3

-34

1156

-39304

35

-3

-27

39

40

42

16

64

48

10

100

1000

58

20

400

8000

Xi = 266

di = 0

d2 = 1686

d3 = -30258

266
= 38 .
7
1686
= 240.86 = 15.52., S 3 = 3738.
7

d 3 30258
=
= 4322 .57 .
n
7

SK m =

4322.57
= 1.16.
3738

De acuerdo con el resultado, la curva de la distribucin es marcadamente asimtrica negativa, lo que


indica que existen valores extremos, por lo tanto la media aritmtica no se puede utilizar como medida
de posicin central por ser esta afectada por los valores extremos, en su lugar se utilizar la mediana
como medida de posicin central, por no ser esta, afectada por los valores extremos.
Los coeficientes SK1, SK2 y skq, se le dejan al participante para que los calcule e interprete los resultados
dando su opinin al respecto
7. Los siguientes datos 90, 70, X, 60, y 80 corresponden al peso en kg. De un grupo de profesores. El
coeficiente de variacin de esa serie de datos es de 19,285 %, el m4 con respecto a la media aritmtica es
de 109.492 y el K4 es de 1,840. Se requiere hacer una investigacin y para ello es necesario tomar una
medida de posicin. Cul es la medida de posicin ms adecuada?.
138

Solucin. Lo primero que se debe hacer es calcular el valor de X, y para ello se procede as:
CV = 19,285 %, m4 = 109492, K4 = 1,840, n = 5, ahora se aplica la formula de la media as:

X =

X
n

K4 =

nX = X i X i = 90 + 70 + X + 60 + 80 X i = 300 + X .

m4
m
109492
S4 = 4 S4 =
= 59506.52 S 4 = 59506.52.
4
K4
1,840
S

S 2 = S 4 S 2 = 59506,52 = 243,94., S = S 2 S = 243,52 = 15.62. S = 15.62.

Calculado S se procede a calcular la media as:

X =

S .x.100 15.62.x.100 1516


=
=
= 81.0 X = 81.0.
19,282
19,282
CV

nX = 5x81.0 = 405

= 300 + X.

300+X = 405
X = 405 300
X = 105.

Despus de calculado X s proceder a calcular los desvos di con respecto a la media aritmtica y
finalmente se calcula el SKm Se proceder ahora a elaborar un cuadro estadstico para facilitar los
clculos.

3
i

3960
= 792.
5
n
Se procede ahora a calcular el m3, siendo S3 = 3811,40
m3 =

Ahora se calculara el SKm

139

SK m =

792
m3
=
= 0.21.
3
3811.40
S

El siguiente cuadro resume los clculos a utilizar.


Xi

(Xi- X ) = di

d3

60

-21

-9261

70

-11

-1331

80

-1

-1

90

729

104

24

13824

Xi = 405

di = 0

di = 3960

De acuerdo con el resultado la curva de la serie de datos es ligeramente asimtrica positiva, por lo tanto
la medida de posicin ms recomendada para el estudio es la media aritmtica. Se le recomienda al
participante calcular el SK2, el mismo debe ser muy parecido al SKm.
8. La media aritmtica de dos nmeros es igual a 60 y su desviacin tpica es igual a 20. Determine esos
nmeros.

Solucin: Datos:

X1 =?;

X2 =? ;

X = 60; S = 20; n = 2

De la formula de la media para datos no agrupados se tiene

X1 + X 2
X + X2
..,. 60 = 1
120 = X 1 + X 2 ....( 1).
2
2
n
La formula de la S para datos simples es
X =

S=

(X i X ) 2
n

(X X ) 2 + (X X ) 2
1
2
n

Remplazando por los valores conocidos se tiene

(X 60) 2 + (X 60) 2
1
2
20 =

X 2 120X + 3600 + X 2 120X + 3600


1
1
2
2
20 =
2

140

Se elevan al cuadrado ambos miembros de la ecuacin y se elimina denominador

2
2
X 120X + 3600 + X 120X + 3600
1
1
2
2

2

20 =

X 2 120X + 3600 + X 2 120X + 3600


1
2
2
400 = 1
2
800 = X 2 120X + 3600 + X 2 120X + 3600
1
1
2
2
800 = X 2 120X + X 2 120X + 7200...(2)
1
1
2
2

Despejando en (1), X1 = 120X2 , y reemplazando en (2) se tiene

800 = 120 X 2 120 120 X + X 2 120X + 7200


2
2
2
2
800 = 14400 240X + X 2 14400 + 120X 120X + 7200 + X 2
2
2
2
2
2
800 = 240X + 2X 2 + 7200
2
2
2X 2 240X + 7200 800 = 0
2
2
2X 2 240X + 6400 = 0;..Dividiendo..entre..2..toda..la..ecuacion..se..tiene :
2
2
X 2 120X + 3200 = 0;..Aplicando..producto..notable..se..tiene :
2
2
(X 80)(X 40) = 0
2
2
141

(X1 80)(. X 2 40) = 0.. .(X1 80) = 0..y..(X 2 40) = 0 X1 = 80..y..X 2 = 40.
Los nmeros buscados son 40 y 80.

142

BIBLIOGRAFA

Benavente del Prado, Arturo Nez(1992): Estadstica Bsica par Planificacin. Editorial
Interamericana. 6. Edicin. Mxico.
Berenso, Mark.(1.992): Estadstica Bsica en Administracin. Editorial. Harla. Cuarta Edicin.
Mxico.
Best,J. W. (1987): Como Investigar en Educacin. Editorial Morata. Madrid Espaa.
Budnick Frank S. (1992): Matemticas Aplicadas para Administracin, Economa y Ciencias Sociales.
Tercera Edicin. Editorial McGaw-Hill Interamericana de Mxico, S.A de C.V. Mxico.
Caballero, Wilfredo (1975): Introduccin a la Estadstica. Editorial ICA. Costa Rica.
Cadoche, L. S.; G. Stegmayer, J. P. Burioni y M. De Bernardez (1998). Material del Seminario de
Encuestas en Educacin, impartido va internet por parte de la Universidad Nacional del Litoral,
en Santa Fe, y de la Universidad Tecnolgica Nacional, Regional Santa Fe, en la Repblica de
Argentina.
Castaeda J., J.(1991): Mtodos de Investigacin 2. Editorial McGraw-Hill. Mxico.
Carono, R., Minujin, A. y Vera, G.(1982): Manual de tcnicas de evaluacin y ajuste de informacin
Estadsticas. Fondo de cultura econmica. Mxico.
Chao, L.(1993): Estadstica para la Ciencia Administrativa. Editorial McGraw Hill. 4ta Edicin.
Colombia
CHOU, YA-LUN (1972): Anlisis Estadstico. Editorial Interamericana. Mxico
DANIEL WAYNE, W. y Otros (1993): Estadstica con Aplicacin a las Ciencias Sociales y a la
Educacin Editorial McGraw-Hill Interamericana de Mxico, S.A. de C.V. Mxico.
De Oteyza de O., E; Emma Lam O., Carlos Hernndez G. y ngel M. Carrillo H. (1998). Temas Selectos
de Matemticas. Prentice Hall. Mxico
Enciclopedia Microsoft Encarta 2003 (2003): Censo- Cuestionario- Encuesta. Estadstica. Editorial
Microsoft corporation. USA.
ERKIN KREYSZIA (1978): Introduccin a la Estadstica Matemtica. Editorial Limusa, S.A. Mxico.
FREUD J: E. y Otros (1990): Estadstica para la Administracin con Enfoque Moderno.Editorial, S.A.
Mxico.
Gomes Rondn, Francisco (1985): Estadstica Metodologica: Ediciones Fragor. Caracas.
Gonzlez, Nijad H. (1986): Mtodos estadsticos en Educacin. Editorial Bourgen, Caracas.

143

Guilford, J. Y Fruchter, B. (1984): Estadstica aplicada a la Psicologa y la Educacin.Editorial


McGraw-Hill Latinoamericana, S. A., Bogot.
Hamdan Gonzlez, Nijad (1986): Mtodos Estadsticos en Educacin. Editorial Bourgen C.A. Caracas
Venezuela.
KEVIN, RICHARD I. (1988): Estadstica para Administradores. Editorial Hispanoamericana. Mxico.
LARSON HAROLD, J. (1985): Introduccin a la Teora de Probabilidades e inferencia Estadstica.
Editorial Limusa. Mxico.
LEHMANN, CHARLES H. (1995): LGEBRA. Editorial limusa, S.A. DE C.V. Grupo Noriega Editores.
Mxico.
LEITHOLD, LOUIS (1992): El Clculo con Geometra Analtica. Editorial HARLA. Mxico.
LINCON L., CHAO (1996): Estadstica para Ciencias Administrativas. Cuarta edicin. Editorial
McGaw-Hill. Usa.
Lenin, R.y Kubin, D.(1992): Estadstica para Administradores. Editorial Hispanoamrica. VI edicin.
Mxico.
LOPEZ CASUSO, R. (1984): Introduccin al Clculo de Probabilidades e Inferencia Estadstica.
Editorial Instituto de Investigaciones Econmicas, UCAB. Caracas- Venezuela.
Mason, Robert (1.992): Estadstica para la Administracin y Economa. Ediciones Alfaomega
S.A.N. Mxico.
MENDENNAF, W. y OTROS (1981): Estadstica para Administradores y Economa. Editorial
Iberoamericana. Mxico.
Mode, Elmer B. (1988): Elementos de Probabilidades y Estadstica Editorial Reverte Mejicana. Mxico.
Murria, R.(1993): Estadstica. Edicin Interamericana.2da Edicin. Mxico.
PARZEN, E. (1986): Teora Moderna de Probabilidades y sus Aplicaciones Editorial Limusa: Mxico
PUGACHEV, V. S. (1973): Introduccin a la Teora de Probabilidades Editorial Mir. Mosc.
Rivas Gonzlez, Ernesto(1980): Estadstica General. Ediciones de la Biblioteca UCV. Caracas
Venezuela.
Soto Negrin, Armando (1982): Iniciacin a la estadstica. Editorial Jos Marti. Caracas Venezuela.
Stephen P., Shao (1986): Estadstica para Economistas y Administradores de Empresa. Editorial
Herreros Hermanos, Sucs., S.A., Mxico.
Stevenson, William(1991):
Mxico.

Estadstica para la Administracin y Econmica. Editorial Harla.


144

Universidad Nacional Experimental Simn Rodrguez (1983): Estadstica 1. Ediciones UNESR,


Caracas.
WALPOLE, R. y
Myers, R. (1987):
EditorialInteramericana. Mxico.

Probabilidad

Estadstica

para

Ingenieros.

Webster, Allen L. (1996): Estadstica Aplicada a la Empresa y la Economa. Editorial Irwin. Segunda
edicin. Barcelona Espaa.
Weimer, Richard C. (1996) Estadstica. Compaa Editorial Continental, SA de CV. Mxico.
Wonnacott, T. H. y Wonnacott, R: J. (1989): Fundamentos de Estadstica para Administracin y
Economa. Editorial LIMUSA. Mxico.

145

Вам также может понравиться