Habitualmente necesitamos disponer de un valor numrico que represente la
disparidad de datos de una distribucin de frecuencias. Estos valores son los llamados parmetros centrales o medidas de centralizacin, ya que son valores "intermedios" que se sitan alrededor del centro de la distribucin. Es decir, Indican los valores ms representativos de un conjunto de datos. Media: Existen tres tipos de media: Media Aritmtica, Media Geomtrica y Media Armnica. Media Aritmtica: La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresin: Xi representa el valor de la variable o en su caso la marca de clase. Para calcular la media se suman todos los valores de los datos y se divide por el nmero total de datos. Ej. Media de 2, 2, 3, 7 = (2+2+3+7)/4= 3,5 Si los datos vienen en una tabla con sus frecuencias absolutas (fi) (tantos con este valor, otros tantos con otro valor...), se multiplica cada dato xi por su frecuencia fi. = (x1.f1 + x2.f2 +...+ xn.fn) / N = (xi.fi)/N Propiedades: Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por dicho nmero. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad.
Media Geomtrica: La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos por G. G = Anti Log [(1/N) * fi * Log (Xi)] Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada usual. Media armnica: La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H
Al igual que en el caso de la media geomtrica su utilizacin es bastante poco frecuente. Mediana Es el valor central de la variable, el que divide a las observaciones en dos grupos con el mismo nmero de individuos (50%). Antes de calcular el valor de la mediana primero hay que tomar en cuenta si la variable es discreta o continua. Discreta: Se toma en cuenta el tamao de la muestra. Si N es Impar, hay un trmino central, el trmino que ser el valor de la mediana. Si N es Par, hay dos trminos centrales, la mediana ser la media de esos dos valores. Ej: N impar - Mediana de 1, 2, 4, 5, 6, 6, 8 = 5 N par - Mediana de 1, 2, 4, 5, 6, 6, 8, 9 = (5+6)/2 = 5.5 Continua: Si la variable es continua, la tabla vendr en intervalos. De donde la mediana vale: donde ai es la amplitud del intervalo.
Moda La moda de una variable estadstica es el valor ms repetido, el que tiene mayor frecuencia absoluta, es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso. Si la variable es discreta se busca el valor de mayor frecuencia. Si los datos estn agrupados, la clase de mayor frecuencia se llama clase modal. A veces se toma la marca de clase de la clase modal como valor de la moda, pero es ms preciso utilizar la frmula:
Otros autores dan una expresin aproximada para la moda que viene dada por la siguiente:
EJEMPLO:
1) A continuacin se dan 40 valores del precio de un artculo en diferentes negocios del pas, agrupar los datos en una tabla de frecuencia con intervalos de clases. 75,6 79 75,6 75,4 80,1 80,2 80,6 84,4 75,9 80,3 75,8 75,3 80,6 80,6 75,8 80,1 80,6 81,8 80,2 75,9 75,9 75,9 78,2 77,4 80,9 72,5 87,5 75,4 - 75,4 80,3 81,1 81,6 75,1 81,6 80,9 81,4 80,9 75,9 80,1 77,4. Li = 72,5, Ls = 87,5. Si ordenamos los datos nos queda as: 72,5 75,1 75,3 75,4 75,4 75,4 75,6 75,6 75,8 75,8 75,9 75,9 75,9 75,9 75,9 77,4 77,4 78,2 79 80,1 80,1 80,1 80,2 80,2 80,3 80,3 80,6 80,6 80,6 80,6 80,9 80,9 80,9 81,1 81,4 81,6 81,6 81,8 84,4 87,5. IC Xi fi Hi Fi Hi hi*100 Hi*100 Xi*fi fi*logxi 72,5-74,5 73,5 1 0,04 2 0,04 4 4 189 3,95 75,5-77,5 76,5 5 0,10 7 0,14 10 14 502.5 10,01 78,5-80,5 79,5 8 0,16 15 0,30 16 30 852 16,22 81,5-83,5 82,5 13 0,26 28 0,56 26 56 1462.5 26,66 84,5-86,5 85,5 11 0,22 39 0,78 22 78 1303.5 22,81 87,5-89,5 88,5 7 0,14 46 0,92 14 92 871.5 14,66 5711 102,79 Media aritmtica: = xi * fi/n = 5711/50 = 114,23
Media geomtrica: G = Anti Log [(1/n) * fi * log xi] = Anti Log [(1/50) * 102,79] = 113,71 Media armnica: H = 1/ [ (1/xi) * fi] = 1/ [ (1/925.5) * 50] = 18,51 Mediana: Md = Li + [((n/2) Fi-1)/ fi] * IC = 110 * [(25-15)/ 13] * 6 = 114,62 Moda: Mo = Li + [di/ (d1+d2)] * IC = 110 + (5/7) * 6 = 114,29 2) Nmero de calzados de estudiantes de Ingeniera de Sistemas de la Santiago Mario: IC Xi Fi Fi Xi*fi fi*logxi 34-35 34,5 2 2 69 3,6 36-37 36,5 4 6 146 6,24 38-39 38,5 11 17 223,5 17,38 40-41 40,5 5 22 202,5 8 42-43 42,5 2 24 85 3,22 44-45 44,5 1 25 45,5 1,64 971,5 40,08 Media aritmtica: = xi * fi/n = 971,5/25 = 38,86 Media geomtrica: G = Anti Log [(1/n) * fi * log xi] = Anti Log [(1/25) * 40,08] = 40,11 Media armnica: H = 1/ [ (1/xi) * fi] = 1/ [ (1/237) * 25] = 9,47 Mediana: Md = Li + [((n/2) Fi-1)/ fi] * IC = 38 * [(12,5-6)/ 11] * 2 = 39,18 Moda: Mo = Li + [di/ (d1+d2)] * IC = 38 + (7/7+6) * 2 = 39,07
MEDIDAS DE POSICIN Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. Las medidas de posicin son: Cuartiles: Los cuartiles son los tres valores de la variable que dividen un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, 50% y 75% de los datos. Q2 coincide con la mediana. En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.
Li es el lmite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.
Deciles: Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. Para su clculo, buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.
Li es el lmite inferior de la clase donde se encuentra la mediana. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.
Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana. Para el clculo de percentiles buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.