0 оценок0% нашли этот документ полезным (0 голосов)
77 просмотров11 страниц
Este documento describe diferentes medidas de tendencia central y dispersión para analizar conjuntos de datos. Define la media, mediana y moda como medidas de tendencia central, y explica cómo calcularlas tanto para datos sin agrupar como agrupados. También define la varianza y desviación estándar como medidas de dispersión absoluta, y el coeficiente de variación como medida de dispersión relativa.
Исходное описание:
Medidas de tendencia central:media, mediana y moda. Y medidas de dispersión.
Este documento describe diferentes medidas de tendencia central y dispersión para analizar conjuntos de datos. Define la media, mediana y moda como medidas de tendencia central, y explica cómo calcularlas tanto para datos sin agrupar como agrupados. También define la varianza y desviación estándar como medidas de dispersión absoluta, y el coeficiente de variación como medida de dispersión relativa.
Este documento describe diferentes medidas de tendencia central y dispersión para analizar conjuntos de datos. Define la media, mediana y moda como medidas de tendencia central, y explica cómo calcularlas tanto para datos sin agrupar como agrupados. También define la varianza y desviación estándar como medidas de dispersión absoluta, y el coeficiente de variación como medida de dispersión relativa.
Nos dan un centro de la distribucin de frecuencias, es decir, dan una idea de un
nmero alrededor del cual tienden a concentrarse todo un conjunto de datos. Es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son: MEDIA: (media aritmtica o simplemente media). La media aritmtica, es la suma de las puntuaciones o valores originales dividida entre el nmero de ellas. Es el promedio aritmtico de las observaciones. Si x i es el valor de la variable y n su frecuencia, tenemos que:
EJEMPLO. Las calificaciones en una evaluacin sobre 100 puntos fueron: 60, 55, 70, 70, 85 y 80. Luego, X = 420 = 70. (La calificacin media es 70 puntos.) Nota: Las puntuaciones extremas afectan o modifican la media, a saber: En los grupos de valores 1,3,5,5,5,6 y 1,3,5,5,5,110 las medias son 4.2 en el primer grupo y 21.5 en el segundo. Estos dos grupos no tienen la misma media, por lo tanto, en un conjunto de valores donde existen valores muy extremos, no se debe calcular la media MEDIANA (Me): es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.
Series simples Serie para datos sin agrupar:
Datos agrupados:
EJEMPLO. (a) 6,11,9,12,13,10,20,15,17. Al ordenarlos se obtiene: 6,9,10,11,12,13,15,17,20. La mediana es 12. Md=12
(b) 9,10,12,11,3,6,20,17,13,15. Al ordenarlos se obtiene: 3,6,9,10,11,12,13,15,17,20. La mediana es el promedio entre 11 y 12, por haber dos valores centrales. Md= 11.5
Nota: Una caracterstica de la mediana es su insensibilidad hacia los valores extremos. As, en el conjunto de valores: 2, 3,8,11,48 la Md= 8; esto es verdad an y cuando hay un valor extremo de 48. Si cambiamos ste valor por 98 la mediana seguira siendo la misma. Esta caracterstica de la mediana la hace muy til para la descripcin de la tendencia central en ciertos tipos de distribuciones en las cuales la media es una medida inaceptable de tendencia central, debido a su sensibilidad hacia las calificaciones extremas.
MODA (M 0 ): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.
EJEMPLO. 1,1,2,2,2,3,3,3,3,4,5,6,8. La cifra 3 aparece cuatro veces lo cual es mas frecuente que otro valor; por lo cual el valor modal o modo es 3. ( Mo=3)
1,1,2,2,2,2,3,3,3,4,4,4,4,5,6,7,8. Las cifras 2 y 4 aparecen cuatro veces. Luego Mo= 2,(Bimodal) Cuando aparecen tres o ms veces se denomina Multimodal.
CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL (PARA DATOS AGRUPADOS)
MEDIA ARITMTICA.(X) Cuando se tienen distribuciones de frecuencia y siempre que el valor del intervalo de clase sea constante, es decir, el mismo en cada una de las clases, se puede calcular la Media a travs del Mtodo de los desvos unitarios o Abreviado; Igualmente se puede utilizar el Mtodo directo.
METODO ABREVIADO. Pasos para calcular la Media Aritmtica:
1.- Se elige una media aritmtica supuesta (Xa), la cual es el valor del punto medio de una de las clases; Aunque puede tomarse el punto medio de cualquiera de las clases y obtener el mismo resultado, por facilidad en el clculo se acostumbra a elegir el de la clase de mayor frecuencia o el de aquella que est ubicada hacia en el centro de la escala.(En el ejemplo, tomaremos Xa=49 ubicado en 48-50)
2.- Se anexa otra columna X, en la cual se anotan las desviaciones respecto a la media supuesta. Como la clase 48-50 contiene a Xa, la desviacin es nula, por lo cual anotamos cero en la columna X. El intervalo o clase 51-53 se desva una clase de la que contiene a la media supuesta, luego, en la columna X anotamos uno (1) para dicho intervalo. Se contina as hasta llegar a la clase mayor. A las clases con valores inferiores, se les asigna consecutivamente Los nmeros enteros negativos: -1,-2,-3,-4,-5,... 3.- Se anexa otra columna fiX en la cual se colocan los productos entre la frecuencias fi y la desviacin X correspondiente. 4.- Se suman algebraicamente los valores de la columna fiX. 5.- Se reemplazan los valores obtenidos en la frmula: X = Xa + EfiX. i
METODO DIRECTO. (Mtodo largo) Pasos para calcular la media aritmtica, usando ste mtodo:
1.- Se elabora una columna con los puntos medios xi de cada clase. 2.- En otra columna se escribe el producto entre las frecuencias y el punto medio de cada clase (fi.xi) 3.- Se obtiene la sumatoria de los valores de la columna fi.xi 4.- Se reemplazan los valores obtenidos en la frmula siguiente:
Para calcular la mediana a partir de un conjunto de datos que han sido organizados previamente en una tabla de distribucin de frecuencias, se procede de la siguiente manera:
1.- Se anexa a la tabla dada una columna fa de frecuencias acumuladas. 2.- Se divide entre 2 el nmero total de casos, obteniendo N/2.Es decir,se determina el nmero de casos que han de estar por debajo y por encima de la mediana.(En la tabla del ejemplo que usaremos, N=38 por lo tanto N/2= 38/2= 19. Luego, la mediana es el valor que deja 19 observaciones tanto por debajo como por encima de l. 3.- Se identifica en la columna fa, un valor que sea igual o inmediato superior a N/2; En sta clase est la mediana.(En la tabla del ejemplo dado, en la columna fa, el valor 24 es inmediato superior a 19 por lo cual, la clase 90-94 contiene a la mediana.) 4.- Se identifica la frecuencia acumulada fa de la clase anterior a la que contiene a la mediana. ( En el ejemplo, 14 es la frecuencia acumulada de la clase 85-89 que precede a 90-94 que contiene a la mediana.) 5.- Se identifica la frecuencia fi de la clase que contiene a la mediana. En el ejemplo sta es 10. 6.- Se identifica el lmite real inferior de la clase que contiene a la mediana. En el ejemplo, ste es 89.5. 7.- Se reemplazan stos valores en la frmula
Interpretacin: Por encima y por debajo de 92,se encuentra el 50% de los casos, es decir, 19.
LA MODA O EL MODO. (Mo)
Se define como el punto medio de la CLASE de mayor frecuencia. En el primer ejemplo, Mo=49. En el segundo ejemplo, Mo=97
MEDIDAS DE DISPERSION Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras. MEDIDAS DE DISPERSIN ABSOLUTAS u VARIANZA ( s 2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones.
Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:
Si los datos estn agrupados utilizamos las marcas de clase en lugar de X i . u DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin tpica):
u RECORRIDO O RANGO MUESTRAL (R e ). Es la diferencia entre el valor de las observaciones mayor y el menor. R e = x max - x min
MEDIDAS DE DISPERSIN RELATIVAS u COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica
CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media. EJEMPLO 1 El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica. SOLUCIN: La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60 La varianza S 2 : Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.
S x 2 =
La desviacin tpica S: es la raz cuadrada de la varianza.
S = 427,61 = 20.67 El rango: diferencia entre el valor de las observaciones mayor y el menor 80 - 15 = 65 das El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media aritmtica CV = 20,67/52,3 = 0,39
EJEMPLO 2 El precio de un interruptor magentotrmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadstica, ms abajo) diagrama de barras y el diagrama de caja. SOLUCIN: (Utilizar la calculadora de debajo)
[El diagrama de cajas: caja desde Q 1 a Q 3 (50% de los datos), bigotes el recorrido] Resumen de Frmulas