Академический Документы
Профессиональный Документы
Культура Документы
La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son :
Media aritmtica Mediana Moda Media geomtrica Media armnica Los cuantilos
Moda
La moda es el valor que aparece con mayor frecuencia en la serie de datos. As por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21. La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fcilmente : es la altura ms corriente, es la velocidad ms comn, etc. Adems tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos. La principal limitacin esta en el hecho de que requiere un nmero suficiente de observaciones para que se manifieste o se defina claramente. Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga varias modas. Por ejemplo : L, K, M, O, N (no hay moda) 5, 6, 10, 5, 8, 6, 7, 4 (2 modas)
Mediana
La mediana toma en cuenta la posicin de los datos y se define como el valor central de una serie de datos o, ms especficamente, como un valor tal que no ms de la mitad de las observaciones son menores que el y no ms de la mitad mayores.
El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el nmero de datos es par, existirn dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos. Por ejemplo : 7, 8, 8, 10, 12, 19, 23 Med = 10 3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5
Los Cuantilos
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. As como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedara dividido en cuatro partes y cada parte se llamara cuartilo.
Pero el conjunto puede dividirse tambin por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantilos. Tanto la mediana, como los cuartilos y los deciles pueden expresarse como percentiles. Por ejemplo: Me = P50; Q3 = P75; D4 = P40 As que conociendo los percentiles se puede averiguar cualquier cuantilo. Para el calculo de los percentiles, el conjunto de datos debe estar ordenado, luego se aplica la siguiente formula : Pm = m 100 (n+1) termino
Donde : Pm = Percentil m. Valor tal que un m/100 de las observaciones son menores que el y un 1 - m/100 son mayores. m = Nmero que indica el percentil que se quiere. Por ejemplo, si m = 43, esto quiere decir que se quiere el percentil 43 (P43).
n = Nmero total de observaciones. Ejemplo : Calcular el percentil 77 de los siguientes datos : 32, 35, 36, 37, 40, 40, 41, 41, 42, 43, 43, 44, 45, 45, 46, 46, 47, 47, 48, 49, 49, 50, 51, 51, 52, 53, 53, 54, 55, 56, 57, 59, 60, 60, 62, 66, 67, 68, 70, 74.
El percentil 77 (P77) ser el valor que este ubicado en la 31. 57 posicin del conjunto de datos, pero esta posicin no existe y entonces hay que hacer una extrapolacin entre los datos 31 y 32. El 31 dato corresponde a 57 mientras que el 32 dato corresponde a 59, entonces diremos que el P77 es un 57% de 59 ms un 43% de 57. P77 = (0.43 * 57) + (0.57 * 59) = 58.14
Media Aritmtica
La media aritmtica es el promedio ms comnmente usado, este puede ser simple o ponderado. La media aritmtica simple esta dada por la formula X/n y que significa: la suma de todos los valores dividida por el nmero de datos. Por ejemplo: 10, 13, 10, 13, 14, 10, 13, 10, 15
En la serie del ejemplo anterior aparecen los nmeros; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderacin y se suman estos productos, se obtendr la misma suma que si se hubieran sumado uno por uno. Sin ponderar Nmero x 10 13 14 15 Suma = 52 52/4 = 13 Nmero x 10 13 14 15 Clculo ponderado Frecuencia 4 3 1 1 9 108/9 = 12 Producto (fx) 40 39 14 15 108
Media Geomtrica
La media geomtrica es la raz ensima del producto de todos los valores de la serie.
Como este sistema de calculo resulta muy difcil de emplear, mxime cuando son nmeros grandes o largas series de datos, en la prctica se recurre a los logaritmos. xg = antilog ( log xi)/n as la xg del ejemplo se calculara as : xg = antilog ( log 3 + log 4 + log 9 + log 12 ) 4 xg = antilog (0.477 + 0.602 + 0.954 + 1.079 ) 4
Media Armnica
La media armnica se define como el recproco de la media aritmtica de los recprocos de los valores.
Xa = 3
Donde: x es el punto medio de clase f es la frecuencia absoluta F es la frecuencia acumulada fx es el producto del punto medio por la frecuencia absoluta
Donde : L = Limite inferior de la clase modal. d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior. d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior. C = Intervalo de clase.
Por ejemplo : Primero se localiza la clase modal que es aquella en la que hay la mayor densidad de frecuencia por unidad de intervalo y luego aplicar la formula. La clase es : 44.5 - 49.5 Entonces: Mo = 44.5 + 1 * 5 1+2 = 44.5 + 1.67 = 46.17
Donde : n = Nmero total de observaciones. L = Limite inferior de la clase que contiene la mediana. f = Frecuencia de la clase que contiene la mediana. F = Frecuencia acumulada "menos de" de la clase anterior. C = Intrvalo de clase. La determinacin de la clase que contiene la mediana se hace dividiendo n/2 y viendo en cual clase qued este acumulado. En el ejemplo es la clase 44.5 - 49.5 ya que en sta qued el 20 dato.
Donde: Pm = Percentil m. m = Nmero del percentil deseado. n = Nmero total de observaciones. L = Limite inferior de la clase donde esta el percentil. f = Frecuencia de la clase que contiene el percentil. F = Frecuencia acumulada de la clase anterior a la que contiene el percentil C = Intervalo de clase. Clculo del P72 Primero se determina la clase donde esta el percentil deseado as : m/100 * n = 72/100 * 40 = 28.8 O sea que el P72 es el 28.8 trmino de la serie y ste queda en la clase 54.5 - 59.5. P72 = 54.5 + 28.8 - 28 * 5 = 55.5 4
Media aritmtica
Para otros usos de este trmino, vase media.
Construccin geomtrica para hallar las medias aritmtica, geomtrica y armnica de dos nmeros a y b. En matemticas y estadstica, la media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es igual a la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadsticos muestrales.
Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin. Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable. Tambin la media aritmtica puede ser denominada como centro de gravedad de una distribucin, el cual no est necesariamente en la mitad. Una de las limitaciones de la media aritmtica es que se trata de una medida muy sensible a los valores extremos; valores muy altos tienden a aumentarla mientras que valores muy bajos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.
Contenido
[ocultar]
[editar] Definicin
Dados los n nmeros como: , la media aritmtica se define simplemente
Se utiliza la letra X con una barra horizontal sobre el smbolo para representar la media de una muestra ( ), mientras que la letra (mi) se usa para la media aritmtica de una poblacin, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable y luego dividido por n : donde n es el nmero de sumandos, o en el caso de estadsticas el nmero de datos.
[editar] Propiedades
La media aritmtica de un conjunto de nmeros positivos siempre es igual o superior a la media geomtrica:
La media aritmtica est comprendida entre el valor mximo y el valor mnimo del conjunto de datos:
MEDIDAS DE DISPERSIN
Contenido:
Poblacin y muestra Amplitud o recorrido Desviacin media. desviacin estndard y varianza Coeficiente de variacin Clculo de la varianza en una tabla de frecuencias
POBLACIN Y MUESTRA
Si un conjunto de datos consta de todas las observaciones concebibles (o hipotticamente posibles) de cierto fenmeno, se denomina poblacin; si un conjunto de datos consta solamente de una parte de estas observaciones se conoce como muestra por lo que una muestra debe ser un subconjunto de la poblacin.
Por ejemplo: Un peridico local imprime un artculo poltico para todos sus lectores. El peridico desea considerar las actitudes de 200 lectores hacia el artculo y conocer sus puntos de vista. De acuerdo a lo planteado en el ejemplo el total de los lectores representara la poblacin a la que le llega el artculo y los 200 lectores seleccionados representaran la muestra para conocer su punto de vista. Se utilizar la palabra "muestra" solo con relacin a datos que se puedan utilizar en forma razonable para hacer generalizaciones acerca de la poblacin de la cual provinieron. En este sentido ms tcnico, no son aceptables muchos conjuntos de datos que por lo comn se denominan muestras. Como el trmino estadstica(o) se introdujo con relacin a los datos de muestra, se agregar que tambin existe un nombre para las descripciones estadsticas de poblaciones llamadas parmetros. Como se observar, la distincin entre estadstica y parmetros servir para simplificar nuestro lenguaje. En realidad, hasta se usarn smbolos diferentes de medidas estadsticas, segn se utilicen para describir muestras o poblaciones. Para poblaciones se utilizarn letras griegas y para muestras, latinas. Por ejemplo para representar la media o el promedio de una muestra se utiliz la frmula:
La media de una poblacin de N elementos se define en la misma forma. Es la suma de los N elementos, dividida entre el tamao de la poblacin N.
En las frmulas anteriores se representa a la media de la muestra por media de la poblacin por para identificarlas entre s.
y la
MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.
Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1: A = 77 73 = 4
Para el Paciente 2: A = 90 64 = 26
La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.
se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media
Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.
sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin.
Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como
Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.
Coeficiente de variacin
Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin. El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa como para la poblacin. Los coeficientes de variacin tienen las siguientes caractersticas:
Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos conjuntos de datos. En reas de investigacin donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisin de un experimento, comparando en CV del experimento en cuestin con los valores del mismo en experiencias anteriores.
Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. b. c. d. e. f.
A = 13 7 = 6
9 7 11 10 13
-2.5 0.0
6.25 27.50
Donde: k es el nmero de intervalos de clase Xi es el valor medio de cada clase fi es el valor de la frecuencia absoluta
Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.
intervalos (07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]
Punto medio de clase (mi) 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL |||| |
Conteo ||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| |||
fi 18 13 24 17 13 0 4 1 90
fAi 18 31 55 72 85 85 89 90 90
FRi
FRAi
18/90 18/90 13/90 31/90 24/90 55/90 17/90 72/90 13/90 85/90 0/90 4/90 1/90 85/90 89/90 90/90
90/90 90/90
Calcular s2 y s.
mi 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL 94.09 187.69 313.29 470.89 660.49 882.09 1135.69 1421.29 #####
fi 18 13 24 17 13 0 4 1 90
fimi 174.6 178.1 424.8 368.9 334.1 0 134.8 37.7 1653.0 1693.62 2439.97 7518.96 8005.13 8586.37 0 4542.76 1421.29 34208.10
Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentracin, debemos como primera medida, calcular la distancia de cada dato respecto a una medida de tendencia central. Por ejemplo: 4 5 2 3 4 5 3 2 5 1 3 2 2 1 4
Tenemos que la media aritmtica es de aproximadamente 3,0667 (indicador de tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333 hacia la derecha. Grficamente tendramos: Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmtica: Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la media. Para indicar las distancias de estos puntos, agregaremos el signo negativo, por tanto, la distancia del tercer dato sera 0,0667. La representacin grfica de todos los puntos quedara: El total de las distancias de los puntos que estn a la izquierda respecto a la media es de 8,6 (empleando todos los decimales), que es igual a la sumatoria de las distancias de los puntos que estn a la derecha respecto a la media 8,6. Concluimos que la sumatoria de todas las distancias de cada punto respecto a la media aritmtica es igual a cero (las distancias se anulan): Para responder a la pregunta de qu tan disperso estn los datos respecto a la media aritmtica?, recurriremos nuevamente al promedio simple. Para llegar a una frmula bsica de dispersin, en que las distancias positivas y negativas no se eliminen, modificaremos la frmula anterior para trabajar solo con distancias positivas mediante el valor absoluto: La distancia promedio sera de aproximadamente 1,15 (resultado de la divisin entre la distancia total absoluta y el total de datos). A esta distancia promedio se le conoce con el nombre de desviacin media y significa que en promedio, los datos se separan de la media en 1,15.
Desviacin media (Dm): Equivale a la divisin de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmtica y el nmero total de datos.
Se debe hacer la distincin que para datos poblacionales (no agrupados), la frmula quedara: La variacin para los datos agrupados en tablas tipo B radica en cambiar el valor de Xi por la marca de clase correspondiente, multiplicando esa distancia por su frecuencia: Para las tablas tipo A solo cambiaremos la marca de clase por su respectivo valor de clase (representada por Xi):
5.1.1 Ejemplo: Desviacin media para datos no agrupados
Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno ms idneo para representar al colegio en un torneo a nivel nacional. El nmero de preguntas buenas por materia se muestra a continuacin: Materia 1 2 3 4 5 6 7 8 9 10 SOLUCIN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. Cul sera entonces el indicador diferenciador entre los alumnos?. Complementemos el anlisis anterior calculando la desviacin media: Carlos 2 9 10 2 3 1 9 9 1 4 Pedro 7 2 2 6 6 3 6 7 6 5 Juan 5 6 5 5 5 5 4 5 6 4
Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin (2,9), siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmtica. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados ms constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variacin muy baja (rondando entre 4 y 6).
5.1.2 Ejemplo: Desviacin media para datos agrupados
Una maquina dispensadora de gaseosas esta programada para llenar un envase con 350 c.c. de un refresco popular. A partir de una muestra de prueba realizada sobre 30 envases se realiz la siguiente tabla de frecuencia: Ni 1 2 3 4 5 6 Lm 130.0 140.1 150.1 160.1 170.1 180.1 Total Calcular e interpretar la desviacin media. SOLUCIN Ls 140.1 150.1 160.1 170.1 180.1 190.0 F 2 5 14 4 4 1 30 Mc 135.1 145.1 155.1 165.1 175.1 185.1
Presentaremos el clculo de la desviacin media en Excel tanto para datos sin agrupar, como para los datos agrupados en tablas de frecuencias. Copiemos los siguientes datos a partir de la celda B2.
Excel cuenta con la funcin DESVPROM para el clculo de la desviacin media para datos sin agrupar.
5.2.4.2. La desviacin tpica y otras medidas de dispersin La variacin o dispersin de los datos numricos es el grado en que estos tienden a extenderse alrededor de un valor medio. Existen diferentes medidas de dispersin o variacin, las ms utilizadas son el rango (expuesto en el numeral 5.2.1.), la desviacin media, el rango semiintercuartlico, el rango entre percentiles 10-90 y la desviacin tpica. Cuartiles, Deciles y Percentiles Si un conjunto de datos estn ordenados por magnitudes, el valor central (o la media de los dos centrales) que dividen al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro partes iguales. Esos valores denotados por Q1, Q2 y Q3, son el primer cuartl, segundo cuartl y tercer cuartl, respectivamente. EL Q2 coincide con la mediana. Similarmente, los valores que dividen a los datos en 10 partes iguales son los deciles, representados por D1, D2,..., D9, mientras que los valores que lo dividen en 100 partes iguales son los percentiles, denotados por P1, P2,..., P99. El 5 decil y el 50 percentil coinciden con la mediana. Los 25 y 75 percentiles coinciden con el primer y tercer cuartiles. Colectivamente, cuartiles, deciles y percentiles son los cuantiles. Las medidas de dispersin tratan de medir el grado de dispersin que tiene una variable estadstica en torno a una medida de posicin o tendencia central, indicndonos lo representativa que es la medida de posicin. A mayor dispersin menor representatividad de la medida de posicin y viceversa. d) Desviacin media absoluta, o promedio de desviacin Indica las desviaciones con respecto a la media aritmtica en valor absoluto. De una serie de N nmeros X1, X2,... Xn definido por: Donde es la media aritmtica de los nmeros y es el valor absoluto de las desviaciones de las diferentes de . Valor absoluto de un nmero es el mismo nmero sin signo asociado alguno, representado por dos barras verticales a ambos lados del nmero. As tenemos: Ejercicio 04 (Desviacin media)
Calcular la desviacin media de los nmeros: 4, 5, 8, 10, 13 Solucin 1 Calculamos la media aritmtica de los nmeros, aplicando la frmula (28) y la funcin PROMEDIO de Excel: 2 Aplicando la frmula (29) y la funcin PROMEDIO de Excel, calculamos la desviacin media: Si X1, X2;..., Xk presentan con frecuencias f 1, f2,..., fk, respectivamente, la desviacin media la podemos representar como: A veces, la desviacin media es definida como desviaciones absolutas de la mediana u otro promedio en lugar de la media. La desviacin media respecto de la mediana es mnima. Ejercicio 05 (Desviacin media) Calcular la desviacin media de las siguientes series de nmeros: Serie 1: 11, 6, 7, 3, 15, 10, 18, 5 Serie 2: 10, 3, 8, 8, 9, 8, 9, 18 Solucin 1 Aplicando la frmula (28) y la funcin PROMEDIO de Excel, calculamos la media aritmtica de cada serie: 1 Calculamos la media aritmtica de cada una de las series aplicando la frmula (34) y la funcin Promedio de Excel: 2 Con la frmula (35) y la funcin PROMEDIO de Excel, calculamos la desviacin media de cada una de las series: Finalmente, la desviacin media evidencia que la serie (2) tiene menos dispersin que la serie (1). e) Desviacin tpica o desviacin estndar La desviacin estndar es una medida estadstica de la dispersin de un grupo o poblacin. Una gran desviacin estndar indica que la poblacin esta muy dispersa respecto de la media; una desviacin estndar pequea indica que la poblacin est muy compacta alrededor de la media.
La desviacin tpica o estndar para una poblacin puede definirse como: Donde a es un promedio que puede ser distinto de la media aritmtica. De todas las desviaciones tpicas, la mnima es aquella para la que a =. El nmero de elementos de la poblacin esta representado por N. Cuando la muestra es pequea (muestra propiamente dicha), generalmente es utilizada la siguiente relacin: Denominada desviacin estndar muestral o desviacin estndar corregida. El nmero de elementos de la muestra lo representa n. Cuando es necesario distinguir la desviacin estndar de una poblacin de la desviacin estndar de una muestra sacada de esta poblacin, empleamos el smbolo s para la ltima y para la primera. As, s2 y representarn la desviacin estndar muestral y poblacional, respectivamente. f) Varianza La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Cuanto mayor sea la varianza mayor dispersin existir y por tanto menor representatividad tendr la media aritmtica. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado. La varianza de un conjunto de datos se define como el cuadrado de la desviacin estndar y viene dada, por tanto, por para una poblacin o s2 para una muestra: Cuando la muestra es pequea (muestra propiamente dicha), generalmente es utilizada la siguiente relacin:
Desviacin estndar
La desviacin estndar o desviacin tpica () es una medida de centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de
tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.
Contenido
[ocultar]
[editar] Formulacin
La varianza representa la media aritmtica de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la coleccin completa de datos (la poblacin en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atencin slo a una muestra de la poblacin, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuacin. Expresin de la varianza muestral:
demostracin
obtenemos
El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en 1894. Por la formulacin de la varianza podemos pasar a obtener la desviacin estndar, tomando la raz cuadrada positiva de la varianza. As, si efectuamos la raz de la varianza muestral, obtenemos la desviacin tpica muestral; y si por el contrario, efectuamos la raz sobre la varianza poblacional, obtendremos la desviacin tpica poblacional.
con a como y s como adems se puede tener una mejor tendencia de medida al desarrollar las formulas indicadas pero se tiene que tener en cuenta la media, mediana y moda
mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio).
[editar] Desglose
La desviacin estndar (DS/DE), tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores concretos del promedio en una distribucin. De hecho, especficamente, la desviacin estndar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, . La desviacin estndar de un conjunto de datos es una medida de cunto se desvan los datos de su media. Esta medida es ms estable que el recorrido y toma en consideracin el valor de cada dato. Es posible calcular la desviacin estndar de una variable aleatoria continua como la raz cuadrada de la integral
donde
As la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin. Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 (Correccin de Bessel)
Tambin hay otra funcin ms sencilla de realizar y con menos riesgo de tener equivocaciones :
[editar] Ejemplo
Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de nios. { 4, 1, 11, 13, 2, 7 } 1. Calcular el promedio o media aritmtica .
Sustituyendo N por 6
Este es el promedio.
Sustituyendo N - 1 por 5; ( 6 - 1 )
Sustituyendo
por 6,33