Вы находитесь на странице: 1из 32

Medidas de Tendencia central

La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son :

Media aritmtica Mediana Moda Media geomtrica Media armnica Los cuantilos

Moda
La moda es el valor que aparece con mayor frecuencia en la serie de datos. As por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21. La moda es una medida muy natural para describir un conjunto de datos; su concepto se adquiere fcilmente : es la altura ms corriente, es la velocidad ms comn, etc. Adems tiene la ventaja de que no se ve afectada por la presencia de valores altos o bajos. La principal limitacin esta en el hecho de que requiere un nmero suficiente de observaciones para que se manifieste o se defina claramente. Otros inconvenientes son que puede darse el caso de que una determinada serie no tenga moda o que tenga varias modas. Por ejemplo : L, K, M, O, N (no hay moda) 5, 6, 10, 5, 8, 6, 7, 4 (2 modas)

Mediana
La mediana toma en cuenta la posicin de los datos y se define como el valor central de una serie de datos o, ms especficamente, como un valor tal que no ms de la mitad de las observaciones son menores que el y no ms de la mitad mayores.

El primer paso es ordenar los datos de acuerdo a su magnitud, luego se determina el valor central de la serie y esa es la mediana. Si el nmero de datos es par, existirn dos valores centrales y entonces la mediana se obtiene sacando el promedio de ellos. Por ejemplo : 7, 8, 8, 10, 12, 19, 23 Med = 10 3, 4, 4, 5, 16, 19, 25, 30 Med = (5+16)/2 = 10.5

Los Cuantilos
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. As como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedara dividido en cuatro partes y cada parte se llamara cuartilo.

Pero el conjunto puede dividirse tambin por 10 (deciles) o por 100 (percentiles) y todos se llaman cuantilos. Tanto la mediana, como los cuartilos y los deciles pueden expresarse como percentiles. Por ejemplo: Me = P50; Q3 = P75; D4 = P40 As que conociendo los percentiles se puede averiguar cualquier cuantilo. Para el calculo de los percentiles, el conjunto de datos debe estar ordenado, luego se aplica la siguiente formula : Pm = m 100 (n+1) termino

Donde : Pm = Percentil m. Valor tal que un m/100 de las observaciones son menores que el y un 1 - m/100 son mayores. m = Nmero que indica el percentil que se quiere. Por ejemplo, si m = 43, esto quiere decir que se quiere el percentil 43 (P43).

n = Nmero total de observaciones. Ejemplo : Calcular el percentil 77 de los siguientes datos : 32, 35, 36, 37, 40, 40, 41, 41, 42, 43, 43, 44, 45, 45, 46, 46, 47, 47, 48, 49, 49, 50, 51, 51, 52, 53, 53, 54, 55, 56, 57, 59, 60, 60, 62, 66, 67, 68, 70, 74.

El percentil 77 (P77) ser el valor que este ubicado en la 31. 57 posicin del conjunto de datos, pero esta posicin no existe y entonces hay que hacer una extrapolacin entre los datos 31 y 32. El 31 dato corresponde a 57 mientras que el 32 dato corresponde a 59, entonces diremos que el P77 es un 57% de 59 ms un 43% de 57. P77 = (0.43 * 57) + (0.57 * 59) = 58.14

Media Aritmtica
La media aritmtica es el promedio ms comnmente usado, este puede ser simple o ponderado. La media aritmtica simple esta dada por la formula X/n y que significa: la suma de todos los valores dividida por el nmero de datos. Por ejemplo: 10, 13, 10, 13, 14, 10, 13, 10, 15

Media Aritmtica Ponderada


Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.

En la serie del ejemplo anterior aparecen los nmeros; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderacin y se suman estos productos, se obtendr la misma suma que si se hubieran sumado uno por uno. Sin ponderar Nmero x 10 13 14 15 Suma = 52 52/4 = 13 Nmero x 10 13 14 15 Clculo ponderado Frecuencia 4 3 1 1 9 108/9 = 12 Producto (fx) 40 39 14 15 108

Media Geomtrica
La media geomtrica es la raz ensima del producto de todos los valores de la serie.

As por ejemplo la media geomtrica de 3,4,9 y 12 seria:

Como este sistema de calculo resulta muy difcil de emplear, mxime cuando son nmeros grandes o largas series de datos, en la prctica se recurre a los logaritmos. xg = antilog ( log xi)/n as la xg del ejemplo se calculara as : xg = antilog ( log 3 + log 4 + log 9 + log 12 ) 4 xg = antilog (0.477 + 0.602 + 0.954 + 1.079 ) 4

xg = antilog (3.11) 4 xg = antilog 0.78 xg = 6

Media Armnica
La media armnica se define como el recproco de la media aritmtica de los recprocos de los valores.

y reacomodando la frmula se tiene:

As la media armnica de 3, 2, 6 sera:

Xa = 3

Clculo de las medidas de posicin en datos agrupados


Cuando los datos estn agrupados en distribucin de frecuencias las frmulas varan un poco. Clases 29.5-34.5 34.5-39.5 39.5-44.5 44.5-49.5 49.5-54.5 54.5-59.5 59.5-64.5 64.5-69.5 69.5-74.5 Total x 32 37 42 47 52 57 62 67 72 f 1 3 8 9 7 4 3 3 2 F 1 4 12 21 28 32 35 38 40 40 fx 32 111 336 423 364 228 186 201 144 2025

Donde: x es el punto medio de clase f es la frecuencia absoluta F es la frecuencia acumulada fx es el producto del punto medio por la frecuencia absoluta

Moda (datos agrupados)

Donde : L = Limite inferior de la clase modal. d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior. d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior. C = Intervalo de clase.

Por ejemplo : Primero se localiza la clase modal que es aquella en la que hay la mayor densidad de frecuencia por unidad de intervalo y luego aplicar la formula. La clase es : 44.5 - 49.5 Entonces: Mo = 44.5 + 1 * 5 1+2 = 44.5 + 1.67 = 46.17

Mediana (datos agrupados)

Donde : n = Nmero total de observaciones. L = Limite inferior de la clase que contiene la mediana. f = Frecuencia de la clase que contiene la mediana. F = Frecuencia acumulada "menos de" de la clase anterior. C = Intrvalo de clase. La determinacin de la clase que contiene la mediana se hace dividiendo n/2 y viendo en cual clase qued este acumulado. En el ejemplo es la clase 44.5 - 49.5 ya que en sta qued el 20 dato.

Media aritmtica (datos agrupados)


Es la suma de los productos de la frecuencia por el punto medio divididos por la frecuencia acumulada total. x = fx = 2025 = 50.62 n 40

Percentiles (datos agrupados)

Donde: Pm = Percentil m. m = Nmero del percentil deseado. n = Nmero total de observaciones. L = Limite inferior de la clase donde esta el percentil. f = Frecuencia de la clase que contiene el percentil. F = Frecuencia acumulada de la clase anterior a la que contiene el percentil C = Intervalo de clase. Clculo del P72 Primero se determina la clase donde esta el percentil deseado as : m/100 * n = 72/100 * 40 = 28.8 O sea que el P72 es el 28.8 trmino de la serie y ste queda en la clase 54.5 - 59.5. P72 = 54.5 + 28.8 - 28 * 5 = 55.5 4

Media aritmtica
Para otros usos de este trmino, vase media.

Construccin geomtrica para hallar las medias aritmtica, geomtrica y armnica de dos nmeros a y b. En matemticas y estadstica, la media aritmtica (tambin llamada promedio o simplemente media) de un conjunto finito de nmeros es igual a la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadsticos muestrales.

Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin. Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable. Tambin la media aritmtica puede ser denominada como centro de gravedad de una distribucin, el cual no est necesariamente en la mitad. Una de las limitaciones de la media aritmtica es que se trata de una medida muy sensible a los valores extremos; valores muy altos tienden a aumentarla mientras que valores muy bajos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.

Contenido
[ocultar]

1 Definicin 2 Propiedades 3 Vase tambin 4 Enlaces externos

[editar] Definicin
Dados los n nmeros como: , la media aritmtica se define simplemente

Por ejemplo, la media aritmtica de 8, 5 y -1 es igual a:

Se utiliza la letra X con una barra horizontal sobre el smbolo para representar la media de una muestra ( ), mientras que la letra (mi) se usa para la media aritmtica de una poblacin, es decir, el valor esperado de una variable.

En otras palabras, es la suma de n valores de la variable y luego dividido por n : donde n es el nmero de sumandos, o en el caso de estadsticas el nmero de datos.

[editar] Propiedades

La media aritmtica de un conjunto de nmeros positivos siempre es igual o superior a la media geomtrica:

La media aritmtica est comprendida entre el valor mximo y el valor mnimo del conjunto de datos:

MEDIDAS DE DISPERSIN
Contenido:
Poblacin y muestra Amplitud o recorrido Desviacin media. desviacin estndard y varianza Coeficiente de variacin Clculo de la varianza en una tabla de frecuencias

POBLACIN Y MUESTRA
Si un conjunto de datos consta de todas las observaciones concebibles (o hipotticamente posibles) de cierto fenmeno, se denomina poblacin; si un conjunto de datos consta solamente de una parte de estas observaciones se conoce como muestra por lo que una muestra debe ser un subconjunto de la poblacin.

Por ejemplo: Un peridico local imprime un artculo poltico para todos sus lectores. El peridico desea considerar las actitudes de 200 lectores hacia el artculo y conocer sus puntos de vista. De acuerdo a lo planteado en el ejemplo el total de los lectores representara la poblacin a la que le llega el artculo y los 200 lectores seleccionados representaran la muestra para conocer su punto de vista. Se utilizar la palabra "muestra" solo con relacin a datos que se puedan utilizar en forma razonable para hacer generalizaciones acerca de la poblacin de la cual provinieron. En este sentido ms tcnico, no son aceptables muchos conjuntos de datos que por lo comn se denominan muestras. Como el trmino estadstica(o) se introdujo con relacin a los datos de muestra, se agregar que tambin existe un nombre para las descripciones estadsticas de poblaciones llamadas parmetros. Como se observar, la distincin entre estadstica y parmetros servir para simplificar nuestro lenguaje. En realidad, hasta se usarn smbolos diferentes de medidas estadsticas, segn se utilicen para describir muestras o poblaciones. Para poblaciones se utilizarn letras griegas y para muestras, latinas. Por ejemplo para representar la media o el promedio de una muestra se utiliz la frmula:

La media de una poblacin de N elementos se define en la misma forma. Es la suma de los N elementos, dividida entre el tamao de la poblacin N.

En las frmulas anteriores se representa a la media de la muestra por media de la poblacin por para identificarlas entre s.

y la

MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.

Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes.

Para el Paciente 1: A = 77 73 = 4

Para el Paciente 2: A = 90 64 = 26

La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:

En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.

Desviacin media, desviacin estndar y varianza


Para presentar la desviacin estndar, que es por mucho la medida generalmente ms til de la dispersin, obsrvese que la dispersin de un conjunto de datos es pequea si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecera razonable medir la dispersin de un conjunto de datos en trminos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de nmeros:

que constituyen una poblacin con una media

, las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media

y en consecuencia tambin su promedio es siempre cero.

Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.

sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin.

Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como

Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.

Coeficiente de variacin

Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin. El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa como para la poblacin. Los coeficientes de variacin tienen las siguientes caractersticas:

para una muestra y

Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos conjuntos de datos. En reas de investigacin donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisin de un experimento, comparando en CV del experimento en cuestin con los valores del mismo en experiencias anteriores.

Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. b. c. d. e. f.

Amplitud. Media. Desviacin media. Desviacin estndar. Varianza. Coeficiente de variacin.

a) Para calcular la amplitud. Valor mximo 13 Valor mnimo 7

A = 13 7 = 6

b) Para calcular la media.

c) Para calcular la desviacin media

d) Para calcular la desviacin estndar

Se puede utilizar la siguiente tabla:

9 7 11 10 13

-0.5 -2.5 1.5 0.5 3.5

0.25 6.25 2.25 0.25 12.25

-2.5 0.0

6.25 27.50

Al sustituir los valores se obtiene:

e) Para calcular la varianza:

f) Para calcular el coeficiente de variacin:

Clculo de la varianza en una tabla de frecuencias


Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente frmula:

Donde: k es el nmero de intervalos de clase Xi es el valor medio de cada clase fi es el valor de la frecuencia absoluta

Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.

intervalos (07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]

Punto medio de clase (mi) 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL |||| |

Conteo ||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| |||

fi 18 13 24 17 13 0 4 1 90

fAi 18 31 55 72 85 85 89 90 90

FRi

FRAi

18/90 18/90 13/90 31/90 24/90 55/90 17/90 72/90 13/90 85/90 0/90 4/90 1/90 85/90 89/90 90/90

90/90 90/90

Calcular s2 y s.

mi 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL 94.09 187.69 313.29 470.89 660.49 882.09 1135.69 1421.29 #####

fi 18 13 24 17 13 0 4 1 90

fimi 174.6 178.1 424.8 368.9 334.1 0 134.8 37.7 1653.0 1693.62 2439.97 7518.96 8005.13 8586.37 0 4542.76 1421.29 34208.10

5.1 DESVIACIN MEDIA

Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentracin, debemos como primera medida, calcular la distancia de cada dato respecto a una medida de tendencia central. Por ejemplo: 4 5 2 3 4 5 3 2 5 1 3 2 2 1 4

Tenemos que la media aritmtica es de aproximadamente 3,0667 (indicador de tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333 hacia la derecha. Grficamente tendramos: Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmtica: Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la media. Para indicar las distancias de estos puntos, agregaremos el signo negativo, por tanto, la distancia del tercer dato sera 0,0667. La representacin grfica de todos los puntos quedara: El total de las distancias de los puntos que estn a la izquierda respecto a la media es de 8,6 (empleando todos los decimales), que es igual a la sumatoria de las distancias de los puntos que estn a la derecha respecto a la media 8,6. Concluimos que la sumatoria de todas las distancias de cada punto respecto a la media aritmtica es igual a cero (las distancias se anulan): Para responder a la pregunta de qu tan disperso estn los datos respecto a la media aritmtica?, recurriremos nuevamente al promedio simple. Para llegar a una frmula bsica de dispersin, en que las distancias positivas y negativas no se eliminen, modificaremos la frmula anterior para trabajar solo con distancias positivas mediante el valor absoluto: La distancia promedio sera de aproximadamente 1,15 (resultado de la divisin entre la distancia total absoluta y el total de datos). A esta distancia promedio se le conoce con el nombre de desviacin media y significa que en promedio, los datos se separan de la media en 1,15.

Desviacin media (Dm): Equivale a la divisin de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmtica y el nmero total de datos.

Se debe hacer la distincin que para datos poblacionales (no agrupados), la frmula quedara: La variacin para los datos agrupados en tablas tipo B radica en cambiar el valor de Xi por la marca de clase correspondiente, multiplicando esa distancia por su frecuencia: Para las tablas tipo A solo cambiaremos la marca de clase por su respectivo valor de clase (representada por Xi):
5.1.1 Ejemplo: Desviacin media para datos no agrupados

Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno ms idneo para representar al colegio en un torneo a nivel nacional. El nmero de preguntas buenas por materia se muestra a continuacin: Materia 1 2 3 4 5 6 7 8 9 10 SOLUCIN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. Cul sera entonces el indicador diferenciador entre los alumnos?. Complementemos el anlisis anterior calculando la desviacin media: Carlos 2 9 10 2 3 1 9 9 1 4 Pedro 7 2 2 6 6 3 6 7 6 5 Juan 5 6 5 5 5 5 4 5 6 4

Carlos muestra una desviacin media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variacin (2,9), siendo Juan el que menos variacin presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmtica. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados ms constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variacin muy baja (rondando entre 4 y 6).
5.1.2 Ejemplo: Desviacin media para datos agrupados

Una maquina dispensadora de gaseosas esta programada para llenar un envase con 350 c.c. de un refresco popular. A partir de una muestra de prueba realizada sobre 30 envases se realiz la siguiente tabla de frecuencia: Ni 1 2 3 4 5 6 Lm 130.0 140.1 150.1 160.1 170.1 180.1 Total Calcular e interpretar la desviacin media. SOLUCIN Ls 140.1 150.1 160.1 170.1 180.1 190.0 F 2 5 14 4 4 1 30 Mc 135.1 145.1 155.1 165.1 175.1 185.1

PASO 1: Calcular la media aritmtica. PASO 2: Calcular la desviacin media.


La desviacin media es de aproximadamente 8,8 c.c. Concluimos que con datos suministrados de una muestra, el dispensador llen los 30 envases con un promedio de 157,095 c.c. con una desviacin media de 8,8 c.c. La desviacin media describe un rango de dispersin promedio de llenado del dispensador, ubicndolo entre 148,295 c.c. (equivale a restar la media a la desviacin media) y 165,895 c.c. (sumar una desviacin media a la media aritmtica).
5.1.3 Clculos de la desviacin media en Excel

Presentaremos el clculo de la desviacin media en Excel tanto para datos sin agrupar, como para los datos agrupados en tablas de frecuencias. Copiemos los siguientes datos a partir de la celda B2.

Excel cuenta con la funcin DESVPROM para el clculo de la desviacin media para datos sin agrupar.

5.2.4.2. La desviacin tpica y otras medidas de dispersin La variacin o dispersin de los datos numricos es el grado en que estos tienden a extenderse alrededor de un valor medio. Existen diferentes medidas de dispersin o variacin, las ms utilizadas son el rango (expuesto en el numeral 5.2.1.), la desviacin media, el rango semiintercuartlico, el rango entre percentiles 10-90 y la desviacin tpica. Cuartiles, Deciles y Percentiles Si un conjunto de datos estn ordenados por magnitudes, el valor central (o la media de los dos centrales) que dividen al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto de datos en cuatro partes iguales. Esos valores denotados por Q1, Q2 y Q3, son el primer cuartl, segundo cuartl y tercer cuartl, respectivamente. EL Q2 coincide con la mediana. Similarmente, los valores que dividen a los datos en 10 partes iguales son los deciles, representados por D1, D2,..., D9, mientras que los valores que lo dividen en 100 partes iguales son los percentiles, denotados por P1, P2,..., P99. El 5 decil y el 50 percentil coinciden con la mediana. Los 25 y 75 percentiles coinciden con el primer y tercer cuartiles. Colectivamente, cuartiles, deciles y percentiles son los cuantiles. Las medidas de dispersin tratan de medir el grado de dispersin que tiene una variable estadstica en torno a una medida de posicin o tendencia central, indicndonos lo representativa que es la medida de posicin. A mayor dispersin menor representatividad de la medida de posicin y viceversa. d) Desviacin media absoluta, o promedio de desviacin Indica las desviaciones con respecto a la media aritmtica en valor absoluto. De una serie de N nmeros X1, X2,... Xn definido por: Donde es la media aritmtica de los nmeros y es el valor absoluto de las desviaciones de las diferentes de . Valor absoluto de un nmero es el mismo nmero sin signo asociado alguno, representado por dos barras verticales a ambos lados del nmero. As tenemos: Ejercicio 04 (Desviacin media)

Calcular la desviacin media de los nmeros: 4, 5, 8, 10, 13 Solucin 1 Calculamos la media aritmtica de los nmeros, aplicando la frmula (28) y la funcin PROMEDIO de Excel: 2 Aplicando la frmula (29) y la funcin PROMEDIO de Excel, calculamos la desviacin media: Si X1, X2;..., Xk presentan con frecuencias f 1, f2,..., fk, respectivamente, la desviacin media la podemos representar como: A veces, la desviacin media es definida como desviaciones absolutas de la mediana u otro promedio en lugar de la media. La desviacin media respecto de la mediana es mnima. Ejercicio 05 (Desviacin media) Calcular la desviacin media de las siguientes series de nmeros: Serie 1: 11, 6, 7, 3, 15, 10, 18, 5 Serie 2: 10, 3, 8, 8, 9, 8, 9, 18 Solucin 1 Aplicando la frmula (28) y la funcin PROMEDIO de Excel, calculamos la media aritmtica de cada serie: 1 Calculamos la media aritmtica de cada una de las series aplicando la frmula (34) y la funcin Promedio de Excel: 2 Con la frmula (35) y la funcin PROMEDIO de Excel, calculamos la desviacin media de cada una de las series: Finalmente, la desviacin media evidencia que la serie (2) tiene menos dispersin que la serie (1). e) Desviacin tpica o desviacin estndar La desviacin estndar es una medida estadstica de la dispersin de un grupo o poblacin. Una gran desviacin estndar indica que la poblacin esta muy dispersa respecto de la media; una desviacin estndar pequea indica que la poblacin est muy compacta alrededor de la media.

La desviacin tpica o estndar para una poblacin puede definirse como: Donde a es un promedio que puede ser distinto de la media aritmtica. De todas las desviaciones tpicas, la mnima es aquella para la que a =. El nmero de elementos de la poblacin esta representado por N. Cuando la muestra es pequea (muestra propiamente dicha), generalmente es utilizada la siguiente relacin: Denominada desviacin estndar muestral o desviacin estndar corregida. El nmero de elementos de la muestra lo representa n. Cuando es necesario distinguir la desviacin estndar de una poblacin de la desviacin estndar de una muestra sacada de esta poblacin, empleamos el smbolo s para la ltima y para la primera. As, s2 y representarn la desviacin estndar muestral y poblacional, respectivamente. f) Varianza La varianza mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Cuanto mayor sea la varianza mayor dispersin existir y por tanto menor representatividad tendr la media aritmtica. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado. La varianza de un conjunto de datos se define como el cuadrado de la desviacin estndar y viene dada, por tanto, por para una poblacin o s2 para una muestra: Cuando la muestra es pequea (muestra propiamente dicha), generalmente es utilizada la siguiente relacin:

Desviacin estndar
La desviacin estndar o desviacin tpica () es una medida de centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de

tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

Contenido
[ocultar]

1 Formulacin 2 Interpretacin y aplicacin 3 Desglose 4 Ejemplo 5 Enlaces externos 6 Vase tambin

[editar] Formulacin
La varianza representa la media aritmtica de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la coleccin completa de datos (la poblacin en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atencin slo a una muestra de la poblacin, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuacin. Expresin de la varianza muestral:

Segunda forma de calcular la varianza muestral:

demostracin

podemos observar que como

(sumamos n veces 1 y luego dividimos por n) y como

obtenemos

Expresin de la cuasivarianza muestral (estimador insesgado de la varianza poblacional):

Expresin de la varianza poblacional:

donde es el valor medio de {Xi}

Expresin de la desviacin estndar poblacional:

El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en 1894. Por la formulacin de la varianza podemos pasar a obtener la desviacin estndar, tomando la raz cuadrada positiva de la varianza. As, si efectuamos la raz de la varianza muestral, obtenemos la desviacin tpica muestral; y si por el contrario, efectuamos la raz sobre la varianza poblacional, obtendremos la desviacin tpica poblacional.

Desviaciones estndar en una distribucin normal. Expresin de la desviacin estndar muestral:

Tambin puede ser tomada como

con a como y s como adems se puede tener una mejor tendencia de medida al desarrollar las formulas indicadas pero se tiene que tener en cuenta la media, mediana y moda

[editar] Interpretacin y aplicacin


La desviacin estndar es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a la media aritmtica. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar muestrales son 8,08, 5,77 y 1,15, respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7. La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las

mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio).

[editar] Desglose
La desviacin estndar (DS/DE), tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores concretos del promedio en una distribucin. De hecho, especficamente, la desviacin estndar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, . La desviacin estndar de un conjunto de datos es una medida de cunto se desvan los datos de su media. Esta medida es ms estable que el recorrido y toma en consideracin el valor de cada dato. Es posible calcular la desviacin estndar de una variable aleatoria continua como la raz cuadrada de la integral

donde

La DS es la raz cuadrada de la varianza de la distribucin

As la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin. Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 (Correccin de Bessel)

Tambin hay otra funcin ms sencilla de realizar y con menos riesgo de tener equivocaciones :

[editar] Ejemplo
Aqu se muestra cmo calcular la desviacin estndar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de nios. { 4, 1, 11, 13, 2, 7 } 1. Calcular el promedio o media aritmtica .

. En este caso, N = 6 porque hay seis datos:

i=nmero de datos para sacar desviacin estndar

Sustituyendo N por 6

Este es el promedio.

2. Calcular la desviacin estndar

Sustituyendo N - 1 por 5; ( 6 - 1 )

Sustituyendo

por 6,33

ste es el valor de la desviacin estndar.

Вам также может понравиться