Вы находитесь на странице: 1из 62

Mediana (estadstica)

De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda Para otros usos de este trmino, vase mediana. En el mbito de la estadstica, la mediana, representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.

Contenido
[ocultar]

1 Clculo o 1.1 Datos sin agrupar o 1.2 Datos agrupados 2 Ejemplos para datos sin agrupar o 2.1 Ejemplo 1: Cantidad (N) impar de datos o 2.2 Ejemplo 2 : Cantidad (N) par de datos 3 Ejemplo para datos agrupados 4 Mtodo de clculo general 5 Mtodo proyectivo 6 Vase tambin 7 Enlaces externos

[editar] Clculo
Es el valor medio en un conjunto de valores ordenados. Corresponde al percentil 50 o segundo cuartil (P50 o Q2). Los pasos son: 1) Arregla los valores en orden del menor al mayor 2) Cuenta de derecha a izquierda o al revs hasta encontrar el valor o valores medios. Ejemplo: tenemos el sig conjunto de nmeros 8,3,7,4,11,2,9,4,10,11,4 oredenamos: 2,3,4,4,4,7,8,9,10,11,11 En esta secuencisa la mediana es 7, que es el nmero central. Y si tuvisemos: 8,3,7,4,11,9,4,10,11,4, entonces ordenamos: 3,4,4,4,7,8,9,10,11,11 y la mediana (Md) est en: los nmeros centrales son 7 y 8, lo que haces es sumar 7 + 8 y divides entre 2 y Md= 7.5. Existen dos mtodos para el clculo de la mediana: 1. Considerando los datos en forma individual, sin agruparlos. 2. Utilizando los datos agrupados en intervalos de clase.

A continuacin veamos cada una de ellas.

[editar] Datos sin agrupar


Sean los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos: a) Si n es impar, la mediana es el valor que ocupa la posicin (n + 1) / 2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque ste es el valor central. Es decir: Me = x(n + 1) / 2. Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9 => El valor central es el tercero: x(5 + 1) / 2 = x3 = 7. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos por encima de l (x4, x5). b) Si n es par, la mediana es la media aritmtica de las dos observaciones centrales. Cuando n es par, los dos datos que estn en el centro de la muestra ocupan las posiciones n / 2 y n / 2 + 1. Es decir: Me = (xn / 2 + (xn / 2 + 1)) / 2. Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8, x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del encima del siguiente dato la media aritmtica de estos dos datos: y otros dos que quedan por . Por tanto, la mediana de este grupo de datos es .

[editar] Datos agrupados


Al ratar con datos agrupados, si coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidir con la abscisa correspondiente. Si no coincide con el valor de ninguna abcisa, se calcula a travs de semejanza de tringulos en el histograma o polgono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Dnde Ni y Ni 1 son las frecuencias absolutas acumuladas tales que , ai 1 y ai son los extemos, interior y exterior, del intervalo donde se alcanza la mediana y Me = ai 1

es la abscisa a calcular, la moda. Se observa que ai ai 1 es la amplitud de los intervalos seleccionados para el diagrama. xi fi Ni

[editar] Ejemplos para datos sin agrupar


[editar] Ejemplo 1: Cantidad (N) impar de datos
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la siguiente tabla: Calificaciones 1 2 3 4 5 6 7 8 9

1 2 2 2 3 4 4 5 6 9 7 3 8 4

2 4 8 13 30 33 37 39

5 8 21 > 19.5

Nmero de alumnos 2 2 4 5 8 9 3 4 2

Primero se hallan las frecuencias absolutas acumuladas Ni. As, aplicando la 9 2 formula asociada a la mediana para n impar, se obtiene X(39 + 1) / 2 = X20.

Ni-1< n/2 < Ni = N19 < 19.5 < N20

Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar.En este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.

[editar] Ejemplo 2 : Cantidad (N) par de datos


Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo): Calificaciones 1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 6 9 4 4 2

xi fi Ni+w 1 2 2 2 3 4 2 4 8

13 Primero se hallan las frecuencias absolutas acumuladas Ni. Ni. As, aplicando 4 5 la frmula asociada a la mediana para n par, se obtiene Formula: X = n / 2 = = 5 6 19 = 19 > X = (38 / 2) = > X = 19 (Donde n= 38 alumnos divididos entre dos). 6 9 28

Ni-1< n/2 < Ni = N18 < 19 < N19

7 4

32 36 38

8 4 Con lo cual la mediana ser la media aritmtica de los valores de la variable 9 2 que ocupen el decimonoveno y el vigsimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms.

[editar] Ejemplo para datos agrupados


Entre 1.70 y 1.80 hay 3 estudiantes. Entre 1.60 y 1.70 hay 5 estudiantes. Entre 1.50 y 1.60 hay 2 estudiantes.

[editar] Mtodo de clculo general


xi fi Ni [x11-x12] f1 N1 . . . . . . . . N(i-2) [x(i-1)1-x(i-1)2] f(i-1) f(i-1)-N(i-2)=N(i-1) [xi1-xi2] fi fi-Ni-1=Ni [x(i+1)1-x(i+2)2] f(i+1) f(i+1)-Ni=N(i+1) . . . . . . . . . [xM1-xM2] fM fM-N(M-1)=NM Consideramos: - x11 valor mnimo< Entonces:

[editar] Mtodo proyectivo


Con base en el mtodo proyectivo, se puede obtener la mediana para datos agrupados de la siguiente forma: 1. Tomar el nmero total de frecuencias y dividirlo entre dos. 2. Restar a ese nmero el total de frecuencias de las clases anteriores a la clase mediana. 3. Usar el nmero obtenido para hacer un cambio del doble superior de escala entre las frecuencias de la clase mediana y sus rangos para obtener la distancia parcial 4. Sumamos la distancia parcial obtenida a el lmite inferior de la clase. Usando el ejemplo anterior:

1. El nmero total de frecuencias es de; (3+5+2)/2 = 10/2 = 5 2. El total de frecuencias anteriores es 2; (5 - 2) = 3 3. Hacemos el cambio de escalas:

Resolviendo:

la mediana es la suma de todos los datos dividido entre el nmero de datos 4. Se suma la distancia parcial al lmite inferior:

Mediana para datos no agrupados

La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos partes iguales, de forma que el nmero de valores mayor o igual a la mediana es igual al nmero de valores menores o igual a estos. Su aplicacin se ve limitada ya que solo considera el orden jerrquico de los datos y no alguna propiedad propia de los datos, como en el caso de la media.

A continuacin se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:

Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado.

Sean ordenados lo datos en orden ascendente x1 , x 2 , x3 , , x n

Si el nmero de valores es impar, la mediana es el valor medio, el cual corresponde al xn dato 2 . Cuando el nmero de valores en el conjunto es par, no existe un solo valor medio, si no que existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la mediana es numricamente igual a xn + xn Md =
2 2 +1

Podemos describir algunas propiedades para la mediana:

1.- Es nica. 2.- Es simple. 3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.

~ La notacin mas usual que se utiliza para representar a la mediana es x , Md o Me

Ejemplo:

Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 para la obtencin de la mediana se debern de ordenar. Tomemos el criterio de orden ascendente con lo que, tendremos:

0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,

por otro lado el nmero de datos es igual a 15 datos, siendo el nmero de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.

La mediana para datos agrupados.

La extensin para el clculo de la mediana en el caso de datos agrupados es realiza a continuacin:

n f acum ( i 1) 2 Md = Li + A f mediana

Donde: Md = Mediana. Li = Limite inferior o frontera inferior de donde se encuentra la mediana, la forma de calcularlo es a travs de encontrar la posicin n / 2 . En ocasiones en el intervalo donde se encuentra la mediana de conoce como intervalo mediano. n = Nmero de observaciones o frecuencia total.
f acum ( i 1)

= frecuencia acumulada anterior al intervalo mediano.

f mediana = Frecuencia del intervalo mediano. A = Amplitud del intervalo en el que se encuentra la mediana .

Geomtricamente la mediana se encuentra en el valor X que divide al histograma en dos partes de reas iguales.

Ejemplo:

Retomemos la tabla del ejemplo mostrado para determinar la media de atenciones mdicas brindadas por el hospital, adicionando la columna de la frecuencia acumulada

Tabla de frecuencias reportadas por la clnica Clases Punto medio Frecuencias de (Datos en aos) de cada cada clase xi fi clase Frecuencias acumulada f acumulada 8 28 42 50 52

10 x < 20

15 25 35 45 55

8 20 14 8 2

20 x < 30
30 x < 40

40 x < 50
50 x < 60

60 x < 70

65 75

2 1 55 enfermos atendidos

54 55

70 x < 80

Determinemos el dato medio de los datos, como n = 55 entonces n/2=27.5 El intervalo mediano o la clase donde se encuentra la mediana se encuentra en la segunda clase.

sustituyendo en la ecuacin tendremos

por lo que se puede concluir que el 50% de las personas atendidas en un fin de semana por el hospital tienen una edad inferior a los 29.75 aos.

Moda estadstica
La moda estadstica es el valor que ms se repite en un grupo de nmeros. Para averiguar la moda en un grupo de nmeros:

Ordena los nmeros segn su tamao. Determina la cantidad de veces de cada valor numrico.

El valor numrico que ms se repite es la moda. Puede haber ms de una moda cuando dos o ms nmeros se repiten la misma cantidad de veces y adems este es el mximo nmero de veces del conjunto. No hay moda si ningn nmero se repite ms de una vez.
Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.
Introduccin Medidas de centralizacin, parmetros estadsticos que marcan, bajo de distintos criterios, los valores en torno a los cuales se disponen los datos de una distribucin. Tambin de medidas de tendencia central, pues en torno a ella se disponen los elementos de las distribuciones. La ms imponente son la media, mediana y moda. La medida aritmtica, promedio o, simplemente, media, de los valores x1, x2,..., xn, se designa por x y se obtiene as:

La mediana (Me), es un numero que supera a la mitad de los valores de la distribucin y es superada por la otra mitad. Si el numero de trminos de la distribucin es impar, la mediana es el valor del individuo que ocupa el valor central cuando los datos estn ordenados de menor a mayor. Por ejemplo, la distribucin de edades 4,6,6,7,9,11,13, la mediana es Me = 7, pues hay tres datos menores que 7 y tres mayores que 7. Si el numero de termino de la distribucin es par, la mediana es el valor medio de los datos centrales. As, en la distribucin 4,6,7,8,9,11,13, los valore 7 y8 son los valores centrales. La mediana es Me = 7,5. La moda (Mo), de una distribucin estadstica es el valor que ms se repite. Una distribucin puede tener mas de una moda o no tener ninguna. En la distribucin 4,6,6,7,9,11,13, la moda es Mo = 6. Historia de la Estadstica Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a. C. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a. C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a. C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en

Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the Condn Bies Of. Mortalita (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico. Media aritmtica o promedio Llamando xl, ..., xk a los datos distintos de un carcter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmtica de la distribucin de frecuencias a

en donde n es la frecuencia total.

Ejemplo La media aritmtica de las veinticinco familias encuestadas ser:

es decir, las familias encuestadas tienen un nmero medio de hijos de 1'68. Ejemplo 2: Se midieron los niveles de colinesterasa en un recuento de eritrocitos en &mu;mol/min/ml de 34 agricultores expuestos a insecticidas agrcolas, obtenindose los siguientes datos: Individuo 1 2 3 Nivel 10,6 12,5 11,1 Individuo 13 14 15 Nivel 12,2 10,8 16,5 Individuo 25 26 27 Nivel 11,8 12,7 11,4

4 5 6 7 8 9 10 11 12

9,2 11,5 9,9 11,9 11,6 14,9 12,5 12,5 12,3

16 17 18 19 20 21 22 23 24

15,0 10,3 12,4 9,1 7,8 11,3 12,3 9,7 12,0

28 29 30 31 32 33 34

9,3 8,6 8,5 10,1 12,4 11,1 10,2

La distribucin de frecuencias las marcas de clase ser: Intervalo Frecuencia Ii 7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5 9'75 8 11'25 10 12'75 10 14'25 1 15'75 2 ?ni=25 ni 3

Marca de Clase xi 8'25

la cual proporciona una media aritmtica de

Mediana La mediana es otra medida de posicin, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de sta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales As, si en la siguiente distribucin de frecuencias, xi 0 1 2 ni 3 2 2 7 ordenamos los valores en orden creciente, 0 0 0 1 1 2 2 el 1 ser el valor que cumple la definicin de mediana. Lgicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razn, daremos a continuacin una frmula que permita calcularla. No obstante, ser necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar. Ni 3 5 7

Datos sin agrupar:

Las grficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:

Si la situacin es como la de la figura de la derecha, es decir, si Si la situacin que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmtica de los dos valores entre los que se produce la indeterminacin; as pues, si Nj-1 = n/2 < Nj entonces la mediana es

Ejemplo 1: La distribucin de frecuencias acumuladas del ejemplo del nmero de hijos era N de hijos(xi) Frecuencias Acumuladas(Ni) y como es n/2=12'5 y en consecuencia 11 < 12'5 < 19 la mediana ser Me= 2. 0 5 1 11 2 19 3 23 4 25

Datos Agrupados

Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:

El ms sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj. Si la situacin es como la que se representa en la figura de la izquierda, en la que Nj-l < n/2 < Nj entonces, la mediana, est en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomndose en ese caso, por razonamientos de proporcionalidad, como mediana el valor

siendo cj la amplitud del intervalo [xj-1, xj). Ejemplo: La distribucin de frecuencias del ejemplo de los niveles de colinesterasa es: Intervalo Frecuencia Frecuencia Acumulada Al ser n/2 = 17 y estar 11 < 17 < 21 la mediana estar en el intervalo [10'5 , 12), y aplicando la frmula anterior, ser Ii ni Ni 7'5-9 3 3 9-10'5 8 11 10'5-12 10 21 12-13'5 10 31 13'5-15 1 32 15-16'5 2 34

Moda La moda se define como aquel valor de la variable al que corresponde mxima frecuencia (absoluta o relativa). Para calcularla, tambin ser necesario distinguir si los datos estn o no agrupados.

Datos sin agrupar:

Para datos sin agrupar, la determinacin del valor o valores (ya que puede haber ms de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese ser la moda. As en el ejemplo del nmero de hijos, la simple inspeccin de la tabla siguiente proporciona como valor para la moda el Md = 2.

N de hijos(xi) N de familias(ni)

0 5

1 6

2 8

3 4

4 2 ?ni=25

Datos agrupados:

Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si stos tienen o no igual amplitud. Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, tambin por razones geomtricas, como

Ejemplo: Este ejemplo presenta un caso de distribucin bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 13'5) tienen frecuencia absoluta mxima. Deberamos aplicar, por tanto, para cada uno de los dos intervalos la frmula anterior, determinando as las dos modas de la distribucin. No obstante, este ejemplo presenta adems la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situacin se considera la distribucin unimodal, eligiendo como moda el extremo comn, Md = 12. Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes

y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la frmula

siendo cj la amplitud del intervalo modal [xj-1, xj). Ejemplo: Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud sern, Ii 0-20 20-30 30-40 40-45 45-50 50-60 60-80 80-100 ni 8 9 12 10 9 10 8 4 li 0'4 0'9 1'2 2 1'8 1 0'4 0'2

con lo que el intervalo modal es el [40 - 45) y la moda

A diferencia de lo que ocurre con la media o con la mediana, s es posible determinar la moda en el caso de datos cualitativos. As, en el ejemplo del tratamiento de radiacin seguido de ciruga puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron ciruga.

Moda
La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la distribucin:

2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Si

en

un

grupo

hay

dos

varias

puntuaciones

con

la

misma

frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando

todas

las

puntuaciones

de

un

grupo

tienen

la

misma

frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Clculo de la moda para datos agrupados


1 Todos los intervalos tienen la misma amplitud.

Li-1 es el lmite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la modal.

en clase

fi-+1 modal.

es

la

frecuencia

absoluta

inmediatamente

posterior

la

clase

ai es la amplitud de la clase.

Tambin

se

utiliza

otra

frmula

de

la

moda

que

da

un

valor

aproximado de sta:

Ejemplo

Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

fi

[60, 5 63)

[63, 18 66)

[66, 42 69)

[69, 27 72)

[72, 8 75)

100

2 Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La

frmula

de

la

moda

aproximada

cuando

existen

distintas

amplitudes es:

Mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana

1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la
puntuacin central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie tiene un nmero par de puntuaciones la mediana es la


media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12Me= 9.5

Clculo de la mediana para datos agrupados

La

mediana

se

encuentra

en

el

intervalo

donde

la

frecuencia

acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Li-1 es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

fi

Fi

[60, 63)

[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

[72, 75)

100

100

100 / 2 = 50

Clase modal: [66, 69)

Media aritmtica
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.

es el smbolo de la media aritmtica.

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmtica para datos agrupados

Si

los

datos

vienen

agrupados

en

una

tabla

de

frecuencias,

la

expresin de la media es:

Ejercicio de media aritmtica

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media.

xi

fi

xi fi

[10, 20)

15

15

[20, 30)

25

200

[30,40)

35

10

350

[40, 50)

45

405

[50, 60

55

440

[60,70)

65

260

[70, 80)

75

150

42

1 820

Propiedades de la media aritmtica

1 La suma de las desviaciones de todas las puntuaciones de una


distribucin respecto a la media de la misma igual a cero.

Las suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:

8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 =

= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0

2 La media aritmtica de los cuadrados de las desviaciones de los


valores de la variable con respecto a un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.

3 Si a todos los valores de la variable se les suma un mismo nmero,


la media aritmtica queda aumentada en dicho nmero.

4 Si todos los valores de la variable se multiplican por un mismo


nmero la media aritmtica queda multiplicada por dicho nmero.

Observaciones sobre la media aritmtica

1 La media se puede hallar slo para variables cuantitativas. 2 La media es independiente de las amplitudes de los intervalos. 3 La media es muy sensible a las puntuaciones extremas. Si tenemos
una distribucin con los siguientes pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la distribucin.

4 La media no se puede calcular si hay un intervalo con una amplitud


indeterminada.

ESTADISTICA
Por: Dra. Luz M. Rivera

Qu es estadstica? Estadstica Descriptiva Estadstica inferencial Poblacin y muestra Elemento La media La mediana La moda

Por mucho tiempo, la palabra estadstica se refera a informacin numrica sobre los estados o territorios polticos. La palabra viene del latn statisticus que significa del estado. Las estadsticas como las conocemos hoy da tomaron en desarrollarse varios siglos y muchas mentes privilegiadas. John Graunt (1620-1674), un ingls que estudiaba los expedientes de los nacimientos y muertes descubri que nacan ms nios que nias, pero tambin encontr que por estar los hombres ms expuestos a accidentes ocupacionales , a enfermedades y la guerra, el nmero de hombres y mujeres en la edad de casarse era ms o menos la misma. Graunt fue el primero en publicar sobre el anlisis estadstico y su trabajo llev al desarrollo de las ciencias actuariales utilizadas por las compaas de seguros. Qu es estadstica? La estadstica es una coleccin de mtodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusin basada en esos datos. Es la ciencia encargada de recopilar,

organizar, analizar e interpretar informacin numrica o cualitativa, de manera que pueda llevar a conclusiones vlidas. La estadstica se puede definir como la ciencia que recopila, organiza, analiza e interpreta la informacin numrica o cualitativa, mejor conocida como datos, de manera que pueda llevar a conclusiones vlidas. La estadstica descriptiva es la ciencia que recopila , organiza e interpreta la informacin numrica cualitativa. Los peridicos, revistas, radio y televisin usan la estadstica descriptiva para informar y persuadirnos acerca de ciertas acciones a tomar y en la formacin de opiniones. La estadstica inferencial es la ciencia que interpreta informacin de manera que pueda llevar a conclusiones vlidas. Los gobiernos y las organizaciones utilizan la estadstica para tomar decisiones que afectan directamente nuestras vidas. Tarea: Contesta las siguientes preguntas: 1.Dnde en nuestras vidas encontramos las estadsticas? 2. Cmo me pueden afectar? 3. Cmo se utiliza la estadsticas en la industria? 4. Cmo se utiliza en el mercadeo de productos?

Qu es un elemento? Un elemento es cada unidad utilizada para un estudio estadstico. Por ejemplo,el conjunto de los datos 3, 5, 5, 3, 7, 2, 4, 1 contiene 8 elementos.

Una muestra es un subconjunto de una poblacin. Las muestras representativas de una poblacin son tiles ya que facilitan el manejo de los datos. Una muestra es representativa de la poblacin si al escogerla

cada elemento tiene la misma probabilidad de salir o de ser escogido.

Poblacin vs. Muestra Poblacin es la totalidad de los elementos del grupo particular que se estudia. Como por ejemplo, una empresa que est llevando a cabo un estudio a todos los 350 empleados de la empresa. Esto es poblacin ya que se estudiar cada elemento de la poblacin; en este caso la poblacin es todos los empleados de la empresa,sus 350 empleados. Muestra es una parte de la poblacin seleccionada de forma que puedan hacerse inferencias de ella con respecto a la poblacin completa. Por ejemplo, la empresa del ejemplo anterior escoger 100 empleados de los 350 para hacerles un estudio. Esto es una muestra ya que el total de empleados es 350, se escogi a 100 para hacerse inferencias del resto.

Medidas de Tendencia Central Las medidas de tendencia central son la media, la mediana y la moda.

La media es la suma de los valores de los elementos dividida por la cantidad de stos. Es conocida tambin como promedio, o media aritmtica. Frmula de la media: Media Poblacional = = X N

= sumatoria = media N = nmero de elementos X = valores o datos Esta frmula se lee:

mu es igual a la sumatoria de x dividido entre N


_

Media Muestral:

x =

x n

Ejemplo: Calcule la media de los siguientes nmeros: 10 , 11 , 12 , 12 , 13 1. Sumar las cantidades < 10 + 11 + 12 + 12 + 13 = 58> 2. Dividir la suma por la cantidad de elementos < 58/5> 3. El resultado es la media <11.6> Por lo tanto, la media de los 5 nmeros es 11.6. Note que la media resulta un nmero que est entre el rango de elementos; en este caso, 11.6 est entre 10,11,12 y 13.

La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan. Frmula de la mediana: Mediana = X[n/2 +1/2]
La parte de [n/2 + 1/2] representa la posicin.

Donde X es la posicin de los nmeros y n es el nmero de elementos. Ejemplo: Buscar la mediana de los siguientes nmeros: 2 4 1 3 5 6 3 Primero, hay que ordenarlos:

1 2 X1 X2

3 X3

3 X4

4 5 6 X5 X 6 X 7

( Las posiciones de los nmeros)

Mediana = X[7/2 + ] X[3.5 + .5] X4 < Se cambi el a .5> < La mediana est en la posicin 4>

Por lo tanto, la mediana es 3. Ejemplo: Buscar la mediana del ejemplo anterior de la media. Nmeros del ejemplo anterior: 10,12,13,12,11 1. Hay que ordenarlos, en este caso de forma ascendente; aunque tambin puede ser descendente. 10 , 11 , 12 , 12 , 13 2. Buscar el elemento intermedio. 10 , 11 , 12 , 12 , 13 El elemento del medio es 12. Por lo tanto, la mediana es 12. Nota: Si el nmero de elementos es impar, la mediana es el nmero del elemento intermedio. Si el nmero de elementos es par, se hace el cmputo mostrado en el ejemplo siguiente: Buscar la mediana de : 15 , 13 , 11 , 14 , 16 , 10 , 12 , 18

Como el nmero de elementos es par, hay que utilizar los dos nmeros intermedios. 10 , 11 , 12 , 13 , 14 , 15 , 16, 18 ( ordenados)

13 y 14 Ahora, para buscar la mediana: 1. Sumar ambos nmeros. <13 + 14 = 27> 2. Dividirlo entre 2. < 27/2 = 13.5> 3. El resultado es la mediana. < 13.5>

La moda es el valor que se presenta el mayor nmero de veces. Ejemplo 1: Buscar la moda de: 5 12 9 5 8 7 1

Como la moda es el nmero que ms se repite, la moda es 5. Ejemplo 2: Buscar la moda de: 14 16 18 16 15 12 14 14 16 18 20 16 16

El 14 se repite 3 veces. El 18 se repite 2 veces. El 16 se repite 5 veces. Por lo tanto, la moda es 16. Ejemplo 3: Buscar la moda de : 23 35 45 33 47 31 29 22

Como ningn nmero se repite, no tiene moda.

CUANTILES
Sabemos que la mediana divide a los datos en dos partes iguales, tambin tiene inters estudiar otros parmetros , llamados cuantiles, que dividen los datos de la distribucin en funcin de otras cantidades. Los ms importantes son los cuartiles, quintiles, deciles y percentiles. Cuartiles: son tres valores que divides la serie de datos en cuatro partes iguales. Se representan por Q1(cuartil primero), Q2 (cuartil segundo) y Q3 (cuartil tercero) Quintiles: son cuatro valores que dividen la serie de datos en cinco partes iguales: K1, K2, K3 y K4. Deciles: Son nueve valores que dividen la serie de datos en 10 partes iguales: D1, D2, ..., D9. Percentiles: son 99 valores que dividen la serie de datos en 100 partes iguales: P1, P2, ..., P99. Se puede observar una relacin grfica entre los cuantiles en el enlace: Relacin grfica entre los cuantiles.

Clculo de los cuantiles


Debido a que los cuantiles son parmetros del tipo de la mediana, su clculo se realiza de forma anloga. Algunas de las frmulas son las siguientes:

Observaciones a los cuantiles


1. Los cuantiles, en particular los deciles y percentiles, son parmetros estadsticos muy usados en Ciencias Sociales.

2. Algunos de ellos no estn cerca del centro de la distribucin, a pesar de ser considerados medidas de centralizacin por su analoga con la mediana. Tambin se les llama parmetros de posicin.
3. El cuartil primero coincide con el percentil de orden 25, y el cuartil tercero con el percentil de orden 75.

Clculo grfico de los cuantiles


El mtodo ms sencillo consiste en representar el polgono de frecuencias absolutas acumuladas, situando en el eje X los valores de la variable (si es discreta), o los intervalos (si es continua), y en el eje Y los porcentajes correspondientes. Para obtener el cuantil de que se trate, se traza una paralela al eje X por el punto correspondiente al cuantil, que corta al polgono de frecuencias en un punto; por ste se traza una paralela al eje Y, que corta al eje X en el punto buscado.Se puede observar un grfico representativo en el siguiente enlace: Clculo grfico de los cuantiles.

DISTRIBUCIONES UNIDIMENSIONALES. CLCULO DE PARMETROS

MEDIDAS DE CENTRALIZACIN
Los datos dados en las tablas estadsticas o en las representaciones grficas hay que simplificarlos mediante unos valores numricos llamados parmetros. A algunos de ellos

tambin se les llama medidas de centralizacin porque tienden a situarse, en general, en el centro del conjunto de datos ordenados. Sinnimos: medidas de tendencia central y promedios. Las ms importantes son: de tamao, media aritmtica; de frecuencia, moda, y de posicin: mediana, cuartiles, deciles y percentiles.

MEDIA ARITMTICA
Definicin: media aritmtica de una variable estadstica (v.e.) es la suma de todos los valores de dicha variable dividida entre el nmero total de valores. Se representa por . Clculo: Si X es una v.e. que toma los valores absolutas frmula: con frecuencias

respectivamente, la media aritmtica se calcula con la

Si los datos son simples (no se repiten) entonces Si la variable X es continua, o discreta con muchos datos agrupados en clases se toman como valores las marcas de cada clase.

Observaciones a la media aritmtica:


1.Es la medida de centralizacin que ms se utiliza. 2.Ventajas: tiene en cuenta todos los datos, y es muy sencillo su clculo. 3.Inconveniente: si hay valores extremos, raros y poco significativos, producen una distorsin en el valor de la media alterando su significado matemtico. 4.No siempre se puede calcular: en el caso de que los datos sean cualitativos, o cuando estn agrupados en clases estando alguna abierta (Ej.:..., Mayores de 60 aos.) En estos casos se utilizan la moda y la mediana.

MODA
Definicin: Moda de una v.e. es el valor de la variable que presenta mayor frecuencia absoluta. Se representa por M0. Puede no ser nica, en caso de que haya 2, 3, etc. valores con mayor frecuencia igual se dice que la distribucin es bimodal, trimodal, etc.

Clculo de la moda
Variable discreta: se mira en la tabla en la columna de las frecuencias absolutas, el valor de la variable que la tiene mayor es la moda. Variable continua: primero hay que determinar la clase modal como en el caso de la variable discreta. El valor del intervalo que se presume tiene mayor frecuencia no se conoce, se podra tomar la marca de clase de la clase modal, o bien con mayor exactitud habr que aplicar la frmula:

Li = lmite inferior de la clase modal C = amplitud de los intervalos. D1= diferencia entre la frec. abs. de la clase modal y la frec. abs. de la clase anterior. D2= diferencia entre la frec. abs. de la clase modal y la frec. abs. de la clase siguiente.

Clculo de la moda por el mtodo grfico

Este mtodo se utiliza para las distribuciones cuyos datos estn agrupados en intervalos. El resultado siempre ser aproximado. Primero se representa el histograma de frecuencias absolutas (mejor en papel milimetrado) A continuacin se unen, con lneas de puntos, los extremos de la clase modal con las contiguas. La moda M0 es la abcisa del punto de corte.

Se puede observar la grfica correspondiente en el siguiente enlace: Clculo de la moda por el mtodo grfico.

Observaciones a la moda
i.Hay distribuciones que no tienen moda, esto sucede cuando las frecuencias de todos los datos son iguales. ii. La moda es menos representativa que la media aritmtica, pero a veces es ms til, como en el caso de datos cualitativos. iii. En la moda no intervienen todos los datos. iv. Aunque se considera una medida de centralizacin algunas veces no est en la zona central. v. La moda representa el valor dominante, en las elecciones la moda es el partido ms votado.

MEDIANA
Definicin: mediana de una v.e. es un valor de la variable, tal que el nmero de observaciones menores que l es igual al nmero de observaciones mayores que l.. Se representa por M.

Clculo de la mediana

Variable estadstica discreta. Datos simples

Se ordenan los datos de menor a mayor, la mediana es el valor central.


o

Si el nmero de datos es impar, el valor central de la variable es nico.

Si el nmero de datos es par no existe trmino central, y por ello se dice que hay dos medianas: los dos valores centrales. Aunque se acostumbra a tomar como mediana la semisuma de los dos valores centrales.

Variable estadstica discreta. Datos agrupados Se ordenan los datos como si fueran simples y se elige el valor central. Como esto es muy laborioso se hace normalmente de otra forma.

Se calculan las frecuencias absolutas acumuladas Fi, la mediana es el primer valor de la variable cuya frecuencia absoluta acumulada excede a la mitad del nmero total de datos. Si la mitad del nmero de datos coincide con la Fi de un valor, la mediana es la semisuma de ese valor y el siguiente

xi 3 6 7 8 9

fi 15 20 15 40 10 100

Fi 15 35

90>50 100

Como la mitad del nmero de datos es 50 y la Fi de 7 coincide con 50 la mediana viene dada por la semisuma de 7 y el valor siguiente, 8.

Por tanto,

Variable estadstica continua Se procede de forma anloga al caso anterior y se determina cul es la clase mediana, pero para obtener el valor concreto aplicamos la frmula:

Li= lmite inferior de la clase mediana. c= amplitud del intervalo. N= nmero total de datos. Fi-1 =frecuencia absoluta acumulada de la clase anterior a la clase mediana. Fi= frecuencia absoluta de la clase mediana.

Observaciones a la mediana
1. Es muy til en los siguientes casos: a)Cuando entre los datos existe alguno muy extremo que afecta a la media. b)Cando los datos estn agrupados en clases y alguna de ellas es abierta. 2. El 50% de los datos son menores o iguales a ella, y el 50% restante son mayores o iguales. 3. Es el primer parmetro de centralizacin que depende del orden de los datos y no de su valor. 4. Geomtricamente, y para distribuciones que se pueden representar mediante un histograma de frecuencias, la mediana es un valor de la variable, tal que la vertical levantada sobre el mismo divide al histograma en dos partes de igual rea.

RELACIN ENTRE MEDIA, MODA Y MEDIANA


Si al construir el polgono de frecuencias se observa que la distribucin es simtrica o ligeramente asimtrica es posible comprobar experimentalmente la siguiente relacin:

Media Moda = 3 (Media Mediana) Gracias a esta relacin se puede obtener, con un cierto error, alguno de estos parmetros en funcin de los otros dos si la distribucin es como se ha dicho. En el siguinte enlace se puede observar tres distribuciones estadsticas, en las que se situan los parmetros de centralizacin: Tipos de sesgos.

MEDIDAS DE DISPERSIN
A veces, el estudio de una distribucin queda incompleto si slo se estudian las medidas de centralizacin, siendo imprescindible saber si los datos numricos estn agrupados o no alrededor de los valores centrales. A esto es a lo que se le llama dispersin, y a los parmetros que miden estas desviaciones respecto a la media medidas de dispersin o parmetros de dispersin. Las ms importantes son: el recorrido, la varianza y la desviacin tpica.

RANGO O RECORRIDO
Definicin: se llama recorrido de una distribucin a la diferencia entre el mayor y el menor valor de la variable estadstica.

Clculo del recorrido


Es muy sencillo aplicando la definicin, consiste en ordenar los valores de menor a mayor y restar al ltimo el primero.

Observaciones al recorrido
1.<![endif]>Cuanto menor es el recorrido mayor es el grado de representatividad de los valores centrales. 2.<![endif]>Cuanto mayor es, la distribucin est menos concentrada o ms dispersa. 3.<![endif]>Tiene la gran ventaja de su sencillez de clculo. 4.<![endif]>Tiene gran aplicacin en procesos de control de calidad,

5.<![endif]>Tiene el inconveniente de que slo depende de los valores extremos. De esta forma basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado. 6.Para paliar este inconveniente a veces se utilizan otros dos rangos:

Rango intercuartlico: Q = Q3 Q1 Rango entre percentiles: P = P90 P10

Estos rangos son algo ms estables, ya que tienden a eliminar aquellos valores extremadamente alejados.

LOS DIAGRAMAS DE CAJAS Y BIGOTES


Los diagramas de cajas y bigotes tambin llamados boxplots o box and whiskers son representaciones grficas de una distribucin estadstica unidimensional en las que se reflejan cinco parmetros: lmite inferior, primer cuartil, mediana, tercer cuartil y lmite superior. A partir de estos cinco parmetros se pueden obtener fcilmente otros dos: el rango y el rango intercuartlico. Adems, tambin dan una medida de la simetra o asimetra de la distribucin, del sesgo y de la dispersin. Se observa que: 1. El bigote de la izquierda es algo ms corto que el de la derecha, lo que indica que las calificaciones de la cuarta parte ms baja de la clase estn algo ms concentradas que las calificaciones de la cuarta parte que las tienen ms altas. 2. Tambin se observa que la parte izquierda de la caja, que corresponde a los alumnos que han obtenido calificaciones entre el 25% y el 50% es menor que la de la derecha, lo que indica que las calificaciones de estos ltimos alumnos estn ms dispersas. 3. Es fcil ver que el rango es: Ls - Li = 9 3 = 6 Y el rango intercuartlico es: Q3 - Q1=6,5 4,5 = 2 Tambin se observa que la distribucin es asimtrica y ligeramente sesgada hacia la derecha. Podemos observar un ejemplo de diagrama de bigotes en el enlace: Diagrama de cajas y bigotes.

DESVIACIONES RESPECTO A LA MEDIA


Definicin: Se llaman desviaciones respecto a la media a las diferencias entre cada valor de la variable y la media aritmtica. Se representan por di y son iguales a:

Observaciones a las desviaciones respecto a la media

1. Las diferencias di dan una idea de la proximidad del valor de xi respecto a la media. 2. Pueden ser positivas, negativas o nulas. 3. La suma de las desviaciones respecto ala media siempre vale 0. Por tanto, no podemos usar esta suma para medir la dispersin. Para evitarlo, se recurre a dos procedimientos: a)Utilizar el valor absoluto de las desviaciones respecto a la media, lo que dar lugar a la desviacin media. b)Utilizar el cuadrado de las desviaciones respecto a la media, lo que dar lugar a la varianza.

DESVIACIN MEDIA
Definicin: Se llama desviacin media a la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Clculo de la desviacin media: Sea X una v.e. que toma los valores frecuencias absolutas por la expresin: con

respectivamente. La desviacin media viene dada

O bien:

Cuanto mayor es la desviacin media ms dispersos o menos concentrados estn los datos.

VARIANZA Y DESVIACIN TPICA


Definicin: Se llama varianza de una variable estadstica a la media aritmtica de los cuadrados de las desviaciones respecto de la media. Se representa por s2 o Var(x) o .

Definicin: Se llama desviacin tpica de una v.e. a la raz cuadrada positiva de la varianza. Se representa por s o .

Clculo de la varianza y de la desviacin tpica


Sea X una v.e. que toma los valores con frecuencias absolutas respectivamente. La varianza viene dada por la siguiente expresin:

O bien, utilizando sumatorias:

A veces no es un nmero entero, entonces las desviaciones (xi - ) suelen ser nmeros decimales. Las operaciones de elevar al cuadrado cada una de las desviaciones y multiplicarlas por las frecuencias respectivas pueden resultar sumamente laboriosas; por ello se utiliza otra expresin equivalente a la anterior en la que se evitan estos clculos:

Como consecuencia de la definicin de varianza, la definicin tpica viene dada por las siguientes expresiones:

Observaciones a la varianza
1. Tanto la varianza como la desviacin tpica dependen de todos los valores de la distribucin, as como de la media. 2. En los casos en los que no sea posible calcular la media aritmtica, no ser posible tampoco obtener la varianza y la desviacin tpica, por ser funciones de la media. 3. La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos, debido a que las desviaciones estn elevadas al cuadrado. Si los datos fueran en metros, la varianza vendra dada en metros cuadrados. En cambio, la desviacin tpica s viene expresada en las mismas unidades que los datos, de ah que resulte ms interesante que la varianza. UTILIZACIN CONJUNTA DE Ys

La media aritmtica, , de un conjunto de datos se encuentra, aproximadamente, hacia el centro de la distribucin. La desviacin tpica s nos informa sobre la dispersin de los datos respecto a la media. Utilizando ambos parmetros conjuntamente podemos obtener resultados muy importantes sobre la distribucin. As, por ejemplo, en las distribuciones unimodales, simtricas o ligeramente asimtricas se demuestra que: 1 En el intervalo ( - s, + s) se encuentra el 68% de los datos. + 2s) se encuentra el 95% de los datos.

2 En el intervalo ( - 2s,

3 En el intervalo (

- 3s,

+ 3s) se encuentra el 99% de los datos.

Estos resultados son consecuencia de lo que estadstica matemtica se conoce con el nombre de desigualdad de Tchebicheff. Se puede observar un grfico bastante repredentativo en el enlace:Utilizacin conjunta de media y desviacin tipica.

COMPARACIN DE PUNTUACIONES. PUNTUACIONES TPICAS


Consideremos el siguiente ejemplo. Un alumno ha contestado a dos test, obteniendo las siguientes puntuaciones: TEST A: 50 puntos. TEST B: 32 puntos. El grupo de alumnos que ha contestado a cada uno de los test tiene las siguientes medias y desviaciones tpicas:

Para el TEST A: Para el TEST B:

y y

En cul de los dos test ha obtenido, comparativa-mente con el grupo, mejor resultado el alumno?
Para poder contestar a esta pregunta tendremos que comparar las puntuaciones del alumno con las del grupo; para ello restamos a cada una de las puntuaciones del alumno la media del grupo y dividimos entre la desviacin tpica, obteniendo:

TEST A:

TEST B:

As pues, si bien la puntuacin directa del test A ha sido mayor que la obtenida en el B, comparativamente con el grupo es mucho mayor la puntuacin obtenida en el test B que en el A. De ah que se haga totalmente imprescindible definir estas puntuaciones comparadas. Definicin: Sea X una v.e. que toma los valores llamados puntuaciones

directas; y sean y s, respectivamente, la media y la desviacin tpica de dicha variable. Se llama puntuaciones tpicas de la variable X a los siguientes valores

Observaciones a las puntuaciones tpicas


1. Son muy utilizadas en las ciencias sociales. 2. Su media aritmtica es 0. 3. Su desviacin tpica es 1. 4. Se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones. No hay que confundir puntuacin tpica, que la obtiene cada individuo, con desviacin tpica que se refiere a todo el grupo.

Seccin : Distribucin emprica Previo : Representaciones grficas Siguiente : Modelos probabilistas

Cuantiles

La funcin cuantil de una ley de probabilidad es la inversa (generalizada) de su funcin de distribucin. Si denota la funcin de distribucin, la funcin cuantil corresponder: es la funcin que a hace

La funcin cuantil emprica de una muestra es la funcin cuantil de su distribucin emprica. Definicin 2.4 Sean una muestra y el vector de sus estadgrafos de orden. La funcin cuantil emprica de la muestra es la funcin intervalo . que , para todo , vale en el

Para algunos valores de cuantiles .

, damos nombres particulares a los

Mediana
,

Cuartiles Deciles Centiles

La mediana es el valor central de la muestra: hay tantos valores inferiores a ella como valores superiores a ella. Si la distribucin emprica de la muestra es poco disimtrica, como por ejemplo para una muestra simulada a partir de una ley uniforme o normal, la media y la mediana estn cercanas. Si la muestra es asimtrica, con una distribucin muy dispersa hacia la derecha, la mediana podr ser mucho ms pequea que la media. A diferencia de la media, la mediana no es sensible a los valores aberrantes. Ella satisface una propiedad de optimalidad con respecto a la desviacin absoluta media. Proposicin 2.5 Sea una muestra donde los son reales. Sea (desviacin absoluta) la funcin que a un nmero asocia:

Esta funcin alcanza un mnimo absoluto para (la mediana). Al valor de este mnimo se le denomina desviacin absoluta media. Demostracin: Para evitar complicar las notaciones, supondremos que los valores son todos diferentes. El grfico de la funcin

est formado por segmentos de rectas. Sobre el intervalo ella vale:

La pendiente positiva (para nico mnimo. Si

es primero negativa (para

), y despus

). Si es impar la mediana es el es par, el mnimo se alcanza en todo el intervalo y en el cual la pendiente se anula.

, que contiene a

Hay algo arbitrario en la definicin de la funcin cuantil para una distribucin emprica: para todos los puntos del intervalo funcin de distribucin vale que nos hacen seleccionar a , la

. Son sobre todo razones tericas las en lugar de otro punto como valor de

. Puede ser una seleccin bastante mala en la prctica. Consideremos la muestra siguiente, de tamao .

La mediana, tal y como la hemos definido, vale . Sin embargo como valor central se impone claramente el punto medio del intervalo es decir . En el caso de las muestras de tamao par, el intervalo , se llama intervalo mediano. A veces la mediana se define como el punto medio del intervalo mediano. ,

Este problema se presenta en el caso de muestras pequeas y para los cuantiles en los cuales es de la forma (ms frecuente la mediana). Nosotros no lo tomaremos en cuenta y conservaremos la definicin 2.4. An en muestras muy grandes, los cuantiles son poco complicados de calcular, pues es suficiente ordenar la muestra en orden creciente para calcular sus estadgrafos de orden y por tanto a la vez obtener todos los cuantiles. Ellos nos proveen una visualizacin fcil de la distribucin emprica. Hemos visto que la mediana es un valor central. Para medir la dispersin, podemos calcular el recorrido, que es la diferencia entre el mayor y el menor valor. Pero este recorrido refleja ms los valores extremos que la localizacin de la mayor parte de los valores. Comprendemos mejor la dispersin de una muestra por los intervalos inter-cuartiles e inter-deciles. Definicin 2.6 Llamamos intervalo inter-cuartiles al intervalo , el cual contiene la mitad central de los valores de la muestra. Llamamos intervalo inter-deciles al intervalo el cual contiene de los valores de la muestra. ,

Estos intervalos forman la base de una representacin muy compacta de la distribucin emprica: el diagrama en caja (o caja y bigotes, box plot, box-and-whisker plot). No existe una definicin general de esta representacin. Ella consiste en una caja rectangular cuyos dos extremos son los cuartiles. Estos extremos se prolongan por trazos que terminan con segmentos ortogonales (los bigotes). La longitud de estos segmentos vara segn el autor. Nosotros proponemos fijarlos en los deciles extremos. Representamos tambin la mediana por un trazo en la caja y a veces se representan tambin los valores extremos de la muestra. (ver la figura 8).

Grfico 8: Diagrama en caja.</FORM< CAPTION>

Grfico 9: Estaturas de nios de 6 aos. La zona sombreada corresponde a el intervalo inter-cuartiles. La mediana est en trazo continuo, los deciles en punteado. y

Medidas de posicin para datos agrupados y no agrupados: cuartiles, deciles y percentiles

1. 2. 3. 4. 5. 6. 7.

Cuantiles Cuartiles Deciles Centiles o percentiles Ejemplo Bibliografa

1. Las Medidas de Posicin, tambin conocidas como Otras Medidas de Dispersin, son otras medidas o mtodos que resultan ser ms prcticos para precisar ciertas situaciones en las que se busca describir la variacin o dispersin en un conjunto de datos.
2. 3. INTRODUCCIN CUANTILES

Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales. Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes. Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles, cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensin de la mediana. Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):
u 0.5 0.25, 0.75 0.1, ... , 0.99 0.01, ..., 0.99 Q(u) Mediana Cuartiles Deciles Centiles

CUARTILES Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3 Donde: Lk = Lmite real inferior de la clase del cuartil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:

El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones. Frmula de Q1, para series de Datos agrupados:

Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase

El segundo cuartil Q2, (coincide, es idntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores. Frmula de Q2, para series de Datos agrupados:

Donde:

L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones. Frmula de Q3, para series de Datos agrupados:

Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil. Para Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: - El primer cuartil: Cuando n es par:

Cuando n es impar:

Para el tercer cuartil

Cuando n es par:

Cuando n es impar:

DECILES Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico. Datos Agrupados Para datos agrupados los deciles se calculan mediante la frmula.

k= 1,2,3,... 9 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra frmula para calcular los deciles:

El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones.

El quinto decil corresponde a la mediana.

El noveno decil supera al 90% y es superado por el 10% restante.

Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:

Cuando n es par:

Cuando n es impar: Siendo A el nmero del decil. CENTILES O PERCENTILES Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99. Datos Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:

k= 1,2,3,... 99 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k

Otra forma para calcular los percentiles es:

Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.

El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: Para los percentiles, cuando n es par:

Cuando n es impar: Siendo A, el nmero del percentil. Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. 3. EJEMPLO Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa

(I. De Clases) Empleados (f1) 200-299 300-299 85 90 85 175

400-499 500-599 600-699 700-800

120 70 62 36

295 365 427 463

Como son datos agrupados, se utiliza la frmula

Siendo,

La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30. Entonces,

El primer cuartil: 115.5 85 = 30.75 Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posicin: 324.1 295 = 29.1 Li = 500, fi = 70

El percentil 30 Posicin:

138.9 85 = 53.9 fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los empleados.

Yyyyyyyyyyyyyyyyyyyyy
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Clculo de los cuartiles

1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresin
.

Nmero impar de datos

2, 5, 3, 6, 7, 4, 9

Nmero par de datos

2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En

primer

lugar

buscamos

la

clase

donde

se

encuentra

, en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase.

Ejercicio de cuartiles

Calcular los cuartiles de la distribucin de la tabla:

fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

Вам также может понравиться