Вы находитесь на странице: 1из 5

TEMA 3: ESTADSTICA DESCRIPTIVA: MEDIDAS DESCRIPTIVAS. 1.

-MEDIDAS DE TENDENCIA CENTRAL

Datos no Agrupados 1.1.-Media Aritmtica La media aritmtica de un conjunto de observaciones es una medida de tendencia central conocida como promedio. Es la suma de todos los valores que toma la variable en estudio dividido por el nmero total de observaciones en la muestra. Ejemplo.- Los siguientes datos corresponden al registro de pesos de pollos (gr.) de seis semanas de vida en un establecimiento. 150 152 154 155 155 157 157 157 157 160 x1 x2 .......................................... xn = 10 Propiedades

La suma algebraica de los desvos de cada observacin, respecto de la media, considerando los signos, es cero. La suma de los desvos cuadrticos de cada observacin respecto de su media es un mnimo. Es un valor tpico o representativo porque su valor puede utilizarse para estimar una cantidad total en la poblacin. Cantidad Total =

Dado que todos los valores entran en el clculo de la media, sta se ve afectada por valores extremos. 1.2.-Mediana La mediana de un conjunto de observaciones ordenadas por su magnitud, es un valor de la variable que divide al conjunto en dos subconjuntos iguales, de forma tal que el nmero de valores mayores o iguales a la mediana es igual al nmero de valores menores o iguales a sta. Mediana de orden (Me0) = (n + 1) / 2, Indica la posicin en la serie ordenada de datos.

Nmero par de datos: promedio de los valores centrales de la serie ordenada.

152 154 155 155 157 157 157 157 160 Me0 = 5,5 Me = (155 +157) / 2 = 156 gr.

Nmero impar de datos: valor que est justo en el centro de la serie ordenada. 150 151 152 154 155 155 157 157 157 157 160 Me0 = 6 Me = 155 gr. Propiedades

Su valor est afectado por el nmero de observaciones, pero no por los valores que adopta la variable. 1.3.-Modo El modo de un conjunto de observaciones es el valor de la variable que se presenta con mayor frecuencia.

150 152 154 155 155 157 157 157 157 160 Mo = 157 gr Propiedades

Su valor no est afectado por valores extremos. Es la nica medida de posicin que puede ser usada para caracterizar datos cualitativos. 1.4.- Cuantiles Son medidas de posicin no central, tales que, segn el nmero de subconjuntos en que se divide la serie ordenada de datos, se denominan cuartiles, deciles o percentiles. 1.4.1.- Cuartiles Los cuartiles de una serie de datos ordenados, son los valores de la variable que dividen al conjunto en cuatro subconjuntos que contienen la misma cantidad de datos. Q1= valor de la variable correspondiente a la (n + 1) / 4 observacin ordenada. Q2 = valor de la variable correspondiente a la 2(n + 1) / 4 observacin ordenada. Corresponde a la mediana. Q3= valor de la variable correspondiente a la 3(n + 1) / 4 observacin ordenada.

Reglas a) Si el valor de la posicin es un nmero entero (Q0= 3) el valor del cuartil es la observacin que coincide con dicha posicin. b) Si el valor de la posicin no es un nmero entero, tenemos: b1 ) El valor de posicin est en la mitad de dos de ellos (Q0= 3.5), entonces, el valor del cuartil es el promedio de los observaciones correspondientes a las posiciones X3 y X4. b2 ) El valor de posicin se obtiene por redondeo al punto de posicin entero ms cercano (Q0= 3.25 pasa a Q0= 3), y en esa posicin, estar la observacin correspondiente al respectivo cuartil. x3 x6 x9 150 151 152 154 155 155 157 157 157 157 160 Q1 Q2 Q3 1.4.- Rango Medio Es el promedio de los valores mximos y mnimos de la variable. (Xmax + Xmin)/2 1.5.- Amplitud semiintercualtil Es el promedio de los valores del primer y tercer cuartil. (Q3 + Q1)/2 1.-MEDIDAS DE POSICIN

Datos Agrupados Media Aritmtica Ejemplo.- la siguiente corresponde a la distribucin de frecuencias del nmero de horas de sueos de 49 pacientes post-ciruga, como resultado de la administracin de cierto anestsico. Intervalos mi Frecuencias fi Frecuencias Fi

3-5 5-7 7-9 9 - 11 11 - 13 13 - 15 15 - 17 Intervalo Modal Intervalo Mediano

4 6 8 10 12 14 16

22 6 8 5 4 3 1

22 28 36 41 45 48 49

Diagrama de Caja y Sesgo (Box and Whisker Plot)

Diagrama que muestra estadsticos resumen para la distribucin. Dibuja Mediana, Percentil 25 (primer cuartil), el percentil 75 (tercer cuartil) y valores extremos o muy extremos. Mediana Limite superior (Q3) && LEI LI LS LES Limite inferior (Q1)

La longitud de la caja representa el Rango o Amplitud intercuartil (Q3 - Q1). El 50% de las observaciones (ordenadas por su magnitud) se encuentran dentro de la caja. El box plot incluye o representa dos categoras de datos: Valores extremos (alejados o outliers). (&) Valores muy extremos (muy alejados). () Cules son? Limite inferior (LI): [Q1 - 1,5 (Q3 - Q1)] Limite superior (LS): [Q3 + 1,5 (Q3 - Q1)] Limite extremo inferior (LEI): [Q1 - 3 (Q3 - Q1)] Limite extremo superior (LES): [Q3 + 3 (Q3 - Q1)]

Valores Extremos(&): se encuentran entre 1.5 y 3 veces la amplitud intercuartil a ambos lados de la caja. Valores muy extremos (): se encuentran por encima de 3 veces la amplitud intercuartil a ambos lados de la caja. Los Whiskers o Patillas (extremos de las lneas verticales o sesgos): muestran los mayores y menores valores que no son valores extremos.

Cmo podemos interpretar nuestros datos a partir del box plot?


o o

Ubicacin de la media en la caja: No est en el centro de la caja entonces la distribucin presenta asimetra. La mediana se localiza cerca del extremo inferior, distribucin asimtrica positiva, con una cola (sesgo) alargado a la derecha. La mediana se localiza cerca del extremo superior, distribucin asimtrica negativa, con una cola (sesgo) alargado a la izquierda. Esta en el centro de la caja entonces la distribucin es simtrica (o aproximadamente simtrica). Longitud de la caja: se puede observar la amplitud (50% central de los datos) o variabilidad de las observaciones. Los box plot resultan tiles para compara varios grupos y sus distribuciones. MEDIDAS DE DISPERSIN La dispersin de un conjunto de observaciones se refiere a la magnitud de la variabilidad que presentan las mismas. Ejemplo Grupo 1 = 150 152 154 155 155 157 157 157 157 160 Grupo 2 = 148 152 154 155 155 157 157 157 157 162 Grupo 3 = 140 148 150 155 155 158 160 162 162 164 Rango - Amplitud Se denomina amplitud a la medida de variabilidad que surge de la diferencia entre el valor mximo y mnimo del conjunto de datos.

o o

Depende de los valores extremos Su uso es slo satisfactorio para un conjunto pequeo de datos. R= Xmax. - Xmn G.1 media = 155,4 gr rango = 10 gr. G.2 media = 155,4 gr rango = 14 gr. G.3 media = 155,4 gr rango = 24 gr. Amplitud intercuatil Se denomina amplitud intercuartil a la diferencia entre los valores del tercer y primer cuartil. Amplitud intercuartil = Q 3 - Q 1 Ejemplo: x3 x6 x9 150 151 152 154 155 155 157 157 157 157 160 Q1 Q2 Q3 Amplitud intercuartil = 157 - 152 = 5 gr. Variancia y Desvo Estndar 3.-MEDIDAS DE FORMA

Propiedad de los datos que tiene en cuenta la forma de distribucin de los mismos. Puede ser simtrica o asimtrica negativa o positiva.
o o

Posicin de la media con respecto a la mediana. Media > Mediana = asimtrica positiva o con sesgo a la derecha. Media " Mediana = simtrica o con sesgo cero. Media < Mediana = asimtrica negativa o con sesgo a la izquierda. Coeficiente Pearsoniano. Valores Positivos significan una distribucin asimtrica positiva o con sesgo a la derecha. Valores aproximados a cero significan una distribucin simtrica o con sesgo cero. Valores Negativos significan una distribucin asimtrica negativa o con sesgo a la izquierda. 4.-MEDIDAS DE AGUDEZA Propiedad de forma de las distribuciones simtricas. K " 0 Platicurtica. K " 0.263 Mesocurtica. K " 0.5 Leptocurtica.