Академический Документы
Профессиональный Документы
Культура Документы
DEFINICION:
Despus de haber ordenado y descrito un conjunto de datos, an el anlisis resulta
todava un tanto incompleto; es necesario entonces resumir la informacin y facilitar
as su anlisis e interpretacin utilizando ciertos indicadores.
CLASIFICACIN:
Las medidas de resumen ms importantes se clasifican en tres grupos:
- Medidas de tendencia central: Media, mediana, moda
- Medidas de posicin: Deciles, cuartiles, percentiles
- Medidas de dispersin: Desviacin standard, varianza, coeficiente de variacin
a) Para datos no agrupados: Se obtiene sumando los valores de todos los datos y
dividiendo esta suma entre el nmero total de datos. La frmula es:
n
S Xi
i=1
X = -----------
n
n
S nh.xh
--- h=1
X = ------------------
nh
Ejemplos
La media tiene como ventajas cuando los datos estn distribuidos normal o
simtricamente, es de gran estabilidad porque toma en cuenta todos los datos y nos
permite estimar y probar parmetros en inferencias.
Sin embargo, tambin tiene algunas desventajas como que al incluir todos los datos,
puede ser afectado por valores extremos, por ello no es recomendable calcular la
media en datos agrupados que tienen clases abiertas en los extremos.
pMd = Nh
2
Donde:
LMdi = Lmite real inferior (por redondeo) de la clase que contiene la mediana
IMd = Tamao del intervalo de la clase Mediana.
La mediana no est afectada por valores extremos, es til cuando los datos agrupados
tienen clases abiertas en los extremos. Se aplica tambin a variables de la escala
ordinal.
M
PCj = jn + 2 = E + f
M
CUARTILES Q 1, 2, 3 4
DECILES D 1, 2, 3,....8, 9 10
pCj = jNh
M
Donde:
LCji = Lmite real inferior (por redondeo) de la clase que contiene el cuantil j
ICj = Tamao del intervalo de la clase cuantil j
N (Cj-1) = Nmero de datos acumulado hasta la clase anterior a la clase cuantil j
NCj = Nmero de datos de la clase cuantil j.
2.3. MEDIDAS DE DISPERSION: Son aquellas que miden cunto se alejan de la
media cada uno de los valores de la variable.
Ejemplos
b) Para datos agrupados:
S2 = I2 [N nh dh2 - ( nh dh)2]
N2
CV = S x 100
X .
Parmetro estadstico
En Estadstica se trata de una funcin definida sobre valores numricos de una
poblacin, como la media aritmtica, una proporcin o su desviacin tpica.
Los parmetros estadsticos son una consecuencia inevitable del propsito esencial de
la estadstica: modelizar la realidad
El estudio de una gran cantidad de datos individuales de una poblacin puede ser
farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita
tener una idea global de la poblacin, compararla con otras, comprobar su ajuste a un
modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en
definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los
parmetros estadsticos.
Muestra estadstica
En estadstica una muestra estadstica (tambin llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacin
estadstica.
Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda
la poblacin porque el manejo de un menor nmero de datos provoca tambin menos
errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra
son los sujetos realmente estudiados.
Poblacin estadstica
En Estadstica la poblacin, tambin llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las observaciones.
Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores) es de:
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada. Si X1,X2,...,Xn es un conjunto de datos o media muestral y w1,w2,...,wn son
nmeros reales positivos, llamados "pesos" o factores de ponderacin, se define la
media ponderada relativa a esos pesos como:
Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34 (seis
valores) es de: (342745552234)
1/6
= 1,699,493,4001/6 34.545.
Media armnica
Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:
Generalizaciones de la media
Media generalizada
Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se
definen y agrupan a travs de la siguiente expresin:
- mximo,
- media cuadrtica,
- media aritmtica,
- media geomtrica,
- media armnica,
- mnimo.
Media-f generalizada
Esta media puede generalizarse para una funcin montona como la media-f
generalizada:
- media aritmtica,
- media armnica,
- media generalizada,
- media geomtrica.
Para una funcin continua f sobre un intervalo [a,b], se puede calcular el valor medio
de funcin f sobre [a,b] como:
De hecho la definicin anterior vale an para una funcin acotada aunque no sea
continua.
Media estadstica
Media muestral
Desviacin estndar
La desviacin estndar o desviacin tpica () es una medida de centralizacin o
dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en
la estadstica descriptiva.
Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin
tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los
datos respecto de su media aritmtica, expresada en las mismas unidades que la
variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que
representan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad
a la hora de describirlos e interpretarlos para la toma de decisiones.
Formulacin