Вы находитесь на странице: 1из 13

ESTADGRAFOS

DEFINICION:
Despus de haber ordenado y descrito un conjunto de datos, an el anlisis resulta
todava un tanto incompleto; es necesario entonces resumir la informacin y facilitar
as su anlisis e interpretacin utilizando ciertos indicadores.

A estos indicadores se les denomina tambin ESTADIGRAFOS o MEDIDAS DE


RESUMEN, permiten hallar un valor numrico, el mismo que representa a toda la
poblacin o muestra en estudio.

CLASIFICACIN:
Las medidas de resumen ms importantes se clasifican en tres grupos:
- Medidas de tendencia central: Media, mediana, moda
- Medidas de posicin: Deciles, cuartiles, percentiles
- Medidas de dispersin: Desviacin standard, varianza, coeficiente de variacin

MEDIDAS DE TENDENCIA CENTRAL: Son los valores numricos que indican el


"centro" de un conjunto de datos, describen a todo el conjunto sealando una
caracterstica que destaca. Los estadgrafos de tendencia central ms importantes
son:

MEDIA ARITMETICA O PROMEDIO ARITMTICO: Es el punto de equilibrio de una


serie de datos, el valor que tendran todos los datos de no existir diferencias entre
ellos.

a) Para datos no agrupados: Se obtiene sumando los valores de todos los datos y
dividiendo esta suma entre el nmero total de datos. La frmula es:
n
S Xi
i=1
X = -----------
n

b) Para datos agrupados: La media se obtiene sumando el producto que se obtiene


del valor medio del intervalo de clase por la frecuencia de esa clase y dividiendo esta
suma entre el nmero total de datos. El valor medio del intervalo de clase se obtiene
sumando el lmite inferior ms el lmite superior de la clase y dividiendo esta suma
entre dos. La frmula es:

n
S nh.xh
--- h=1
X = ------------------
nh

Ejemplos
La media tiene como ventajas cuando los datos estn distribuidos normal o
simtricamente, es de gran estabilidad porque toma en cuenta todos los datos y nos
permite estimar y probar parmetros en inferencias.

Sin embargo, tambin tiene algunas desventajas como que al incluir todos los datos,
puede ser afectado por valores extremos, por ello no es recomendable calcular la
media en datos agrupados que tienen clases abiertas en los extremos.

B. MEDIANA: Es un valor numrico de posicin central, que nos determina que el 50


% de las observaciones sea menor o igual que l y el otro 50 % sea mayor o igual. Para
obtenerlo se deben seguir los siguientes pasos:

a) Para datos no agrupados:

A. Ordenar los datos de menor a mayor.

B. Determinar la posicin con:

pMd = n+1 = E + f (Entero + fraccin)


2

C. Calcular el valor de la mediana con:

vMd = xE + fD donde D = (xE+1 - xE)

b) Para datos agrupados:

A. Obtener Nh (nmero de datos acumulado)

B. Determinar la posicin de la mediana (y marcar la clase que la contiene), con:

pMd = Nh
2

C. Calcular el valor de la mediana con:


Ejemplos

vMd = LMdi + IMd (Nh/2) - N(Md-1)


nMd

Donde:

LMdi = Lmite real inferior (por redondeo) de la clase que contiene la mediana
IMd = Tamao del intervalo de la clase Mediana.

N(Md-1) = Nmero de datos acumulado hasta la clase anterior a la clase mediana

nMd = Nmero de datos de la clase mediana.

La mediana no est afectada por valores extremos, es til cuando los datos agrupados
tienen clases abiertas en los extremos. Se aplica tambin a variables de la escala
ordinal.

C. MODA: Es el valor que ms se repite, , en una distribucin de frecuencias, es el


valor de ms alta frecuencia. Si hay dos o ms valores con esta caracterstica, se dice
entonces que el conjunto de datos es bi. o multimodal. Si la cantidad de elementos
que se repiten es mayor que n/2, entonces se afirma que no hay moda.

a) Para datos no agrupados: La moda es el valor ms frecuente o el que ms se


repite.

b) Para datos agrupados:

A. La posicin de la moda est en la clase de frecuencia mxima, a ella se le


denomina clase moda.
PMo = nmx

B. El valor de la moda se calcula con:

VMo = LMoi + IMo 1


1 + 2
Ejemplos
Donde:

LMoi = Lmite real inferior (por redondeo) de la clase moda


IMo = Tamao del intervalo de la clase moda
1 = nMo - n (Mo-1)
2 = nMo - n (Mo+1)
NMo = Valor de la clase moda
N (Mo-1) = Valor de la clase anterior a la clase moda
N (Mo+1) = Valor de la clase posterior a la clase moda.

2.2. MEDIDAS DE POSICION RELATIVA: Llamados tambin CUANTILES, son


aquellos valores de las variables que dividen una distribucin de frecuencias o serie de
nmeros en 4, 10 100 partes iguales, tomando la denominacin de QUARTILES,
DECILES PERCENTILES. Determinan la dispersin alrededor de la mediana. Se
obtienen de la siguiente manera:
a) Para datos no agrupados:
A. Ordenar los datos de menor a mayor.

B. Encontrar la posicin con:

M
PCj = jn + 2 = E + f
M

Donde M = nmero de partes en que se divide la distribucin

C. Calcular el valor con:

VCj = xE + fD donde D = (xE+1 - xE)

MEDIDA SIMBOLO POSICION PARTES


------------------------------------------------------------------------------
CUANTILES C j M

CUARTILES Q 1, 2, 3 4

DECILES D 1, 2, 3,....8, 9 10

PERCENTILES P 1, 2, 3,...98, 99 100


-----------------------------------------------------------------------------
Ejemplos
b) Para datos agrupados: Se realizan los siguientes pasos:
A. Obtener Nh (nmero de datos acumulado)

B. Determinar la posicin del cuantil j (y marcar la clase que lo contiene), con:

pCj = jNh
M

C. Calcular el valor del cuantil con:

vCj = LCji + ICj (jNh/M) - N(Cj-1)


nCj

Donde:
LCji = Lmite real inferior (por redondeo) de la clase que contiene el cuantil j
ICj = Tamao del intervalo de la clase cuantil j
N (Cj-1) = Nmero de datos acumulado hasta la clase anterior a la clase cuantil j
NCj = Nmero de datos de la clase cuantil j.
2.3. MEDIDAS DE DISPERSION: Son aquellas que miden cunto se alejan de la
media cada uno de los valores de la variable.

A. VARIANZA: Es el promedio de la suma de las desviaciones al cuadrado con


respecto a la media. Sirve para comparar dos o ms distribuciones. Se obtiene de la
siguiente manera:

a) Para datos no agrupados:


n
S (X i - x) 2
i=1
S=
2
n

Ejemplos
b) Para datos agrupados:

S2 = I2 [N nh dh2 - ( nh dh)2]
N2

B. DESVIACION STANDARD: Es igual a la raz cuadrada de la varianza, tiene


algunos principios que mencionamos:

a) A mayor dispersin alrededor de la media, mayor valor de la desviacin standard.

b) Las desviaciones extremas con respecto a la media, pesan mucho para


determinar el valor de la desviacin standard.

c) Para distribuciones normales:


El 68,97 % de las observaciones est en X 1 S
El 95,45 % de las observaciones est en X 2 S
El 99,73 % de las observaciones est en X 3 S

C. COEFICIENTE DE VARIACIN: Mide la homogeneidad de una muestra.

CV = S x 100
X .

Se da en porcentaje, el resultado es la heterogeneidad de la poblacin; el resto de 100


% es la homogeneidad

Parmetro estadstico
En Estadstica se trata de una funcin definida sobre valores numricos de una
poblacin, como la media aritmtica, una proporcin o su desviacin tpica.

En estadstica se llama parmetro estadstico, medida estadstica o parmetro


poblacional a un valor representativo de una poblacin, como la media aritmtica, la
proporcin de individuos que presentan determinada caracterstica, o la desviacin
tpica.

Un parmetro es un nmero que resume la ingente cantidad de datos que pueden


derivarse del estudio de una variable estadstica. El clculo de este nmero est bien
definido, usualmente mediante una frmula aritmtica obtenida a partir de datos de
la poblacin.

Los parmetros estadsticos son una consecuencia inevitable del propsito esencial de
la estadstica: modelizar la realidad

El estudio de una gran cantidad de datos individuales de una poblacin puede ser
farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita
tener una idea global de la poblacin, compararla con otras, comprobar su ajuste a un
modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en
definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los
parmetros estadsticos.

Por ejemplo, suele ofrecerse como resumen de la "juventud" de una poblacin la


media aritmtica de las edades de sus miembros, esto es, la suma de todas ellas,
dividida por el total de individuos que componen tal poblacin.

Varianza o Desviacin Cuadrtica Media: Es otro estadgrafo de dispersin


bsico en adelante para la obtencin de la desviacin tpica o estndar.

Desviacin Tpica o Estndar: Es otro estadgrafo de dispersin, que expresa en


forma ms real los resultados de la varianza, ya que como vimos sta da la dispersin
de las unidades al cuadrado, mientras que la desviacin tpica lo hace en las unidades
originales de la investigacin. La desviacin tpica se obtiene extrayndole la raz
cuadrada a la varianza.

Estadgrafo: es la medida que en Estadstica se aplica sobre una muestra. En


general se utilizan dos tipos: Los de Tendencia Central y los de Dispersin. Entre los
primeros tenemos: a) las medidas denominadas promedios, sea aquellas que tratan
de localizarse hacia el centro de la serie; moda, media y mediana; y b) los cuartiles y
deciles, o cuartas y dcimas partes de las observaciones; esto slo se aplican en los
datos agrupados. Entre los de Dispersin estn: la desviacin media, la desviacin
mediana, la varianza, la desviacin tpica o estndar, la dispersin absoluta y relativa

Muestra estadstica
En estadstica una muestra estadstica (tambin llamada muestra aleatoria o
simplemente muestra) es un subconjunto de casos o individuos de una poblacin
estadstica.

Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la


poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta
caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de
muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio
exhaustivo con mayor rapidez y menor coste (vanse las ventajas de la eleccin de una
muestra, ms abajo).

Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda
la poblacin porque el manejo de un menor nmero de datos provoca tambin menos
errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra
son los sujetos realmente estudiados.

El nmero de sujetos que componen la muestra suele ser inferior que el de la


poblacin, pero suficiente para que la estimacin de los parmetros determinados
tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es
preciso recurrir a su clculo.

Poblacin estadstica
En Estadstica la poblacin, tambin llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las observaciones.

En epidemiologa una poblacin es un conjunto de sujetos o individuos con


determinadas caractersticas demogrficas, de la que se obtiene la muestra o
participantes en un estudio epidemiolgico a la que se quiere extrapolar los resultados
de dicho estudio (inferencia estadstica).

El nmero de elementos o sujetos que componen una poblacin estadstica es igual o


mayor que el nmero de elementos que se obtienen de ella en una muestra (n).

Existen distintos tipos de poblaciones que son:

Poblacin base: es el grupo de personas designadas por las siguientes


caractersticas: personales, geogrficas o temporales, que son elegibles para
participar en el estudio.
Poblacin muestreada: es la poblacin base con criterios de viabilidad o
posibilidad de realizarse el muestreo.
Muestra estudiada: es el grupo de sujetos en el que se recogen los datos y se
realizan las observaciones, siendo realmente un subgrupo de la poblacin
muestreada y accesible. El nmero de muestras que se puede obtener de una
poblacin es una o mayor de una.
Poblacin diana: es el grupo de personas a la que va proyectado dicho estudio,
la clasificacin caracterstica de los mismos, lo cual lo hace modelo de estudio
para el proyecto establecido.
Media (Estadstica)
En matemticas y estadstica una media o promedio es una medida de tendencia
central que segn la Real Academia Espaola (2001) [] resulta al efectuar una serie
determinada de operaciones con un conjunto de nmeros y que, en determinadas
condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos
de medias, tales como la media geomtrica, la media ponderada y la media armnica
aunque en el lenguaje comn, el trmino se refiere generalmente a la media
aritmtica.

Ejemplos de medias: Media aritmtica

La media aritmtica es un promedio estndar que a menudo se denomina "promedio".

La media se confunde a veces con la mediana o moda. La media aritmtica es el


promedio de un conjunto de valores, o su distribucin; sin embargo, para las
distribuciones con sesgo, la media no es necesariamente el mismo valor que la
mediana o que la moda. La media o moda son elementos intuitivos de medir los datos.
Es a veces una forma de medir el sesgo de una distribucin tal y como se puede hacer
en las distribuciones exponencial y de Poisson.

Por ejemplo, la media aritmtica de 34, 27, 45, 55, 22, 34 (seis valores) es de:

Media aritmtica ponderada

A veces puede ser til otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada. Si X1,X2,...,Xn es un conjunto de datos o media muestral y w1,w2,...,wn son
nmeros reales positivos, llamados "pesos" o factores de ponderacin, se define la
media ponderada relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala,


de las variables, es decir si X es una variable aleatoria e Y es otra variable aleatoria que
depende linealmente de X, es decir, Y = aX + b (donde a representa la magnitud del
cambio de escala y b la del cambio de origen) se tiene que:
Media geomtrica

La media geomtrica es un promedio muy til en conjuntos de nmeros que son


interpretados en orden de su producto, no de su suma (tal y como ocurre con la media
aritmtica). Por ejemplo, las velocidades de crecimiento.

Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34 (seis
valores) es de: (342745552234)
1/6
= 1,699,493,4001/6 34.545.

Media armnica

La media armnica es un promedio muy til en conjuntos de nmeros que se definen


en relacin con alguna unidad, por ejemplo la velocidad (distancia por unidad de
tiempo).

Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:

Generalizaciones de la media

Existen diversas generalizaciones de las medias anteriores.

Media generalizada

Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se
definen y agrupan a travs de la siguiente expresin:

Eligiendo un valor apropiado del parmetro m, se tiene:

- mximo,
- media cuadrtica,
- media aritmtica,
- media geomtrica,
- media armnica,
- mnimo.

Media-f generalizada

Esta media puede generalizarse para una funcin montona como la media-f
generalizada:

Y una forma posible de de invertir f nos dar

- media aritmtica,

- media armnica,
- media generalizada,
- media geomtrica.

Media de una funcin

Para una funcin continua f sobre un intervalo [a,b], se puede calcular el valor medio
de funcin f sobre [a,b] como:

De hecho la definicin anterior vale an para una funcin acotada aunque no sea
continua.

Media estadstica

La media estadstica se usa en estadstica para dos conceptos diferentes aunque


numricamente similares:

La media muestral, que es un estadstico que se calcula a partir de la media


aritmtica de un conjunto de valores de una variable aleatoria.
La media poblacional, valor esperado o esperanza matemtica de una variable
aleatoria.

En la prctica dada una muestra estadstica suficientemente grande el valor de la


media muestral de la misma es numricamente muy cercano a la esperanza
matemtica de la variable aleatoria medida en esa muestra. Dicho valor esperado,
slo es calculable si se conoce con toda exactitud la distribucin de probabilidad, cosa
que raramente sucede en la realidad, por esa razn, a efectos prcticos la llamada
media se refiere normalmente a la media muestral.

Media muestral

La media resume en un valor las caractersticas de una variable teniendo en cuenta a


todos los casos. Solamente puede utilizarse con variables cuantitativas Media
muestral: Si se tiene una muestra estadstica de valores (X1,X2,...,Xn) de valores para
una variable aleatoria X con distribucin de probabilidad F(x,) [donde es un
conjunto de parmetros de la distribucin] se define la media muestral n-sima como:

Desviacin estndar
La desviacin estndar o desviacin tpica () es una medida de centralizacin o
dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en
la estadstica descriptiva.

Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin
tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los
datos respecto de su media aritmtica, expresada en las mismas unidades que la
variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que
representan los datos en su distribucin respecto de la media aritmtica de dicha
distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad
a la hora de describirlos e interpretarlos para la toma de decisiones.

Formulacin

La varianza representa la media aritmtica de las desviaciones con respecto a la media


que son elevadas al cuadrado.

Si atendemos a la coleccin completa de datos (la poblacin en su totalidad)


obtenemos la varianza poblacional; y si por el contrario prestamos atencin slo a una
muestra de la poblacin, obtenemos en su lugar la varianza muestral. Las expresiones
de estas medidas son las que aparecen a continuacin.

Expresin de la varianza muestral:


Expresin de la cuasi varianza muestral (estimador insesgado de la varianza
poblacional):

Expresin de la varianza poblacional:

Expresin de la desviacin estndar poblacional:

El trmino desviacin estndar fue incorporado a la estadstica por Karl Pearson en


1894.

Por la formulacin de la varianza podemos pasar a obtener la desviacin estndar,


tomando la raz cuadrada positiva de la varianza. As, si efectuamos la raz de la
varianza muestral, obtenemos la desviacin tpica muestral; y si por el contrario,
efectuamos la raz sobre la varianza poblacional, obtendremos la desviacin tpica
poblacional.

Desviaciones estndar en una distribucin normal.

Expresin de la desviacin estndar muestral:

Tambin puede ser tomada como


Con a como y s como

Вам также может понравиться