Академический Документы
Профессиональный Документы
Культура Документы
resumen
Estadsticos de
Son valores de la variable que dividen a la muestra en
Posicin
partes de igual porcentaje. Los percentiles separan la
muestra en grupos de 1% cada uno (son 99).
Cuartiles: agrupan 25% cada uno (son 3)
Quintiles: agrupan 20% cada uno (son 4)
Deciles: agrupan 10% cada uno (son 9)
Los Percentiles
Son los valores que dividen en 100 partes iguales a un
conjunto de datos.
Los Percentiles
En datos no agrupados:
Primero se ordenan de menor a mayor los n datos.
Clculo: A
n*k
Donde 100
A = posicin para ubicar el percentil
n = tamao de la muestra
k = percentil a ubicar
P25: A= 12 x 25 /100 = 3
Aqu, resulta un entero, por tanto el P25 corresponde
al promedio de las observaciones en las posiciones 3 y 4,
es decir, P25= (5+8)/2 = 6.5
n*k F
100
i -1
P L a
k i fi
Donde:
k es el porcentaje hasta donde se desea acumular, Li
es el lmite inferior de la clase del percentil, Fi-1 es la
frecuencia acumulada anterior a esta clase y fi la
frecuencia absoluta.
Ejemplo:
75 % 25 %
P75
Menor Mayor
Experiencia Experiencia
K = 75
n * k 334 * 75
Lugar del P75 250,5 (de los nmeros ordenados)
100 100
334 * 75 248
100 P 16.2 aos
P 16 3
75 40 75
Rango = Mximo
Mnimo.
Rango:
Proporciona una primera informacin de la variabilidad
de la distribucin, pero es insuficiente ya que si la
variable toma un valor muy alto o muy bajo en relacin
con el resto, puede inducir a engao, esta es una
medida de dispersin que viene expresada en la misma
unidad que la variable.
n 2
Xi X S S2
S i 1
n 1
Se define como la raz cuadrada de la varianza. Junto
con este valor, la desviacin tpica es una medida
(cuadrtica) que informa de la media de distancias que
tienen los datos respecto de su media aritmtica,
expresada en las mismas unidades que la variable.
Ejemplo
El gerente de una empresa de alimentos desea saber
que tanto varan los pesos de los empaques (en
gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para
pesarlos. Los productos tienen los siguientes pesos
(490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
490 500 510 515 520 2535
x 507
5 5
la desviacin estndar sera
S
490 507 2 500 507 2 510 507 2 515 507 2 520 507 2
5 1
580
S 145 12.04
4
Con lo que concluiramos que el peso promedio de los
empaques es de 507 gramos, con una tendencia a
variar por debajo o por encima de dicho peso en 12
gramos. Esta informacin le permite al gerente
determinar cuanto es el promedio de perdidas causado
por el exceso de peso en los empaques y le da las bases
para tomar los correctivos necesarios en el proceso de
empacado.
Varianza
En datos sin tabular:
Si x1, x2, , xn denota una muestra con n
observaciones, la varianza se denota por:
n 2
Xi X
S i 1
2
n 1
La Varianza muestral, denotada por S2, tiene el
problema que utiliza las unidades de los valores de la
variable elevados al cuadrado, lo que hace que su
interpretacin sea difcil. Para evitar este problema se
utiliza la desviacin estndar.
A menudo se prefiere la desviacin estndar en relacin con la
varianza, porque se expresa en las mismas unidades fsicas de
las observaciones.
Si los datos estn agrupados: n 2
Xi X fi
i 1 i-sima, fi
Donde Xi es la marca de clase deS 2la categora
la frecuencia absoluta de la i-sima clase ny k1 es el
nmero de categoras.
Propiedades de la
1. La varianza es mnima cuando se calcula con respecto
a varianza y
la media, sin importar lacualquier otro valor de la
distribucin que se tome.
2.desviacin
La varianza no puede ser negativa por ser una suma de
cuadrados. Puede darse el caso en el que sea igual a cero,
en este caso, todas las desviaciones son iguales a cero, lo
que significa que todos los valores obtenidos son iguales
entre si, e iguales a la media aritmtica.
3. La desviacin tpica y la varianza no varia si a todos los
valores de la variable X se les suma una constate.
4. Si se multiplican todos los valores de la variable X por
una constante B, la desviacin tpica queda multiplicada
por esa constante B y la varianza por el cuadrado de la
constante.
Rango entre Cuartiles
La diferencia entre el tercer cuartil y el primer
cuartil se llama rango entre cuartiles, denotado
por RQ=Q3-Q1. El rango entre cuartiles mide la
variabilidad de la mitad central de los datos.