Академический Документы
Профессиональный Документы
Культура Документы
30 – 39 7 0.14 34.5 7 45
líneas de la distribución de 40
40 – 49 12 0.24 44.5 19
frecuencias acumuladas
0.36
35
50 – 59 18 54.5 37
30
– 69
60 9 0.18 64.5 46 25
70 – 79 3 0.06 74.5 49 20
15
80 - 89 1 0.02 84.5 50 10
total n=50 1 5
0
29 39 49 59 69 79 89
IIB.- MEDIDAS ESTADÍSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersión de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor único que nos indica el punto medio o típico de los datos
que cabe esperar.
MEDIDA DATOS SIMPLES DATOS AGRUPADOS. (Distribuciones de frecuencias)
ó NO AGRUPADOS EXCEL NO TIENE FUNCIONES PARA OBTENER
MEDIDAS ESTADÍSTICAS CON DATOS
AGRUPADOS
MEDIA ARITMÉTICA
Es el más comúnmente usado. También llamado
Media de la muestra x
x i
mi = punto medio de la clase
fi = frecuencia de clase
promedio o simplemente media.
n n = # elementos en el conjunto
x = media muestral x i =valor de cada observación m f
media poblacional i i
n =# elementos en el conjunto x
n
x i
Media de la población
N
EXCEL: =PROMEDIO()
MEDIANA Md 1. Ordene los datos de manera ascendente Aproxime su valor mediante el gráfico de ojiva
Es el valor intermedio cuando los valores de los 2. Calcule un índice i n
i
datos se ordenan en forma ascendente. 2
3. a) si i no es entero: El valor entero inmediato
se prefiere sobre la media cuando hay valores mayor que i indica la posición de la mediana
extremos (muy altos o muy bajos) en el conjunto de b) Si i sí es entero, la mediana es el promedio de
datos. los valores de los datos ubicados en los lugares
i e i 1
EXCEL: =MEDIANA()
MODA Mo Se determina por inspección (buscamos el valor
Es el valor de los datos que se presenta con más que más se presenta en el conjunto) Cuando los datos están agrupados, debemos suponer
frecuencia. Cuando hay dos o más modas en un EXCEL: =MODA() que la moda se halla en la clase que tenga más
conjunto, los datos son llamados bimodales o multi- elementos, llamada Clase Modal.
modales. También puede ser que no haya moda.
MEDIDAS DE DISPERSION. Se usa el término dispersión para describir el grado en que una serie de valores varía respecto a su media. Los valores incluidos en un
conjunto de datos usualmente varían en magnitud; algunos valores son pequeños y algunos son grandes. La variación de los valores es llamada Dispersión, y hay varios
criterios para medirla:
Una medida de dispersión es importante en dos modos:
1. Puede ser usada para mostrar el grado de variación de los valores en los datos
2. Puede ser usada para suplementar un promedio: si la dispersión es alta, el promedio no es significativo; si la dispersión es baja, el promedio se vuelve
altamente significativo.
RANGO R valor máximo-valor mínimo R=(l.r.s. última clase)- (l.r.i. primera clase)
Es La amplitud del intervalo en que están contenidos
todos los datos observados.
VARIANZA varianza muestral varianza muestral
Es una medida de la dispersión que emplea todos los 2 2
xi x fi mi x
datos para su cálculo. Es el promedio de las
s
2 s
2
desviaciones de los datos respecto a su media elevadas n 1 n 1
al cuadrado. Se mide en el cuadrado de las unidades EXCEL: =VAR()
originales.
s2= variancia muestral. varianza poblacional varianza poblacional
2= variancia poblacional.
x fi m
2 2
2
i
2 i
N N
EXCEL: =VARP()
DESVIACIÓN ESTANDAR desviación estándar muestral desviación estándar muestral
fi m x
Dispersión promedio de los datos alrededor de la 2 2
xi x i
media aritmética, se mide con las mismas unidades s s 2 s s2
que las de los datos originales. n 1 n 1
Es la raíz cuadrada positiva de la varianza. n – 1 = grados de libertad. desviación estándar poblacional
fi m
2
EXCEL: =DESVEST()
desviación estándar poblacional 2 i
N
x
2
i
2
N
EXCEL: =DESVESTP()
APLICACIONES DE LA DESVIACIÓN ESTÁNDAR
La desviación estándar nos permite determinar, con cierto grado de precisión, donde se sitúan los valores de una distribución en relación con la media. Cuando los
valores de una serie de datos están concentrados cerca de su media, la desviación estándar es pequeña.
REGLA EMPÍRICA:
Para datos con distribución en forma de campana, se puede aplicar la regla empírica para determinar el porcentaje de elementos que debe estar dentro de
determinada cantidad de desviaciones estándar respecto al promedio.
Aproximadamente 68.27% de los elementos están a menos de una desviación estándar de la media.
Aproximadamente 95.45% de los elementos están a menos de dos desviaciones estándar de la media.
Casi todos los elementos (99.73%) están a menos de tres desviaciones estándar de la media.
Podemos medir con mayor precisión la proporción de elementos que caen dentro de intervalos específicos si estos están distribuidos normalmente, es decir, si la
gráfica de la distribución es simétrica con forma de campana, Md Mo
Distribución normal estándar
xi x
donde z ;
s
se considera que cualquier elemento con valor z fuera del intervalo de 3 es un
valor atípico.
III.- REGRESIÓN LINEAL Y CORRELACIÓN.
REGRESIÓN LINEAL SIMPLE:
Nos interesa saber si dos variables cuantitativas x e y están asociadas, qué tan fuertemente lo están y como se asocian.
Datos: un muestra de n pares ordenados x, y
x valor observado de la variable predictora o independiente
y valor observado de la variable a predecir o dependiente
yˆ valor de la variable dependiente, estimado mediante la ecuación de la línea de regresión,
e y yˆ residuo o error
MÉTODO DE MÍNIMOS CUADRADOS PARA ESTIMAR LA LÍNEA DEL MEJOR AJUSTE Mediante excel:
xy n x y =pendiente(conocido_y,conocido_x)
b = pendiente o inclinación de la recta b
x2 n x
2
r
xy n x y
xy 2 2
2
x n x y 2 n y
2 =coeficiente.r2(conocido_y,conocido_x)
COEFICIENTE DE DETERMINACIÓN: r : corresponde al cuadrado del
coeficiente de correlación; multiplicado por 100,
Interpretación: nos informa qué porcentaje del valor de Y, está explicado por la
ecuación de regresión.
IV. PROBABILIDAD
0 certeza no ocurrencia
Probabilidad de ocurrencia del evento A: # resultados favorables
p A
# resultados posibles 1 certeza
de ocurrencia
Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se llama
punto muestral. Un subconjunto de uno o más resultados del espacio muestral se llama evento.
TECNICAS DE CONTEO: Para determinar el número de formas en que ocurre un experimento o un evento, usando fórmulas o procedimientos
sistemáticos.
1. Diagrama de árbol: Dispositivo gráfico útil para visualizar un experimento de varias etapas y enumerar los resultados posibles..
2. Técnica de conteo de etapas múltiples: n1 n 2 nk
3. Permutaciones: Una permutación es cualquier arreglo u ordenación de todos o una parte de n elementos
n!
Permutaciones de r elementos tomados de n elementos elegibles: n Pr , rn =permutaciones(número, tamaño)
n r!
4. Combinaciones: Una combinación es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los elementos
n!
carece de importancia. El número de combinaciones es: nCr =combinat(número, tamaño)
r!n r!
Métodos más comunes para asignar probabilidades:
Probabilidad clásica Todos los resultados del experimento son N Número de resultados asociados con Ei
pE i E i
probables
igualmente N Número de resultados posibles
Probabilidad empírica o de Se analiza como ha ocurrido el n E i número de veces que ocurre el evento Ei
pE i
frecuencia relativa experimento en el pasado para calcular n Número de ensayos u observaciones
probabilidades
Probabilidad subjetiva o de Es una evaluación personal de la probabilidad de que ocurra un evento
juicio
Reglas o requerimientos básicos para la asignación de probabilidades
1. 0 pEi 1 2.- pEi 1 3.- pE1 E2 pE1 pE2
Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros eventos o
clasificaciones.
# resultados favorables f
pA
# resultados posibles n
Ley aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A ó B (ó ambos):
p A B p A p B , cuando A y B son mutuamente excluyentes.
p A
B p A pB p A B , cuando A y B no son mutuamente excluyentes.
Probabilidad Condicional : la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A,
pA B
pB A ;
pA
Si A y B son independientes, pB A pB, o también pA B pA pB
DISTRIBUCIONES
DISCRETAS DE PROBABILIDAD
DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos n ensayos, cada uno de los cuales tiene dos resultados posibles, éxito o
fracaso, y los resultados de los ensayos son independientes.
Probabilidad de x éxitos: Parámetros: n p
p xéxitos n C x p q
x n x
DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el número de veces que ocurre un fenómeno durante un intervalo dado
o en una región específica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias: Parámetro:
x
e Media aritmética: Desviación estándar
f x
x!
=poisson(x,media)
El área total bajo la curva es 1.00, por lo cual las áreas bajo la curva y dentro de dos límites corresponden a la probabilidad de que
la variable tenga valor dentro de ésos límites. La tabla muestra las áreas bajo la curva normal a la izquierda de un valor Z, donde
(Z es la forma estandarizada o tipificada de la variable aleatoria x).
x
z x z
=distr.norm.estand(Z) para obtener el área bajo la curva, a la izquierda de Z