Вы находитесь на странице: 1из 5

FORMULARIO

II.- ESTADISTICA DESCRIPTIVA Y MEDIDAS ESTADÍSTICAS


IIA.- DISTRIBUCIONES DE FRECUENCIAS: Muestra el número (frecuencia) de elementos correspondientes a cada una de varias clases que no se traslapan.
Datos cualitativos Telenovela Noticieros;
s; 6 1 Deportivos
clase o frecuencia frecuencia relativa frecuencia ; 10
categoría absoluta f i f porcentual
fr  i f %  fr  100
n
Noticieros 1 0.0333 3.33%
Deportivos 10 0.3333 33.33%
Culturales  5 0.1667

16.67%
Comedias 8  0.2667 26.67%
Comedias;
Telenovelas 6 0.2000 20.00% 8 Culturales;
total n=30 1.00 100% 5

gráfica: barras pastel

Datos cuantitativos Gráficas:


Construcción distribución de frecuencias histograma: grafico de barras de
1.- Determinar el rango = dato mayor – dato menor ancho proporcional al tamaño de
2.- determinar # clases  1  3.3  logn →redondear a entero clase y altura proporcional a la
frecuencia.
2.- Determinar rango →redondear según la precisión de los datos polígono de frecuencias:
W
# clases gráfico de líneas.
4.- formar las clases usando como li de la primera clase un número menor o
igual que el dato menor.
Clase fi fr mi fa
Li a Ls
ojiva menor que: gráfico de 50

30 – 39 7 0.14 34.5 7 45
líneas de la distribución de 40
40 – 49 12 0.24 44.5 19
frecuencias acumuladas
0.36 
35
50 – 59 18 54.5 37
 30

– 69
60 9 0.18 64.5 46 25

70 – 79 3 0.06 74.5 49 20
15
80 - 89 1 0.02 84.5 50 10
total n=50 1 5
0
29 39 49 59 69 79 89

Algunas formas características de distribución:

uniforme sesgada hacia la normal o forma de


derecha o positivamente campana
asimétrica

IIB.- MEDIDAS ESTADÍSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersión de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor único que nos indica el punto medio o típico de los datos
que cabe esperar.
MEDIDA DATOS SIMPLES DATOS AGRUPADOS. (Distribuciones de frecuencias)
ó NO AGRUPADOS EXCEL NO TIENE FUNCIONES PARA OBTENER
MEDIDAS ESTADÍSTICAS CON DATOS
AGRUPADOS
MEDIA ARITMÉTICA
Es el más comúnmente usado. También llamado
Media de la muestra x
x i
mi = punto medio de la clase
fi = frecuencia de clase
promedio o simplemente media.
n n = # elementos en el conjunto
x = media muestral x i =valor de cada observación m  f
  media poblacional  i i
n =# elementos en el conjunto x
 n

x i

Media de la población
N
  EXCEL: =PROMEDIO()

MEDIANA Md 1. Ordene los datos de manera ascendente Aproxime su valor mediante el gráfico de ojiva
Es el valor intermedio cuando los valores de los 2. Calcule un índice i n
i
datos se ordenan en forma ascendente.  2
3. a) si i no es entero: El valor entero inmediato
se prefiere sobre la media cuando hay valores mayor que i indica la posición de la mediana
extremos (muy altos o muy bajos) en el conjunto de b) Si i sí es entero, la mediana es el promedio de
datos. los valores de los datos ubicados en los lugares
i e i 1
EXCEL: =MEDIANA()
MODA Mo Se determina por inspección (buscamos el valor
Es el valor de los datos que se presenta con más que más se presenta en el conjunto) Cuando los datos están agrupados, debemos suponer
frecuencia. Cuando hay dos o más modas en un EXCEL: =MODA() que la moda se halla en la clase que tenga más
conjunto, los datos son llamados bimodales o multi- elementos, llamada Clase Modal.
modales. También puede ser que no haya moda.

MEDIDAS DE DISPERSION. Se usa el término dispersión para describir el grado en que una serie de valores varía respecto a su media. Los valores incluidos en un
conjunto de datos usualmente varían en magnitud; algunos valores son pequeños y algunos son grandes. La variación de los valores es llamada Dispersión, y hay varios
criterios para medirla:
Una medida de dispersión es importante en dos modos:
1. Puede ser usada para mostrar el grado de variación de los valores en los datos
2. Puede ser usada para suplementar un promedio: si la dispersión es alta, el promedio no es significativo; si la dispersión es baja, el promedio se vuelve
altamente significativo.
RANGO R  valor máximo-valor mínimo R=(l.r.s. última clase)- (l.r.i. primera clase)
Es La amplitud del intervalo en que están contenidos
todos los datos observados.
VARIANZA varianza muestral varianza muestral

    
Es una medida de la dispersión que emplea todos los 2 2
xi  x fi  mi  x
datos para su cálculo. Es el promedio de las
s 
2 s 
2
desviaciones de los datos respecto a su media elevadas n 1 n 1
al cuadrado. Se mide en el cuadrado de las unidades EXCEL: =VAR()
originales.
s2= variancia muestral. varianza poblacional varianza poblacional
2= variancia poblacional.
x    fi  m  
2 2

2 
i
2  i

N N
EXCEL: =VARP()
DESVIACIÓN ESTANDAR desviación estándar muestral desviación estándar muestral

   fi  m  x
Dispersión promedio de los datos alrededor de la 2 2
xi  x i
media aritmética, se mide con las mismas unidades  s s  2 s  s2 
que las de los datos originales. n 1 n 1
Es la raíz cuadrada positiva de la varianza. n – 1 = grados de libertad. desviación estándar poblacional
 fi  m  
2
EXCEL: =DESVEST()
desviación estándar poblacional   2  i

N
 x  
2
i
   2

N
EXCEL: =DESVESTP()

MEDIDAS DE POSICIÓN Ó DE LOCALIZACIÓN.


 Percentiles: limitan centésimas partes de losdatos: P1 a P99.
 Cuartiles: limitan cuartas partes de los datos: Q1, Q2, Q3
Nota: la mediana corresponde a Q2, a P50.
PERCENTILES. El p-ésimo percentil es un valor tal que Cálculo del p-ésimo percentil Aproxime su valor mediante el gráfico de ojiva
por lo menos p porciento de las observaciones son 1. Ordene los datos de manera ascendente
menores o iguales que p y (100 – p) porciento de las 2. Calcule un índice i  p 
observaciones son mayores o iguales que p. i   n
100 
en donde p es el percentil de interés.
3. a) si i no es entero, se redondea. El valor entero
inmediato mayor que i indica la posición del
p-ésimo  percentil
b) Si i sí es entero, el p-ésimo percentil es el
promedio de los valores de los datos ubicados
en los lugaresi e i 1
EXCEL: =PERCENTIL(MATRIZ,K)
CUARTILES Localización Q1 : i = 14 n Aproxime su valor mediante el gráfico de ojiva
Valores que dividen los datos en cuatro partes:
Q1= primer cuartil, Localización Q2 : i = 24 n
Localización Q3 : i = 34 n
Q2= segundo cuartil,
Q3= tercer cuartil.
 EXCEL: =CUARTIL(MATRIZ,CUARTIL)
COEFICIENTE DE VARIACIÓN CV desviación estandar desviación estandar
Es una medida de dispersión relativa.  C.V .  media aritmética 100 C.V .  100
media aritmética
Para comparar la dispersión de variables que tienen
distintas desviaciones estándar y distintos promedios.  Indica lo grande que es la desviación
estándar en comparación con la media.

 
APLICACIONES DE LA DESVIACIÓN ESTÁNDAR
La desviación estándar nos permite determinar, con cierto grado de precisión, donde se sitúan los valores de una distribución en relación con la media. Cuando los
valores de una serie de datos están concentrados cerca de su media, la desviación estándar es pequeña.

REGLA EMPÍRICA:
Para datos con distribución en forma de campana, se puede aplicar la regla empírica para determinar el porcentaje de elementos que debe estar dentro de
determinada cantidad de desviaciones estándar respecto al promedio.
 Aproximadamente 68.27% de los elementos están a menos de una desviación estándar de la media.
 Aproximadamente 95.45% de los elementos están a menos de dos desviaciones estándar de la media.
 Casi todos los elementos (99.73%) están a menos de tres desviaciones estándar de la media.
Podemos medir con mayor precisión la proporción de elementos que caen dentro de intervalos específicos si estos están distribuidos normalmente, es decir, si la
gráfica de la distribución es simétrica con forma de campana,   Md  Mo
Distribución normal estándar

xi  x
donde z  ;
s
se considera que cualquier elemento con valor z fuera del intervalo de 3 es un
valor atípico.


III.- REGRESIÓN LINEAL Y CORRELACIÓN.
REGRESIÓN LINEAL SIMPLE:
Nos interesa saber si dos variables cuantitativas x e y están asociadas, qué tan fuertemente lo están y como se asocian.
Datos: un muestra de n pares ordenados x, y 
x  valor observado de la variable predictora o independiente
y  valor observado de la variable a predecir o dependiente
yˆ  valor de la variable dependiente, estimado mediante la ecuación de la línea de regresión,
e   y  yˆ   residuo o error
MÉTODO DE MÍNIMOS CUADRADOS PARA ESTIMAR LA LÍNEA DEL MEJOR AJUSTE Mediante excel:

Ecuación de la línea de regresión estimada: yˆ  a  bx Insertar el gráfico de dispersión de los datos,


Clic derecho en uno de los puntos de datos observados
Agregar línea de tendencia
Modelo lineal,
La línea de regresión siempre pasa por el par ordenado x, y  Presentar la ecuación en el gráfico
presentar r2 en el gráfico (r2 = coeficiente de determinación)
a = intersección de la recta con el eje vertical a  y  bx =intercepción.eje(conocido_y,conocido_x)

  xy  n  x  y =pendiente(conocido_y,conocido_x)
b = pendiente o inclinación de la recta b
 x2  n  x
2

Interpretación de la pendiente: representa el cambio promedio del valor de y


por cada unidad que aumenta x
COEFICIENTE DE CORRELACIÓN DE PEARSON : Es una herramienta estadística =Pearson(matriz1,matriz2)
que nos sirve para describir el grado de asociación entre dos variables. Su valor
varía desde -1 hasta 1, el signo es el de la pendiente, su valor numérico informa
la fuerza de la relación entre las variables, hasta una correlación perfecta en r=-
1 ó r=1.

r 
 xy  n x y  
xy  2  2 
 
2
 x  n x  y 2  n y 

  
2 =coeficiente.r2(conocido_y,conocido_x)
COEFICIENTE DE DETERMINACIÓN: r : corresponde al cuadrado del
coeficiente de correlación; multiplicado por 100,

Interpretación: nos informa qué porcentaje del valor de Y, está explicado por la
ecuación de regresión.
IV. PROBABILIDAD
0 certeza no ocurrencia
Probabilidad de ocurrencia del evento A: # resultados favorables 
p A    
# resultados posibles 1 certeza
 de ocurrencia
Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se llama
punto muestral. Un subconjunto de uno o más resultados del espacio muestral se llama evento.

TECNICAS DE CONTEO: Para determinar el número de formas en que ocurre un experimento o un evento, usando fórmulas o procedimientos
sistemáticos.
1. Diagrama de árbol: Dispositivo gráfico útil para visualizar un experimento de varias etapas y enumerar los resultados posibles..
2. Técnica de conteo de etapas múltiples: n1  n 2    nk
3. Permutaciones: Una permutación es cualquier arreglo u ordenación de todos o una parte de n elementos
n!
 Permutaciones de r elementos tomados de n elementos elegibles: n Pr  , rn =permutaciones(número, tamaño)
n  r!
4. Combinaciones: Una combinación es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los elementos
n!
carece de importancia. El número de combinaciones es: nCr  =combinat(número, tamaño)
r!n  r!

Métodos más comunes para asignar probabilidades:
Probabilidad clásica Todos los resultados del experimento son N Número de resultados asociados con Ei
pE i   E i 
probables
igualmente N Número de resultados posibles
Probabilidad empírica o de Se analiza como ha ocurrido el n E i número de veces que ocurre el evento Ei
pE i   
frecuencia relativa experimento en el pasado para calcular n Número de ensayos u observaciones
probabilidades 
Probabilidad subjetiva o de Es una evaluación personal de la probabilidad de que ocurra un evento
juicio

Reglas o requerimientos básicos para la asignación de probabilidades
1. 0  pEi   1 2.-  pEi   1 3.- pE1  E2   pE1   pE2 
Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros eventos o
clasificaciones.
# resultados favorables f
pA  
# resultados posibles n
Ley aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A ó B (ó ambos):
     
p A  B  p A  p B , cuando A y B son mutuamente excluyentes.
p A 
B   p A  pB   p A  B  , cuando A y B no son mutuamente excluyentes.

Ley multiplicativa: A y B se presenten al mismo tiempo o en sucesión. Sean A y B dos eventos de S,


pA B  pA pB, si A y B son independientes.
pAB  pA pB A, si A y B no son independientes.


Probabilidad Condicional : la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A,
pA  B
 pB A  ;
pA
Si A y B son independientes, pB A  pB, o también pA  B  pA pB

VI. DISTRIBUCIONES DE PROBABILIDAD



Distribución de probabilidad: describe como se espera que varíen los resultados de un experimento, si este se llevara a cabo: La distribución de
 se distribuyen las probabilidades
probabilidad de una variable aleatoria describe cómo  de los diferentes valores de la variable aleatoria.
Variable aleatoria es aquella que asocia un valor numérico con cada resultado experimental posible. El valor numérico de la variable aleatoria
depende del resultado del experimento. Se puede clasificar como discreta o continua, dependiendo de los valores numéricos que asume.
Para variable aleatoria discrita,
Valor esperado, E x      x  f x , donde f (x) es la probabilidad de ocurrencia del evento x
varianza: Var  x      x     f x 
2 2

DISTRIBUCIONES
 DISCRETAS DE PROBABILIDAD 
DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos n ensayos, cada uno de los cuales tiene dos resultados posibles, éxito o
fracaso, y los resultados de los ensayos son independientes.
Probabilidad de x éxitos: Parámetros: n p
p xéxitos  n C x  p  q
x n x 

p= probabilidad de éxito en cada ensayo Media aritmética: Desviación estándar:


x= número de éxitos en los n ensayos   n p   n pq
n-x = número de fracasos en los n ensayos
=distr.binom(núm_exito,ensayos,prob_exito)

DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el número de veces que ocurre un fenómeno durante un intervalo dado
o en una región específica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias: Parámetro: 

x
 e Media aritmética: Desviación estándar
f x   
x!  
=poisson(x,media)

APROXIMACIÓN DE POISSON A LA BINOMIAL: es adecuada cuando n≥20 , p≤0.05, consiste en


 poisson  binomial  x  e
f x  
  n p 
entonces calculamos la probabilidad de X éxitos:
x!
=poisson(x,media)

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD


DISTRIBUCION NORMAL:
Muy importante distribución continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teoría de Estadística
Inferencial.
Para definir una población distribuida normalmente, se necesitan solo 2 parámetros: la media  y la desviación estándar .
Distribución normal estándar:

El área total bajo la curva es 1.00, por lo cual las áreas bajo la curva y dentro de dos límites corresponden a la probabilidad de que
la variable tenga valor dentro de ésos límites. La tabla muestra las áreas bajo la curva normal a la izquierda de un valor Z, donde
(Z es la forma estandarizada o tipificada de la variable aleatoria x).
x 
z x  z  

=distr.norm.estand(Z) para obtener el área bajo la curva, a la izquierda de Z

=inv.norm.estand(probabilidad) ó =distr.norm.estand.inv(probabilidad) para obtener Z dada el área


APROXIMACIÓN DE LA DISTRIBUCIÓN  NORMAL A LA BINOMIAL. Las áreas bajo la curva de la distribución normal se utilizan para aproximar
las probabilidades binomiales.
Es aceptable cuando n30 y p0.05, y tanto np≥5 como nq 5. Se realiza una corrección por continuidad, sumando o restando 0.5 al
valor de la variable a estandarizar, según corresponda.
Media aritmética:   n p Desviación estándar:   n pq
xcorr  
z



Вам также может понравиться