Вы находитесь на странице: 1из 44

Introduccin a la

simulacin
Universidad Andrs Bello
I semestre 2017
Repaso de estadsticas
Introduccin a la simulacin
Repaso de estadsticas
La naturaleza estadstica de la vida.
Cmo fue que empez todo.

3
Repaso de estadsticas
Compendios (surveys): No invasivos.
Experimentos: Invasivos. Se buscan relaciones de causa y
efecto.
La muestra y el sesgo.
Estadsticas descriptivas.
Datos categricos por categoras (gnero, afiliacin poltica,
otros).
Numricos (peso, color, densidad, otros).

4
Repaso de estadsticas
Distribuciones
Variable es una caracterstica que puede ser contada, medida,
categorizada (gnero, edad, estatura, etc.).
X = caracterstica.
x = valor que la caracterstica toma.

5
Repaso de estadsticas
Distribuciones
Distribucin listado de posibles valores de la variable (o
intervalos de valores) y con qu frecuencia (o con qu
densidad) se dan.
Si una variable cuenta el nmero de xitos en cierto nmero de
ensayos, estamos en presencia de una distribucin binomial.
Si ocurren de acuerdo a una curva de campana, distribucin normal.
Si est basada en muestras promedio y el nmero de datos es limitado,
estamos en presencia de una distribucin t.

6
Repaso de estadsticas
Distribuciones de probabilidad ms comunes.
A Binomial
B Normal
C t de Student

7
Repaso de estadsticas
Margen de error: variabilidad entre las muestras. Error
Equivocacin.
Elementos ms comunes en una distribucin:
La media (tiempo promedio de reparto de pizzas, por ejemplo).
Proporcin de la poblacin (que apoya a un candidato, por
ejemplo).
Correlacin (relacin entre x e y).
Regresin (prediccin que basados en una variable
hacemos sobre la otra).

8
Repaso de estadsticas
Etapas de un estudio estadstico:
Determinar la poblacin a estudiar.
Recoger los datos.
Organizar, resumir, analizar.
Extraer conclusiones.
En qu momento entra la simulacin?

9
Repaso de estadsticas
La poblacin (population).
La muestra subconjunto de la poblacin (sample).
La aleatoriedad instrumento para seleccionar una
muestra evitando el sesgo (bias).

10
Repaso de estadsticas
Estadstico nmero que resume los datos recogidos de
una muestra: porcentaje, promedio, percentil, moda, etc.
Parmetro nmero o cifra que corresponde a toda una
poblacin.
Sesgo (bias) la Nmesis del estadstico. Favoritismo con
que se selecciona una muestra.

11
Repaso de estadsticas
Media (mean) tambin conocida como promedio
(average). Muy influida por los datos fuera de rango
(outliers).
Mediana (median) punto central en el que hay el mismo
nmero de datos hacia la derecha que hacia la izquierda
de un conjunto de datos.
Desviacin estndar (standard deviation):

12
Repaso de estadsticas
En sentido general, la desviacin estndar tambin nos
sirve para describir dnde va a caer la mayora de los
datos (como en la curva normal 68%, 95%, 99,7%).

13
Repaso de estadsticas
Distribucin listado o funcin que muestra todos los
posibles valores de los datos y la frecuencia con que ellos
se dan.

14
Repaso de estadsticas
Experimento: estudio que impone un control sobre los
sujetos (en estudio), sobre el entorno, y sobre el registro
de las respuestas. El propsito es encontrar relaciones
causa efecto.

15
Repaso de estadsticas
p-value recurso de los tests de hiptesis para pesar la
fortaleza de una evidencia (que es lo que los datos dicen
acerca de una poblacin). Es un nmero entre 0 y 1 que se
interpreta as:

16
Repaso de estadsticas
Significancia o valor estadstico se dice de aquel
resultado con una probabilidad muy baja de haber
ocurrido por azar (para lo cual se cuenta con un p-value
dado).

17
Repaso de estadsticas
Causalidad y correlacin: la correlacin nos dice que hay
una relacin entre dos variables. La causalidad nos explica
por qu o cmo.
Por ejemplo, el nmero de asesinatos en Nueva York est
correlacionado con la venta de helados, pero estos ltimos no
son la causa de los primeros ni aquellos de estos.

~
https://goo.gl/Mg3kDj http://goo.gl/dCjuxk

18
Repaso de estadsticas
Regla emprica.

19
Repaso de estadsticas
La media y la mediana.
http://goo.gl/8wgsZT

20
Repaso de estadsticas
Variables discretas y continuas. http://goo.gl/ipNr8h

Variables aleatorias discretas: van a depender de si el valor x


que toma la variable es entero o no (0, 1, 2, 3, , 10).
Variable aleatoria continua: en este caso, los posibles valores de
x pueden ser descritos solo usando intervalos de nmeros
reales (por ejemplo, 0 a ).

https://goo.gl/9NGrMb

21
Repaso de estadsticas
La distribucin normal:
Media poblacional:
Desviacin estndar:

22
Repaso de estadsticas

23
Repaso de estadsticas
La distribucin normal estndar (distribucin Z).
Es el estndar por el que todas las distribuciones normales son
medidas.
Su media es y su desviacin estndar es
Casi todos sus valores (99,7%) caen entre -3 y +3.
Un valor z (z value) representa el nmero de desviaciones
estndar a que un valor particular dado se encuentra en
relacin a la media.

24
Repaso de estadsticas

25
26
Repaso de estadstica
La distribucin t.

27
28
Repaso de estadsticas
La relacin entre la distribucin normal y la t es que esta
ltima es utilizada para analizar la media de una
poblacin si la poblacin tiene una distribucin normal (o
adecuadamente cercana a ella).
El anlisis se realiza utilizando test de hiptesis e
intervalos de confianza.
Sirve especialmente cuando el conjunto de datos es
pequeo (n<30) o cuando no se conoce la desviacin
estndar de la poblacin (lo que suele suceder).
29
Repaso de estadsticas
Las distribuciones t que estn basadas en pequeas
colecciones de datos tienen desviaciones estndar ms
grandes. Sus formas son ms planas; sus valores se
encuentran ms dispersos.
Esto, porque los resultados basados en conjuntos de pocos
datos son ms variables que aquellos que se encuentran
basados en largas colecciones de datos.
En consecuencia, mientras ms datos haya, ms se
parecer la distribucin t a la normal.
30
31
Repaso de estadsticas
El teorema del lmite central.

32
Repaso de estadsticas

33
Repaso de estadsticas

34
Repaso de estadsticas
El teorema de lmite central.

35
Repaso de estadsticas
Intervalo de confianza
Se llama intervalo porque el resultado lo buscado- es un
intervalo.
Por ejemplo el intervalo de nios a los que les gusta el
bsquetbol es de 40%, ms o menos 3,5%.
Esto significa que el porcentaje de nios a los que gusta el
bsquetbol est en algn lugar entre el 36,5% y el 43,5%.

36
Repaso de estadsticas
Interpretando resultados
Suponga que usted es un bilogo e intenta atrapar un pez
usando una pequea red.
El tamao de la red representa el margen de error de un
intervalo de confianza.
Digamos que el nivel de confianza es de 95%.
Qu significa esto? Significa que si uno pasa la red por el
estanque, atrapar un pez el 95% de las veces.
Atrapar un pez significa, por tanto, que el I.C. estaba correcto y
contiene al verdadero parmetro (el pez).

37
Repaso de estadsticas
Pero, significa esto que en cualquier intento hay un 95%
de probabilidades de atrapar un pez con la red?

http://goo.gl/039RlX http://goo.gl/wVhtCt

38
Repaso de estadsticas
No!

Si usted cierra los ojos antes de meter la red en el agua, en ese


momento, las probabilidades de atrapar un pez son de un
95%.
Pero una vez que usted mete la red en el agua manteniendo
los ojos cerrados, usted, al sacar la red, encuentra solo una de
dos posibilidades
La probabilidad ya no tiene nada que ver.
39
Repaso de estadsticas
Sorprendido?

http://goo.gl/59a5f1

40
Repaso de estadsticas
De manera que no se est afirmando que hay un 95% de
confianza de que el parmetro est presente en ese
intervalo. Lo que se est afirmando es que hay un 95% de
confianza en el proceso por el cual las muestras aleatorias
son seleccionadas y los IC son creados.
Esto es, a la larga, el 95% del tiempo, usted atrapar un
pez.
Este proceso resultar en intervalos que capturan la
media poblacional el 95% del tiempo.
41
Repaso de estadsticas
El 5% restante representa errores debidos nicamente al
azar y no contienen sesgo.
El ancho del intervalo de confianza es dos veces el margen
de error. Si el margen de error es 5%, el ancho (width)
del I.C. es 2 x 5% = 10%.

42
Valores para varios niveles de
confianza

Repaso de estadsticas Nivel de confianza


80%
Z* - value
1,28
90% 1,645 (convencin)
Tres factores afectan el ancho de un IC: 95% 1,96
Nivel de confianza (confidence level). 98% 2,33

Tamao de la muestra. 99% 2,58

Tamao de la variabilidad en la poblacin.


A medida que el nivel de confianza crece, el nmero de
errores estndar (valor crtico, z* value) incrementa, de
modo que el margen de error incrementa.
(Un IC es un estadstico ms o menos un margen de error, y el margen de error es el nmero
de errores estndar que se necesitan para obtener el nivel de confianza buscado.)

43
Valores para varios niveles de
confianza

Repaso de estadsticas Nivel de confianza


80%
Z* - value
1,28
90% 1,645 (convencin)
Tres factores afectan el ancho de un IC: 95% 1,96
Nivel de confianza (confidence level). 98% 2,33

Tamao de la muestra. 99% 2,58

Tamao de la variabilidad en la poblacin.


A medida que el nivel de confianza crece, el nmero de
errores estndar (valor crtico, z* value) incrementa, de
modo que el margen de error incrementa.
(Un IC es un estadstico ms o menos un margen de error, y el margen de error es el nmero
de errores estndar que se necesitan para obtener el nivel de confianza buscado.)

44

Вам также может понравиться