Академический Документы
Профессиональный Документы
Культура Документы
13/02/2012
Introduccin
Objetivo: Conocer los principales conceptos de estadstica y probabilidad con aplicaciones a las Ciencias Sociales.
13/02/2012
1. Uso de la estadstica
Definicin de estadstica. Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos, principalmente para la toma de decisiones.
13/02/2012
1. Uso de la estadstica
Proceso de Investigacin
13/02/2012
2. Teora de medicin
Los elementos o individuos son las entidades acerca de las cuales se renen datos Una variable es una caracterstica de inters de los elementos Los datos se obtienen anotando las mediciones de cada variable para cada elemento en el estudio
13/02/2012
2. Teora de medicin
Variables
Cualitativas Categricas
Cuantitativas Numricas
Dicotmicas 2 categoras
Nominales +2 categoras
Ordinales
Discretas
Continuas
Clasificacin de variables
Razn
2. Teora de medicin
Cuantitativas. Los datos consisten en nmeros que representan conteos o mediciones. Cunto o cuntos.
13/02/2012
2. Teora de medicin
Variables
Cualitativas Categricas
Cuantitativas Numricas
Dicotmicas 2 categoras
Nominales +2 categoras
Ordinales
Discretas
Continuas
Razn
Clasificacin de variables
Intervalar 13/02/2012 Elisha Jacobo Rufeil 8
2. Teora de medicin
Cualitativas: Tipo Nominal
Se define cuando los datos son coleccionados usando diferentes categoras o clasificaciones como la escala de medida. Dos ejemplos obvios son el sexo y el medida. estado civil. Cuando slo existen dos categoras se civil. llaman variables dicotmicas. dicotmicas.
13/02/2012
2. Teora de medicin
Cualitativas: Tipo Nominal
Variable Sexo Estado Civil Categoras Masculino, Femenino Soltero, Casado, Divorciado, Viudo
Elisha Jacobo Rufeil 10
13/02/2012
2. Teora de medicin
Cualitativas: Tipo Nominal
Es la escala de medicin ms simple (dbil) Individuos en categoras distintas tienen
13/02/2012
11
2. Teora de medicin
Cualitativas: Tipo Ordinal
Se define cuando se puede establecer un orden entre categoras. Un ejemplo comn en categoras. investigacin de mercados es cuando los consumidores se clasifican en: usuarios heavy, en: heavy, usuarios medium y usuarios light. light.
13/02/2012
12
2. Teora de medicin
Cualitativas: Tipo Ordinal
Otro ejemplo es cuando se pregunta sobre las actitudes hacia un producto en la siguiente escala: escala: muy dulce dulce ni dulce ni amargo amargo muy amargo
13/02/2012 Elisha Jacobo Rufeil 13
2. Teora de medicin
Cualitativas: Tipo Ordinal
Un ejemplo ms es cuando al entrevistado se le pide que ordene una serie de productos en cuanto a su preferencia: el primero, el segundo, ... preferencia: Estadsticas vlidas: porcentajes, moda. vlidas: moda.
13/02/2012
14
2. Teora de medicin
Variables
Cualitativas Categricas
Cuantitativas Numricas
Dicotmicas 2 categoras
Nominales +2 categoras
Ordinales
Discretas
Continuas
Razn
Clasificacin de variables
Intervalar 13/02/2012 Elisha Jacobo Rufeil 15
2. Teora de medicin
Cuantitativas
Discretas. Respuestas numricas que surgen de un proceso de conteo Continuas. Respuestas numricas que surgen de un proceso de medicin Estatura 1.72, 1.64,
Nmero de hijos: 4, 1, 2,
13/02/2012
16
2. Teora de medicin
Cuantitativas continuas: Tipo intervalar y de razn
En las escalas intervalares las distancias tienen un significado (temperatura). En las escalas de razn, (temperatura). razn, adems, los cocientes se pueden interpretar y no dependen de las unidades (altura). Para las (altura). escalas de razn el cero es un punto conocido y con significado. significado.
13/02/2012 Elisha Jacobo Rufeil 17
2. Teora de medicin
Existe mayor posibilidad de anlisis estadstico para variables intervalares y de razn. Estadsticas razn. vlidas: vlidas: promedio, porcentajes, moda, mediana, etc. etc.
13/02/2012
18
2. Teora de medicin
Ejemplos:
13/02/2012
Pas de origen Tamao de auto (compacto, mediano, grande) Salario Temperatura RFC Cdigo Postal Distancia al trabajo Nivel Socioeconmico Nmero de accidentes automovilsticos Prueba de embarazo
Elisha Jacobo Rufeil 19
3. Estadstica descriptiva
Definicin de estadstica descriptiva. Se conforman de grficas, conteos o tablas que tratan de presentar las principales caractersticas de los datos.
13/02/2012
20
3. Estadstica descriptiva
Ejemplo Se realiz una encuesta a 200 amas de casa (individuos) y se les pregunt por el nmero de bolsas de 1kg de harina que compran al mes (variable). Los resultados se muestran en la siguiente tabla (datos).
13/02/2012
21
3. Estadstica descriptiva
Tabla de datos cuantitativos agrupados
Nmero de bolsas X No de hogares con X bolsas
0 1 2 3 4 5 6 7 8 Total
12 15 20 40 60 30 15 5 3 200
Elisha Jacobo Rufeil 22
Distribucin de frecuencias
13/02/2012
3. Estadstica descriptiva
Distribucin de frecuencias: lista valores de datos (ya sea de manera individual o por grupos de intervalo), junto con sus frecuencias (o conteos) correspondientes.
13/02/2012
23
3. Estadstica descriptiva
nmero de bolsas X frecuencia absoluta frecuencia relativa % frecuencia absoluta acumulada frecuencia relativa acumulada %
0 1 2 3 4 5 6 7 8
13/02/2012
12 15 20 40 60 30 15 5 3 200
Total
100.0
3. Estadstica descriptiva
Frecuencias absolutas: conteos directos Frecuencias relativas: se obtienen dividiendo cada frecuencia absoluta por el total de frecuencias absolutas. Frecuencias acumuladas: resultan de sumar las frecuencias para la categora en cuestin ms las previas.
Elisha Jacobo Rufeil 25
13/02/2012
3. Estadstica descriptiva
Ejemplo
Se registraron las estaturas de un conjunto de 20 individuos:
Tabla de datos cuantitativos NO agrupados
1.53 1.6 1.6 1.6 1.63
13/02/2012
3. Estadstica descriptiva
Para calcular una distribucin de frecuencias en este caso es necesario:
1. 2. 3. 4. 5. 6. 7. 8. 9. Definir rangos o intervalos de clase (categoras) Para esto comenzar pensando que el total de clases diferentes que se necesita es de 5 (en realidad debe ser un nmero entre 5 y 20) Calcular el ancho de clase como la diferencia entre el valor ms alto menos el ms bajo todo dividido por el nmero de clases necesarias (5). Redondear hacia arriba. Seleccionar el lmite inferior de la primera clase. Puede ser un valor poco menor al dato original ms pequeo. Listar los lmites inferiores de las clases sucesivas sumando cada vez el ancho de clase Calcular los lmites superiores de clase como el inferior de la clase previa Calcular las marcas de clase como el promedio del lmite inferior y superior Definir la frecuencia de clase como el total de casos estrictamente mayores (no iguales) al lmite inferior y menores o iguales al lmite superior Nota : cada valor original debe pertenecer a una sola clase
13/02/2012
27
3. Estadstica descriptiva
LI 1.52 1.6 1.67 1.74 1.81 LS 1.6 1.67 1.74 1.81 1.89 Total MC 1.56 1.635 1.705 1.775 1.85 f 4 3 5 5 3 20 fr 20.00% 15.00% 25.00% 25.00% 15.00% 100.00% fa 4 7 12 17 20 fra 20.00% 35.00% 60.00% 85.00% 100.00%
13/02/2012
28
3. Estadstica descriptiva
Para calcular una distribucin de frecuencias en este caso es necesario:
1. 2. 3. 4. 5. 6. 7. 8. 9. Definir rangos o intervalos de clase (categoras) Para esto comenzar pensando que el total de clases diferentes que se necesita es de 5 (en realidad debe ser un nmero entre 5 y 20) Calcular el ancho de clase como la diferencia entre el valor ms alto menos el ms bajo todo dividido por el nmero de clases necesarias (5). Redondear hacia arriba. Seleccionar el lmite inferior de la primera clase. Puede ser un valor poco menor al dato original ms pequeo. Listar los lmites inferiores de las clases sucesivas sumando cada vez el ancho de clase Calcular los lmites superiores de clase como el inferior de la clase previa Calcular las marcas de clase como el promedio del lmite inferior y superior Definir la frecuencia de clase como el total de casos estrictamente mayores (no iguales) al lmite inferior y menores o iguales al lmite superior Nota : cada valor original debe pertenecer a una sola clase
13/02/2012
29
3. Estadstica descriptiva
LI 1.52 1.59 1.66 1.73 1.8 LS 1.59 1.66 1.73 1.8 1.87 Total MC 1.56 1.63 1.70 1.77 1.84 F 1 6 4 6 3 20 FR 5% 30% 20% 30% 15% 100% FA 1 7 11 17 20 FRA 5% 35% 55% 85% 100%
13/02/2012
30
3. Estadstica descriptiva
Histograma: representacin grfica de una tabla de frecuencias para datos cuantitativos. Histograma
7 6 frecuencia 5 4 3 2 1 0 1.56 1.63 1.70 estatura 1.77 1.84
Nota: en el eje horizontal tambin se pueden especificar los lmites inf y sup.
13/02/2012 Elisha Jacobo Rufeil 31
3. Estadstica descriptiva
Polgono de frecuencias: conecta por medio de lneas las frecuencias situadas sobre las marcas de clase.
polgono de frecuencias
7 6 frecuencia 5 4 3 2 1 0 1.56 1.63 1.70 estatura 1.77 1.84
13/02/2012
32
3. Estadstica descriptiva
Ojiva: grfica tambin lineal que representa funciones acumulativas. Usa los lmites superiores para las marcas y el primer inferior.
Ojiva
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1.52 1.59 1.66 1.73 1.8 1.87 estatura
13/02/2012
33
3. Estadstica descriptiva
Tallo y hojas: cada valor original se separa en dos partes, el tallo (dgito izquierdo) y las hojas (dgito derecho) .
Ejemplo estaturas
3 0 2 0 0 3 0 0 3 2 3 4 4 5 5 7 6 6 8 7
13/02/2012
34
3. Estadstica descriptiva
Diagrama de dispersin: grfica de datos apareados. Por ejemplo estatura versus Datos nmero de calzado.
estatura 1.53 1.6 1.6 1.6 1.63 1.65 1.66 1.68 1.72
13/02/2012
estatura 1.73 1.74 1.75 1.76 1.77 1.8 1.8 1.82 1.84 1.87
3. Estadstica descriptiva
Diagrama de dispersin: grfica de datos apareados. Por ejemplo estatura versus nmero de calzado.
Diagrama dispersin 10 calzado 7.5 5 2.5 0 1.5
13/02/2012
1.6
1.7 estatura
1.8
1.9
36
3. Estadstica descriptiva
Ejemplo con datos agrupados cualitativos. muestra de 20 individuos
Signo zodiacal acuario aries cncer escorpin gminis leo libra piscis sagitario virgo capricornio tauro
13/02/2012
frecuencia 1 1 1 3 2 2 5 2 1 2 0 0 20
Distribucin de frecuencias
total
37
3. Estadstica descriptiva
Diagrama de pastel: representa las frecuencias relativas de datos cualitativos.
acuario 5% sagitario 5% piscis 10% virgo 10% aries 5% cancer 5% escorpin 15% tauro 0% libra 25% geminis 10% capricornio leo 10% 0%
13/02/2012
38
3. Estadstica descriptiva
Diagrama de barras: representa las frecuencias relativas o absolutas de datos cualitativos.
Diagrama de barras
6 5
frecuencia
4 3 2 1 0
geminis
piscis
tauro
sagitario
cancer
aries
leo
acuario
escorpin
13/02/2012
capricornio
virgo
libra
39
3. Estadstica descriptiva
Caractersticas generales de los datos
Centro: Valor representativo o promedio que indica dnde se encuentra la mitad de los datos Variacin: medida de la cantidad en que los datos varan entre s Distribucin: forma que describe el polgono de frecuencias Datos aberrantes: valores alejados de la mayora
Elisha Jacobo Rufeil 40
13/02/2012
3. Estadstica descriptiva
Medidas de tendencia central
Moda: Para datos no agrupados es la observacin que ocurre con mayor frecuencia. La moda para datos agrupados en una tabla de frecuencias se define como la marca de clase del intervalo con la mayor frecuencia.
13/02/2012
41
3. Estadstica descriptiva
Medidas de tendencia central
Mediana: para un nmero impar de observaciones no agrupadas es el registro medio cuando ellos son ordenados de manera creciente. Para un nmero par de observaciones no agrupadas, la mediana es el promedio de las dos observaciones medias cuando los registros se ordenan de manera creciente.
Elisha Jacobo Rufeil 42
13/02/2012
3. Estadstica descriptiva
Medidas de tendencia central
Media: La media aritmtica de un conjunto de observaciones no agrupadas es la suma de ellas dividida por el nmero total de registros. Para datos agrupados en una tabla de frecuencias la media se calcula como:
13/02/2012
43
3. Estadstica descriptiva
Medidas de tendencia central
13/02/2012
44
3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Moda 1. Puede haber ms de una moda por distribucin 2. La moda no es influida por valores extremos 3. El valor de la moda puede cambiar si los datos son organizados en categoras distintas 4. La moda es aplicable a datos cuantitativos y cualitativos
13/02/2012
45
3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Mediana 1. Slo hay una mediana por distribucin 2. La mediana no es influida por valores extremos 3. El valor de la mediana es estable cuando los datos se organizan en categoras distintas 4. Slo se aplica a datos cuantitativos
13/02/2012 Elisha Jacobo Rufeil 46
3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Media 1. Slo hay una media por distribucin 2. La media es influida por valores extremos. 3. La media es aplicable a datos en escala de intervalo y de razn solamente 4. Toma en cuenta cada valor
13/02/2012
47
3. Estadstica descriptiva
Medidas de variacin o dispersin
Rango: El rango de un conjunto de observaciones es la diferencia entre la mayor y la menor. Si los datos estn agrupados en una tabla de frecuencias es la diferencia entre el lmite superior del intervalo de clase mayor y el lmite inferior del intervalo de clase menor.
13/02/2012
48
3. Estadstica descriptiva
Desviacin estndar
El valor de la desviacin estndar es positivo. Solo es cero cuando todos los datos son iguales Valores grandes de s indican mayor variacin Se afecta por datos extremos La unidad de la desviacin estndar es la misma que la de los datos originales
Elisha Jacobo Rufeil 49
13/02/2012
3. Estadstica descriptiva
Medidas de variacin o dispersin
Ejemplo de estaturas datos No agrupados Agrupados rango 0.34 0.35 varianza 0.0085305 0.0070147 desviacin estndar 0.0923608 0.0837540
13/02/2012
50
3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana
Si estas dos medidas son iguales, los datos se pueden considerar simtricos
13/02/2012
51
3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana
Si la media excede a la mediana los datos se pueden describir como con sesgo positivo a la derecha
13/02/2012
52
3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana
13/02/2012
53
3. Estadstica descriptiva
Percentiles
Recordar que la mediana de un conjunto de datos es el valor que est a la mitad, de modo que 50% son iguales o menores a la mediana y 50% de los datos son mayores o iguales a la mediana El percentil k-simo (Pk) denota el valor para el cual k% de los datos son menores o iguales a l.
Elisha Jacobo Rufeil 54
13/02/2012
3. Estadstica descriptiva
Percentiles
Algunos percentiles especiales como:
13/02/2012
tienen
nombres
P10 : percentil 10 o primer decil P20 : percentil 20 o segundo decil P25 : percentil 25 o primer cuartil (Q1) P30 : percentil 30 o tercer decil P50 : percentil 50 o segundo cuartil o mediana (Q2) P75 : percentil 75 o tercer cuartil (Q3) P90 : percentil 90 o noveno decil
Elisha Jacobo Rufeil 55
3. Estadstica descriptiva
Clculo de percentiles para datos no agrupados
inicio Ordenar datos de menor a mayor Calcular L =(k/100)n n: nmero de casos k: percentil L es entero
no
Pk es el L-simo valor
13/02/2012
3. Estadstica descriptiva
Clculo de percentiles
Ejemplo de estaturas
datos
no agrupados agrupados
13/02/2012
P25
P75
P10
57
3. Estadstica descriptiva
Diagramas de caja
Grfica que consiste en una lnea que se extiende desde el vlor mnimo hasta el valor mximo, as como una caja que indica el primer, segundo y tercer cuartil.
1.9 1.85 1.8 1.75 1.7 1.65 1.6 1.55 1.5
13/02/2012
max Q2 Q3 Q1 min
a1
58
4. Teora de probabilidad
Probabilidad Definicin
Rama de las matemticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la combinatoria y es fundamento necesario de la estadstica
Elisha Jacobo Rufeil 59
13/02/2012
4. Teora de probabilidad
Probabilidad Definicin
En un proceso aleatorio, razn entre el nmero de casos favorables y el nmero de casos posibles La probabilidad de un resultado se representa con un nmero entre 0 y 1, ambos inclusive. La probabilidad 0 indica que el resultado no ocurrir nunca, y la probabilidad 1, que el resultado ocurrir siempre.
Elisha Jacobo Rufeil
13/02/2012
60
4. Teora de probabilidad
Ejemplos de procesos o experimentos aleatorios
E1: se lanza un dado y se observa el nmero que aparece en la cara superior E2: se lanza una moneda cuatro veces y se cuenta el nmero total de soles E3: en un saln de 10 alumnos hay 3 mujeres, se elige al azar una persona despus de otra (sin sustitucin) hasta que se obtiene la ltima mujer, se cuentan el nmero total de personas seleccionadas E4: De una urna con esferas negras, se escoge una esfera y se observa su color Elisha Jacobo Rufeil
13/02/2012
61
4. Teora de probabilidad
Ejemplos de procesos o experimentos aleatorios
E5: se selecciona al azar una carta de la baraja inglesa se observa el color de la carta E6: se selecciona al azar una carta de la baraja inglesa y se observa la figura de la carta E7: se selecciona al azar una carta de la baraja inglesa y se observa el palo de la carta
13/02/2012
62
4. Teora de probabilidad
Espacio muestral
Para cada experimento aleatorio, el espacio muestral es el conjunto de todos los resultados posibles. posibles. Usualmente se designa como S.
13/02/2012 S1: {1,2,3,4,5,6} S2: {0,1,2,3,4} S3: {3,4,5,6,7,8,9,10} S4: {esfera negra} S5: {negro,rojo} S6: {as, rey, reina, joto, 10, 9, 8, 7, 6, 5, 4, 3, 2} Elisha Jacobo diamantes, espadas} S7: {corazones, trboles, Rufeil
63
4. Teora de probabilidad
Evento o suceso
Un evento A (respecto a un espacio muestral S) es simplemente un conjunto de resultados posibles. posibles. Ejemplos de eventos
13/02/2012 A1: Un nmero par, i.e., A1={2,4,6} A2: Dos soles, i.e., A2={2} A3: Ms de 8 personas, i.e., A3={9,10} A4: Esfera negra, i.e., A4={esfera negra} A5: Carta negra, i.e., A5 ={negro} A6: As, i.e., A6 ={as} Elisha Jacobo Rufeil A7: Corazones, i.e., A7={corazones}
64
4. Teora de probabilidad
Evento simple y evento compuesto
Un evento A es simple si ya no puede desglosarse en componentes ms simples. El simples. espacio muestral se compone de todos los eventos simples. De otra forma es compuesto. simples. compuesto.
Ejemplos de eventos
13/02/2012
A1: compuesto, A1={2,4,6} A2: simple, A2={2} A3: compuesto, A3={9,10} A4: simple, A4={esfera negra}
Elisha Jacobo Rufeil 65
4. Teora de probabilidad
Probabilidad marginal o simple
Significa la probabilidad de ocurrencia de un evento simple. simple. Ejemplo: P(A5)=P(carta negra) P(A5)=P
Probabilidad conjunta
Significa la probabilidad de ocurrencia de un evento que se compone de dos o ms eventos. eventos.
Ejemplo: P(A5 y A6)=P(carta negra y as) P( A6)=P
13/02/2012 Elisha Jacobo Rufeil 66
4. Teora de probabilidad
Probabilidad condicional
Significa la probabilidad de un evento A usando la informacin adicional de otro suceso B que ya ocurri. ocurri.
Ejemplo:
13/02/2012
67
4. Teora de probabilidad
Clculo de probabilidades
Ley de los grandes nmeros. Conforme un procedimiento se repite una y otra vez la probabilidad de frecuencias relativas (regla 1) tiende a aproximarse a la probabilidad real.
13/02/2012
68
4. Teora de probabilidad
Reglas de probabilidad
Complemento de un evento. El complemento del evento A se define por todos los puntos muestrales o resultados que no estn en A. Se denota como .
Espacio muestral
13/02/2012
69
4. Teora de probabilidad
Reglas de probabilidad
Regla aditiva. Es til cuando se tienen dos eventos y se desea conocer la probabilidad de que ocurra al menos uno de ellos, es decir que ocurra A o B o ambos.
AoB Espacio muestral
13/02/2012
70
4. Teora de probabilidad
Reglas de probabilidad
Regla aditiva (eventos mutuamente excluyentes). Dos eventos son excluyentes si no tienen puntos muestrales en comn.
Espacio muestral
13/02/2012
71
4. Teora de probabilidad
Reglas de probabilidad
Probabilidad condicional. Representa la probabilidad de un evento B dado que otro evento A ya ocurri.
AyB
13/02/2012 Elisha Jacobo Rufeil 72
4. Teora de probabilidad
Tcnica de respuesta aleatorizada
Segn el resultado de un evento aleatorio (como lanzar una moneda) el entrevistado contesta ya sea una pregunta incmoda o una pregunta general. La pregunta que se va a contestar es desconocida por todos excepto el entrevistado. Usando la probabilidad condicional y los resultados observados por los encuestados se puede calcular la probabilidad de contestar positivamente a la pregunta incmoda.
Elisha Jacobo Rufeil 73
13/02/2012
4. Teora de probabilidad
Tcnica de respuesta aleatorizada
No S
Pregunta incmoda A
Pregunta general B
13/02/2012
74
4. Teora de probabilidad
Teorema de Bayes
Particin de s
B1
B3
A
B4 B2 B5
Elisha Jacobo Rufeil 75
13/02/2012
4. Teora de probabilidad
Teorema de Bayes
Ejemplo. Tres turnos de fabricacin: B1 (diurno) produce el 40% de las llantas B2 (vespertino) produce el 40% de las llantas B3 (nocturno) produce el 20% de las llantas En das anteriores se registr el porcentaje de llantas defectuosas de cada turno Diurno: 5% Vespertino: 10% Nocturno: 20% Se obtiene una llanta defectuosa al azar, cul es la probabilidad que se haya producido en B1?
13/02/2012
76
4. Teora de probabilidad
Tcnicas de conteo
Regla fundamental del conteo. Para una secuencia de dos sucesos en la que el primer suceso puede ocurrir de m formas y el segundo suceso puede ocurrir de n formas, los sucesos juntos pueden ocurrir de un total de mn formas.
8 maneras x 5 maneras = 40 maneras
Puebla-Mxico
13/02/2012
Mxico-Cancn
Puebla-Cancn
77
4. Teora de probabilidad
Tcnicas de conteo
Regla factorial. Una coleccin de n objetos, se puede acomodar de n! diferentes maneras.
13/02/2012
78
5. Distribuciones de probabilidad
Variables aleatorias
Discretas: toman un nmero finito o contable de valores. Continuas: toman un nmero infinito de valores.
13/02/2012
79
5. Distribuciones de probabilidad
13/02/2012
80
5. Distribuciones de probabilidad
Variables aleatorias discretas
Distribucin Binomial.
Distribucin Binomial n=4, p=0.2
0.5 0.4 P(x) 0.3 0.2 0.1 0 0 1 2 x 3 4 5
13/02/2012
81
5. Distribuciones de probabilidad
Variables aleatorias discretas
Distribucin Binomial.
Distribucin Binomial n=10, p=0.5
0.3 0.25 0.2 P(x) 0.15 0.1 0.05 0 0 2 4 x 6 8 10
13/02/2012
82
5. Distribuciones de probabilidad
13/02/2012
83
5. Distribuciones de probabilidad
13/02/2012
84
5. Distribuciones de probabilidad
13/02/2012
85
5. Distribuciones de probabilidad
13/02/2012
86
5. Distribuciones de probabilidad
0.03 f(x) 0.02 0.01 0 40 60 80 100 x 13/02/2012 Elisha Jacobo Rufeil 87 120 140 160
5. Distribuciones de probabilidad
-4
-3
-2
-1
13/02/2012
88
5. Distribuciones de probabilidad
Variables aleatorias continuas
Distribucin t de student Distribucin Ji-cuadrada Distribucin F
13/02/2012
89
6. Inferencia estadstica
Universo: todas las mediciones de inters Parmetro: % de rojos en el universo.
13/02/2012
90
6. Inferencia estadstica
Definicin
Conjunto de mtodos que posibilitan realizar estimaciones de las caractersticas (parmetros) de poblaciones/universos o que permiten tomar decisiones con relacin a hiptesis sobre las mismas caractersticas. Todo lo anterior se lleva a cabo con base en los resultados del muestreo.
13/02/2012
91
6. Inferencia estadstica
Metodologa
En la teora del muestreo se hace nfasis en la definicin de estimadores, en el estudio de sus propiedades, entre las que se encuentra la distribucin muestral. La distribucin muestral se refiere al modelo de probabilidad que describe el comportamiento de los estimadores cuyos valores dependen de las muestras y por lo tanto son variables aleatorias.
13/02/2012
92
6. Inferencia estadstica
Metodologa
El resultado ms importante de la inferencia estadstica llamado del Lmite Central, determina la forma de las distribuciones muestrales y que origina un mtodo para la comprobacin de hiptesis sobre los parmetros poblacionales. inferencia
Se definen hiptesis sobre los parmetros de la poblacin Se recolectan datos: muestra Se obtienen conclusiones sobre los parmetros
13/02/2012
93
7. Muestreo
Por qu muestreo?
La mayora de las investigaciones de mercado usan muestreo con la intencin de conocer ms acerca de grupos grandes de personas. Lo anterior se personas. realiza por medio del estudio de un subconjunto de la poblacin y slo en pocos casos es recomendable observar el total (censo). censo)
13/02/2012
94
7. Muestreo
Cmo slo cientos o algunos miles de personas pueden representar poblaciones de millones?
Muestras bien seleccionadas (muestras probabilsticas) probabilsticas) an pequeas en relacin a la poblacin pueden representar una poblacin muy variada en estructura. Sin embargo hay que tomar estructura. en cuenta la variabilidad muestral. muestral.
13/02/2012 Elisha Jacobo Rufeil 95
7. Muestreo
e
Qu es la variabilidad muestral?
Algo se debe perder cuando se muestrea. Cada vez muestrea. que se toman muestras diferentes de la misma poblacin esperamos tener resultados distintos obedeciendo cierta distribucin de probabilidad (distribucin muestral). Cada uno de estos muestral) resultados estar equivocado hasta un cierto grado. grado. A este grado de variabilidad se le llama variabilidad muestral. muestral o error muestral.
13/02/2012 Elisha Jacobo Rufeil 96
7. Muestreo
Qu es la distribucin muestral?
Cada vez que se muestrea se obtiene un resultado diferente. diferente. Cul es la probabilidad de que resulte X o resulte Y ? Esta es la distribucin muestral: El muestral: patrn de todos los resultados posibles al obtener una muestra de la misma poblacin. poblacin.
13/02/2012
97
7. Muestreo
Qu es la distribucin muestral?
Ejemplo: Ejemplo:
13/02/2012
98
7. Muestreo
Qu es la distribucin muestral?
Resultado % 100 90 80 70 60 Probabilidad 0.001 0.010 0.044 0.117 0.205 Resultado % 50 40 30 20 10 0
Ejemplo:
Probabilidad 0.246 0.205 0.117 0.044 0.010 0.001
Estimaciones: p
13/02/2012 Elisha Jacobo Rufeil 99
7. Muestreo
Qu es la distribucin muestral?
0.300 0.250 0.200 0.150 0.100 0.050 0.000
Ejemplo:
20
40
60
80
13/02/2012
10 0
100
7. Muestreo
Cul es la probabilidad de observar a todos los individuos en la muestra con la caracterstica C, con diferentes n ?
n 2 5 10 15 20
13/02/2012
7. Muestreo
Por lo tanto, un factor determinante tanto, en la precisin de las estimaciones es el tamao muestral : n
13/02/2012
102
7. Muestreo
Existen otros factores que afecten la precisin de las estimaciones?
S. Poblaciones con mayor variabilidad producirn S. estimadores menos precisos. Si el porcentaje de individuos precisos. 10% con la caracterstica C en ejemplo anterior fuera 10% y no 50% el error muestral sera menor. Esta es la variabilidad 50% menor. poblacional. poblacional.
13/02/2012
103
7. Muestreo
Cmo puedo estimar el error muestral?
Teorema del Lmite Central: La distribucin muestral de Central: promedios o proporciones para tamaos de muestra grandes (50 o ms) ser siempre de la forma dada por la Distribucin Normal. Normal.
13/02/2012
104
7. Muestreo
Cmo puedo estimar el error muestral?
Estndar. La Distribucin de Probabilidad Normal Estndar.
Q !0 W !1
-4
13/02/2012
-3
-2
-1
4
105
7. Muestreo
Cmo puedo estimar el error muestral?
La Distribucin de Probabilidad Normal Estndar. Estndar.
13/02/2012
106
7. Muestreo
Cmo puedo estimar el error muestral?
La Distribucin de Probabilidad Normal. Una caracterstica importante de la distribucin normal es que aproximadamente a 2 desviaciones 95% casos. estndar se tiene el 95% de los casos.
13/02/2012
107
7. Muestreo
Cmo puedo estimar el error muestral?
Desviacin estndar de los estimadores. Correccin por poblacin finita Variabilidad poblacional
N n W N n
Tamao de la poblacin
13/02/2012
Tamao de la muestra
108
7. Muestreo
Cmo puedo estimar el error muestral?
Por lo tanto, el grado de equivocacin de los estimadores (con respecto al verdadero valor del parmetro p) estar acotado con un nivel de confianza del 95% por la expresin: 95% expresin:
N n W2 e ! 2v N n
13/02/2012 Elisha Jacobo Rufeil
7. Muestreo
Cmo puedo saber el valor esperado o promedio de los estimadores?
Para estimadores insesgados, el valor insesgados, promedio de los estimadores es el valor del parmetro p a estimar
13/02/2012
110
7. Muestreo
Qu puede causar que un estimador sea sesgado?
Definicin incorrecta de estimadores. muestral. Cobertura incompleta. Error en el marco muestral. No respuesta (entre 5 y 20%) Cuotas. Sobre-representacin deliberada. Cuotas. Sobre No conocer el diseo muestral
13/02/2012
111
7. Muestreo
Qu es el diseo muestral?
El diseo muestral contempla los requerimientos no tan slo de precisin de estimadores, sino tambin de estimadores, costo, velocidad, costo, velocidad, practicalidad y credibilidad de las investigaciones a travs de encuestas. encuestas.
13/02/2012
112
7. Muestreo
Qu es el diseo muestral?
Definiendo a la Poblacin Objetivo. El muestreo Objetivo. probabilstico requiere que cada individuo en la poblacin de inters tenga una probabilidad conocida y positiva de ser seleccionado. seleccionado.
13/02/2012
113
7. Muestreo
Qu es el diseo muestral aleatorio simple? simple?
Es el ms sencillo de los diseos e implica que todas las posibles muestras del mismo tamao tienen una probabilidad igual de ser seleccionadas. Por ejemplo seleccionadas. para la seleccin del nmero premiado de la lotera se usa este tipo de muestreo. muestreo.
13/02/2012
114
7. Muestreo
Qu es el diseo muestral aleatorio simple? simple?
13/02/2012
115
7. Muestreo
Qu es el diseo muestral estratificado? estratificado?
La estratificacin es un mtodo de muestreo para reducir el error muestral. Asegura que los diferentes muestral. grupos o estratos de la poblacin estarn correctamente representados en la muestra. Dentro muestra. de cada estrato existe un proceso de seleccin aleatoria (generalmente un muestreo aleatorio simple) simple).
13/02/2012 Elisha Jacobo Rufeil 116
7. Muestreo
estratificado? Qu es el diseo muestral estratificado?
El xito de esta estrategia de muestreo depende de la existencia de diferencias marcadas entre estratos para la variable a medir y de homogeneidad dentro de los grupos (entre ms mejor). mejor).
13/02/2012
117
7. Muestreo
Qu es el diseo muestral estratificado? estratificado?
13/02/2012
118
7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
Para encuestas personales es demasiado costoso dispersar las entrevistas a lo largo del pas. Con la pas. intencin de reducir costos y tiempos de traslado, se definen grupos o conglomerados de personas que pertenecen a un nmero limitado de reas y que constituirn los elementos a seleccionar directamente. directamente.
13/02/2012
119
7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
Este procedimiento mejorar costos a cambio de aumentar el error muestral. El xito de la tcnica muestral. depender del nmero de elementos a seleccionar en cada conglomerado (entre menos mejor) y del grado de heterogeneidad dentro de los grupos (entre ms mejor). mejor).
13/02/2012
120
7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
13/02/2012
121
7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
13/02/2012
122
7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?
Para elegir una muestra de n unidades se toma una unidad al azar entre las k primeras y luego se toman las subsecuentes a intervalos de k. Este diseo tiene grandes ventajas cuando la seleccin de unidades se hace en campo. campo.
13/02/2012
123
7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?
13/02/2012
124
7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?
13/02/2012
125
7. Muestreo
Qu es un proceso de correccin por ponderacin? ponderacin?
Este procedimiento se aplica a las muestras para obtener estimadores insesgados. Por ejemplo un subinsesgados. subgrupo de la poblacin puede estar sobre representado en la muestra, el proceso de ponderacin le dar su peso o importancia justa. justa.
13/02/2012
126
7. Muestreo
Cmo determinar el tamao muestral? muestral?
El tamao de muestra requerido depende de tres factores : La variabilidad de la poblacin El diseo muestral La precisin esperada de los resultados
13/02/2012
127
7. Muestreo
Cmo determinar el tamao muestral?
En trminos de una frmula se expresa: factor de diseo
4 v FD 2 v W 2 n! 2 e
13/02/2012
128
8. Estimacin estadstica
La inferencia estadstica usa los resultados de una muestra para estimar u obtener conclusiones en cuanto a las caractersticas o parmetros de la poblacin. Hay dos tipos principales de estimadores: estimadores puntuales y estimadores de intervalo.
Elisha Jacobo Rufeil 129
13/02/2012
8. Estimacin estadstica
Estimadores puntuales. Utilizan un solo valor calculado a partir de la muestra para estimar el parmetro de la poblacin.
xQ s W
2 2
13/02/2012
130
8. Estimacin estadstica
Estimadores de intervalo. Usan un rango de valores calculado a partir de la muestra que, a un nivel de confianza, asegura contener al parmetro a estimar.
Q
a b
13/02/2012 Elisha Jacobo Rufeil 131
8. Estimacin estadstica
Estimacin de medias (caso
Supuestos:
Se obtiene una muestra aleatoria simple Se conoce el valor de la desviacin estndar de la poblacin El tamao de muestra es mayor a 30 casos
conocida)
13/02/2012
132
8. Estimacin estadstica
Estimacin de medias (caso
Hechos:
La media muestral es el mejor estimador puntual de la media de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la media muestral ms/menos el error muestral
conocida)
x s zE / 2
13/02/2012
W n
Donde -z /2 representa el /2 percentil de una distribucin Elisha Jacobo Rufeil normal estndar.
133
8. Estimacin estadstica
Estimacin de medias (caso
conocida)
Interpretacin correcta de una estimacin intervalar: Se tiene una confianza del 95% (por ejemplo) de que el intervalo calculado contiene el verdadero valor del parmetro
Q
13/02/2012 Elisha Jacobo Rufeil 134
8. Estimacin estadstica
Estimacin de medias (caso
Supuestos:
Se obtiene una muestra aleatoria simple Se desconoce el valor de la desviacin estndar de la poblacin El tamao de muestra es mayor a 30 casos
desconocida)
Q
13/02/2012 Elisha Jacobo Rufeil 135
8. Estimacin estadstica
Estimacin de medias (caso
Hechos:
La media muestral es el mejor estimador puntual de la media de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la media muestral ms/menos el estimador del error muestral
desconocida)
Q
13/02/2012
x s tE / 2
Elisha Jacobo Rufeil
s n
136
Donde -t /2 representa el /2 percentil de una distribucin t de student con n-1 grados de libertad.
8. Estimacin estadstica
Estimacin de proporciones
Supuestos:
13/02/2012
137
8. Estimacin estadstica
Estimacin de proporciones
Hechos:
La proporcin muestral es el mejor estimador puntual de la proporcin de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la proporcin muestral ms/menos el estimador del error muestral
p s zE / 2
13/02/2012
pq n
138
Donde -z /2 representa el /2 percentil de una distribucin Elisha Jacobo Rufeil normal estndar.
8. Estimacin estadstica
Estimacin de proporciones
Determinacin de tamao de muestra para estimacin de proporciones:
p
13/02/2012
n!
2 E /2
pq
2
8. Estimacin estadstica
Intervalos de confianza para diferencias de medias y proporciones
( x1 x2 ) s tE / 2
s s n1 n2
2 1
2 2
( p1 p2 ) s zE / 2
13/02/2012
p1q1 p2 q2 n1 n2
140
9. Pruebas de hiptesis
Una prueba de hiptesis es un procedimiento para verificar una aseveracin acerca de alguna caracterstica de la poblacin
Si bajo un supuesto dado, la probabilidad de un suceso observado es excepcionalmente baja, se concluye que el supuesto es incorrecto
Elisha Jacobo Rufeil 141
13/02/2012
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Hiptesis nula (H0) : es la afirmacin que el valor de un parmetro es igual a una cantidad dada. Se asume que es verdadera y despus se llega a la conclusin de rechazar H0 o no rechazar H0
H 0 : Q ! 100
13/02/2012 Elisha Jacobo Rufeil 142
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Hiptesis alternativa (H1) : es la afirmacin de que el parmetro tiene un valor que, de alguna manera, difiere con la hiptesis nula.
H1 : Q 100
13/02/2012 Elisha Jacobo Rufeil 143
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Estadstico de prueba: es un valor calculado a partir de los datos muestrales que se usa para tomar la decisin de rechazar o no H0. Se construye convirtiendo el estadstico muestral (media o proporcin) en una puntuacin (como z o t) bajo H0.
13/02/2012
144
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Regin crtica o de rechazo: El conjunto de todos los valores del estadstico de prueba que pueden hacer que se rechace la hiptesis nula.
Valores por abajo de la zona blanca
13/02/2012
145
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Valor crtico: Es valor que separa la regin crtica de los valores del estadstico de prueba que no conducen al rechazo de la hiptesis nula.
Valor crtico
13/02/2012 Elisha Jacobo Rufeil 146
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Valor P: Es la probabilidad de obtener un valor del estadstico de prueba que sea al menos tan extremo como el que arrojan los datos muestrales. La hiptesis nula se rechaza si el valor P es muy pequeo (0.05 o menos)
13/02/2012
147
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Nivel de significancia ( ): Es la probabilidad de que el estadstico de prueba caiga en la regin crtica cuando la hiptesis nula es verdadera. Alpha representa la probabilidad de cometer el error de rechazar la hiptesis nula cuando es verdadera.
13/02/2012
148
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Dos colas H1
149
13/02/2012
9. Pruebas de hiptesis
Componentes de una prueba de hiptesis
Criterio de decisin:
Mtodo tradicional. Rechazar la hiptesis nula si el estadstico de prueba cae dentro de la regin crtica, de otro modo no rechazarla. Mtodo del valor P. Si el valor P es menor o igual a entonces rechazar la hiptesis nula, de otro modo no rechazarla. Mtodo del intervalo de confianza. Rechazar cualquier valor que no este contenido en el intervalo de confianza. Nota: Elisha coincide 150 este mtodo no siempre Jacobo Rufeilcon los anteriores.
13/02/2012
9. Pruebas de hiptesis
Proporciones
Estadstico de prueba:
p p z! pq n
Para determinar el valor P y valor crtico usar la distribucin normal estndar.
13/02/2012 Elisha Jacobo Rufeil 151
9. Pruebas de hiptesis
Promedio con conocida
Estadstico de prueba:
xQ z! W n
Para determinar el valor P y valor crtico usar la distribucin normal estndar.
13/02/2012 Elisha Jacobo Rufeil 152
9. Pruebas de hiptesis
Promedio con desconocida
Estadstico de prueba:
xQ t! s n
Para determinar el valor P y valor crtico usar la distribucin t con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 153
9. Pruebas de hiptesis
Desviacin estndar
Estadstico de prueba:
(n 1) s G ! 2 W
2
Para determinar el valor P y valor crtico usar la distribucin chi cuadrada con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 154
9. Pruebas de hiptesis
Igualdad de proporciones
H 0 : p1 ! p2
Estadstico de prueba:
( p1 p2 ) z! pq pq n1 n2 n1 p1 n2 p2 donde p ! n1 n2
13/02/2012
155
9. Pruebas de hiptesis
Igualdad de promedios independientes varianzas desiguales
H 0 : Q1 ! Q 2
Estadstico de prueba:
t!
( x1 x2 ) s s n1 n2
2 1 2 2
Para determinar el valor P y valor crtico usar la distribucin t con grados de libertad igual al mnimo entre n1-1 y n2-1.
13/02/2012 Elisha Jacobo Rufeil 156
9. Pruebas de hiptesis
Igualdad de promedios independientes varianzas iguales
H 0 : Q1 ! Q 2
Estadstico de prueba:
t!
( x1 x2 ) s
2 p
n1
13/02/2012
2 p
n2
Para determinar el valor P y valor crtico usar la distribucin t con grados de libertad igual a n1+n2-2.
Elisha Jacobo Rufeil 157
9. Pruebas de hiptesis
Igualdad de promedios dependientes
H 0 : d ! Qd
Estadstico de prueba:
d Qd sd n donde d es el valor medio de las diferencias t!
Para determinar el valor P y valor crtico usar la distribucin t con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 158
El anlisis de regresin es una tcnica til para medir el nivel de relacin existente entre una variable de inters (variable dependiente) y varias variables explicativas (variables independientes).
13/02/2012
159
En una encuesta aplicada a consumidores de cerveza en la Ciudad de Mxico, resulta de inters conocer los siguientes aspectos:
Cules son las caractersticas fsicas o intrnsecas de la cerveza (variables independientes) que influyen de manera ms directa en la intencin de compra de cerveza (variable dependiente)? Cmo se puede establecer una jerarquizacin de dichas caractersticas de la ms a la menos influyente?
Elisha Jacobo Rufeil 160
13/02/2012
Amargor
13/02/2012
161
Sabor
Definitivamente no la comprara Probablemente no la comprara Tal vez si o tal vez no la comprara Probablemente s la comprara Definitivamente s la comprara
13/02/2012
163
? ? ? ? ?
Elisha Jacobo Rufeil 164
Intencin de compra
De este forma, a partir del anlisis de regresin lineal buscaremos estimar el valor de los coeficientes beta de cada una de las variables, los cuales nos ayudarn a contestar las preguntas:
13/02/2012 Elisha Jacobo Rufeil 165
13/02/2012
y ! b0 b1 x
n xy x y b1 ! n x 2 ( x ) 2
b0 ! y b1 x
13/02/2012 Elisha Jacobo Rufeil 167