Вы находитесь на странице: 1из 167

Curso de Estadstica

Elisha Jacobo Rufeil

13/02/2012

Elisha Jacobo Rufeil

Introduccin
Objetivo: Conocer los principales conceptos de estadstica y probabilidad con aplicaciones a las Ciencias Sociales.

13/02/2012

Elisha Jacobo Rufeil

1. Uso de la estadstica
Definicin de estadstica. Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos, principalmente para la toma de decisiones.

13/02/2012

Elisha Jacobo Rufeil

1. Uso de la estadstica
Proceso de Investigacin

13/02/2012

Elisha Jacobo Rufeil

2. Teora de medicin
Los elementos o individuos son las entidades acerca de las cuales se renen datos Una variable es una caracterstica de inters de los elementos Los datos se obtienen anotando las mediciones de cada variable para cada elemento en el estudio

13/02/2012

Elisha Jacobo Rufeil

2. Teora de medicin
Variables

Cualitativas Categricas

Cuantitativas Numricas

Dicotmicas 2 categoras

Nominales +2 categoras

Ordinales

Discretas

Continuas

Clasificacin de variables

Razn

Intervalar 13/02/2012 Elisha Jacobo Rufeil 6

2. Teora de medicin
Cuantitativas. Los datos consisten en nmeros que representan conteos o mediciones. Cunto o cuntos.

Cualitativas. Los datos se distinguen por ser categoras o nombres

Sexo: hombre, mujer

Estatura 1.72, 1.64,

13/02/2012

Elisha Jacobo Rufeil

2. Teora de medicin
Variables

Cualitativas Categricas

Cuantitativas Numricas

Dicotmicas 2 categoras

Nominales +2 categoras

Ordinales

Discretas

Continuas

Razn

Clasificacin de variables
Intervalar 13/02/2012 Elisha Jacobo Rufeil 8

2. Teora de medicin
Cualitativas: Tipo Nominal
Se define cuando los datos son coleccionados usando diferentes categoras o clasificaciones como la escala de medida. Dos ejemplos obvios son el sexo y el medida. estado civil. Cuando slo existen dos categoras se civil. llaman variables dicotmicas. dicotmicas.

13/02/2012

Elisha Jacobo Rufeil

2. Teora de medicin
Cualitativas: Tipo Nominal
Variable Sexo Estado Civil Categoras Masculino, Femenino Soltero, Casado, Divorciado, Viudo
Elisha Jacobo Rufeil 10

13/02/2012

2. Teora de medicin
Cualitativas: Tipo Nominal
 Es la escala de medicin ms simple (dbil)  Individuos en categoras distintas tienen

comportamientos diferentes (se espera)  Estadsticas vlidas: porcentajes, moda.

13/02/2012

Elisha Jacobo Rufeil

11

2. Teora de medicin
Cualitativas: Tipo Ordinal
Se define cuando se puede establecer un orden entre categoras. Un ejemplo comn en categoras. investigacin de mercados es cuando los consumidores se clasifican en: usuarios heavy, en: heavy, usuarios medium y usuarios light. light.

13/02/2012

Elisha Jacobo Rufeil

12

2. Teora de medicin
Cualitativas: Tipo Ordinal
Otro ejemplo es cuando se pregunta sobre las actitudes hacia un producto en la siguiente escala: escala: muy dulce dulce ni dulce ni amargo amargo muy amargo
13/02/2012 Elisha Jacobo Rufeil 13

2. Teora de medicin
Cualitativas: Tipo Ordinal
Un ejemplo ms es cuando al entrevistado se le pide que ordene una serie de productos en cuanto a su preferencia: el primero, el segundo, ... preferencia: Estadsticas vlidas: porcentajes, moda. vlidas: moda.

13/02/2012

Elisha Jacobo Rufeil

14

2. Teora de medicin
Variables

Cualitativas Categricas

Cuantitativas Numricas

Dicotmicas 2 categoras

Nominales +2 categoras

Ordinales

Discretas

Continuas

Razn

Clasificacin de variables
Intervalar 13/02/2012 Elisha Jacobo Rufeil 15

2. Teora de medicin
Cuantitativas
Discretas. Respuestas numricas que surgen de un proceso de conteo Continuas. Respuestas numricas que surgen de un proceso de medicin Estatura 1.72, 1.64,

Nmero de hijos: 4, 1, 2,

13/02/2012

Elisha Jacobo Rufeil

16

2. Teora de medicin
Cuantitativas continuas: Tipo intervalar y de razn
En las escalas intervalares las distancias tienen un significado (temperatura). En las escalas de razn, (temperatura). razn, adems, los cocientes se pueden interpretar y no dependen de las unidades (altura). Para las (altura). escalas de razn el cero es un punto conocido y con significado. significado.
13/02/2012 Elisha Jacobo Rufeil 17

2. Teora de medicin

Existe mayor posibilidad de anlisis estadstico para variables intervalares y de razn. Estadsticas razn. vlidas: vlidas: promedio, porcentajes, moda, mediana, etc. etc.

13/02/2012

Elisha Jacobo Rufeil

18

2. Teora de medicin
Ejemplos:

13/02/2012

Pas de origen Tamao de auto (compacto, mediano, grande) Salario Temperatura RFC Cdigo Postal Distancia al trabajo Nivel Socioeconmico Nmero de accidentes automovilsticos Prueba de embarazo
Elisha Jacobo Rufeil 19

3. Estadstica descriptiva
Definicin de estadstica descriptiva. Se conforman de grficas, conteos o tablas que tratan de presentar las principales caractersticas de los datos.

13/02/2012

Elisha Jacobo Rufeil

20

3. Estadstica descriptiva
Ejemplo Se realiz una encuesta a 200 amas de casa (individuos) y se les pregunt por el nmero de bolsas de 1kg de harina que compran al mes (variable). Los resultados se muestran en la siguiente tabla (datos).

13/02/2012

Elisha Jacobo Rufeil

21

3. Estadstica descriptiva
Tabla de datos cuantitativos agrupados
Nmero de bolsas X No de hogares con X bolsas

0 1 2 3 4 5 6 7 8 Total

12 15 20 40 60 30 15 5 3 200
Elisha Jacobo Rufeil 22

Distribucin de frecuencias

13/02/2012

3. Estadstica descriptiva
Distribucin de frecuencias: lista valores de datos (ya sea de manera individual o por grupos de intervalo), junto con sus frecuencias (o conteos) correspondientes.

13/02/2012

Elisha Jacobo Rufeil

23

3. Estadstica descriptiva
nmero de bolsas X frecuencia absoluta frecuencia relativa % frecuencia absoluta acumulada frecuencia relativa acumulada %

0 1 2 3 4 5 6 7 8
13/02/2012

12 15 20 40 60 30 15 5 3 200

6.0 7.5 10.0 20.0 30.0 15.0 7.5 2.5 1.5


Elisha Jacobo Rufeil

12 27 47 87 147 177 192 197 200

6.0 13.5 23.5 43.5 73.5 88.5 96.0 98.5 100.0


24

Total

100.0

3. Estadstica descriptiva
Frecuencias absolutas: conteos directos Frecuencias relativas: se obtienen dividiendo cada frecuencia absoluta por el total de frecuencias absolutas. Frecuencias acumuladas: resultan de sumar las frecuencias para la categora en cuestin ms las previas.
Elisha Jacobo Rufeil 25

13/02/2012

3. Estadstica descriptiva
Ejemplo
Se registraron las estaturas de un conjunto de 20 individuos:
Tabla de datos cuantitativos NO agrupados
1.53 1.6 1.6 1.6 1.63
13/02/2012

1.73 1.74 1.75 1.76 1.77

1.65 1.66 1.68 1.72 1.73

1.8 1.8 1.82 1.84 1.87


26

Elisha Jacobo Rufeil

3. Estadstica descriptiva
Para calcular una distribucin de frecuencias en este caso es necesario:
1. 2. 3. 4. 5. 6. 7. 8. 9. Definir rangos o intervalos de clase (categoras) Para esto comenzar pensando que el total de clases diferentes que se necesita es de 5 (en realidad debe ser un nmero entre 5 y 20) Calcular el ancho de clase como la diferencia entre el valor ms alto menos el ms bajo todo dividido por el nmero de clases necesarias (5). Redondear hacia arriba. Seleccionar el lmite inferior de la primera clase. Puede ser un valor poco menor al dato original ms pequeo. Listar los lmites inferiores de las clases sucesivas sumando cada vez el ancho de clase Calcular los lmites superiores de clase como el inferior de la clase previa Calcular las marcas de clase como el promedio del lmite inferior y superior Definir la frecuencia de clase como el total de casos estrictamente mayores (no iguales) al lmite inferior y menores o iguales al lmite superior Nota : cada valor original debe pertenecer a una sola clase

13/02/2012

Elisha Jacobo Rufeil

27

3. Estadstica descriptiva
LI 1.52 1.6 1.67 1.74 1.81 LS 1.6 1.67 1.74 1.81 1.89 Total MC 1.56 1.635 1.705 1.775 1.85 f 4 3 5 5 3 20 fr 20.00% 15.00% 25.00% 25.00% 15.00% 100.00% fa 4 7 12 17 20 fra 20.00% 35.00% 60.00% 85.00% 100.00%

13/02/2012

Elisha Jacobo Rufeil

28

3. Estadstica descriptiva
Para calcular una distribucin de frecuencias en este caso es necesario:
1. 2. 3. 4. 5. 6. 7. 8. 9. Definir rangos o intervalos de clase (categoras) Para esto comenzar pensando que el total de clases diferentes que se necesita es de 5 (en realidad debe ser un nmero entre 5 y 20) Calcular el ancho de clase como la diferencia entre el valor ms alto menos el ms bajo todo dividido por el nmero de clases necesarias (5). Redondear hacia arriba. Seleccionar el lmite inferior de la primera clase. Puede ser un valor poco menor al dato original ms pequeo. Listar los lmites inferiores de las clases sucesivas sumando cada vez el ancho de clase Calcular los lmites superiores de clase como el inferior de la clase previa Calcular las marcas de clase como el promedio del lmite inferior y superior Definir la frecuencia de clase como el total de casos estrictamente mayores (no iguales) al lmite inferior y menores o iguales al lmite superior Nota : cada valor original debe pertenecer a una sola clase

13/02/2012

Elisha Jacobo Rufeil

29

3. Estadstica descriptiva
LI 1.52 1.59 1.66 1.73 1.8 LS 1.59 1.66 1.73 1.8 1.87 Total MC 1.56 1.63 1.70 1.77 1.84 F 1 6 4 6 3 20 FR 5% 30% 20% 30% 15% 100% FA 1 7 11 17 20 FRA 5% 35% 55% 85% 100%

13/02/2012

Elisha Jacobo Rufeil

30

3. Estadstica descriptiva
Histograma: representacin grfica de una tabla de frecuencias para datos cuantitativos. Histograma
7 6 frecuencia 5 4 3 2 1 0 1.56 1.63 1.70 estatura 1.77 1.84

Nota: en el eje horizontal tambin se pueden especificar los lmites inf y sup.
13/02/2012 Elisha Jacobo Rufeil 31

3. Estadstica descriptiva
Polgono de frecuencias: conecta por medio de lneas las frecuencias situadas sobre las marcas de clase.
polgono de frecuencias
7 6 frecuencia 5 4 3 2 1 0 1.56 1.63 1.70 estatura 1.77 1.84

13/02/2012

Elisha Jacobo Rufeil

32

3. Estadstica descriptiva
Ojiva: grfica tambin lineal que representa funciones acumulativas. Usa los lmites superiores para las marcas y el primer inferior.
Ojiva
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1.52 1.59 1.66 1.73 1.8 1.87 estatura

13/02/2012

frecuen relativa acum.

Elisha Jacobo Rufeil

33

3. Estadstica descriptiva
Tallo y hojas: cada valor original se separa en dos partes, el tallo (dgito izquierdo) y las hojas (dgito derecho) .
Ejemplo estaturas

1.5 1.6 1.7 1.8

3 0 2 0 0 3 0 0 3 2 3 4 4 5 5 7 6 6 8 7

13/02/2012

Elisha Jacobo Rufeil

34

3. Estadstica descriptiva
Diagrama de dispersin: grfica de datos apareados. Por ejemplo estatura versus Datos nmero de calzado.
estatura 1.53 1.6 1.6 1.6 1.63 1.65 1.66 1.68 1.72
13/02/2012

# calzado 2 4.5 4 4 4 4 8 4.5 7

estatura 1.73 1.74 1.75 1.76 1.77 1.8 1.8 1.82 1.84 1.87

# calzado 7.5 7.5 7 7.5 8.5 8 10 9 10 8.5


35

1.73 Elisha Jacobo Rufeil 7.5

3. Estadstica descriptiva
Diagrama de dispersin: grfica de datos apareados. Por ejemplo estatura versus nmero de calzado.
Diagrama dispersin 10 calzado 7.5 5 2.5 0 1.5
13/02/2012

1.6

1.7 estatura

1.8

1.9
36

Elisha Jacobo Rufeil

3. Estadstica descriptiva
Ejemplo con datos agrupados cualitativos. muestra de 20 individuos
Signo zodiacal acuario aries cncer escorpin gminis leo libra piscis sagitario virgo capricornio tauro
13/02/2012

frecuencia 1 1 1 3 2 2 5 2 1 2 0 0 20

Distribucin de frecuencias

total

Elisha Jacobo Rufeil

37

3. Estadstica descriptiva
Diagrama de pastel: representa las frecuencias relativas de datos cualitativos.
acuario 5% sagitario 5% piscis 10% virgo 10% aries 5% cancer 5% escorpin 15% tauro 0% libra 25% geminis 10% capricornio leo 10% 0%

13/02/2012

Elisha Jacobo Rufeil

38

3. Estadstica descriptiva
Diagrama de barras: representa las frecuencias relativas o absolutas de datos cualitativos.
Diagrama de barras
6 5
frecuencia

4 3 2 1 0

geminis

piscis

tauro

sagitario

cancer

aries

leo

acuario

escorpin

13/02/2012

Elisha Jacobo Rufeil

capricornio

virgo

libra

39

3. Estadstica descriptiva
Caractersticas generales de los datos
Centro: Valor representativo o promedio que indica dnde se encuentra la mitad de los datos Variacin: medida de la cantidad en que los datos varan entre s Distribucin: forma que describe el polgono de frecuencias Datos aberrantes: valores alejados de la mayora
Elisha Jacobo Rufeil 40


13/02/2012

3. Estadstica descriptiva
Medidas de tendencia central
Moda: Para datos no agrupados es la observacin que ocurre con mayor frecuencia. La moda para datos agrupados en una tabla de frecuencias se define como la marca de clase del intervalo con la mayor frecuencia.

13/02/2012

Elisha Jacobo Rufeil

41

3. Estadstica descriptiva
Medidas de tendencia central
Mediana: para un nmero impar de observaciones no agrupadas es el registro medio cuando ellos son ordenados de manera creciente. Para un nmero par de observaciones no agrupadas, la mediana es el promedio de las dos observaciones medias cuando los registros se ordenan de manera creciente.
Elisha Jacobo Rufeil 42

13/02/2012

3. Estadstica descriptiva
Medidas de tendencia central
Media: La media aritmtica de un conjunto de observaciones no agrupadas es la suma de ellas dividida por el nmero total de registros. Para datos agrupados en una tabla de frecuencias la media se calcula como:

13/02/2012

Elisha Jacobo Rufeil

43

3. Estadstica descriptiva
Medidas de tendencia central

Ejemplo de estaturas datos moda No agrupados Agrupados 1.6 1.63, 1.77

mediana 1.73 1.71

media 1.71 1.71

13/02/2012

Elisha Jacobo Rufeil

44

3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Moda 1. Puede haber ms de una moda por distribucin 2. La moda no es influida por valores extremos 3. El valor de la moda puede cambiar si los datos son organizados en categoras distintas 4. La moda es aplicable a datos cuantitativos y cualitativos

13/02/2012

Elisha Jacobo Rufeil

45

3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Mediana 1. Slo hay una mediana por distribucin 2. La mediana no es influida por valores extremos 3. El valor de la mediana es estable cuando los datos se organizan en categoras distintas 4. Slo se aplica a datos cuantitativos
13/02/2012 Elisha Jacobo Rufeil 46

3. Estadstica descriptiva
Caractersticas principales de las medidas de tendencia central
Media 1. Slo hay una media por distribucin 2. La media es influida por valores extremos. 3. La media es aplicable a datos en escala de intervalo y de razn solamente 4. Toma en cuenta cada valor

13/02/2012

Elisha Jacobo Rufeil

47

3. Estadstica descriptiva
Medidas de variacin o dispersin
Rango: El rango de un conjunto de observaciones es la diferencia entre la mayor y la menor. Si los datos estn agrupados en una tabla de frecuencias es la diferencia entre el lmite superior del intervalo de clase mayor y el lmite inferior del intervalo de clase menor.

13/02/2012

Elisha Jacobo Rufeil

48

3. Estadstica descriptiva
Desviacin estndar
El valor de la desviacin estndar es positivo. Solo es cero cuando todos los datos son iguales Valores grandes de s indican mayor variacin Se afecta por datos extremos La unidad de la desviacin estndar es la misma que la de los datos originales
Elisha Jacobo Rufeil 49


13/02/2012

3. Estadstica descriptiva
Medidas de variacin o dispersin

Ejemplo de estaturas datos No agrupados Agrupados rango 0.34 0.35 varianza 0.0085305 0.0070147 desviacin estndar 0.0923608 0.0837540

13/02/2012

Elisha Jacobo Rufeil

50

3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana

Si estas dos medidas son iguales, los datos se pueden considerar simtricos

13/02/2012

Elisha Jacobo Rufeil

51

3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana

Si la media excede a la mediana los datos se pueden describir como con sesgo positivo a la derecha

13/02/2012

Elisha Jacobo Rufeil

52

3. Estadstica descriptiva
Formas de distribuciones. Para describir la propiedad de la
forma de la distribucin basta con comparar la media y la mediana

Si la mediana excede a la media es sesgo es negativo o a la izquierda

13/02/2012

Elisha Jacobo Rufeil

53

3. Estadstica descriptiva
Percentiles
Recordar que la mediana de un conjunto de datos es el valor que est a la mitad, de modo que 50% son iguales o menores a la mediana y 50% de los datos son mayores o iguales a la mediana El percentil k-simo (Pk) denota el valor para el cual k% de los datos son menores o iguales a l.
Elisha Jacobo Rufeil 54

13/02/2012

3. Estadstica descriptiva
Percentiles
Algunos percentiles especiales como:

13/02/2012

tienen

nombres

P10 : percentil 10 o primer decil P20 : percentil 20 o segundo decil P25 : percentil 25 o primer cuartil (Q1) P30 : percentil 30 o tercer decil P50 : percentil 50 o segundo cuartil o mediana (Q2) P75 : percentil 75 o tercer cuartil (Q3) P90 : percentil 90 o noveno decil
Elisha Jacobo Rufeil 55

3. Estadstica descriptiva
Clculo de percentiles para datos no agrupados
inicio Ordenar datos de menor a mayor Calcular L =(k/100)n n: nmero de casos k: percentil L es entero

no

Pk es el L-simo valor

Modificar L al siguiente entero mayor

Pk es el promedio del L-simo valor y el siguiente valor en el conjunto ordenado


56

13/02/2012

Elisha Jacobo Rufeil

3. Estadstica descriptiva
Clculo de percentiles
Ejemplo de estaturas

datos
no agrupados agrupados
13/02/2012

P25

P75

P10

Elisha Jacobo Rufeil

57

3. Estadstica descriptiva
Diagramas de caja
Grfica que consiste en una lnea que se extiende desde el vlor mnimo hasta el valor mximo, as como una caja que indica el primer, segundo y tercer cuartil.
1.9 1.85 1.8 1.75 1.7 1.65 1.6 1.55 1.5
13/02/2012

max Q2 Q3 Q1 min
a1
58

Elisha Jacobo Rufeil

4. Teora de probabilidad
Probabilidad Definicin
Rama de las matemticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad est basada en el estudio de la combinatoria y es fundamento necesario de la estadstica
Elisha Jacobo Rufeil 59

13/02/2012

4. Teora de probabilidad
Probabilidad Definicin
En un proceso aleatorio, razn entre el nmero de casos favorables y el nmero de casos posibles La probabilidad de un resultado se representa con un nmero entre 0 y 1, ambos inclusive. La probabilidad 0 indica que el resultado no ocurrir nunca, y la probabilidad 1, que el resultado ocurrir siempre.
Elisha Jacobo Rufeil

13/02/2012

60

4. Teora de probabilidad
Ejemplos de procesos o experimentos aleatorios
E1: se lanza un dado y se observa el nmero que aparece en la cara superior E2: se lanza una moneda cuatro veces y se cuenta el nmero total de soles E3: en un saln de 10 alumnos hay 3 mujeres, se elige al azar una persona despus de otra (sin sustitucin) hasta que se obtiene la ltima mujer, se cuentan el nmero total de personas seleccionadas E4: De una urna con esferas negras, se escoge una esfera y se observa su color Elisha Jacobo Rufeil

13/02/2012

61

4. Teora de probabilidad
Ejemplos de procesos o experimentos aleatorios
E5: se selecciona al azar una carta de la baraja inglesa se observa el color de la carta E6: se selecciona al azar una carta de la baraja inglesa y se observa la figura de la carta E7: se selecciona al azar una carta de la baraja inglesa y se observa el palo de la carta

13/02/2012

Elisha Jacobo Rufeil

62

4. Teora de probabilidad
Espacio muestral
Para cada experimento aleatorio, el espacio muestral es el conjunto de todos los resultados posibles. posibles. Usualmente se designa como S.
13/02/2012 S1: {1,2,3,4,5,6} S2: {0,1,2,3,4} S3: {3,4,5,6,7,8,9,10} S4: {esfera negra} S5: {negro,rojo} S6: {as, rey, reina, joto, 10, 9, 8, 7, 6, 5, 4, 3, 2} Elisha Jacobo diamantes, espadas} S7: {corazones, trboles, Rufeil

63

4. Teora de probabilidad
Evento o suceso
Un evento A (respecto a un espacio muestral S) es simplemente un conjunto de resultados posibles. posibles. Ejemplos de eventos
13/02/2012 A1: Un nmero par, i.e., A1={2,4,6} A2: Dos soles, i.e., A2={2} A3: Ms de 8 personas, i.e., A3={9,10} A4: Esfera negra, i.e., A4={esfera negra} A5: Carta negra, i.e., A5 ={negro} A6: As, i.e., A6 ={as} Elisha Jacobo Rufeil A7: Corazones, i.e., A7={corazones}

64

4. Teora de probabilidad
Evento simple y evento compuesto
Un evento A es simple si ya no puede desglosarse en componentes ms simples. El simples. espacio muestral se compone de todos los eventos simples. De otra forma es compuesto. simples. compuesto.
Ejemplos de eventos


13/02/2012

A1: compuesto, A1={2,4,6} A2: simple, A2={2} A3: compuesto, A3={9,10} A4: simple, A4={esfera negra}
Elisha Jacobo Rufeil 65

4. Teora de probabilidad
Probabilidad marginal o simple
Significa la probabilidad de ocurrencia de un evento simple. simple. Ejemplo: P(A5)=P(carta negra) P(A5)=P

Probabilidad conjunta
Significa la probabilidad de ocurrencia de un evento que se compone de dos o ms eventos. eventos.
Ejemplo: P(A5 y A6)=P(carta negra y as) P( A6)=P
13/02/2012 Elisha Jacobo Rufeil 66

4. Teora de probabilidad
Probabilidad condicional
Significa la probabilidad de un evento A usando la informacin adicional de otro suceso B que ya ocurri. ocurri.
Ejemplo:

P(A5|A6)=P(carta negra dado que sali as) A5|A6)=P

13/02/2012

Elisha Jacobo Rufeil

67

4. Teora de probabilidad
Clculo de probabilidades
Ley de los grandes nmeros. Conforme un procedimiento se repite una y otra vez la probabilidad de frecuencias relativas (regla 1) tiende a aproximarse a la probabilidad real.

13/02/2012

Elisha Jacobo Rufeil

68

4. Teora de probabilidad
Reglas de probabilidad
Complemento de un evento. El complemento del evento A se define por todos los puntos muestrales o resultados que no estn en A. Se denota como .
Espacio muestral

13/02/2012

Elisha Jacobo Rufeil

69

4. Teora de probabilidad
Reglas de probabilidad
Regla aditiva. Es til cuando se tienen dos eventos y se desea conocer la probabilidad de que ocurra al menos uno de ellos, es decir que ocurra A o B o ambos.
AoB Espacio muestral

13/02/2012

Elisha Jacobo Rufeil Ay

70

4. Teora de probabilidad
Reglas de probabilidad
Regla aditiva (eventos mutuamente excluyentes). Dos eventos son excluyentes si no tienen puntos muestrales en comn.
Espacio muestral

13/02/2012

Elisha Jacobo Rufeil

71

4. Teora de probabilidad
Reglas de probabilidad
Probabilidad condicional. Representa la probabilidad de un evento B dado que otro evento A ya ocurri.

AyB
13/02/2012 Elisha Jacobo Rufeil 72

4. Teora de probabilidad
Tcnica de respuesta aleatorizada
Segn el resultado de un evento aleatorio (como lanzar una moneda) el entrevistado contesta ya sea una pregunta incmoda o una pregunta general. La pregunta que se va a contestar es desconocida por todos excepto el entrevistado. Usando la probabilidad condicional y los resultados observados por los encuestados se puede calcular la probabilidad de contestar positivamente a la pregunta incmoda.
Elisha Jacobo Rufeil 73

13/02/2012

4. Teora de probabilidad
Tcnica de respuesta aleatorizada
No S

Pregunta incmoda A

Pregunta general B

13/02/2012

Elisha Jacobo Rufeil

74

4. Teora de probabilidad
Teorema de Bayes
Particin de s

B1

B3

A
B4 B2 B5
Elisha Jacobo Rufeil 75

13/02/2012

4. Teora de probabilidad
Teorema de Bayes
Ejemplo. Tres turnos de fabricacin: B1 (diurno) produce el 40% de las llantas B2 (vespertino) produce el 40% de las llantas B3 (nocturno) produce el 20% de las llantas En das anteriores se registr el porcentaje de llantas defectuosas de cada turno Diurno: 5% Vespertino: 10% Nocturno: 20% Se obtiene una llanta defectuosa al azar, cul es la probabilidad que se haya producido en B1?

13/02/2012

Elisha Jacobo Rufeil

76

4. Teora de probabilidad
Tcnicas de conteo
Regla fundamental del conteo. Para una secuencia de dos sucesos en la que el primer suceso puede ocurrir de m formas y el segundo suceso puede ocurrir de n formas, los sucesos juntos pueden ocurrir de un total de mn formas.
8 maneras x 5 maneras = 40 maneras

Puebla-Mxico
13/02/2012

Elisha Jacobo Rufeil

Mxico-Cancn

Puebla-Cancn
77

4. Teora de probabilidad
Tcnicas de conteo
Regla factorial. Una coleccin de n objetos, se puede acomodar de n! diferentes maneras.

13/02/2012

Elisha Jacobo Rufeil =6

78

5. Distribuciones de probabilidad
Variables aleatorias
Discretas: toman un nmero finito o contable de valores. Continuas: toman un nmero infinito de valores.

13/02/2012

Elisha Jacobo Rufeil

79

5. Distribuciones de probabilidad

Variables aleatorias discretas


Distribucin Binomial
Se realiza un procedimiento un nmero fijo de ensayos Los ensayos deben ser independientes Los resultados de cada ensayo deben estar clasificados en dos categoras (xito y Fracaso) Las probabilidades de cada categora se mantienen constantes en cada ensayo

13/02/2012

Elisha Jacobo Rufeil

80

5. Distribuciones de probabilidad
Variables aleatorias discretas
Distribucin Binomial.
Distribucin Binomial n=4, p=0.2
0.5 0.4 P(x) 0.3 0.2 0.1 0 0 1 2 x 3 4 5

13/02/2012

Elisha Jacobo Rufeil

81

5. Distribuciones de probabilidad
Variables aleatorias discretas
Distribucin Binomial.
Distribucin Binomial n=10, p=0.5
0.3 0.25 0.2 P(x) 0.15 0.1 0.05 0 0 2 4 x 6 8 10

13/02/2012

Elisha Jacobo Rufeil

82

5. Distribuciones de probabilidad

Variables aleatorias discretas


Distribucin Poisson
Se aplica a las ocurrencias de algn suceso durante un intervalo especfico La variable aleatoria X es el nmero de ocurrencias de un suceso en el intervalo El intervalo puede ser de tiempo, distancia, rea, volumen o alguna unidad similar Las ocurrencias tienen que ser independientes entre s

13/02/2012

Elisha Jacobo Rufeil

83

5. Distribuciones de probabilidad

Variables aleatorias discretas


Distribucin Poisson.
Distribucin Poisson =2
0.3 0.25 0.2 P(x) 0.15 0.1 0.05 0 0 2 4 x 6 8

13/02/2012

Elisha Jacobo Rufeil

84

5. Distribuciones de probabilidad

Variables aleatorias discretas


Distribucin Poisson.
Distribucin Poisson =4
0.25 0.2 P(x) 0.15 0.1 0.05 0 0 2 4 x 6 8 10

13/02/2012

Elisha Jacobo Rufeil

85

5. Distribuciones de probabilidad

Variables aleatorias continuas


Distribucin Normal
Es quiz la distribucin de probabilidad ms importante para describir una variable aleatoria continua, debido a que muchos fenmenos de la naturaleza (como estatura, peso, IQ, etc) siguen este comportamiento. El punto ms alto de la curva normal es la media, que tambin es la mediana y la moda de la distribucin. Su forma es simtrica. La media de la distribucin puede ser cualquier valor numrico, la varianza siempre es positiva.

13/02/2012

Elisha Jacobo Rufeil

86

5. Distribuciones de probabilidad

Variables aleatorias continuas


Distribucin Normal
Distribucin normal media=100, d.e.=15

0.03 f(x) 0.02 0.01 0 40 60 80 100 x 13/02/2012 Elisha Jacobo Rufeil 87 120 140 160

5. Distribuciones de probabilidad

Variables aleatorias continuas


Distribucin Normal Estndar

-4

-3

-2

-1

13/02/2012

Elisha Jacobo Rufeil

88

5. Distribuciones de probabilidad
Variables aleatorias continuas
Distribucin t de student Distribucin Ji-cuadrada Distribucin F

13/02/2012

Elisha Jacobo Rufeil

89

6. Inferencia estadstica
Universo: todas las mediciones de inters Parmetro: % de rojos en el universo.

Muestra: subconjunto del universo

13/02/2012

Elisha Jacobo Rufeil

Estimador: % de rojos en la muestra

90

6. Inferencia estadstica

Definicin
Conjunto de mtodos que posibilitan realizar estimaciones de las caractersticas (parmetros) de poblaciones/universos o que permiten tomar decisiones con relacin a hiptesis sobre las mismas caractersticas. Todo lo anterior se lleva a cabo con base en los resultados del muestreo.

13/02/2012

Elisha Jacobo Rufeil

91

6. Inferencia estadstica
Metodologa
En la teora del muestreo se hace nfasis en la definicin de estimadores, en el estudio de sus propiedades, entre las que se encuentra la distribucin muestral. La distribucin muestral se refiere al modelo de probabilidad que describe el comportamiento de los estimadores cuyos valores dependen de las muestras y por lo tanto son variables aleatorias.

13/02/2012

Elisha Jacobo Rufeil

92

6. Inferencia estadstica
Metodologa
El resultado ms importante de la inferencia estadstica llamado del Lmite Central, determina la forma de las distribuciones muestrales y que origina un mtodo para la comprobacin de hiptesis sobre los parmetros poblacionales. inferencia
Se definen hiptesis sobre los parmetros de la poblacin Se recolectan datos: muestra Se obtienen conclusiones sobre los parmetros

13/02/2012

Elisha Jacobo Rufeil

93

7. Muestreo
Por qu muestreo?
La mayora de las investigaciones de mercado usan muestreo con la intencin de conocer ms acerca de grupos grandes de personas. Lo anterior se personas. realiza por medio del estudio de un subconjunto de la poblacin y slo en pocos casos es recomendable observar el total (censo). censo)

13/02/2012

Elisha Jacobo Rufeil

94

7. Muestreo
Cmo slo cientos o algunos miles de personas pueden representar poblaciones de millones?
Muestras bien seleccionadas (muestras probabilsticas) probabilsticas) an pequeas en relacin a la poblacin pueden representar una poblacin muy variada en estructura. Sin embargo hay que tomar estructura. en cuenta la variabilidad muestral. muestral.
13/02/2012 Elisha Jacobo Rufeil 95

7. Muestreo

e
Qu es la variabilidad muestral?
Algo se debe perder cuando se muestrea. Cada vez muestrea. que se toman muestras diferentes de la misma poblacin esperamos tener resultados distintos obedeciendo cierta distribucin de probabilidad (distribucin muestral). Cada uno de estos muestral) resultados estar equivocado hasta un cierto grado. grado. A este grado de variabilidad se le llama variabilidad muestral. muestral o error muestral.
13/02/2012 Elisha Jacobo Rufeil 96

7. Muestreo
Qu es la distribucin muestral?
Cada vez que se muestrea se obtiene un resultado diferente. diferente. Cul es la probabilidad de que resulte X o resulte Y ? Esta es la distribucin muestral: El muestral: patrn de todos los resultados posibles al obtener una muestra de la misma poblacin. poblacin.

13/02/2012

Elisha Jacobo Rufeil

97

7. Muestreo
Qu es la distribucin muestral?
Ejemplo: Ejemplo:

Se sabe que en una poblacin determinada el 50% de la gente tiene la caracterstica C.

Se toma una muestra de tamao 10

13/02/2012

Elisha Jacobo Rufeil

98

7. Muestreo
Qu es la distribucin muestral?
Resultado % 100 90 80 70 60 Probabilidad 0.001 0.010 0.044 0.117 0.205 Resultado % 50 40 30 20 10 0

Ejemplo:
Probabilidad 0.246 0.205 0.117 0.044 0.010 0.001

Estimaciones: p
13/02/2012 Elisha Jacobo Rufeil 99

7. Muestreo
Qu es la distribucin muestral?
0.300 0.250 0.200 0.150 0.100 0.050 0.000

Ejemplo:

20

40

60

80

13/02/2012

Elisha Jacobo Rufeil

10 0

100

7. Muestreo
Cul es la probabilidad de observar a todos los individuos en la muestra con la caracterstica C, con diferentes n ?
n 2 5 10 15 20
13/02/2012

Probabilidad 0.2500000000 0.0312500000 0.0009765625 0.0000305176 0.0000009537

n 25 30 100 500 1000

Probabilidad 0.0000000298 0.0000000009 0.0000000000 0.0000000000 0.0000000000


101

Elisha Jacobo Rufeil

7. Muestreo

Por lo tanto, un factor determinante tanto, en la precisin de las estimaciones es el tamao muestral : n

13/02/2012

Elisha Jacobo Rufeil

102

7. Muestreo
Existen otros factores que afecten la precisin de las estimaciones?

S. Poblaciones con mayor variabilidad producirn S. estimadores menos precisos. Si el porcentaje de individuos precisos. 10% con la caracterstica C en ejemplo anterior fuera 10% y no 50% el error muestral sera menor. Esta es la variabilidad 50% menor. poblacional. poblacional.

13/02/2012

Elisha Jacobo Rufeil

103

7. Muestreo
Cmo puedo estimar el error muestral?
Teorema del Lmite Central: La distribucin muestral de Central: promedios o proporciones para tamaos de muestra grandes (50 o ms) ser siempre de la forma dada por la Distribucin Normal. Normal.

13/02/2012

Elisha Jacobo Rufeil

104

7. Muestreo
Cmo puedo estimar el error muestral?
Estndar. La Distribucin de Probabilidad Normal Estndar.

Q !0 W !1
-4
13/02/2012

-3

-2

-1

4
105

Elisha Jacobo Rufeil

7. Muestreo
Cmo puedo estimar el error muestral?
La Distribucin de Probabilidad Normal Estndar. Estndar.

13/02/2012

Elisha Jacobo Rufeil

106

7. Muestreo
Cmo puedo estimar el error muestral?
La Distribucin de Probabilidad Normal. Una caracterstica importante de la distribucin normal es que aproximadamente a 2 desviaciones 95% casos. estndar se tiene el 95% de los casos.

13/02/2012

Elisha Jacobo Rufeil

107

7. Muestreo
Cmo puedo estimar el error muestral?
Desviacin estndar de los estimadores. Correccin por poblacin finita Variabilidad poblacional

N n W N n
Tamao de la poblacin
13/02/2012

Tamao de la muestra

Elisha Jacobo Rufeil

108

7. Muestreo
Cmo puedo estimar el error muestral?
Por lo tanto, el grado de equivocacin de los estimadores (con respecto al verdadero valor del parmetro p) estar acotado con un nivel de confianza del 95% por la expresin: 95% expresin:

N n W2 e ! 2v N n
13/02/2012 Elisha Jacobo Rufeil

Rel. Directa Rel. Inversa


109

7. Muestreo
Cmo puedo saber el valor esperado o promedio de los estimadores?
Para estimadores insesgados, el valor insesgados, promedio de los estimadores es el valor del parmetro p a estimar

13/02/2012

Elisha Jacobo Rufeil

110

7. Muestreo
Qu puede causar que un estimador sea sesgado?
Definicin incorrecta de estimadores. muestral. Cobertura incompleta. Error en el marco muestral. No respuesta (entre 5 y 20%) Cuotas. Sobre-representacin deliberada. Cuotas. Sobre No conocer el diseo muestral

13/02/2012

Elisha Jacobo Rufeil

111

7. Muestreo
Qu es el diseo muestral?
El diseo muestral contempla los requerimientos no tan slo de precisin de estimadores, sino tambin de estimadores, costo, velocidad, costo, velocidad, practicalidad y credibilidad de las investigaciones a travs de encuestas. encuestas.

13/02/2012

Elisha Jacobo Rufeil

112

7. Muestreo
Qu es el diseo muestral?
Definiendo a la Poblacin Objetivo. El muestreo Objetivo. probabilstico requiere que cada individuo en la poblacin de inters tenga una probabilidad conocida y positiva de ser seleccionado. seleccionado.

13/02/2012

Elisha Jacobo Rufeil

113

7. Muestreo
Qu es el diseo muestral aleatorio simple? simple?
Es el ms sencillo de los diseos e implica que todas las posibles muestras del mismo tamao tienen una probabilidad igual de ser seleccionadas. Por ejemplo seleccionadas. para la seleccin del nmero premiado de la lotera se usa este tipo de muestreo. muestreo.

13/02/2012

Elisha Jacobo Rufeil

114

7. Muestreo
Qu es el diseo muestral aleatorio simple? simple?

13/02/2012

Elisha Jacobo Rufeil

115

7. Muestreo
Qu es el diseo muestral estratificado? estratificado?
La estratificacin es un mtodo de muestreo para reducir el error muestral. Asegura que los diferentes muestral. grupos o estratos de la poblacin estarn correctamente representados en la muestra. Dentro muestra. de cada estrato existe un proceso de seleccin aleatoria (generalmente un muestreo aleatorio simple) simple).
13/02/2012 Elisha Jacobo Rufeil 116

7. Muestreo
estratificado? Qu es el diseo muestral estratificado?
El xito de esta estrategia de muestreo depende de la existencia de diferencias marcadas entre estratos para la variable a medir y de homogeneidad dentro de los grupos (entre ms mejor). mejor).

13/02/2012

Elisha Jacobo Rufeil

117

7. Muestreo
Qu es el diseo muestral estratificado? estratificado?

13/02/2012

Elisha Jacobo Rufeil

118

7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
Para encuestas personales es demasiado costoso dispersar las entrevistas a lo largo del pas. Con la pas. intencin de reducir costos y tiempos de traslado, se definen grupos o conglomerados de personas que pertenecen a un nmero limitado de reas y que constituirn los elementos a seleccionar directamente. directamente.

13/02/2012

Elisha Jacobo Rufeil

119

7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?
Este procedimiento mejorar costos a cambio de aumentar el error muestral. El xito de la tcnica muestral. depender del nmero de elementos a seleccionar en cada conglomerado (entre menos mejor) y del grado de heterogeneidad dentro de los grupos (entre ms mejor). mejor).

13/02/2012

Elisha Jacobo Rufeil

120

7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?

13/02/2012

Elisha Jacobo Rufeil

121

7. Muestreo
Qu es el diseo muestral por conglomerados? conglomerados?

13/02/2012

Elisha Jacobo Rufeil

122

7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?
Para elegir una muestra de n unidades se toma una unidad al azar entre las k primeras y luego se toman las subsecuentes a intervalos de k. Este diseo tiene grandes ventajas cuando la seleccin de unidades se hace en campo. campo.

13/02/2012

Elisha Jacobo Rufeil

123

7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?

13/02/2012

Elisha Jacobo Rufeil

124

7. Muestreo
Qu es el diseo muestral sistemtico? sistemtico?

13/02/2012

Elisha Jacobo Rufeil

125

7. Muestreo
Qu es un proceso de correccin por ponderacin? ponderacin?
Este procedimiento se aplica a las muestras para obtener estimadores insesgados. Por ejemplo un subinsesgados. subgrupo de la poblacin puede estar sobre representado en la muestra, el proceso de ponderacin le dar su peso o importancia justa. justa.

13/02/2012

Elisha Jacobo Rufeil

126

7. Muestreo
Cmo determinar el tamao muestral? muestral?
El tamao de muestra requerido depende de tres factores : La variabilidad de la poblacin El diseo muestral La precisin esperada de los resultados

13/02/2012

Elisha Jacobo Rufeil

127

7. Muestreo
Cmo determinar el tamao muestral?
En trminos de una frmula se expresa: factor de diseo

4 v FD 2 v W 2 n! 2 e

13/02/2012

Elisha Jacobo Rufeil

128

8. Estimacin estadstica
La inferencia estadstica usa los resultados de una muestra para estimar u obtener conclusiones en cuanto a las caractersticas o parmetros de la poblacin. Hay dos tipos principales de estimadores: estimadores puntuales y estimadores de intervalo.
Elisha Jacobo Rufeil 129

13/02/2012

8. Estimacin estadstica
Estimadores puntuales. Utilizan un solo valor calculado a partir de la muestra para estimar el parmetro de la poblacin.

xQ s W
2 2

13/02/2012

Elisha Jacobo Rufeil

130

8. Estimacin estadstica
Estimadores de intervalo. Usan un rango de valores calculado a partir de la muestra que, a un nivel de confianza, asegura contener al parmetro a estimar.

Q
a b
13/02/2012 Elisha Jacobo Rufeil 131

8. Estimacin estadstica
Estimacin de medias (caso
Supuestos:
Se obtiene una muestra aleatoria simple Se conoce el valor de la desviacin estndar de la poblacin El tamao de muestra es mayor a 30 casos

conocida)

13/02/2012

Elisha Jacobo Rufeil

132

8. Estimacin estadstica
Estimacin de medias (caso
Hechos:
La media muestral es el mejor estimador puntual de la media de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la media muestral ms/menos el error muestral

conocida)

x s zE / 2
13/02/2012

W n

Donde -z /2 representa el /2 percentil de una distribucin Elisha Jacobo Rufeil normal estndar.

133

8. Estimacin estadstica
Estimacin de medias (caso

conocida)

Interpretacin correcta de una estimacin intervalar: Se tiene una confianza del 95% (por ejemplo) de que el intervalo calculado contiene el verdadero valor del parmetro

Q
13/02/2012 Elisha Jacobo Rufeil 134

8. Estimacin estadstica
Estimacin de medias (caso
Supuestos:
Se obtiene una muestra aleatoria simple Se desconoce el valor de la desviacin estndar de la poblacin El tamao de muestra es mayor a 30 casos

desconocida)

Q
13/02/2012 Elisha Jacobo Rufeil 135

8. Estimacin estadstica
Estimacin de medias (caso
Hechos:
La media muestral es el mejor estimador puntual de la media de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la media muestral ms/menos el estimador del error muestral

desconocida)

Q
13/02/2012

x s tE / 2
Elisha Jacobo Rufeil

s n
136

Donde -t /2 representa el /2 percentil de una distribucin t de student con n-1 grados de libertad.

8. Estimacin estadstica

Estimacin de proporciones
Supuestos:

Se obtiene una muestra aleatoria simple El experimento representa un ejercicio binomial np 5 y nq 5

13/02/2012

Elisha Jacobo Rufeil

137

8. Estimacin estadstica
Estimacin de proporciones
Hechos:
La proporcin muestral es el mejor estimador puntual de la proporcin de la poblacin El estimador de intervalo a un nivel de confianza 1- para la media se define como la proporcin muestral ms/menos el estimador del error muestral

p s zE / 2
13/02/2012

pq n
138

Donde -z /2 representa el /2 percentil de una distribucin Elisha Jacobo Rufeil normal estndar.

8. Estimacin estadstica
Estimacin de proporciones
Determinacin de tamao de muestra para estimacin de proporciones:

p
13/02/2012

n!

2 E /2

pq
2

Donde E representa el error muestral deseado.


Elisha Jacobo Rufeil 139

8. Estimacin estadstica
Intervalos de confianza para diferencias de medias y proporciones

( x1  x2 ) s tE / 2

s s  n1 n2

2 1

2 2

grados de libertad=mnimo entre n1-1 y n2-1

( p1  p2 ) s zE / 2
13/02/2012

p1q1 p2 q2  n1 n2
140

Elisha Jacobo Rufeil

9. Pruebas de hiptesis
Una prueba de hiptesis es un procedimiento para verificar una aseveracin acerca de alguna caracterstica de la poblacin

Si bajo un supuesto dado, la probabilidad de un suceso observado es excepcionalmente baja, se concluye que el supuesto es incorrecto
Elisha Jacobo Rufeil 141

13/02/2012

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Hiptesis nula (H0) : es la afirmacin que el valor de un parmetro es igual a una cantidad dada. Se asume que es verdadera y despus se llega a la conclusin de rechazar H0 o no rechazar H0

H 0 : Q ! 100
13/02/2012 Elisha Jacobo Rufeil 142

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Hiptesis alternativa (H1) : es la afirmacin de que el parmetro tiene un valor que, de alguna manera, difiere con la hiptesis nula.

H1 : Q 100
13/02/2012 Elisha Jacobo Rufeil 143

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Estadstico de prueba: es un valor calculado a partir de los datos muestrales que se usa para tomar la decisin de rechazar o no H0. Se construye convirtiendo el estadstico muestral (media o proporcin) en una puntuacin (como z o t) bajo H0.

13/02/2012

xQ z! W Elisha Jacobo Rufeil n

144

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Regin crtica o de rechazo: El conjunto de todos los valores del estadstico de prueba que pueden hacer que se rechace la hiptesis nula.
Valores por abajo de la zona blanca

13/02/2012

Elisha Jacobo Rufeil

145

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Valor crtico: Es valor que separa la regin crtica de los valores del estadstico de prueba que no conducen al rechazo de la hiptesis nula.

Valor crtico
13/02/2012 Elisha Jacobo Rufeil 146

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Valor P: Es la probabilidad de obtener un valor del estadstico de prueba que sea al menos tan extremo como el que arrojan los datos muestrales. La hiptesis nula se rechaza si el valor P es muy pequeo (0.05 o menos)

13/02/2012

Elisha Jacobo Rufeil

147

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Nivel de significancia ( ): Es la probabilidad de que el estadstico de prueba caiga en la regin crtica cuando la hiptesis nula es verdadera. Alpha representa la probabilidad de cometer el error de rechazar la hiptesis nula cuando es verdadera.

13/02/2012

Elisha Jacobo Rufeil

148

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Cola derecha H1 >

Cola izquierda H1 < /2


Elisha Jacobo Rufeil

Dos colas H1
149

13/02/2012

9. Pruebas de hiptesis
Componentes de una prueba de hiptesis

Criterio de decisin:
Mtodo tradicional. Rechazar la hiptesis nula si el estadstico de prueba cae dentro de la regin crtica, de otro modo no rechazarla. Mtodo del valor P. Si el valor P es menor o igual a entonces rechazar la hiptesis nula, de otro modo no rechazarla. Mtodo del intervalo de confianza. Rechazar cualquier valor que no este contenido en el intervalo de confianza. Nota: Elisha coincide 150 este mtodo no siempre Jacobo Rufeilcon los anteriores.

13/02/2012

9. Pruebas de hiptesis
Proporciones

Estadstico de prueba:

p p z! pq n
Para determinar el valor P y valor crtico usar la distribucin normal estndar.
13/02/2012 Elisha Jacobo Rufeil 151

9. Pruebas de hiptesis
Promedio con conocida

Estadstico de prueba:

xQ z! W n
Para determinar el valor P y valor crtico usar la distribucin normal estndar.
13/02/2012 Elisha Jacobo Rufeil 152

9. Pruebas de hiptesis
Promedio con desconocida

Estadstico de prueba:

xQ t! s n
Para determinar el valor P y valor crtico usar la distribucin t con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 153

9. Pruebas de hiptesis
Desviacin estndar

Estadstico de prueba:

(n  1) s G ! 2 W
2

Para determinar el valor P y valor crtico usar la distribucin chi cuadrada con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 154

9. Pruebas de hiptesis
Igualdad de proporciones

H 0 : p1 ! p2

Estadstico de prueba:

( p1  p2 ) z! pq pq  n1 n2 n1 p1  n2 p2 donde p ! n1  n2

13/02/2012

Para determinar el valor P y valor crtico usar la distribucin normal estndar.


Elisha Jacobo Rufeil

155

9. Pruebas de hiptesis
Igualdad de promedios independientes varianzas desiguales

H 0 : Q1 ! Q 2

Estadstico de prueba:

t!

( x1  x2 ) s s  n1 n2
2 1 2 2

Para determinar el valor P y valor crtico usar la distribucin t con grados de libertad igual al mnimo entre n1-1 y n2-1.
13/02/2012 Elisha Jacobo Rufeil 156

9. Pruebas de hiptesis
Igualdad de promedios independientes varianzas iguales

H 0 : Q1 ! Q 2

Estadstico de prueba:

t!

( x1  x2 ) s
2 p

n1
13/02/2012

2 p

n2

2 (n1  1) s12  (n2  1) s2 2 sp ! n1  n2  2

Para determinar el valor P y valor crtico usar la distribucin t con grados de libertad igual a n1+n2-2.
Elisha Jacobo Rufeil 157

9. Pruebas de hiptesis
Igualdad de promedios dependientes

H 0 : d ! Qd

Estadstico de prueba:
d  Qd sd n donde d es el valor medio de las diferencias t!
Para determinar el valor P y valor crtico usar la distribucin t con n-1 grados de libertad.
13/02/2012 Elisha Jacobo Rufeil 158

10. Anlisis de regresin

El anlisis de regresin es una tcnica til para medir el nivel de relacin existente entre una variable de inters (variable dependiente) y varias variables explicativas (variables independientes).

13/02/2012

Elisha Jacobo Rufeil

159

10. Anlisis de regresin


Ejemplo

En una encuesta aplicada a consumidores de cerveza en la Ciudad de Mxico, resulta de inters conocer los siguientes aspectos:
Cules son las caractersticas fsicas o intrnsecas de la cerveza (variables independientes) que influyen de manera ms directa en la intencin de compra de cerveza (variable dependiente)? Cmo se puede establecer una jerarquizacin de dichas caractersticas de la ms a la menos influyente?
Elisha Jacobo Rufeil 160

13/02/2012

10. Anlisis de regresin


Las caractersticas o atributos fueron medidos de la siguiente manera: Alcohol Consistencia

Amargor

13/02/2012

Elisha Jacobo Rufeil

161

10. Anlisis de regresin


Refrescancia

Sabor

13/02/2012 Elisha Jacobo Rufeil 162

10. Anlisis de regresin


Por otro lado, la variable dependiente (Intencin de Compra) fu medida en una escala de cinco puntos como la siguiente:

Definitivamente no la comprara Probablemente no la comprara Tal vez si o tal vez no la comprara Probablemente s la comprara Definitivamente s la comprara

13/02/2012

Elisha Jacobo Rufeil

163

10. Anlisis de regresin


El siguiente diagrama clarifica el tipo de relaciones que estamos buscando entre las variables:
Variables Independientes Nivel de Relacin Variable Dependiente

Alcohol Consistencia Amargor Refrescancia Sabor


13/02/2012

? ? ? ? ?
Elisha Jacobo Rufeil 164

Intencin de compra

10. Anlisis de regresin


As, para este ejemplo, la ecuacin matemtica que representa la relacin planteada entre los atributos de inters sobre una cerveza en general y el correspondiente nivel de compra es la siguiente:

Intencin de Compra = b3 Amargor +

b0 + b1 Alcohol + b2 Consistencia + b4 Refrescancia + b5 Sabor + e

De este forma, a partir del anlisis de regresin lineal buscaremos estimar el valor de los coeficientes beta de cada una de las variables, los cuales nos ayudarn a contestar las preguntas:
13/02/2012 Elisha Jacobo Rufeil 165

10. Anlisis de regresin


En conjunto, las variables independientes utilizadas en el modelo son estadsticamente las adecuadas para explicar el comportamiento de la variable Intencin de Compra? Cules son los coeficientes que de manera individual son estadsticamente importantes para explicar el comportamiento de la variable Intencin de Compra? Todos los coeficientes son positivos? En caso de tener coeficientes negativos, cul es la interpretacin que debemos darle a este tipo de coeficientes ?
Elisha Jacobo Rufeil 166

13/02/2012

10. Anlisis de regresin


En el caso de tener slo una variable independiente la tcnica se denomina regresin lineal simple con las siguientes definiciones: Ecuacin de regresin

y ! b0  b1 x

Dada una muestra de n pares (x,y) las estimaciones de b0 y b1 son:

n xy  x y b1 ! n x 2  ( x ) 2

b0 ! y  b1 x
13/02/2012 Elisha Jacobo Rufeil 167

Вам также может понравиться