Estadística para Los Negocios.: Facultad de Ciencias Economicas Franja Morada - Conduccion

FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION
ESTADSTICA PARA LOS NEGOCIOS.

Paul Newbold. Cmo resumir la informacin numrica. Poblaciones y muestras. Definicin. La poblacin es el conjunto completo de la informacin numrica sobre una caracterstica particular en la que el investigador est interesado. Una muestra es un subconjunto de los valores poblacionales observados. Notacin. Poblacin: N observaciones designadas por x ! x"! ...! xN. Muestra: n observaciones designadas por x ! x"! ...! xn Resumen numrico: medidas de centralizacin. La media. Definicin. La media de un conjunto de observaciones numricas es la suma de los valores del conjunto dividida por el n#mero de observaciones! es decir! su promedio. La media se calcula sumando todas las observaciones $ dividiendo el resultado por el n#mero de observaciones. %xpresiones algebraicas para la media. &ean x ! x"! ...! xN! los N datos correspondientes a una poblacin. %ntonces! la media
xi poblacional es' (
i =1
N &ean x ! x"! ...! xn! los datos correspondientes a una muestra. %ntonces! la media
muestral es'
X =
x
i =1
La mediana. Definicin. La mediana de un conjunto de observaciones es la observacin que ocupa el lugar central cuando stas estn ordenadas en sentido creciente si el n#mero de observaciones es impar! $ el promedio de las dos observaciones centrales si la cantidad es par. %s decir! si se tienen N observaciones ordenadas de menor a ma$or! la mediana es la observacin que ocupa la posicin )*N + ,-". cuando N es impar! $ la media de las observaciones que ocupan las posiciones *N-", $ )*N + ",-". cuando N es par.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %n aquellas situaciones en las que se considera inadecuado dar muc/o peso a las observaciones extremas! se preferir usar como medida de centrali0acin la mediana en lugar de la media. 1 pesar de esta ventaja de no verse tan afectada por las observaciones extremas! la mediana se usa con menor frecuencia que la media. %l motivo es que el desarrollo terico de los mtodos de inferencia basados en la media es considerablemente ms sencillo que el desarrollo de los mtodos basados en la mediana. La moda. Definicin. La moda de un conjunto de observaciones es el valor que aparece con ma$or frecuencia. %l concepto de moda es relevante en los casos de conjuntos de datos en los que /a$ observaciones que aparecen varias veces. Resumen numrico: medidas de dispersin. La varianza y la desviacin tpica. 2epresentemos por x ! x"! ...! xN una poblacin de valores numricos con media . Dado que queremos anali0ar la dispersin de estos valores! ser fijarnos en sus discrepancias con respecto a la media. &in embargo! las diferencias de las observaciones con respecto a la media estn equilibradas3 es decir! su suma es 43 pero no nos interesa el signo de estas diferencias. %l promedio de los cuadrados de las discrepancias nos proporciona una medida de la dispersin que se conoce con el nombre de varian0a. Definiciones. &ean x ! x"! ...! xN los N miembros de una poblacin con media . La varianza poblacional! "! es el promedio de los cuadrados de las diferencias entre estos valores $ su media. %s decir' ( ) *xi 5 , . - N ( * xi",-N 5 "
" "
i =1 i =1 N N
La desviacin tpica poblacional! ! es la ra0 cuadrada *positiva, de la varian0a. La equivalencia entre ambas frmulas se demuestra de la forma siguiente'
N N N N N N N
i =1 " i
*xi 5 , (
" "
i =1
*x 5 "xi + , (
" i "
i =1
x 5 " xi +
" i i =1
i =1
(
"
i =1
x 6 "N + N (
" i " "
i =1
x 5 N
Interpretacin de la desviacin tpica poblacional. 7uede usarse la desviacin tpica para estimar el porcentaje de valores de la poblacin que se encontrarn a menos de una distancia especfica de la media. 7ara construir tales estimaciones! usaremos dos reglas. 2egla de 8c/eb$c/ev. 7ara cualquier poblacin con media $ desviacin tpica ! al menos el 44* 6 -m",9 de los valores de la poblacin se encuentran a una distancia de la media menor que m veces la desviacin tpica! para cualquier n#mero m : .
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2egla emprica. 7ara la ma$ora de poblaciones grandes! aproximadamente el ;<9 de los valores de la poblacin se encuentran a una distancia de la media menor que una desviacin tpica! $ aproximadamente el =>9 estn a una distancia de la media menor que dos veces la desviacin tpica.
Varianza muestral y desviacin tpica. Definiciones. &ean x ! x"! ...! xn los n valores de una muestra cu$a media es x . La varianza muestral! s"! se define como s" ( ) *xi 5 x ,". - *n 6 , o s" ( ) *xi 5 x ,". - *n 6 ,
i =1 i =1 n n
La desviacin tpica muestral! s! es la ra0 cuadrada *positiva, de la varian0a. %l /ec/o de que se divida por *n 6 , en lugar de /acerlo por n es que en esta frmula /emos usado como medida de centrali0acin la media muestral en lugar de la media poblacional. La media de las desviaciones absolutas. Definiciones. &ean x ! x"! ...! xN los N valores de una poblacin cu$a media es . La media de las desviaciones absolutas es el promedio del valor absoluto de las desviaciones de estos
x valores respecto a su media! es decir' ?D1 (

i i =1
N La media muestral de las desviaciones absolutas se define de manera anloga como el promedio de las desviaciones absolutas de las observaciones muestrales respecto a su media. 1 la /ora de elegir una medida que describa la cantidad de dispersin de un conjunto de datos! la media de las desviaciones absolutas tiene dos ventajas frente a la desviacin tpica. %n primer lugar! es ms fcil de interpretar conceptualmente. %n segundo lugar! dado que en el clculo de la varian0a $ de la desviacin tpica se elevan al cuadrado las desviaciones individuales! estas dos medidas se vern ms influenciadas por observaciones extremadamente grandes o extremadamente peque@as que la media de las desviaciones absolutas. 1 pesar de sus ventajas! la media de las desviaciones absolutas se emplea con poca frecuencia en la prctica! debido a las complicaciones que pueden surgir si se usa para /acer inferencias sobre una poblacin a partir de las observaciones de una muestra. l ran!o o recorrido. Definicin. %l rango o recorrido de un conjunto de datos es la diferencia entre la ma$or $ la menor de sus observaciones.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %s susceptible de sufrir una distorsin considerable si la muestra contiene alguna observacin exageradamente atpica. 1dems! su valor puede verse influido por el n#mero de observaciones. La principal aplicacin econmica del recorrido es el control de calidad estadstico. l ran!o intercuartlico. Una forma de solventar el inconveniente de la dispersin del rango o recorrido es descartar unas pocas de las observaciones ms altas $ ms bajas! $ /allar el recorrido de las observaciones restantes. Los cuartiles se calculan de forma que /a$a el mismo n#mero de observaciones antes $ despus de cada cuartil.
Auartiles $ rango intercuartlico. &upongamos que se tienen N observaciones ordenadas de menor a ma$or. %ntonces! el primer cuartil es la observacin que ocupa la posicin )*N + , - B. $ el tercer cuartil es la observacin que ocupa la posicin )C*N + , - B.. %l segundo cuartil *la mediana, es la observacin que ocupa la posicin )*N + , - ".. Auando *N + , no es un m#ltiplo entero de B! los cuartiles se calculan por interpolacin. &e toma como primer cuartil el n#mero que est a una determinada posicin *4!">3 4!>3 4!D>, entre la x $ la x+ observacin. 1nlogamente! tomamos como tercer cuartil el n#mero que est a una determinada posicin entre la x $ la x+ observacin. La diferencia entre el tercer $ el primer cuartil nos da una medida de la dispersin que se conoce con el nombre de rango intercuartlico. %s el rango que contiene la mitad central de las observaciones. &e ve mu$ poco influenciado por observaciones atpicas. "atos a!rupados e #isto!ramas. Los subintervalos en los que se dividen el conjunto de datos! reciben el nombre de clases! $ el n#mero de observaciones en cada clase se llama frecuencia. 7ara cada clase particular! la frecuencia acumulada es el n#mero total de observaciones que /a$ en esa clase $ las anteriores. Las frecuencias relativas acumuladas son las sumas acumuladas de las frecuencias relativas. &e obtiene a@adiendo la frecuencia relativa de esa clase a la frecuencia relativa acumulada de la clase anterior. Definiciones $ notacin. &upongamos que un conjunto de N observaciones numricas se subdivide en E clases. %ntonces' 1. Los n#meros de observaciones que caen en cada una de estas clases reciben el nombre de frecuencias! $ se designan f ! f"! ...! fE. 7uesto que N es el n#mero total de observaciones! deber verificarse'
i =1
fi ( N
2. La proporcin de observaciones que se encuentra en cada una de las clases recibe el nombre de frecuencia relativa. 7or tanto! la frecuencia relativa de la clase i5sima es f -N. 3. La proporcin de todas las observaciones que son menores que el lmite superior de la i 6 sima clase recibe el nombre de frecuencia relativa acumulada. %sta proporcin viene dada por f -N + f"-N + ... + fi-N ( *f + f" + F + fi,-N Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2eglas generales. . %l rango de posibles observaciones debe subdividirse en clases no solapadas! de forma que cada observacin particular debe estar en una $ slo una de las clases. ". %n general! para lograr una interpretacin ms fcil! es preferible establecer intervalos de igual longitud. C. %s importante que nos aseguremos de que los puntos medios de las clases o intervalos son representativos de los valores de los miembros de esa clase. B. Aon frecuencia! la decisin ms difcil de tomar es decidir el n#mero de clases a incluir. &i el n#mero de clases es demasiado peque@o! la clasificacin resultante puede esconder aspectos importantes de los datos. &i /a$ demasiadas clases! puede resultar un grfico difcil de interpretar. Diagramas de tallo y ho as. %l diagrama de tallos $ /ojas consiste en agrupar los datos seg#n sus primeras cifras! $ /acer un listado de las #ltimas cifras de cada miembro de una clase. 8ransmite una impresin visual del n#mero de observaciones de cada clase. Resumen numrico de datos a!rupados. $edia y varianza para con%untos de datos con observaciones repetidas. ?edia $ varian0a para conjuntos de datos con observaciones repetidas. &upongamos que en un conjunto de datos aparecen los valores m ! m"! ...! mE! con frecuencias f ! f"! ...! fE respectivamente. 1. 7ara una poblacin de N observaciones! tal que N ( La media es (
i =1
fi
fm
i i =1
N La varianza es' ( ) fi*mi 5 , . - N ( )* fimi", - N. 5 "

" " i =1 i =1 K K
2. 7ara una muestra de n observaciones! tal que n ( La media es x (
i =1
fi
fm
i i =1
n La varianza es' s" ( ) fi*mi 5 x ,". - *n 6 , ( G)* fimi", - N. 5 n x "H- *n 6 ,

i =1 i =1 K K
$edia y varianza para datos a!rupados. &upongamos que se dispone slo de datos agrupados en clases. &in embargo! no conocemos el valor exacto de las observaciones. 7ara poder dar alguna medida! necesitaremos /acer alguna aproximacin. 7uesto que la locali0acin exacta de los valores de cada clase es desconocida! una posibilidad consiste en proceder como si todos los puntos de una clase estuviesen situados en el centro del intervalo. Auando se /ace esto! suele llamarse a los untos medios de cada clase marcas de clase. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION ?edia $ varian0a aproximadas para datos agrupados. &upongamos que tenemos datos agrupados en E clases con frecuencias f ! f"! ...! fE. &i los puntos medios de estas clases son m ! m"! ...! mE! la media $ la varian0a del conjunto de datos agrupados pueden estimarse usando las frmulas para observaciones repetidas que se dieron anteriormente. $ediana y ran!o intercuartlico para datos a!rupados. %stimacin de la posicin de una observacin en una clase. &upongamos que una clase! cu$o extremo inferior es L $ cu$o extremo superior es U! contiene f observaciones. &i se ordenan estas observaciones de menor a ma$or! se (U L) estimar la j 6 sima observacin por' L + *j 6 I, para j ( ! "! ...! f f Clase modal. Definicin. 7ara datos agrupados! la clase modal es la clase con ma$or frecuencia. &simetra. %n una distribucin simtrica! los datos se distribu$en simtricamente alrededor de su valor central3 las observaciones extremadamente grandes no son ms frecuentes que las extremadamente peque@as. Una distribucin asimtrica a la derec/a! tiene la caracterstica de que su media es ma$or que su mediana. Una distribucin asimtrica a la i0quierda! representa la situacin opuesta. %l /istograma es una /erramienta grfica importante para anali0ar los datos. 'tros mtodos !r(ficos. "ia!ramas de barras. Los diagramas de barra constitu$en una /erramienta mu$ adecuada para comparar los tama@os relativos de cantidades que se distribu$en! en el espacio! en el tiempo. Los diagramas de barras por componentes! permite /acer comparaciones visuales tanto sobre el total como sobre sus componentes individuales. )r(ficos temporales. Una forma alternativa de ilustrar la evolucin de una cantidad a lo largo del tiempo! consiste en dibujar un grfico con los diferentes valores a lo largo del tiempo. &ituando el tiempo a lo largo del eje /ori0ontal! $ la cantidad numrica de inters en el eje vertical! se obtiene! para cada observacin! un punto del grfico. Uniendo los puntos consecutivos mediante lneas se obtiene un grfico temporal! que proporciona una idea visual de la evolucin fcil $ rpida de la variable. Los grficos temporales proporcionan una visin mu$ adecuada de la evolucin /istrica de una variable.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Picto!ramas. Los pictogramas! o diagramas de tarta! son #tiles para representar la divisin de un todo de las partes que lo constitu$en. La tarta se constru$e de forma que el rea de cada fragmento es proporcional a la frecuencia que le corresponde. "ia!ramas de dispersin. Los diagramas de dispersin! proporcionan una visin grfica de la relacin entre dos variables. "ia!ramas de ca%a. %l rectngulo *o JcajaK, se dibuja de forma que sus lmites inferior $ superior corresponden al primer $ al tercer cuartil respectivamente. %n el interior de la caja se /a dibujado una lnea para se@alar el lugar que ocupa la mediante. %l valor atpico aparece lejos de la caja! $ las lneas que van desde los bordes de la caja /asta las lneas intermitentes *o JbigotesK, se@alan la menor $ la ma$or de las observaciones restantes. Los diagramas de caja resultan mu$ #tiles para comparar visualmente dos o ms conjuntos de datos.
Probabilidad. *ntroduccin. &i nos basamos en la informacin muestral! es imposible determinar exactamente la reaccin de la totalidad de la poblacin3 cualquier medida de dic/a reaccin inevitablemente llevar consigo incertidumbre. +perimentos aleatorios, resultados, sucesos. Definicin. Un e!perimento aleatorio es un proceso que puede concretarse en al menos dos resultados posibles! con incertidumbre en cuanto a cul de ellos tendr lugar. Los resultados posibles de un experimento aleatorio se denominan resultados b"sicos! $ el conjunto de todos los resultados bsicos se llama espacio muestral. Definicin. Los resultados bsicos no pueden ocurrir simultneamente. %l experimento aleatorio debe conducir necesariamente a la ocurrencia de uno de los resultados bsicos. &e utili0ar & para denominar el espacio muestral. Definicin. Un suceso es un conjunto de resultados bsicos de un espacio muestral! $ se dice que ocurre si el experimento aleatorio da lugar a uno de los resultados bsicos que lo constitu$en. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Definicin. &ean 1 $ L dos sucesos pertenecientes a un espacio muestral &. &u interseccin! que se denomina 1 L! es el conjunto de todos los resultados bsicos en & que pertenecen a 1 $ a L. 7or tanto! la interseccin 1 L ocurre si $ solo si tanto 1 como L ocurren. De manera ms general! dados E sucesos % ! %"! ...! %E! su interseccin % %" ... %E! es el conjunto de todos los resultados bsicos que pertenecen a todo %i*i ( ! "! ...! E,. Definicin. &i los sucesos 1 $ L no tienen en com#n resultados bsicos! se denominan mutuamente e!cluyentes $ su interseccin 1 L es el con unto vaco. De esto se deduce! entonces! que 1 L no puede ocurrir. De manera ms general! los E sucesos % ! %"! ...! %E se dice que son mutuamente exclu$entes si todo par de estos sucesos s mutuamente exclu$ente! es decir! si %i %j es el conjunto vaco para todo i j. Definicin. &ean 1 $ L los dos sucesos en el espacio muestral &. &u unin! denominada 1 L! es el conjunto de todos los resultados bsicos en & que pertenecen al menos a uno de estos dos sucesos. 7or tanto! la unin 1 L tiene lugar si $ slo si 1 $-o L ocurren. De manera ms general! dados E sucesos % ! %"! ...! %E! su unin! % %" ... %E! es el conjunto de todos los resultados bsicos pertenecientes al menos a uno de estos E sucesos. Definicin. &ean % ! %"! ...! %E E sucesos en el espacio muestral &. &i % %" ... %E ( &! estos E sucesos se denominan colectivamente e!haustivos.
Definicin. &ea 1 un suceso en el espacio muestral &. %l conjunto de resultados bsicos de un experimento aleatorio perteneciente a & pero no a 1 se denomina el complementario de 1! $ se representa por A 2eglas de probabilidad. 1. &ean 1 $ L dos sucesos. %ntonces los sucesos 1 L $ A L son mutuamente exclu$entes! $ su unin es L. Alaramente' *1 L, * A L, ( L 2. &ean 1 $ L dos sucesos. Los sucesos 1 $ A L son mutuamente exclu$entes! $ su unin es 1 L. De su observacin debe quedar claro que' 1 * A L, ( 1 L 3. &ean % ! %"! ...! %E E sucesos mutuamente exclu$entes $ colectivamente ex/austivos! $ sea 1 otro suceso. %ntonces! los E sucesos % 1! %" 1! ...! %E 1 son mutuamente exclu$entes $ su unin es 1. -.u es la probabilidad/ %l concepto de probabilidad pretende aportar una medida numrica de la verosimilitud de ocurrencia de un suceso. 0recuencia relativa. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &upongamos que un experimento aleatoria puede ser replicado de tal manera que! despus de una tentativa! es posible volver al estado inicial $ repetir el experimento de modo que el resultado no se vea afectado por los resultados previos. &i se reali0a un n#mero N de experimentos $ el suceso 1 ocurre N1 veces *N1 obviamente depende de N,! tenemos que' 7roporcin de ocurrencias de 1 en N intentos ( N1-N 1/ora bien! si N es mu$ grande! esperaremos que la proporcin N1-N no experimente gran variacin a medida que N aumenta! es decir! la proporcin de ocurrencias de 1 permanecer aproximadamente constante. Definicin. &ea N1 el n#mero de ocurrencias de un suceso 1 en N repeticiones. %ntonces! siguiendo el concepto de probabilidad de frecuencia relativa! la probabilidad de que 1 ocurra es el lmite del cociente N1-N a medida que el n#mero de intentos N se /ace infinitamente grande. Probabilidad sub%etiva. Una visin alternativa! que no depende de la nocin de experimentos repetibles! considera la probabilidad como un concepto personal subjetivo que expresa un grado de creencia individual sobre la posibilidad de que un suceso ocurra. Las probabilidades subjetivas son personales3 no se requiere que diferentes individuos consideren que el mismo suceso debe tener lugar con las mismas probabilidades. La probabilidad y sus postulados. Postulados probabilsticos. 1. &i 1 es un suceso cualquiera en el espacio muestral &! o M 7*1, M 2. &ea 1 un suceso en &! $ sean Ni los resultados bsicos. %ntonces! 7*1, (
7*Ni,!
donde la notacin indica que el sumatorio corresponde a todos los resultados bsicos pertenecientes a 1. C. 7*&, ( %l primer postulado exige que una probabilidad se encuentre entre 4 $ . el segundo puede ser justificado en trminos de las frecuencias relativas. &upongamos que un experimento aleatorio se repite N veces. &ea Ni el n#mero de veces que el resultado bsico Ni ocurre $ N1 el n#mero de veces que el suceso 1 ocurre. %ntonces! dado que los resultados bsicos son mutuamente exclu$entes! N1 es justamente la suma de Ni correspondiente a todos los resultados bsicos en 1! es decir' N1 ( por el n#mero de repeticiones N! obtenemos' N1-N (
Ni! $ dividiendo
Ni-N
7ero bajo el concepto de frecuencia relativa de probabilidad! N1-N tiende a 1! $ cada Ni-N tiende a 7*Ni, a medida que N se /ace infinitamente grande. %l tercer postulado! sustitu$endo 1 por el espacio muestral & en el segundo postulado tenemos que' 7*&, (
7*Ni, donde el sumatorio se extiende a todos los resultados bsicos en el espacio
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION muestral. 7ero dado que 7*N, ( por el tercer postulado! se deduce que'
7*Ni, (
%s decir! la suma de las probabilidades de todos los resultados bsicos en el espacio muestral es . Consecuencia de los postulados. 1. &i el espacio muestral & est constituido por n resultados bsicos igualmente probables! N ! N"! ...! Nn! entonces cada una de ellos tiene una probabilidad -n! es decir' 7*N , ( -n *i ( ! "! ...! n,. n %s decir! si 7*Ni, es igual para todo resultado bsico $ i ( 7*Ni, ( ! entonces! 7*Ni, ( -n para todo resultado. 2. &i el espacio muestral & est constituido por n resultados bsicos igualmente probables $ el suceso 1 est formado por n1 de estos resultados! entonces! 7*1, ( n1-n 8odo resultado bsico tiene probabilidad -n $! 7*1, es justamente la suma de las probabilidades *cada una es -n, de los n1 resultados bsicos en 1. 3. &ean 1 $ L dos sucesos mutuamente exclu$entes. %ntonces la probabilidad de la unin es la suma de las probabilidades individuales! es decir' 7*1L, ( 7*1, + 7*L, De manera ms general! si % ! %"! ...! %E son sucesos mutuamente exclu$entes! *% %" ...%E, ( 7*% , + 7*%", + ... + 7*%E, La probabilidad de la unin de 1 $ L es 7*1L, (
A B
7*Ni, donde el sumatorio se
extiende a todos los resultados bsicos en 1 L. 7ero dado que 1 $ L son mutuamente exclu$entes! un resultado bsico no puede pertenecer a ambos sucesos! por lo que el lado derec/o de la ecuacin puede ser dividido en dos partes' (
A B
7*Ni,
7*Ni, +
7*Ni, %l lado derec/o de esta ecuacin es 7*1, + 7*L,.
4. &i % ! %"! F! %E son sucesos mutuamente exclu$entes! la probabilidad de la unin es 7*% %" ...%E, ( Dado que los sucesos son colectivamente ex/austivos! su unin es la totalidad del espacio muestral &! $ el resultado se deduce del tercer postulado. Permutaciones y combinaciones. %l n#mero de posibles ordenaciones de x objetos es' x*x 6 ,*x 6 ", ... *",* , ( xO Definicin. %l n#mero de permutaciones! n7x! de n objetos tomados de x en x es el n#mero de posibles ordenaciones cuando x objetos /an de ser seleccionados de un total de n $ n! dispuestos en orden. %ste n#mero es n7x ( (n x)! Definicin.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %l n#mero de combinaciones! nAx! de n objetos tomados de x en x es el n#mero de n! posibles elecciones que pueden ser /ec/as. %ste n#mero es' nAx ( x!(n x)! Re!las de la probabilidad. &ea 1 un suceso en el espacio muestral &. Dado que 1 $ su complementario A son mutuamente exclu$entes! 7*1 A , ( 7*1, + 7* A , $! dado que 1 $ A son colectivamente ex/austivos' 7*1 A , ( . De estas dos ecuaciones se deduce que 7*1, + 7* A , ( o 7* A , ( 6 7*1, de modo que la probabilidad de que un suceso no ocurra es menos la probabilidad de que s ocurra. &ean 1 $ L dos sucesos. &i 1 $ L son mutuamente exclu$entes! la probabilidad de la unin es la suma de las probabilidades individuales. 7ara calcular la unin cuando los sucesos no son mutuamente exclu$entes! sabemos que los sucesos *1 L, $ * A L, son mutuamente exclu$entes! $ su unin es L. 7or tanto' 7*L, ( 7*1L, + 7* A L, Los sucesos 1 $ * A L, tambin son mutuamente exclu$entes! $ su unin es 1 L! por lo que 7*1 L, ( 7*1, + 7* A L, Despejando 7* A L, e igualando obtenemos' 7*1 L, ( 7*1, + 7*L, 6 7*1 L, 2egla de la suma de probabilidades. &ean 1 $ L dos sucesos. La probabilidad de la unin es' 7*1L, ( 7*1, + 7*L, 6 7*1L, La regla implica que la probabilidad de la unin no es la suma de las probabilidades individuales! a no ser que los sucesos sean mutuamente exclu$entes! es decir! a no ser que la probabilidad de la interseccin sea cero. La posibilidad de que cualquier suceso ocurra es probable que dependa de la ocurrencia o no ocurrencia de otros sucesos. Definicin. &ean 1 $ L dos sucesos. La probabilidad condicional del suceso 1! dado el suceso L! P( A B ) denominada 7*1-L,! se define como 7*1-L, ( siempre que 7*L, : 4. De igual P( B) P( A B ) modo! la probabilidad condicional de L dado 1 se define como 7*L-1, ( P( A) siempre que 7*1, : 4. %sta definicin puede ser explicada en trminos de frecuencias relativas. &upongamos que un experimento aleatorio es repetido N veces! con NL ocurrencias del suceso L $ N1L ocurrencias de los sucesos 1 $ L conjuntamente. %ntonces! la proporcin de veces que 1 ocurre! cuando L /a ocurrido es N1L-NL $ se puede pensar en la probabilidad condicional de 1 dado L como el lmite de la proporcin cuando el n#mero de rplicas del experimento se /ace infinitamente grande. 7ero N1L-NL ( *N1L-N, - *NL-N, $! a medida que N aumenta! el numerador $ el denominador del lado derec/o de esta expresin tienden a 7*1 L, $ 7*L,! respectivamente.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2egla del producto de probabilidades. &ean 1 $ L dos sucesos. La probabilidad de la interseccin es' 7*1L, ( 7*1PL,.7*L, 8ambin' 7*1L, ( 7*LP1,.7*1, Definicin. &ean 1 $ L dos sucesos. &e dice que estos sucesos son independientes estadsticamente si $ slo si 7*1 L, ( 7*1,.7*L, &e deduce de la regla del producto que son conclusiones equivalentes' 7*1PL, ( 7*1, si 7*L, : 4 7*LP1, ( 7*L, si 7*1, : 4 De manera ms general! los sucesos % ! %"! ...! %E son independientes estadsticamente si $ slo si 7*% %"... %E, ( 7*% ,.7*%",...7*%E, &upongamos que creemos que la probabilidad de que un suceso 1 ocurra es 7*1,. &e nos da a continuacin la informacin adicional de que el suceso L /a ocurrido. &i esto no cambia mi opinin sobre la probabilidad de ocurrencia de 1! mi evaluacin de la probabilidad condicional 7*1PL, ser igual a 7*1,. Probabilidades bivariantes. Un experimento aleatorio /a de llevarse a cabo! $ el inters se centra en dos grupos distintos de sucesos. Los llamaremos 1 ! 1"! ...! 1/ $ L ! L"! ...! LQ. Los sucesos 1i son mutuamente exclu$entes $ colectivamente ex/austivos! al igual que los sucesos L j. &in embargo! cualquier suceso 1i puede ocurrir conjuntamente con cualquier sucesos Lj! de modo que las intersecciones 1i Lj pueden tener lugar. %stas intersecciones son entonces los resultados elementales del experimento. Dos conjuntos de sucesos! considerados conjuntamente de esta manera! se denominan bivariantes $ sus probabilidades se llaman probabilidades bivariantes. &i se pueden asignar probabilidades a todos los sucesos 1i Lj! entonces! la totalidad de la estructura de probabilidad del experimento es conocida $ las otras probabilidades de inters pueden ser deducidas. Definicin. %n el contexto de las probabilidades bivariantes! las probabilidades de la interseccin 7*1i Lj, se denominan probabilidades con untas. Las probabilidades de los sucesos elementales! 7*1i, o 7*Lj,! se denominan probabilidades marginales. Dadas las probabilidades conjuntas! supongamos que necesitamos saber las probabilidades marginales. Aonsideremos un caso donde el inters reside en el suceso 1i. 1/ora 1i es la unin de los sucesos mutuamente exclu$entes 1i L ! 1i L"! ...! 1iLQ. 7or tanto! por la regla de la suma para sucesos mutuamente exclu$entes! la probabilidad del suceso 1i es la suma de las probabilidades de aquellas intersecciones que inclu$en 1 i! es decir' 7*1i, ( 7*1iL , + 7*1iL", + ... + 7*1iLQ,! Definicin. &ean 1 $ L dos atributos! cada uno de los cuales dividimos en categoras que dan lugar a sucesos mutuamente exclu$ente $ colectivamente ex/austivos que denominamos! respectivamente! 1 ! 1"! ...! 1/ $ L ! L"! ...! LE. &i todo suceso 1i es independiente de todo suceso Lj! se dice que los atributos 1 $ L son independientes.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION l teorema de 1ayes. &ean 1 $ L dos sucesos con probabilidades 7*1, $ 7*L,! respectivamente. La regla del producto de probabilidades dice que' 7*1 L, ( 7*1PL,7*L, $ tambin 7*1L, ( 7*LP 1,7*1,. Dado que el la0o i0quierdo de las ecuaciones es el mismo! lo mismo sucede con el lado derec/o! por lo que' 7*LP1,7*1, ( 7*1PL,7*L, Despejando $ suponiendo que la probabilidad 7*1, no es cero! deducimos el teorema de La$es. %l teorema de La$es. &ean 1 $ L dos sucesos. %ntonces' 7*LP1, ( P( A | B ).P( B ) P( A)
&upongamos que una persona est interesada en el suceso L $ se forma una opinin subjetiva de la probabilidad de que L ocurra3 en este contexto! la probabilidad 7*L, se denomina probabilidad a priori. &i despus este individuo consigue informacin adicional! puede provocar una modificacin de su juicio inicial. La probabilidad relevante correspondiente a L es a/ora la probabilidad condicional de L dado 1! que se denota probabilidad a posteriori. %l teorema de La$es es un mtodo que permite actuali0ar una probabilidad a priori cuando se conoce la informacin adicional de que el suceso 1 /a tenido lugar. %xiste una expresin alternativa del teorema de La$es. &ean % ! %"! ...! %Q E sucesos mutuamente exclu$entes $ colectivamente ex/austivos! $ sea 1 otro suceso cualquiera. La probabilidad de %i dado 1 para alg#n i puede calcularse directamente! utili0ando el teorema de La$es $ sustitu$endo L por %i. &in embargo! el denominador del lado derec/o de la ecuacin puede expresarse en trminos de las probabilidades condicionales de 1 dado %j $ las probabilidades de los %j. Los sucesos % 1! %"1! ...! %Q 1 son mutuamente exclu$entes $ que su unin es 1. &e deduce que la probabilidad de 1 es 7*1, ( 7*% 1, + 7*%"1, + ... + 7*%E 1, 1dems! la regla del producto de probabilidades nos dice que 7*%j 1, ( 7*1P%j,7*%j, *j ( ! "! ...! E, as que sustitu$endo en la ecuacin! tenemos que 7*1, ( 7*1P% ,7*% , + 7*1P %",7*%", + ... + 7*1P%E,7*%E, Rinalmente! esta reexpresin del teorema de La$es se obtiene sustitu$endo L por %i $ 7*1, en la primera ecuacin por el lado derec/o de la #ltima. 8eorema de La$es *expresin alternativa,. &ean % ! %"! ... %E E sucesos mutuamente exclu$entes $ colectivamente ex/austivos! $ sea 1 otro suceso cualquiera. La probabilidad condicional de %i! dado 1 puede ser expresada como' P( A | E1) P ( E1) 7*%iP1, ( P ( A | E1) P ( E1) + P ( A | E 2) P ( E 2) + ... + P ( A | EK ) P ( EK ) La ventaja de esta reexpresin del teorema reside en el /ec/o de que las probabilidades que inclu$e son en muc/as ocasiones aquellas de las que se dispone directamente. 2ariables aleatorias discretas y distribuciones de probabilidad. 2ariables aleatorias. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Definicin. Una variable aleatoria es una variable que toma valores numricos determinados por el resultado de un experimento aleatorio. %s importante distinguir entre una variable aleatoria $ los posibles valores que sta puede tomar. Usaremos letras ma$#sculas! tales como S! para designar la variable aleatoria $ la correspondiente min#scula x para designar un valor posible. Definicin. Una variable aleatoria es discreta si slo puede tomar una cantidad numerable de valores. De la definicin se deduce que una variable aleatoria que slo puede tomar un n#mero finito de variables es discreta. Tncluso si el n#mero de resultados posibles es infinito pero numerable! la variable aleatoria es discreta. Definicin. Una variable aleatoria es continua si puede tomar todos los valores de un intervalo. 7ara las variables aleatorias continuas! no es posible asignar probabilidades a cada valor concreto. "istribuciones de probabilidad para variables aleatorias discretas. &upongamos que S es una variable aleatoria discreta $ que x es uno de sus posibles valores. La probabilidad de que la variable aleatoria S tome el valor x se representa 7*S ( x,. La distribucin de probabilidad de una variable aleatoria es una representacin de las probabilidades de todos los resultados posibles. Definicin. La funcin de probabilidad! 7x*x,! de una variable aleatoria discreta S representa la probabilidad de que S tome el valor x! como funcin de x. %s decir! 7 x*x, ( 7*S ( x, donde la funcin se eval#a en todos los posibles valores de x. 7ropiedades de las funciones de probabilidad de variables aleatorias discretas. &ea S una variable aleatoria discreta con funcin de probabilidad 7x*x,. %ntonces! 1. 7x*x, : 4 para cada valor x 2. Las probabilidades individuales suman ! es decir'
7x*x, (
donde la notacin
indica la suma sobre todos los posibles valores de x. La propiedad dice que las probabilidades no pueden ser negativas. La propiedad " se obtiene como consecuencia del /ec/o de que los sucesos JS ( xK para todos los posibles valores de x! son mutuamente exclu$entes $ conjuntamente ex/austivos. 7or tanto! las probabilidades de estos sucesos deben sumar . Definicin. La funcin de probabilidad acumulada! Rx*x4,! de una variable aleatoria S representa la probabilidad de que S no tome un valor superior a x 4! como funcin de x4. %s decir! Rx*x4, ( 7*S M x4, donde la funcin se eval#a en todos los valores de x4. 2elacin entre funcin de probabilidad $ funcin de probabilidad acumulada. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &ea S una variable aleatoria con funcin de probabilidad 7 x*x, $ funcin de probabilidad acumulada Rx*x,. %ntonces! Rx*x4, (
x x 0
7x*x, donde la notacin indica que la suma es
sobre todos los posibles valores de x que son menores o iguales que x4. 7ropiedades de las funciones de probabilidad acumulada para variables aleatorias discretas. &ea S una variable aleatoria discreta con funcin de probabilidad acumulada R x*x4,. %ntonces! 1. 4 M Rx*x4, M para cada n#mero x4 2. &i x4 $ x son dos n#meros tales que x4 M x ! entonces! Rx*x4, M Rx*x , La propiedad establece que una probabilidad no puede ser menor que 4 ni ma$or que . la propiedad " implica que la probabilidad de que una variable aleatoria est por debajo de cierta cantidad no puede superar a la probabilidad de que est por debajo de una cantidad ma$or. speranzas de variables aleatorias discretas. %l valor esperado es la correspondiente medida de centrali0acin de una variable aleatoria. Definicin. %l valor esperado! %*S,! de una variable aleatoria S se define como %*S, (
x7x*x,
donde la notacin indica que la suma es sobre todos los posibles valores de x. %l valor esperado de una variable aleatoria se conoce como su media $ se representa x. La definicin de valor esperado puede /acerse en trminos de frecuencias relativas a largo pla0o. &upongamos que un experimento aleatorio se repite N veces! $ que el suceso JS ( xK ocurre en Nx ocasiones. %l promedio de los valores que toma la variable aleatoria sobre las N repeticiones ser entonces la suma de xNx-N sobre todos los posibles valores de x. Auando el n#mero de repeticiones N tiende a infinito! el coeficiente Nx-N tiende a la probabilidad de ocurrencia del suceso JS ( xK! es decir! a 7x*x,. 7or tanto! xNx-N tiende a x7x*x,. De este modo! el valor esperado puede entenderse como el valor promedio que tomara una variable aleatoria sobre un n#mero grande de repeticiones. La nocin de esperan0a no se restringe a la propia variable aleatoria! tambin puede aplicarse a cualquier funcin de la misma. Definicin. &ea S una variable aleatoria discreta con funcin de probabilidad 7 x*x,! $ sea g*S, una funcin de S. %ntonces! el valor esperado! %*g*S,,! de esta funcin se define como %)g*S,. (
g*S,7x*x,
La varian0a en un conjunto de observaciones numricas! es el promedio de las diferencias al cuadrado entre las observaciones $ su media. Del mismo modo! para definir la varian0a de una variable aleatoria! se constru$e un promedio ponderado de las posibles diferencias con la media al cuadrado3 la ponderacin asociada a *x 5 x," es la probabilidad de que la variable aleatoria tome el valor x. La varian0a puede verse como el Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION valor promedio que tomar la funcin *S 5 x," sobre un n#mero mu$ grande de repeticiones del experimento. Definicin. &ea S una variable aleatoria discreta. La esperan0a es la diferencia con la media al cuadrado *S 5 x," se denomina varianza! se representa "x! $ se obtiene como' "x ( %)*S 5 ,". (
*x 5 x,"7x*x,
La desviacin tpica! x! es la ra0 cuadrada positiva de la varian0a. La equivalencia entre la frmula alternativa $ la definicin puede verificarse' x" ( x,"7x*x, (
*x 5
*x" 5 "xx + x",7x*x, (
x"7x*x, 5 "x x7x*x, + x" 7x*x,

x x
7ero /emos visto que x" (
x7x*x, ( x
7x*x, ( ! luego x" (
xU"7x*x, 5 "x" +
x"7x*x, 5 x"
Varian0a de una variable aleatoria discreta *frmula alternativa,. La varian0a de una variable aleatoria discreta S puede expresarse como "x ( %*S", 5 x" (
x"7x*x, 5 x"
Wemos definido la esperan0a de una funcin de una variable aleatoria S. La funcin lineal a + bS! donde a $ b son constantes fijas! es de particular inters. &ea S una variable aleatoria que toma el valor x con probabilidad 7x*x,! $ consideremos la nueva variable aleatoria X! definida como X ( a + bS Auando la variable aleatoria S toma el valor x! X debe tomar el valor a + bx. ?edia $ varian0a de una variable aleatoria X ( a + bS. &ea S una variable aleatoria con media x $ varian0a x"! $ sean a $ b dos constantes. Definamos la variable aleatoria X ( a + bS. %ntonces! la media $ la varian0a de X son' x ( %*a + bS, ( a + bx $ X" ( var*a + bS, ( b"x" $! por tanto! la desviacin tpica de X es X ( PbPx &i X toma valores a + bx con probabilidades 7x*x,! su media es' %*X, ( X ( bx,7x*x, ( a
*a +
7x*x, + b
x7x*x,
%ntonces! puesto que el primer sumatoria del lado
derec/o de la ecuacin vale tenemos' %*X, ( a + bx.
$ el segundo sumatoria es! por definicin! la media de S!
1dems! la varian0a de X es! por definicin! X" ( %)*X 5 X,". ( &ustitu$endo a + bx por X se obtiene' X" (
x x
)*a + bx, 5 X." 7x*x,
*bx 5 bx,"7x*x, ( b" *x 5 x,"7x*x,
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2esultados. . 8omando b ( 4! se obtiene que para cualquier constante a! %*a, ( a $ Var*a, ( 4 %s decir! si una variable aleatoria siempre toma el valor a! tendr media a $ varian0a 4. 2. 8omando a ( 4 en estas ecuaciones! tenemos! para cualquier constante b! %*bS, ( bx $ Var*bS, ( b"x" %s decir! si una variable aleatoria se multiplica por una constante! la media queda multiplicada por la misma constante! $ la varian0a por el cuadrado de esa constante. X x 3. 8omando a ( x-x! $ b ( -x! tenemos' X ( a + bS ( luego x X x x 1 %* ,(5 + x ( 4 x x x X x Var * , ( * -x",x" ( x %s decir! restndole a una variable aleatoria su media $ dividindola por su desviacin tpica se obtiene una variable aleatoria con media 4 $ desviacin tpica .
"istribucin con%unta de variables aleatorias discretas. Definicin. &ean S e Y dos variables aleatorias discretas. &u funcin de probabilidad con unta representa la probabilidad de que simultneamente S tome el valor de x e Y tomo el valor $! como funcin de x e $. &e usa la notacin 7x!$*x! $,! de donde' 7x!$*x! $, ( 7*S ( x Y ( $, %n general! si S ! S"! ...! SE son E variables aleatorias discretas! su funcin de probabilidad conjunta es' 7x !x"!...!xE*x ! x"! ...! xE, ( 7*S ( x S" ( x" ... SE ( xE, Definicin. &ean S e Y dos variables aleatorias conjuntamente distribuidas. %n este contesto! la funcin de probabilidad de la variable aleatoria S se denomina funcin de probabilidad marginal! $ se obtiene sumando las probabilidades conjuntas sobre todos los posibles valores de Y! es decir' 7x*x, (
7x!$*x! $,
1nlogamente! la funcin de probabilidad marginal de la variable aleatoria Y es' 7$*$, (
7x!$*x! $,
%n general! si S ! S"! ...! SE son variables aleatorias discretas conjuntamente distribuidas! la funcin de probabilidad marginal de una de ellas se obtiene sumando las probabilidades conjuntas sobre todos los posibles valores de las dems. 7ropiedades de las funciones de probabilidad conjunta de variables aleatorias discretas. &ean S e Y variables aleatorias discretas con funcin de probabilidad conjunta 7x!$*x! $,. %ntonces' 1. 7x!$*x! $, : 4 para cualquier par de valores x e $. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2. La suma de las probabilidades conjuntas 7x!$*x! $, sobre todos los posibles pares de valores debe ser . Definicin. &ean S e Y dos variables aleatorias discretas conjuntamente distribuidas. La funcin de probabilidad condicional de la variable aleatoria Y! dado que la variable aleatoria S toma el valor x! representa la probabilidad de que Y tomo el valor $! como funcin de $! cuando se especifica el valor x para S. %sta funcin se representa 7 $Px*$Px,! $ por la definicin de Px , y ( x, y ) probabilidad condicional' 7$Px*$Px, ( 1nlogamente! la funcin de probabilidad Px ( x ) Px , y ( x, y ) condicional de S! dado Y ( $! es' 7$Px*$Px, ( Px ( x ) Definicin. Las variables aleatorias S e Y son independientes si $ slo si su funcin de probabilidad conjunta es el producto de sus funciones de probabilidad marginal! es decir! si $ slo si' 7x!$*x! $, ( 7x*x,7$*$, para todos los posibles valores x e $. %n general! las E variables aleatorias S ! S"! ...! SE son independientes si $ slo si 7x !x"!...!xE*x ! x"! ...! xE, ( 7x *x ,7x"*x", ... 7xE*xE, De la definicin de funcin de probabilidad condicional! se deduce que si las variables aleatorias S e Y son independientes! entonces! la funcin de probabilidad condicional de Y dado S es igual que la funcin de probabilidad marginal de Y! es decir! 7$Px*$Px, ( 7$*$, 1nlogamente! se deduce que 7xP$*xP$, ( 7x*x,
Definicin. La funcin de probabilidad con unta acumulada! Rx!$*x4! $4,! de un par de variables aleatorias discretas S e Y representa la probabilidad de que simultneamente S no exceda del valor x4 e Y no supere el valor $4! como funcin de x4 e $4. %s decir! Rx!$*x4! $4, ( 7*S M x4 Y M $4, donde la funcin se eval#a en todos los valores x4 e $4. %sto puede escribirse Rx!$*x4! $4, (
x x 0
7x!$*x!$, donde la notacin indica que la suma es sobre
y y 0
todos los pares de valores x e $ que las variables aleatorias pueden tomar simultneamente! $ que satisfacen x M x4 e $ M $4. Definicin. &ean S e Y dos variables aleatorias discretas con funcin de probabilidad conjunta 7 x!$*x! $,. La esperanza de una funcin g*S! Y, de estas variables aleatorias se define como %)g*S! Y,. (

x y
g*x! $,7x!$*x! $,
%n general! si las E variables aleatorias S ! S"! ...! SE tienen funcin de distribucin conjunta 7x !x"!...!xE,*x ! x"! ...! xE,! entonces! la esperan0a de la funcin g*S ! S"! ...! SE, es %)g*S ! S"! ...! SE,. (

x1
x2
... g*x ! ...! xE,7x

xK
!FxE
*x ! F! xE,
&upongamos que la variable aleatoria S tiene media x! e Y tiene media $! $ consideremos el producto *S 5 x,*Y 5 $,. &i los valores altos de S tienden a estar Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION asociados con valores altos de Y! $ valores bajos de S con valores bajos de Y! debemos esperar que este producto sea positivo! $ para ma$or asociacin con valores bajos de Y! $ valores bajos de S con valores altos de Y! el valor esperado de este producto debe ser negativo. Una esperan0a 4 para *S 5 x,*Y 5 $, implicar ausencia de relacin lineal entre S e Y. %n consecuencia! usaremos el valor esperado de *S 5 x,*Y 5 $, como medida de la relacin lineal en la poblacin. Definicin. &ea S una variable aleatoria con media x! $ sea Y una variable aleatoria con media $. %l valor esperado de *S 5 x,*Y 5 $, se denomina covarianza entre S e Y! $ se representa Aov*S! Y,. 7ara variables aleatorias discretas' Aov*S! Y, ( %)*S 5 x,*Y 5 $,. ( 5 x,*$ 5 $,7x!$*x! $, Una expresin equivalente es' Aov*S! Y, ( %*SY, 5 x$ (

x y
*x

x y
x$7x!$*x! $, 5 x$
Aovarian0a e independencia estadstica. &i un par de variables aleatorias son estadsticamente independientes! la covarian0a entre ellas es 4. sin embargo! el recproco no es necesariamente cierto. &umas $ diferencias de variables aleatorias. &ean S e Y un par de variables aleatorias con medias x $ $ $ varian0as x" $ $". &e verifican las siguientes propiedades' %l valor esperado de su suma es la suma de sus valores esperados' %*S + Y, ( x + $ 1. %l valor esperado de su diferencia es la diferencia de sus valores esperados' %*S 6 Y, ( x 5 $ 2. &i la covarian0a entre S e Y es 4! la varian0a de su suma es la suma de sus varian0as' Var*S + Y, ( x" + $" 3. &i la covarian0a entre S e Y es 4! la varian0a de su diferencia es la suma de sus varian0as' Var*S 6 Y, ( x" + $" &ean S ! S"! ...! SE E variables aleatorias con medias ! "! ...! E $ varian0a "! ""! ...! E". &e verifican las siguientes propiedades' 4. %l valor esperado de su suma es' %*S + S" + ... + SE, ( + " + ... + E 5. &i la covarian0a entre cada par de variables es 4! la varian0a de su suma es' Var*S + S" + ... + SE, ( " + "" + ... + E" Los resultados C! B $ ; requiere que las covarian0as entre las variables aleatorias sean 4. en general! si Aov*S! Y, es la covarian0a entre las variables aleatorias S e Y! puede probarse que' Var*S + Y, ( x" + $" + " Aov*S! Y, $ Var*S 6 Y, ( x" + $" 6 " Aov*S! Y, La distribucin binominal. &upongamos que un experimento aleatorio tiene slo dos resultados posibles que son mutuamente exclu$entes $ colectivamente ex/austivos. &ea p la probabilidad de xito3 la probabilidad de fracaso es! por tanto * 6 p,. La variable aleatoria S toma el valor si el resultado del experimento es xito $ 4 en caso contrario. La funcin de probabilidad de esta variable aleatoria es! entonces' 7x*4, ( * 6 p, 7x* , ( p %sta distribucin se conoce como la distribucin de #ernoulli. La media de una variable aleatoria Lernoulli es' x ( %*S, ( (p Cedido por el TURCO
x7x*x, ( *4,* 6 p, + * ,*p,
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Y la varian0a' x" ( %)*S 5 x,". (
*x 5 x,"7x*x, ( *4 6 p,"* 6 p, + * 6 p,"p ( p* 6 p,
Aonsideremos el caso en el que un experimento aleatorio! con dos resultados posibles! se repite varias veces. &upongamos que la probabilidad de xito en cada repeticin es p $ que se reali0an n ensa$os independientes! con lo que el resultado de un ensa$o no influ$e en el resultado de cualquier otro. %l n#mero de xitos S en las n repeticiones puede ser cualquier n#mero entero entre 4 $ n! $ estamos interesados en la probabilidad de obtener exactamente S ( x xitos en n repeticiones. %l resultado de las n repeticiones es una secuencia de n resultados! cada uno de los cuales debe ser xito *&, o fracaso *R,. %n las x primeras repeticiones el resultado es xito! mientras que en las restantes *n 6 x, es siempre fracaso. La probabilidad de xito en cada repeticin es p! $ la probabilidad de fallo * 6 p,. 7uesto que las n repeticiones son independientes! la probabilidad de cualquier secuencia de resultados es! por la regla de multiplicacin de probabilidades! igual al producto de las probabilidades de los resultados individuales. 7or tanto! la probabilidad de observar la secuencia de resultados descrita es' pUpU...Up * 6 p,U* 6 p,U...U* 6 p, ( px* 6 p,n5x 7ero nuestro inters original no era determinar la probabilidad de ocurrencia de una secuencia particular sino la probabilidad de obtener exactamente x xitos! sin tener en cuenta el orden de los resultados. %xisten varias secuencias en las que pueden aparecer x xitos intercalados entre *n 6 x, fracasos. De /ec/o! el n#mero de secuencias de este tipo es precisamente el n#mero de combinaciones den elementos tomados de x en x! puesto que podemos elegir x posiciones de un total de n en las que colocar los xitos. 7or tanto! el n#mero de secuencias que contienen x xitos en n repeticiones es nAx ( n! 1dems! estas secuencias son mutuamente exclu$entes! puesto que no x!(n x)! pueden ocurrir dos de ellas simultneamente. Wemos visto que el suceso Jse obtienen x xitos en n repeticionesK puede ocurrir de nAx maneras mutuamente exclu$entes! cada una con probabilidad px* 6 p,n5x. 7or tanto! por la regla de la adicin de probabilidades! la probabilidad buscada es la suma de estas nAx probabilidades individuales! es decir' 7*x n! +xitos en n repeticiones, ( px* 6 p,n5x x!(n x)! La distribucin binominal. &upongamos que un experimento aleatorio tiene slo dos resultados posibles mutuamente exclu$entes $ conjuntamente ex/austivos! JxitoK $ JfracasoK! $ que p es la probabilidad de obtener xito en cada repeticin. &i se reali0an n repeticiones independientes! la distribucin del n#mero de xitos! S! resultante se denomina n! distribucin binomial. &u funcin de probabilidad es' 7 x*x, ( px* 6 p,n 6 x x!(n x)! para x ( 4! ! "! ...! n Aonsideremos n ensa$os independientes! cada uno con probabilidad de xito p! $ sea S i ( si el resultado del i5simo ensa$o es xito $ 4 si no. Las variables aleatorias S ! S"! ...! Sn son! entonces! n variables Lernoulli independientes! cada una con probabilidad de xito p. 1dems! el n#mero total de xitos S es' S ( S + S" + ... + Sn Lo que significa que la variable aleatoria binomial puede expresarse como suma de variables aleatorias Lrenoull independientes. 7ara una variable Lernoulli' Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %*Si, ( p $ Var*Si, ( p* 6 p, para i ( ! "! ...! n 7or tanto! para la distribucin binomial' %*S, ( %*S + S" + ... + Sn, ( %*S , + %*S", + ... + %*Sn, ( np Aomo las variables aleatorias Lernoulli son independientes! la covarian0a entre ellas es 4! $' Var*S, ( Var*S + S" + ... + Sn, ( Var*S , + Var*S", + ... + Var*Sn, ( np* 6 p, ?edia $ varian0a de la distribucin binominal. &ea S el n#mero de xitos en n repeticiones independientes! cada una con probabilidad de xito p. %ntonces! S sigue una distribucin binominal con media' x ( %*S, ( np Y la varian0a' x" ( %)*S 5 x," ( np* 6 p, La distribucin #iper!eomtrica. %n los casos en los que el n#mero de elementos de la muestra es una proporcin grande del n#mero total de artculos en la poblacin! la distribucin binomial es inapropiada. La ra0n es que en estas situaciones no /a$ independencia entre el resultado de un elemento particular de la muestra $ los restantes. 7ara que la distribucin del n#mero de xitos en n ensa$os sea binomial! es necesario que los resultados de stos sean independientes. %ste no ser el caso si el muestreo se reali0a sobre una poblacin peque@a de elementos. &upongamos que un conjunto de N elementos! cada uno de los cuales puede etiquetarse como JxitoK o JfracasoK! contiene & xitos $ *N 6 &, fracasos. &e elige una muestra aleatoria de n elementos de este conjunto! $ buscamos la probabilidad de que la muestra contenga x xitos. %n primer lugar! el n#mero total de posibles muestras de n elementos N! que pueden elegirse de un total de N es el n#mero de combinaciones' NAn ( %l n!( N n)! n#mero de posibles maneras de obtener x xitos en la muestra de un total de & xitos es' S! 7uesto que la muestra contiene x xitos! tambin debe contener *n 6 x, &Ax ( x!( S x)! fracasos! $ el n#mero de maneras de elegirlos entre un total de *N 6 &, fracasos es' N5&An5x ( N S )! ( %l n#mero total de muestras de n elementos que contienen (n x )!( N S n + x)! exactamente x xitos $ *n 6 x, fracasos es! por tanto' S! ( N S )! 7or #ltimo! puesto que el n#mero de posibles &Ax N5&An5x ( x!( S x)! (n x )!( N S n + x)! muestras es NAn! la probabilidad de obtener x xitos en la muestra es' S! ( N S )! x!( S x )! (n x )!( N S n + x)! SCx. N SCn x 7*x xitos, ( ( N! NC n n!( N n)! La distribucin /ipergeomtrica. &upongamos que se elige una muestra aleatoria de tama@o n de un conjunto de N elementos. & de los cuales son xitos. La distribucin del n#mero de xitos! S! en la muestra se denomina distribucin hipergeom$trica. &u funcin de probabilidad es'
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION S! ( N S )! x!( S x )! (n x )!( N S n + x)! SCxN SCn x 7x*x, ( ( donde x puede tomar valores enteros N! NC n n!( N n)! entre el mximo de 4 $ )n 6 *N 6 &,. $ el mnimo de n $ &. La media $ la varian0a de esta distribucin son' x ( %*S, ( np N n np* 6 p, donde p ( &-N es la proporcin de xitos en la $ x" ( %)*S 5 x,". ( N 1 poblacin. &i el tama@o muestral es mu$ peque@o en relacin al n#mero total de elementos! N! las probabilidades /ipergeomtricas son mu$ parecidas a las binomiales! $ puede usarse la distribucin binomial en lugar de la /ipergeomtrica. %n este caso! *N 6 n, - *N 6 , est mu$ prximo a ! por lo que la varian0a de la distribucin /ipergeomtrica est prxima a np* 6 p,! la varian0a de la distribucin binomial. La distribucin de Poisson. . 7ara cada intervalo de tiempo peque@o! representado mediante un peque@o segmento entre 4 $ t del tiempo temporal! la probabilidad de que ocurra un suceso en ese intervalo es aproximadamente proporcional a la amplitud del intervalo. ". La probabilidad de ocurrencia de dos o ms sucesos en un intervalo como el descrito es despreciable en comparacin con la probabilidad de una ocurrencia. C. Wa$ independencia entre el n#mero de ocurrencias en intervalos no solapados. &i estas afirmaciones son ciertas! puede probarse que la probabilidad de x ocurrencias en el intervalo de 4 a t es' e x 7*x ocurrencias, ( donde es el n#mero medio de ocurrencias entre 4 $ t! $ e ( x! "!D <"< es la base de los logaritmos naturales. La distribucin de 7oisson. &e dice que la variable aleatoria S sigue una distribucin de Poisson si tiene funcin de e x probabilidad' 7x*x, ( 7ara x ( 4! ! "! ... donde es cualquier n#mero tal que x! :4 La media de esta distribucin es' x ( %*S, ( Y la varian0a' x" ( %)*S 5 x,". ( La forma de la funcin de probabilidad de 7oisson depende de la media . La distribucin de 7oisson aparece de manera natural para representar el n#mero de ocurrencias de un suceso en un perodo de tiempo. La distribucin de 7oisson puede usarse cuando el n#mero de ensa$os es grande! pero! al mismo tiempo! la probabilidad de xito en p en cada ensa$o es mu$ peque@a! con lo cual np tiene un tama@o moderado *la aproximacin que presentamos aqu es! en general! satisfactoria si np M D,. 1proximacin 7oisson de la distribucin binomial. &ea S el n#mero de xitos resultante de n ensa$os independientes! cada uno con probabilidad de xito p. La distribucin del n#mero de xitos S es binomial con media np. &in embargo! si el n#mero de ensa$os n es grande $ np tiene un tama@o moderado *preferiblemente np M D,! esta distribucin puede aproximarse bien por la distribucin de Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 7oisson de media ( np. La funcin de probabilidad de la distribucin aproximada es entonces' e np (np ) x 7x*x, ( 7ara x ( 4! ! "! ... x! 2ariables aleatorias continuas y distribuciones de probabilidad. "istribuciones de probabilidad de variables aleatorias continuas. Definicin. La funcin de distribucin acumulada Rx*x, de una variable aleatoria continua S expresa la probabilidad de que S sea menor o igual que x! como funcin de x! es decir! R x*x, ( 7*S M x, La funcin de distribucin acumulada para esta variable aleatoria es' 4 Rx*x, ( x si x M a si a M x M b si x : b
7robabilidades de intervalos $ funcin de distribucin acumulada. &ea S una variable aleatoria continua con funcin de distribucin acumulada Rx*x,! $ sean a $ b dos posibles valores de S que verifican a M b. La probabilidad de que S est entre a $ b es 7*a M S M b, ( Rx*b, 6 Rx*a, La funcin de probabilidad de una variable aleatoria discreta! expresa la probabilidad de que la variable tome un valor especfico. 7uede construirse una funcin anloga para variables aleatorias continuas! llamada funcin de densidad. Runcin de densidad. &ea S una variable aleatoria continua! $ x un n#mero perteneciente al rango de posibles valores de S. La funcin de densidad fx*x, de la variable S es una funcin que tiene las siguientes propiedades' 1. fx*x, : o para todo x ". &upongamos que dibujamos la funcin de densidad. &ean a $ b dos posibles valores de la variable aleatoria S que verifican que a M b. %ntonces! la probabilidad de que S est entre a $ b es el rea por debajo de la funcin de densidad entre los dos puntos. La probabilidad de que una variable aleatoria est entre un par de valores es el rea bajo la funcin de densidad entre los dos valores. %n primer lugar! teniendo en cuenta que la variable aleatoria debe tomar alg#n valor! puede deducirse que el rea total por debajo de la funcin de densidad es *este resultado es anlogo al requerimiento en variables aleatorias discretas de que la suma de probabilidades individuales sea ,. %n segundo lugar! sea Rx*x4, la funcin de distribucin acumulada evaluada en x4! en otras palabras! la probabilidad de que la variable aleatoria sea menor o igual que x4! es decir! Rx*x4, ( 7*S M x4, que es el rea debajo de la funcin de densidad a la i0quierda de x4. Zreas bajo funciones de densidad continuas. &i S es una variable aleatoria continua con funcin de densidad fx*x, $ funcin de distribucin acumulada Rx*x,! entonces' 1. %l rea total bajo la curva fx*x, es . Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 2. %l rea bajo la curva fx*x, a la i0quierda de x4 es Rx*x4,! donde x4 es cualquier valor posible de la variables aleatoria. Rormalmente! utili0ando notacin integral'
fx*x,dx (
La funcin de distribucin es! pues! la integral' Rx*x4, (
7or tanto! la funcin de densidad es la derivada de la funcin de distribucin! es decir' dFx ( x) fx*x, ( dx speranzas de variables aleatorias continuas. %speran0a de una variable aleatoria continua. &upongamos que el resultado de un experimento aleatorio puede ser representado mediante una variable aleatoria continua. &i tenemos N rplicas independientes de este experimento! entonces! el valor esperado de la variable aleatoria es la media de los valores obtenidos! cuando el n#mero de rplicas! N! tiende a infinito. Denominaremos el valor esperado de la variable aleatoria S como %*S,. 1nlogamente! si g*S, es una funcin de la variable aleatoria S! entonces el valor esperado de esta funcin es la media de los valores obtenidos en sucesivas rplicas independientes! cuando el n#mero de replicas tiende a infinito. Denominaremos el valor esperado de g*S, como %)g*S,.. De manera formal! utili0ando notacin integral! expresaremos el valor esperado de S como' %*S, (
x0
fx*x,dx
x.fx*x,dx
Y el valor esperado de la funcin g*S, como' %)g*S,. (
g*x,fx*x,dx
Definiciones. &ea S una variable aleatoria continua' 1. La media de S! representada por x! se define como el valor esperado de S! es decir! x ( %*S,. 2. La varianza de S! representada por x"! se define como la esperan0a del cuadrado de la diferencia entre la variable $ su media! *S 5 x,"! es decir! x" ( %)*S 5 x,". Una expresin alternativa para la varian0a es x" ( %*S", 5 x". 3. La desviacin tpica de S! x! es la ra0 cuadrada de la varian0a. &ea S una variable aleatoria continua con media x $ varian0a x"! sean a $ b constantes cualesquiera. Definimos la variable aleatoria X como X ( a + bS %ntonces la media $ varian0a de X son 0 ( %*a + bS, ( a + bx 0" ( Var*a + bS, ( b"x" 0 ( PbPx X x Aomo caso particular de estos resultados! la variable aleatoria X ( tiene media 4 $ x varian0a . "istribucin con%unta de variables aleatorias continuas. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Definiciones. &ean S ! S"! ...! SE variables aleatorias continuas. 1. &u funcin de distribucin acumulada con unta Rx ! x"! ...! xQ*x ! x"! ...! xE, ( 7*S M x S" M x" ... SE M xE, 2. Las funciones de distribucin acumulada Rx *x ,! Rx"*x",! ...! RxQ*xE, de las variables individuales se llaman funciones de distribucin marginal. 7ara cualquier i! se tiene que Rxi*xi, es la probabilidad de que Si sea menor o igual que xi. 3. &e dice que las variables aleatorias son independientes si $ solo si Rx ! x"! ...! xQ*x ! x"! ...! xE, ( Rx *x ,Rx"*x", ... RxQ*xE, %l concepto de independencia estadstica! en este caso! es exactamente igual que en el caso discreto. La independencia de un conjunto de variables aleatorias implica que la distribucin de probabilidad de cada una de ellas no se ve afectada por los valores que tomen las dems. La covarian0a se utili0a para cuantificar la asociacin lineal entre un par de variables aleatorias. Definicin. &ean S e Y dos variables aleatorias continuas! con medias x $ $! respectivamente. %l valor esperado de *S 5 x,*Y 5 $, se llama covarianza entre S e Y. %s decir! Aov*S! Y, ( %)*S 5 x,*Y 5 $,. Una expresin alternativa es Aov*S! Y, ( %*SY, 5 x$ &i las variables aleatorias S e Y son independientes! entonces su covarian0a es 4. no obstante! el recproco no es necesariamente cierto. &umas $ diferencias de variables aleatorias. &ean S ! S"! ...! SE E variables aleatorias con medias ! "! ...! x $ varian0as "! ""! ...! E". &e cumplen las siguientes propiedades' 1. La media de la suma es la suma de las medias! es decir! %*S + S" + ... + SE, ( + " + ... + E 2. &i la covarian0a entre cada par de estas variables aleatorias es 4! entonces! la varian0a de la suma es la suma de las varian0as! es decir! Var*S + S" + ... + SE, ( " + "" + ... + E" &ean S e Y un par de variables aleatorias con medias x $ $ $ varian0as x" $ $". &e cumplen las siguientes propiedades' 3. La media de su diferencia es la diferencia de las medias! es decir! %*S 6 Y, ( x 5 $ 4. &i la covarian0a entre S e Y es 4! entonces! la varian0a de la diferencia es la suma de las varian0as! es decir! Var*S 6 Y, ( x" + $" Los resultados " $ B son vlidos #nicamente si la covarian0a entre las variables es 4. de forma general! si S e Y son un par de variables aleatorias con varian0as x" $ $"! $ covarian0a Aov*S! Y,! puede probarse que' " Var*S + Y, ( x + $" + "Aov*S! Y, Var*S 6 Y, ( x" + $" 6 Aov*A! Y, La distribucin normal. La distribucin normal tiene un pico en la media $ va descendiendo gradualmente en los extremos. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Runcin de densidad de una distribucin normal. &i la variable aleatoria S tiene densidad fx*x, ( * - "",. e5*x5 ," - " " para 5 M x M " " donde $ son n#meros tales que 5 M M $ 4 M M donde e $ son las constantes! e ( "!D <"<... $ ( C! B >=...! entonces se dice que S sigue una distribucin normal. 7ropiedades de la distribucin normal. &upongamos que la variable aleatoria S sigue una distribucin normal con parmetros $ ". se cumplen las siguientes propiedades' 1. La media de la variable aleatoria es ! es decir! %*S, ( . 2. La varian0a de la variable aleatoria es "! es decir! Var*S, ( %)*S 5 ,". ( " 3. La forma de la funcin de densidad es una curva simtrica con forma de campana centrada en la media . De estas propiedades puede concluirse que dadas la media $ la varian0a de una variable aleatoria normal! queda determinada la distribucin especfica dentro de la familia de distribuciones normales. Notacin. &i la variable aleatoria S sigue una distribucin normal con media $ varian0a "! escribiremos S N*! ", Tncrementar la media! dejando constante la varian0a! traslada la funcin de densidad pero n4 altera su forma. Las funciones con variables aleatorias normales con media com#n pero diferentes varian0as son simtricas alrededor de la media com#n! pero la que tiene ma$or varian0a es ms dispersa. Runcin de distribucin acumulada de una distribucin normal. &upongamos que S es una variable aleatoria normal con media $ varian0a "! es decir! S N*! ",. %ntonces! la funcin de distribucin acumulada Rx*x4, es Rx*x4, ( 7*S M x4, %sto corresponde al rea bajo la funcin de densidad a la i0quierda de x4. como ocurre para cualquier densidad propia! el rea total por debajo de la curva es ! es decir! Rx* , ( No /a$ una expresin algebraica simple para calcular la funcin de distribucin acumulada de una variable aleatoria distribuida normalmente. 7robabilidades de rangos para variables aleatorias normales. &ea S una variable aleatoria normal con funcin de distribucin acumulada Rx*x,! $ sean a $ b dos posibles valores de S! que verifican que a M b. %ntonces! 7*a M S M b, ( R x*b, 6 Rx*a, La probabilidad es el rea por debajo de la funcin de densidad correspondiente entre a $ b. Las probabilidades de cual%uier distribucin normal pueden expresarse en trminos de las probabilidades de una normal determinada! para la cual $a se /an calculado $ tabulado las propiedades. La distribucin normal estndar. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &ea X una variable aleatoria normal con media 4 $ varian0a 3 es decir X N*4! , %ntonces! se dice que X sigue una distribucin normal est"ndar. &i denominados R0*0, a la funcin de distribucin acumulada de esta variable aleatoria! $ aU $ bU son dos n#meros tales que aU M bU! entonces 7*aU M X M bU, ( R0*bU, 6 R0*aU, &ea 04 un n#mero positivo cualquiera! $ supongamos que se quiere calcular R 0*504, ( 7*X M 504, La simetra de la funcin de densidad de la variable aleatoria normal estndar alrededor del 4! implica que el rea por debajo de la curva a la i0quierda de 604 es la misma que el rea por debajo de la curva a la derec/a de 04! es decir 7*X M 504, ( 7*X : 04, %s ms! por ser el rea total por debajo de la curva igual a ! 7*X : 04, ( 6 7*X M 04, ( 6 R0*04, 7or tanto! puede deducirse que R0*504, ( 6 R0*04, &ea S una variable aleatoria normal con media $ varian0a ". restando la media $ dividendo por la desviacin tpica se obtiene una variable aleatoria X con media 4 $ varian0a . 8ambin puede probarse que si S es una variable normal! entonces! X tambin lo es. 7or tanto! X se distribu$e como una variable aleatoria normal estndar. &upongamos! entonces! que queremos calcular la probabilidad de que S est entre a $ b. %sto es equivalente a decir que *S 5 ,- est entre *a 5 ,- $ *b 5 ,-! luego la probabilidad que se quiere es' b b a a <Z< 7*a M S M b, ( 7 5 R0 (R0 Amo /allar probabilidades de intervalos para variables aleatorias normales. &ea S una variable aleatoria normal con media $ varian0a ". %ntonces! la variable aleatoria X ( *S 5 ,- tiene una distribucin normal estndar3 es decir! X N*4! ,. De aqu se deduce que si a $ b son n#meros cualesquiera con a M b! entonces' b b a a <Z< 7*a M S M b, ( 7 5 R0 donde X es la variable (R0 aleatoria normal estndar $ R0*0, representa su funcin de distribucin acumulada. l teorema central del lmite. &ean S ! S"! ...! Sn! n variables aleatorias independientes con idntica distribucin de media $ varian0a ". representaremos su suma por S ( S + S" + ... + Sn La media de una suma es la suma de las medias $ que! para variables aleatorias independientes! la varian0a de la suma es la suma de las varian0as. 7or tanto! la media $ la varian0a de S son %*S, ( n $ Var*S, ( n" 1dems! para cualquier variable aleatoria! al restar la media $ dividir por la desviacin tpica! se obtiene una variable aleatoria de media 4 $ varian0a ! as que la variable X E( X ) aleatoria X ( ( *S 5 n, - * n", tiene media 4 $ varian0a . Dividiendo el Var ( X ) numerador $ el denominador de esta expresin por n se obtiene X ( X = X 1 + X 2 + ... + Xn X = es el promedio de las S n n X n donde n
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION La informacin crucial que proporciona el teorema central del lmite! es que! sea cual sea la distribucin de las Si *suponiendo que la varian0a " sea finita,! cuando el n#mero de trminos de la suma! n! es grande! la distribucin de X tiende a una distribucin normal estndar. 8eorema central del lmite. &ean S ! S"! ...! Sn! n variables aleatorias independientes $ con idntica distribucin de media $ varian0a ". &ean S $ X la suma $ el promedio de estas variables aleatoria! respectivamente. Auando n se /ace grande! la distribucin de X ( *S 5 n, - * n", ( X n tiende a la normal estndar. n %l teorema central del lmite afirma que cualquiera que sea la distribucin com#n de un conjunto de variables aleatorias! suponiendo que su varian0a sea finita! la suma o el promedio de un n#mero moderadamente grande de ellas ser una variable aleatoria con distribucin parecida a la normal. La distribucin uniforme es simtrica alrededor de la media. &in embargo! el teorema central del lmite puede aplicarse tambin a variables asimtricas3 $ a su ve0 se extiende tambin a variables aleatorias discretas. La distribucin normal como una apro+imacin a las distribuciones binomial y de Poisson. &pro+imacin normal a la distribucin binomial. &i se llevan a cabo n intentos! cada uno con probabilidad p de xito! entonces el n#mero S de xitos conseguidos tiene una distribucin binomial con media %*S, ( np $ varian0a Var*S, ( np* 6 p, La variable aleatoria S poda escribirse como la suma de n variables aleatorias Lernoulli independientes! es decir! S ( S + S" + ... + Sn donde la variable aleatoria Si toma el valor si el resultado del intento i5simo es JxitoK $ 4 en otro caso! con probabilidades p $ * 6 p,! respectivamente. &e deduce por tanto! que si el n#mero de intentos n es grande! la distribucin de la X E( X ) X np = variable X ( es aproximadamente una normal estndar. Var ( X ) np (1 p ) &upongamos que queremos calcular que el n#mero de xitos est dentro de un intervalo dado! a $ b. 8enemos entonces que 7*a M S M b, ( 7 a np a np X np b np b np ( Z ( 7 np(1 p) np(1 p) np ( 1 p ) np ( 1 p ) np ( 1 p ) &i el n#mero de intentos es grande! la distribucin de X puede aproximarse mediante la normal estndar. &i el n#mero de intentos n es de tama@o moderado! entonces puede conseguirse una mejora a esta aproximacin. %stamos aproximando una distribucin discreta mediante una distribucin continua. ?ientras que la binomial puede tomar solamente valores enteros! la variable aleatoria normal est definida en un continuo. 7ara permitir esta distincin se aplica la correccin de continuidad a la frmula anterior! reempla0ando a $ b por *a 6 4!>, $ *b + 4!>,! respectivamente. 8enemos entonces' 7*a M a 0,5 np b + 0,5 np Z S M b, ( 7 np (1 p ) np ( 1 p ) Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 1proximacin de probabilidades binomiales usando la distribucin normal. &ea S el n#mero de xitos que resultan de n intentos independientes! cada uno con probabilidad de xito p. &i n es grande $ p no es ni demasiado grande ni demasiado peque@o! entonces! la siguiente es una buena aproximacin 7*a M S M b, ( 7 a np b np o usando la correccin de continuidad! 7*a M S M b, ( 7 Z np(1 p) np (1 p ) a 0,5 np b + 0,5 np donde X es una distribucin normal estndar. Z np (1 p ) np(1 p) La aproximacin simple es generalmente suficiente si n : >4. La calidad de aproximacin depende tambin de p $ es bastante fiable si np* 6 p, : =. &pro+imacin normal a la distribucin de Poisson. &ea la variable aleatoria S el n#mero de veces que ocurre un suceso en determinado intervalo de tiempo! $ sea el n#mero esperado de ocurrencias en dic/o intervalo. %ntonces S sigue una distribucin de 7oisson! con media %*S, ( $ varian0a Var*S, ( . Aonsidrese la situacin en la que el n#mero de ocurrencias esperadas! ! es grande. &upongamos que el intervalo de tiempo se divide en subintervalos de idntica longitud. %ntonces el n#mero total de ocurrencias es la suma de las ocurrencias en cada subintervalo. 7or tanto! vemos que cuando la media de la distribucin de 7oisson es grande! el n#mero total de ocurrencias puede verse como la suma de un n#mero moderadamente grande de variables aleatorias! cada una de las cuales representa el n#mero de ocurrencias en un subintervalo del perodo de tiempo. %ntonces! invocando el teorema central del lmite! se deduce que cuando es grande! la distribucin de la X E( X ) X = variable aleatoria X ( es aproximadamente una normal estndar. Var ( X ) Una ve0 ms! si es de tama@o moderado! ser conveniente aplicar una correccin de continuidad. 1proximacin de probabilidades de 7oisson usando la distribucin normal. &ea S una variable aleatoria de 7oisson con media . &i es grande! entonces! la b a Z o usando la siguiente es una buena aproximacin 7*a M S M b, ( 7 b + 0,5 a 0,5 Z donde X tiene correccin de continuidad! 7*a M S M b, ( 7 una distribucin normal estndar. La distribucin e+ponencial. La distribucin exponencial difiere de la normal en dos caractersticas bsicas' se restringe a variables aleatorias que pueden tomar valores positivos #nicamente! $ su funcin de densidad no es simtrica alrededor de la media. La distribucin exponencial.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &i la variable aleatoria S no puede tomar valores negativos $ tiene funcin de densidad fx*x, ( *e5x- ,- para x : 4! donde es cualquier n#mero positivo $ e ( "!D <"<...! entonces se dice que S sigue una distribucin e!ponencial. La funcin de distribucin acumulada es Rx*x, ( 6 e5xpara x : 4 La distribucin tiene media $ varian0a ". $uestreo y distribuciones muestrales. Llamaremos poblacin al grupo grande del que deseamos obtener informacin $ muestra al subconjunto de individuos de la poblacin cu$as caractersticas /an sido observadas. La principal ra0n para observar una muestra en lugar de la poblacin completa es el /ec/o de que la recogida de toda la informacin ser! en la ma$ora de las ocasiones! exageradamente cara. %l objetivo de extrae una muestra de una poblacin ser! en general! poder /acer afirmaciones que tengan cierta valide0 sobre la aplicacin completa. 7or tanto! es importante que la muestra sea representativa de la poblacin3 por eso es importante que el proceso de seleccin de la muestra est basado en el principio de aleatori0acin. ?uestro aleatorio simple. &upongamos que se /a de seleccionar una muestra de n objetos de una poblacin de N objetos. Un procedimiento de muestreo aleatorio simple es aquel en el que todas las posibles muestras de n objetos tienen la misma probabilidad de ser escogidas. %ste mtodo se usa con tanta frecuencia que! en muc/os casos! el adjetivo simple se elimina! $ a las muestras obtenidas por procedimientos de este tipo se las denomina muestras aleatorias. %n la prctica! pueden usarse tablas de n#meros aleatorios! bolilleros u ordenadores. %l principio de aleatori0acin en la seleccin de los miembros de la muestra proporciona cierta proteccin contra la presencia en la muestra de individuos no representativos de la poblacin! en el sentido de que! en media! si se extraen repetidas muestras de la poblacin seg#n este mecanismo! ning#n subgrupo particular debera estar ms representado en la muestra. 1dems! el concepto de distribucin muestral nos permite determinar la probabilidad de que la muestra particular que se /a obtenido no sea representativa en un determinado grado. &obre la base de la informacin muestral! nuestro objetivo ser /acer inferencias acerca de la poblacin de la que procede la muestra. La distribucin de probabilidades de los posibles resultados muestrales proporciona una base para reali0ar inferencias sobre la poblacin. %stadsticos $ distribuciones muestrales. &upongamos que se /a extrado una muestra aleatoria de una poblacin $ que se desea /acer inferencia sobre ciertas caractersticas de la distribucin de la poblacin. %sta inferencia estar basada en alg#n estadstico! es decir! en alguna funcin particular de la informacin muestral. La distribucin muestral! o distribucin en el muestreo! de este estadstico es la distribucin de probabilidades de los valores que puede tomar el estadstico a lo largo de todas las posibles muestras con el mismo n#mero de observaciones que pueden ser extradas de la poblacin. "istribucin en el muestreo de la media muestral. [ueremos anali0ar la distribucin muestral de la variable aleatoria X . %n primer lugar! determinaremos la media de esta distribucin. 7ara variables aleatorias discretas $ Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION continuas! la esperan0a de una suma es la suma de las esperan0as $! por tanto' %* Si,
i =1 n
( %*S , + %*S", + ... + %*Sn,

n i =1
7uesto que cada variable aleatoria Si tiene media x!
podemos escribir %* Si, ( nx La media muestral es la suma de los valores de la muestra multiplicada por -n! $! por tanto! su valor esperado ser' %* X , ( %* 1 n
i =1
Si, (
n 1 nx %* Si, ( ( x n n i =1 La media de la distribucin en el muestreo de la media muestral es la media poblacional. %sto nos asegura que! si se extraen repetidas muestras independientes de n observaciones de una poblacin! entonces! cuando el n#mero de muestras se /ace mu$ grande! el promedio de las medias muestrales se /ace mu$ prximo a la verdadera media poblacional. 7or supuesto! la media obtenida para una muestra particular puede ser muc/o ma$or o muc/o menor que la media poblacional. &in embargo! en la media! no /a$ ra0ones para esperar un valor que sea ma$or o menor que el valor poblacional.
&i el tama@o de la poblacin es mu$ grande con respecto al tama@o muestral! entonces! una consecuencia del muestreo aleatorio simple es que la distribucin de cada uno de los valores de la muestra es independiente de la de los otros. %n tal caso! la varian0a de la suma es la suma de las varian0as $! por tanto! tendremos' Var* Si, ( Var*S , + Var*S",
i =1 n
+ ... + Var*Sn, 7uesto que cada Si tiene varian0a ! se sigue que Var* Si, ( nx"
" x
Llegamos as a que la varian0a de la media muestral es Var* X , ( Var * Var* Si, ( nx"-n" ( x"-n
i =1 n
1 n
i =1 n
i =1
Si, ( -n"
La varian0a de la distribucin muestral de X decrece a medida que aumenta el tama@o muestral de n. Auantas ms observaciones tenga la muestra! ms concentrada estar la distribucin muestral de la media muestral alrededor de la media poblacional. 2epresentaremos por x" la varian0a de la media muestral3 la correspondiente desviacin x tpica! que recibe el nombre de error est"ndar de X ! vendr dada por' x ( n &i el n#mero n de miembros de la muestra no es una fraccin mu$ peque@a del n#mero N de miembros de la poblacin! no podremos asumir que los valores individuales de la muestra se distribu$an independientemente unos de otros. %n este caso! Var* X , ( N n *x"-n,. 1l trmino *N 6 n,-*N 6 , se le suele dar el nombre de factor de correccin N 1 por poblacin finita. &e puede probar que! si la poblacin de la que se extrajo la muestra es normal! la media muestral sigue una distribucin normal. &i el tama@o muestral es una proporcin peque@a del tama@o poblacional! entonces! restando la media $ dividiendo por el error estndar! se X x X x = x obtiene una variable aleatoria' X ( x n Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %l teorema central del lmite nos asegura que! incluso cuando la distribucin de la poblacin no es normal! si el tama@o muestral n es suficientemente grande! la distribucin de X ser tambin mu$ prxima a la normal estndar. Distribucin muestral de X . &ea X la media de una muestra aleatoria den observaciones extradas de una poblacin con media x $ varian0a x". %ntonces' 1. La distribucin muestral de X tiene media x! es decir! %* X , ( x x 2. La distribucin muestral de X tiene desviacin tpica x ( %sta cantidad recibe el n nombre de error est"ndar de X . 3. &i el tama@o muestral n no es una fraccin peque@a del tama@o poblacional N! x N n entonces! el error estndar de X es x ( n N 1 X x 4. &i la distribucin de la poblacin es normal! entonces! la variable aleatoria X ( x sigue una distribucin normal estndar. >. &i la distribucin de la poblacin no es normal pero el tama@o muestral n es suficientemente grande! entonces! del teorema central del lmite se sigue que! el resultado del apartado B es aproximadamente vlido. "istribucin en el muestreo de una proporcin muestral. &i se repite n veces un experimento que tiene probabilidad de xito p! entonces! la variable aleatoria S! que recoge el n#mero total de xitos en las n repeticiones! sigue una distribucin binomial. Definicin. &ea S el n#mero de xitos en una muestra binomial de n observaciones! donde la probabilidad de xito es p. *%n la ma$ora de las aplicaciones! el parmetro p ser la proporcin de individuos de una gran poblacin que posean la caracterstica de inters,. %ntonces! la proporcin de xitos en la muestra \px ( S-n recibe el nombre de proporcin muestral. La media $ la varian0a de la distribucin muestral de la proporcin muestral pueden deducirse fcilmente a partir de la media $ la varian0a del n#mero de xitos que! vienen dadas por %*S, ( np $ Var*S, ( np* 6 p, De aqu se deduce que %*\px, ( %*S-n, ( -n %*S, ( p %s decir! la media de la proporcin muestral es la proporcin p de xitos en la poblacin. &u varian0a es Var*\p x, ( Var*S-n, p (1 p ) ( -n" Var*S, ( De nuevo! la desviacin tpica de la proporcin muestral! que es n la ra0 cuadrada de su varian0a recibe el nombre de error est"ndar. &i el n#mero N de individuos en la poblacin no es demasiado grande comparado con el n#mero de individuos de la muestra! en la expresin de la varian0a de la proporcin muestral ser necesaria una correccin por poblacin finita. La varian0a ser entonces p (1 p ) N n Var*\px, ( n N 1 Aomo una consecuencia del teorema central del lmite! la distribucin del n#mero de xitos es aproximadamente normal para tama@os muestrales grandes. %sto mismo es tambin cierto para la proporcin de xitos. 7or tanto! si restamos a la proporcin Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION muestral su media p $ la dividimos por su error estndar! obtendremos una variable aleatoria con distribucin normal estndar. Distribucin en el muestreo de una proporcin muestral. &ea \px la proporcin de xitos en una muestra aleatoria de n observaciones. %ntonces' 1. La distribucin muestral de \px tiene media p! es decir %*\px, ( p p (1 p ) 2. La distribucin muestral de \px tiene desviacin tpica \p ( La cantidad \p n recibe el nombre de error estndar de \px. 3. &i el n#mero n de individuos de la muestra no es una proporcin peque@a del n#mero N de individuos de la poblacin! entonces! el error estndar de \p x es \p ( p (1 p ) N n n N 1 ^ px p 4. &i el tama@o muestral es grande! entonces! la variable aleatoria X ( se ^p distribu$e aproximadamente como una normal estndar. %n general! la aproximacin es satisfactoria para muestras de >4 observaciones o ms. La calidad de la aproximacin depender tambin de p3 lo idea es que se verifique np* 6 p, : =. Ntese que para p fijo! el error estndar de la proporcin muestral disminu$e a medida que crece el tama@o muestral. %sto implica que! al aumentar el tama@o muestral! la distribucin de \px se concentra ms alrededor de su media. "istribucin en el muestreo de la varianza muestral. &upongamos que se extrae una muestra de n observaciones de una poblacin con media desconocida x $ varian0a desconocida x". 2epresentaremos las observaciones muestrales por S ! S"! ...! Sn. La varian0a poblacional es la esperan0a x" ( %)*S 5 x,". $! por tanto! una cantidad en la que evidentemente deberamos fijarnos sera en la media de los *S 5 x," para los n individuos de la muestra. &in embargo! la media poblacional x es desconocida! por lo que en la prctica esta cantidad no podr ser calculada. %s natural! entonces! sustituir la desconocida x por la media muestral X ! $ considerar la media de 1 n los *S 5 X ,". de /ec/o! la varian0a muestral se define como sx" ( *Si 5 X ," n 1 i =1
Definicin. &ea S ! S"! ...! Sn una muestra aleatoria de una poblacin. La cantidad s x" ( X ," recibe el nombre de varianza muestral. desviacin tpica muestral. 1 n *Si 5 n 1 i =1 &u ra0 cuadrada! sx! se denomina
La conclusin de que el valor esperado de la varian0a muestral es la varian0a poblacional! es general. &in embargo! para poder caracteri0ar completamente su distribucin muestral! necesitaremos saber ms acerca de la distribucin de la poblacin. %n muc/as aplicaciones prcticas! el supuesto de que la distribucin de la poblacin es normal resulta ra0onable. %n tal caso! puede probarse que la variable aleatoria )*n 6 ,sx". - x" ( sx" ( ) Cedido por el TURCO
i =1 &
*Si 5 X ,". - x" sigue una distribucin conocida con el nombre de distribucin
'distribucin (hi cuadrado) con 'n * +) grados de libertad. %sto slo es cierto cuando el tama@o muestral es una proporcin peque@a del tama@o de la poblacin. %stas distribuciones slo estn definidas para valores positivos de la variable aleatoria. Un miembro concreto de la familia A/i cuadrado viene caracteri0ado por un #nico parmetro! al que llamaremos grado de libertad! para el que /abitualmente se usa el smbolo . &i una variable aleatoria sigue una distribucin " con grados de libertad! se representar por ". La media $ la varian0a de esta distribucin son! respectivamente! el n#mero de grados de libertad $ el doble del n#mero de grados de libertad! es decir! %*", ( $ Var*", ( " %n nuestro contexto! la variable aleatoria *n 6 ,sx" - x" sigue una distribucin "*n5 ,! $! por tanto! su media es %)*n 6 ,sx" - x". ( *n 6 , 7or tanto tenemos *n 6 , - x" ( %*sx", ( *n 6 , de donde %*sx", ( x" como antes. 7ara /allar la varian0a de sx"! usamos que Var)*n 6 ,sx". - x" ( "*n 6 , 7or consiguiente *n 6 ," - xB Var*sx", ( "*n 6 , $! en consecuencia! Var*sx", ( "xB - *n 6 , Las propiedades de la distribucin " pueden usarse tambin para calcular la varian0a de la distribucin muestral de la varian0a muestral. %l parmetro de la distribucin " recibe el nombre de grados de libertad. 7ara entender esta terminologa! observemos que la varian0a muestral involucra en su definicin a la suma de los cuadrados de las cantidades *S 5 X ,! *S" 5 X ,! ...! *Sn 5 X , %sto supone que estas n pie0as de informacin intervienen en el clculo de la varian0a muestral. &in embargo! no son pie0as de informacin independientes! puesto que su suma /a de ser 4! seg#n se deduce de la definicin de X . 7or tanto! si conocemos *n 6 , cualesquiera de los *Si 5 X ,! podemos calcular el otro a partir de los *n 6 , primeros.
7or ejemplo! dado que
i =1
*Si 5 X , ( 4
se tiene que Sn 5 X ( 5
i =1
n 1
*Si 5 X ,
Las n
cantidades *Si 5 X , son equivalentes a un conjunto de *n 6 , pie0as independientes de informacin. 7odemos pensar en esta situacin de la forma siguiente' queremos /acer inferencia sobre la desconocida x". &i la media poblacional x fuese conocida! nuestra inferencia podra estar basada en la suma de cuadrados de *S 5 x,! *S" 5 x,! ...! *Sn 5 x, %stas cantidades son independientes unas de otras! $ podramos decir que tenemos n grados de libertad para la estimacin de x". &in embargo! dado que en la prctica la media poblacional se pierde! $ nos quedamos con *n 6 , observaciones independientes para /acer inferencia sobre la varian0a poblacional. &e dice por ello que los grados de libertad disponibles son *n 6 ,. Distribucin muestral de la varian0a muestral. &ea sx" a varian0a muestral de una muestra aleatoria de n observaciones extradas de una poblacin con varian0a x". %ntonces! 1. La distribucin muestral de sx" tiene media x"! es decir! %*sx", ( x" 2. La varian0a de la distribucin muestral de sx" depende de la distribucin de la poblacin. &i dic/a distribucin es normal! entonces! Var*sx", ( "xB - *n 6 , 3. &i la distribucin poblacional es normal! entonces! *n 6 ,sx" - x" se distribu$e cono una "*n5 , Una poblacin normal se ver ms afectada por desviaciones del supuesto de normalidad de la distribucin poblacional. Auando se quieren calcular probabilidades relativas a la media muestral! el teorema central del lmite asegura que! para muestras moderadamente Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION grandes! desviaciones peque@as de la /iptesis de normalidad de la poblacin de la que se extrae la muestra tienen un efecto peque@o en la valide0 de las probabilidades calculadas. 7or esta ra0n! se dice que las inferencias basadas en la media muestral son robustas frente a desviaciones del supuesto de normalidad de la poblacin! mientras que las inferencias basadas en la varian0a poblacional no lo son.
stimacin puntual. *ntroduccin. Aualquier inferencia que se /aga sobre la poblacin tendr que basarse necesariamente en estadsticos muestrales! es decir! en funciones de la informacin muestral. Definiciones. Un estimador de un parmetro poblacional es una variable aleatoria que depende de la informacin de la muestra $ cu$as reali0aciones proporcionan aproximaciones al valor desconocido del parmetro. &e llama estimacin a una reali0acin especfica de esta variable aleatoria. 7ara estudiar la estimacin de un parmetro desconocido! deben considerarse dos posibilidades. 7rimero! podramos calcular! en base a los datos de la muestra! un valor como "representativoK o como el Jms representativoK. 1lternativamente! podramos intentar encontrar un intervalo o rango! en el cual estemos casi seguros de que est el verdadero parmetro. Definiciones. Un estimador puntual de un parmetro poblacional es una funcin de la nuestra que da como resultado un #nico valor. La correspondiente reali0acin se llama estimacin puntual del parmetro. stimadores inses!ados y su eficiencia. Designaremos al parmetro que se quiere estimar $ \ al correspondiente estimador puntual. %ste estimador se dice que es insesgado! si la media de su distribucin muestral es el parmetro desconocido . Definiciones. &e dice que el estimador \ es un estimador insesgado del parmetro! si la media de la distribucin muestral de \ es ! es decir %*\ , ( Diremos que la correspondiente estimacin puntual se obtiene mediante un procedimiento de estimacin insesgado. La notacin de esperan0as indica que si repetimos el proceso de muestreo muc/as veces! en promedio! el valor que se obtiene de un estimador insesgado ser igual al parmetro poblacional. 7ara tres de los estimadores considerados! Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %* X , ( x %*sx", ( x" %*\px, ( p 7or tanto! podemos decir que la media! la varian0a $ la proporcin muestrales son estimadores insesgados de los correspondientes parmetros poblacionales. %s por esta ra0n! por la que al definir la varian0a muestral dividimos la suma de los cuadrados de las discrepancias por *n 6 , en lugar de n. La media de la distribucin de la desviacin tpica muestral no es la desviacin tpica poblacional. 7or tanto! la desviacin tpica muestral no es un estimador insesgado de la desviacin tpica poblacional. %stimadores insesgados. . La media! la varian0a $ las proporciones muestrales son estimadores insesgados de los correspondientes parmetros poblacionales. 2. %n general! la desviacin tpica muestral no es un estimador insesgado de la desviacin tpica poblacional. Definicin. &ea \ un estimador de . %l sesgo de \ se define como la diferencia entre su media $ ! es decir! &esgo*\, ( %*\ , 5 De esto se deduce que el sesgo de un estimador insesgado es . %n muc/os problemas prcticos! pueden obtenerse diferentes estimadores insesgados! $ debe encontrase alg#n mtodo que nos permita elegir entre ellos. %n este contexto! es natural preferir el estimador cu$a distribucin est ms concentrada alrededor del valor del parmetro poblacional que se est estimando. Los valores de este estimador difieren del verdadero parmetro con menos probabilidad que los otros estimadores. &i usamos la varian0a como medida de dispersin! introduciremos el concepto de eficiencia de un estimador como criterio para preferir un estimador a otro. Definiciones. &ean \ $ ]" dos estimadores insesgados de ! obtenidos en nuestras del mismo tama@o! entonces! 1. &e dice que \ es m"s eficiente que \" se Var*\ , M Var*\", 2. La eficiencia relativa de un estimador con respecto al otro es el cociente de sus varian0as! es decir! %ficiencia relativa (Var*\ ", - Var*\ , Definicin. &i \ es un estimador insesgado de ! $ no /a$ ning#n otro estimador insesgado que tenga menor varian0a! entonces se dice que \ es el estimador insesgado m"s eficiente o de mnima varianza de . leccin de un estimador puntual. %xisten problemas de estimacin para los cuales no /a$ un estimador insesgado que sea satisfactorio. %n este tipo de problemas /a$ muc/o que ganar a cambio del sacrificio de aceptar un peque@o sesgo. Una medida de la proximidad esperada de un estimador \ al parmetro es su error cuadr"tico medio! la esperan0a del cuadrado de la diferencia entre el estimador $ el parmetro! es decir! %A? ( %)*\ 5 ,". 7uede probarse que %A?*\ , ( Var*\, + )&esgo*\ ,." 7uede deducirse que! en ocasiones! se puede obtener un error cuadrtico medio ms peque@o pasando de un estimador insesgado a otro sesgado! si esto permite conseguir una reduccin suficiente en la varian0a del estimador. &in embargo! este enfoque es impracticable! $a que el error Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION cuadrtico medio depender del valor real de ! que es desconocido. %n algunos casos se puede probar que un estimador tiene menor error cuadrtico medio que toro para todos los valores posibles del parmetro. %n este caso se dice que el estimador inferior es inadmisible. &ea el parmetro que se quiere estimar $ \n el estimador puntual basado en una muestra de tama@o n. 7uesto que estamos interesados en la proximidad del estimador al parmetro! vamos a considerar la probabilidad de que \ n difiera de en menos de ! donde es un n#mero positivo! es decir! 7)P\n 5 P M . &i para cualquier positivo! no importa lo peque@o que sea! esta probabilidad tiende a cuando el tama@o muestral n tiende a infinito! se dice que el estimador es consistente. De manera informal! lo que esto significa es que si utili0amos un estimador consistente con una muestra infinita! obtendremos el resultado correcto. La desviacin tpica muestral es consistente para la desviacin tpica poblacional *esto tambin es cierto en el caso de la media $ la varian0a para sus correspondientes parmetros poblacionales,. 8ambin la proporcin muestral es consistente para la proporcin poblacional. Un estimador que sea consistente $ que su distribucin lmite tenga mnima varian0a es el me or asintticamente normal. De /ec/o! existe un procedimiento conocido como m"!imo verosimilitud para encontrar estimadores puntuales.
stimacin por intervalos. *ntervalos de confianza. La b#squeda de un estimador por intervalos es la b#squeda de un rango de valores entre los que posiblemente se encuentre la cantidad que se estima. Auanto ma$or sea la muestra! menor ser el intervalo que recoge nuestra incertidumbre sobre el verdadero valor del parmetro! siempre que las otras condiciones permane0can iguales. Definiciones. Un estimador por intervalos de un parmetro poblacional es una regla *basada en informacin muestral, para determinar un rango! o un intervalo! en el cual posiblemente se encuentre dic/o parmetro. La estimacin correspondiente se denomina estimacin por intervalos. 7odemos definir intervalos de confian0a del porcentaje que nosotros queramos! siempre menor! por supuesto! del 449. &upongamos que las variables aleatorias 1 $ L son tales que 7*1 M M L, ( 5 donde es un n#mero cualquiera entre 4 $ . entonces! si se extraen repetidamente muestras aleatorias de la poblacin $ se calcula este intervalo! una proporcin * 5 ,! o 44* 5 ,9! de estos intervalos contendrn al parmetro . Un intervalo calculado de esta manera se denomina un intervalo de confian0a del 44* 5 ,9 para . Definiciones. &ea un parmetro desconocido. &upongamos que basndonos en la informacin muestral! podemos encontrar dos variables aleatorias 1 $ L tales que 7*1 M M L, ( 5 &i representamos las reali0aciones particulares de 1 $ L por a $ b! entonces! el intervalo de a a b se denomina intervalo de confianza del +,,'+ - ). para . La cantidad * 5 , se denomina contenido probabilstico o nivel de confianza del intervalo. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &i se extraen muestras aleatorias de la poblacin un n#mero elevado de veces! el parmetro estar contenido en un 44* 5 ,9 de los intervalos calculados de este modo. %l intervalo de confian0a obtenido de esta manera se escribe a M M b *ntervalos de confianza para la media de una distribucin normal: varianza poblacional conocida. Tmaginemos que se extrae una muestra aleatoria de una distribucin normal con media desconocida $ varian0a conocida! $ que nuestro objetivo es /allar un intervalo de confian0a para la media poblacional. &i representamos por S ! S"! ...! Sn una muestra aleatoria de n observaciones de una poblacin normal con media $ varian0a conocida "! $ por X la media muestral! entonces! los intervalos de confian0a para la media poblacional estn basados en el X resultado por el que la variable aleatoria X ( tiene una distribucin normal n estndar. Un intervalo de confian0a para la media poblacional estar basado en el valor observado de la media muestral! es decir! en una observacin extrada de una distribucin muestral. Notacin. &ea X una variable aleatoria estndar $ un valor tal que 4 M M entonces 04 al n#mero que verifica 7*X : 04, ( Dado que 7*X : 04, ( ! entonces! R0*04, ( 7*X M 04, ( 5 . Llamaremos
&upongamos a/ora que necesitamos un intervalo de confian0a del 44* 5 ,9 para la media poblacional. %mpleando la notacin $a introducida! tenemos que 7*X : 0-", ( -" $ por la simetra de la densidad normal alrededor de la media 7*X M 50-", ( -" &e deduce! por tanto! que 7*50-" M X M 0-", ( 5 -" 5 -" ( 5 Wemos encontrado un rango de valores de la variable aleatoria normal estndar con un contenido probabilstico especfico. %sta informacin puede ser empleada para elaborar un intervalo de confian0a con el mismo contenido probabilstico para la media poblacional. X 8enemos que' 5 ( 7*50-" M X M 0-", ( 7*50-" M M 0-", ( 7 n z / 2 z / 2 z / 2 z / 2 < X < <<X+ ( 7 X n n n n &e deduce de la definicin de intervalos de confian0a que si x es el valor especfico observado de la media muestral! entonces! un intervalo de confian0a del 44* 5 ,9 para z / 2 z / 2 < < x+ la media poblacional viene dado por x n n Tntervalos de confian0a para la media de una poblacin normal' varian0a poblacional conocida. &upongamos que tenemos una muestra aleatoria de n observaciones procedentes de una distribucin normal con media $ varian0a ". &i " es conocida $ el valor observado de la media muestral es x ! entonces! un intervalo de confian0a del 44* 5 ,9 para la media
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION z / 2 z / 2 < < x+ poblacional viene dado por x donde 0-" es el n#mero que verifica n n 7*X : 0-", ( -" $ la variable aleatoria X tiene una distribucin normal estndar. Wemos visto que un intervalo de confian0a del 44* 5 ,9 para la media poblacional es z / 2 z / 2 x < < x+ Aomo se podra intuir! la media muestral x est en el centro n n del intervalo. La longitud! ^! del intervalo! es decir! la distancia entre los extremos! es ^ ( 2 z / 2 n 7uede comprobarse! entonces! que la longitud de un intervalo de confian0a depende de su contenido probabilstico! la desviacin tpica poblacional $ el n#mero de observaciones de la muestra. %n particular! se verifican los siguientes resultados' 1. Dado un contenido probabilstico $ un tama@o muestral! cuanto ma$or sea la desviacin tpica poblacional ! ma$or longitud tendr el intervalo de confian0a para la media poblacional. %sto resulta convincente intuitivamente! dado que! siempre que las otras condiciones permane0can intactas! cuanto ms dispersa est la distribucin de la poblacin alrededor de su media! ms incierta ser nuestra inferencia sobre la media. %sta incertidumbre adicional se refleja en unos intervalos de confian0a de ma$or longitud. ". Dado un contenido probabilstico $ una desviacin tpica poblacional! cuanto ma$or sea el tama@o de la muestra n! ms corto ser el intervalo de confian0a para la media poblacional. Una ve0 ms! esta conclusin resulta intuitiva. Auanta ma$or informacin obtenemos sobre una poblacin! ms precisa debe ser nuestra inferencia sobre su media. %sta precisin adicional se refleja en unos intervalos de confian0a ms cortos. 3. Dada una desviacin tpica poblacional $ un tama@o muestral! cuanto ma$or sea el contenido probabilstico * 5 ,! ma$or ser la longitud del intervalo de confian0a para la media poblacional. Auanto ma$or sea * 5 ,! menor ser $! por tanto! ma$or ser 0-". en efecto! a cambio de una ma$or certidumbre en nuestras declaraciones de probabilidad! obtenemos una menor precisin de dic/as afirmaciones. %sto se refleja en unos intervalos de confian0a ms largos para los parmetros de la poblacin! $a que el contenido probabilstico aumenta. &i el tama@o de la muestra es grande! ninguno de los requisitos resulta mu$ restrictivo. %n este caso! por el teorema central del lmite! estos intervalos de confian0a siguen siendo aproximadamente vlidos incluso cuando la distribucin de la poblacin no es normal. 1dems! cuando el tama@o de la muestra es grande! la desviacin tpica muestral ser un estimador lo suficientemente bueno de la desviacin tpica poblacional como para permitirnos emplear el primero en lugar del segundo sin afectar seriamente el contenido probabilstico de los intervalos. Tntervalos de confian0a para la media poblacional' tama@os muestrales grandes. &upongamos que tenemos una muestra de n observaciones procedentes de una distribucin con media . &ean x $ sx la media muestral observada $ la desviacin tpica! respectivamente. %ntonces! si n es grande! una buena aproximacin de un intervalo de z / 2 s 2 z / 2 s 2 < < x+ confian0a del 44* 5 ,9 para viene dada por x n n %n la ma$or parte de los casos esta aproximacin seguir siendo adecuada incluso cuando la distribucin de la poblacin no es normal. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Aonsideramos que n ( C4 observaciones o ms constitu$en una muestra JgrandeK. La distribucin 3 de 4tudent. %n el caso en el que la desviacin tpica poblacional sea desconocida es natural considerar la variable aleatoria que resulta de sustituir el valor desconocido por la X desviacin tpica muestral! sx! obtenindose' t ( %sta variable aleatoria no sigue sx n una distribucin normal estndar. &in embargo! es conocida $ es de /ec/o un miembro de una familia de distribuciones denominada t de /tudent. La distribucin t de &tudent. Dada una muestra de n observaciones con media X $ desviacin tpica sx! procedente de X una poblacin normal con media ! la variable aleatoria t ( sigue una sx n distribucin t de /tudent con 'n * +) grados de libertad. %l n#mero de grados de libertad coincide con el correspondiente a la distribucin A/i cuadrado basada en el mismo tama@o muestral. Rormalmente! la variable aleatoria t de &tudent con grados de libertad se define como t ( X - *"-, donde X es una variable aleatoria normal estndar! " es una variable aleatoria A/i cuadrado con grados de libertad $ X $ " son independientes. Notacin. 2epresentaremos por t la variable aleatoria que sigue una distribucin t de &tudent con grados de libertad. 1dems! t! ser el valor para el cual 7*t : t!, ( %n las aplicaciones ms usuales! necesitaremos encontrar el valor t! correspondiente a una probabilidad determinada . Utili0aremos a/ora la distribucin t de &tudent para calcular intervalos de confian0a para la media de una poblacin normal. &e deduce que 7*t : t!-", ( -" 1dems! debido a la simetra de la funcin de densidad de la distribucin t de &tudent alrededor de su media 4! 7*t M 5 t!-", ( -" Rinalmente! dado que las probabilidades de sucesos mutuamente exclu$entes $ colectivamente ex/austivos suman ! se deduce que 7*5t!-" M t M t!-", ( 6 7*t : t!-", 6 7*t M 5 t!-", ( 5 -" 5 -" ( 5 *ntervalos de confianza para la media de una distribucin normal: varianza poblacional desconocida. 7odemos emplear la distribucin t de &tudent para derivar intervalos de confian0a para la media de una poblacin normal cuando la varian0a es desconocida. &upongamos que disponemos de una muestra aleatoria de n observaciones procedentes de una poblacin normal con media $ varian0a desconocida! $ que buscamos intervalos de confian0a para la media poblacional. &ean X $ sx" la media $ la varian0a muestrales! respectivamente. %ntonces! la variable X aleatoria tn5 ( sigue una distribucin t de &tudent con *n 6 , grados de libertad. sx n
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &upongamos que queremos calcular un intervalo de confian0a del 44* 5 ,9 para la X media poblacional. 8enemos que 5 ( 7*5 tn5 !-" M tn5 M tn5 !-", ( 7*5tn5 !-" M M tn5 !-", sx n tn 1, / 2 sx tn 1, / 2 sx tn 1, / 2 sx tn 1, / 2 sx < X < <<X+ ( 7 X ( 7 n n n n 7or tanto! de la definicin de intervalos de confian0a se deduce que si x $ sx son los valores observados para la media $ la desviacin tpica muestrales! entonces! un intervalo de confian0a del 44* 5 ,9 para la media poblacional viene dado por tn 1, / 2 sx tn 1, / 2 sx x < < x+ n n Tntervalos de confian0a para la media de una poblacin normal' varian0a poblacional desconocida. &upongamos que tenemos una muestra aleatoria de n observaciones procedentes de una distribucin normal con media $ varian0a desconocida. &i la media $ la desviacin tpica muestrales observadas son! respectivamente! x $ sx! entonces! un intervalo de confian0a del 44* 5 ,9 para la media poblacional viene dado por tn 1, / 2 sx tn 1, / 2 sx x < < x+ donde tn5 !-" es el valor que verifica 7*tn5 : tn5 !-", ( -" n n $ la variable aleatoria tn5 sigue una distribucin t de &tudent con *n 6 , grados de libertad. *ntervalos de confianza para proporciones de la poblacin 5muestras !randes6. &upongamos a/ora que estamos interesados en la proporcin de miembros de la poblacin que poseen un determinado atributo. &itundonos en el marco de la distribucin binomial \px representa la proporcin de JxitosK en n intentos independientes! cada uno con probabilidad de JxitoK p. La variable ^ px p aleatoria X ( sigue aproximadamente una distribucin normal. p (1 p ) / n Desgraciadamente! este resultado no nos permite por si solo el clculo de intervalos de confian0a para la proporcin poblacional! $a que el denominador depende del parmetro p desconocido!. &in embargo! si el tama@o muestral es grande! podemos conseguir una buena aproximacin sustitu$endo p por su estimador puntual \px! es decir! p (1 p ) ^ px (1 ^ px ) 7or tanto! para tama@os muestrales grandes! la variable n n ^ px p aleatoria Z = sigue aproximadamente una distribucin normal. 7odemos! ^ px (1^ px ) / n pues! utili0ar este resultado para la construccin de intervalos de confian0a para la proporcin poblacional. Aomo $a /emos /ec/o anteriormente! definiremos 0-" como el valor para el cual 7*X : 0-", ( -" donde la variable aleatoria X sigue una distribucin normal. %ntonces! 5 ( ^ px p ^ px (1^ px ) 7*50-" M X M 0-", ( 7*50-" M M 0-", ( 7*50-" M \px 6 p M 0-" ^ px (1^ px ) / n n ^ px (1^ px ) ^ px (1^ px ) ^ px (1^ px ) ,( ( 7*\px 5 0-" M p M \px + 0-" , n n n
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 7or lo que se deduce que si la proporcin muestral observada es \p x! un intervalo de confian0a aproximado al 44* 5 ,9 para la proporcin poblacional viene dado por \p x 5 ^ px (1^ px ) ^ px (1^ px ) 0-" M p M \px + 0-" n n Tntervalos de confian0a para la proporcin poblacional *?uestras grandes,. &ea \px la proporcin observada de JxitosK en una muestra aleatoria de n observaciones procedentes de una poblacin con una proporcin p de xitos. %ntonces! si n es grande! un intervalo de confian0a del 44* 5 ,9 para la proporcin poblacional viene dado por ^ px (1^ px ) ^ px (1^ px ) \px 5 0-" M p M \px + 0-" donde 0-" es el valor para el cual 7*X n n : 0-", ( -" $ la variable aleatoria X tiene una distribucin normal. Los intervalos de confian0a construidos de este modo son generalmente bastante fiables cuando se basan en muestras con nK B4 o ms observaciones. Los intervalos de confian0a para la proporcin poblacional estn centrados en la proporcin muestral. &iempre que las dems condiciones permane0can intactas! cuanto ma$or sea el tama@o muestral n! menor ser la longitud del intervalo de confian0a. *ntervalos de confianza para la varianza de una poblacin normal. Tmaginemos que tenemos una muestra de n observaciones procedentes de una poblacin normal con varian0a "! $ representamos por sx" la varian0a muestral. La variable aleatoria "n5 ( )*n 6 ,sx". - " sigue una distribucin A/i cuadrado con *n 6 , grados de libertad. Notacin. Denominaremos " la variable aleatoria que tiene una distribucin A/i cuadrado con grados de libertad. "! ser el valor para el cual 7*" : "!, ( 8enemos que 7*" : "!-", ( - " De manera similar! se define "! verifica 7*" : "! 5-", ( 5 -" $! por tanto! 7*" M "! 5-", ( -" Rinalmente! 7*"n! 5-" M " M "!-", ( 5 -" 5 -" ( 5
5-"
como el valor que
7ara calcular intervalos de confian0a para la varian0a poblacional! tenemos que para la distribucin A/i cuadrado con *n 6 , grados de libertad 5 ( 7*"n5 ! 5-" M "n5 M "n5 !-", ( 7*"n5 ! 5-" M )*n 6 ,sx". - " M "n5 !-", ( 7G)*n 6 ,sx". - *"n5 " " " !-", M M )*n 6 ,sx . - * n5 ! 5-",H " 7or tanto! si sx es el valor observado de la varian0a muestral! un intervalo de confian0a del 44* 5 ,9 vendr dada por G)*n 6 ,sx". - *"n5 !-", M " M )*n 6 ,sx". - *"n5 ! 5-",H Tntervalos de confian0a para la varian0a de una poblacin normal. &upongamos que disponemos de una muestra aleatoria de n observaciones procedentes de una poblacin normal con varian0a ". &i la varian0a muestral observada es sx"! entonces! un intervalo de confian0a del 44* 5 ,9 para la varian0a poblacional vendr dado por G)*n 6 ,sx". - *"n5 !-", M " M )*n 6 ,sx". - *"n5 ! 5-",H donde "n5 !-" es el valor que verifica 7*"n5 : "n5 !-", ( -" $ "n5 ! 5-" es el valor para el cual 7*"n5 M "n5 ! 5-", ( -" $ la variable aleatoria "n5 sigue una distribucin A/i cuadrado con *n 6 , grados de libertad.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Wa$ que advertir el peligro de seguir este procedimiento cuando la distribucin de la poblacin no es normal. La valide0 del estimador por intervalos para la varian0a depende en ma$or medida de la /iptesis de normalidad que el correspondiente a la media poblacional. *ntervalos de confianza para la diferencia de medias de dos poblaciones normales. 7ara comparar las medias poblacionales! se extrae una muestra aleatoria de las dos poblaciones $ la inferencia sobre la diferencia entre ambas medias se basa en los resultados muestrales. %l mtodo apropiado para anali0ar esta informacin depende del procedimiento empleado al seleccionar las muestras. Nosotros consideraremos las dos posibilidades siguientes' . Datos pareados' en este procedimiento! las muestras se eligen por pares! una de cada poblacin. La idea es que! aparte del aspecto objeto de estudio! los elementos de cada uno de estos pares deben estar relacionados! de manera que la comparacin pueda ser establecida directamente. ". ?uestras independientes' en este mtodo se extraen dos muestras independientes de cada una de las dos poblaciones de inters! de manera que los miembros de una muestra no tienen necesariamente relacin con los miembros de la otra. *ntervalos de confianza basados en datos pareados. De manera general! supongamos que tomamos una muestra aleatoria de n pares de observaciones que representamos por *x ! $ ,! *x"! $",! ...! *xn! $n,! procedentes de dos poblaciones con medias x $ $. 1s! x ! x"_...! xn_ corresponden a las observaciones con media x! e $ ! $"! ...! $n a las observaciones con media $. Nos encontramos en una situacin en la que podemos plantearnos el clculo de un intervalo de confian0a para una media poblacional *x 5 $,! dada una muestra aleatoria *los valores de las diferencias di, de esa poblacin. &i la distribucin poblacional asumida es normal! el mtodo para el clculo de intervalos de confian0a para la media de una distribucin normal! con varian0a poblacional desconocida! puede aplicarse directamente! $a que las diferencias en los datos pareados constitu$en una muestra aleatoria de una poblacin cu$a media es igual a la cantidad que estamos intentado estimar. Tntervalos de confian0a para la diferencia de medios' datos pareados. &upongamos que disponemos de una muestra aleatoria de datos pareados procedentes de distribuciones con medias x $ $. &ean d $ sd la media $ la desviacin tpica muestrales para las n diferencias di ( xi 6 $i. &i se asume que la distribucin de las diferencias es normal! entonces! un intervalo de confian0a del 44* 5 ,9 para *x 5 $, tn 1, / 2 sd tn 1, / 2 sd < x y < d + viene dado por d donde tn5 !-" es el valor para el cual n n 7*tn5 : tn5 !-", ( -" $ la variable aleatoria tn5 sigue una distribucin t de &tudent con *n 6 , grados de libertad. *ntervalos de confianza basados en muestras independientes. Tmaginemos que disponemos de una muestra aleatoria de nx observaciones procedentes de una poblacin con media x $ varian0a "x! $ de una muestra aleatoria independiente de n$ observaciones de una poblacin con media $ $ varian0a $". &ean X e Y las medias muestrales respectivas. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Aomo un primer paso! veamos el caso en el que las dos distribuciones poblacionales son normales con varian0as conocidas. Dado que el objeto de inters es la diferencia entre las dos medias poblacionales! resulta ra0onable basar la inferencia en la diferencia entre las medias muestrales correspondientes. %sta variable aleatoria tiene media %* X 5 Y , (%* X , 6 %* Y , ( x 5 $ $! dado que las muestras son independientes! varian0a Var* X 5 Y , ( Var* X , + Var* Y , ( x"-nx + $"-n$ 1dems! se puede probar que su distribucin es normal. 7or tanto! la variable aleatoria X ( )* X 5 Y , 6 *x 5 $,. - )*x"-nx + $"-n$,. tiene una distribucin normal estndar. Tntervalos de confian0a para la diferencia de medias' muestras independientes *Varian0as conocidas o tama@os de muestras grandes,. &upongamos que disponemos de muestras aleatorias independientes de nx $ n$ observaciones procedentes de distribuciones normales con medias x $ $! $ varian0as x" $ $". &i las medias muestrales observadas son x e y ! entonces! un intervalo de confian0a del 44* 5 ,9 para *x 5 $, viene dado por * x 5 y , 5 0-" *x"-nx + $"-n$, M x 5 $ M * x 5 y , + 0-" *x"-nx + $"-n$, donde 0-" es el valor para el cual 7*X : 0-", ( -" $ la variable aleatoria X sigue una distribucin normal estndar. &i el tama@o de las muestras nx $ n$ es grande! entonces! sustitu$endo en la expresin anterior las varian0as poblacionales sx" $ s$" por las muestrales! se obtiene una buena aproximacin a un intervalo de confian0a del 44* 5 ,9 para *x 5 $,. 7ara muestras grandes! esta aproximacin seguir siendo vlida incluso cuando las distribuciones poblacionales no sean normales. 8reinta observaciones en cada muestra son! en general! suficientes para reali0ar esta aproximacin. 7ara /allar un intervalo cuando los tama@os muestrales no son grandes $ se requiere un intervalo de confian0a para la diferencia de medias de dos poblaciones normales! $ si se puede asumir que las varian0as poblacionales son iguales! se puede emplear un mtodo bastante sencillo. &upongamos que disponemos de dos muestras aleatorias de nx $ n$ observaciones procedentes de dos poblaciones con medias x $ $! $ varian0a com#n desconocida ". la inferencia sobre las medias poblacionales se basa en la diferencia * X 5 Y , entre las dos medias muestrales. %sta variable aleatoria tiene una distribucin normal con media * x 5 1 1 nx + ny + X Y X Y $, $ varian0a Var* 5 , ( Var* , + Var* , ( "-nx + "-n$ ( " nx ny ( " nxny nx + ny .H 7or tanto! se verifica que la variable aleatoria X ( )* X 5 Y , 6 *x 5 $,. - G)" nxny tiene una distribucin normal estndar. &in embargo! debido a que esta varian0a es la misma para ambas poblaciones! pueden emplearse los dos conjuntos de informacin muestral para estimarla. %l estimador es s" ( )*nx 6 ,sx" + *n$ 6 ,s$". - *nx + n$ 6 ", donde sx" $ s$" son las dos varian0as muestrales. 2eempla0ando la varian0a desconocida ( X Y ) ( x y ) " " nx + ny por su estimador s ! obtenemos la variable aleatoria t ( 7uede s nxny demostrar que esta variable aleatoria sigue una distribucin t de &tudent con *n x + n$ 6 ", grados de libertad.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Tntervalo de confian0a para la diferencia de medias de dos poblaciones normales' ?uestras independientes! varian0as poblaciones iguales. &upongamos que disponemos de dos muestras aleatorias independientes con nx $ n$ observaciones que proceden de dos poblaciones normales con medias x $ $! $ varian0a com#n desconocida. &i las medias $ varian0as muestrales observadas son x ! y ! $ sx"! s$"! entonces! un intervalo de confian0a del 44* 5 ,9 viene dado por * x 5 y , 6 tnx+n$5"! -" nx + ny nx + ny s M x 5 $ M * x 5 y , + tnx+n$5"! -" s donde s" ( )*nx 6 ,sx" + *n$ 6 ,s$". - *nx + nxny nxny n$ 6 ", $ tnx+n$5"! -" es el valor que verifica 7*tnx+n$5" : tnx+n$5"! -", ( -" donde la variable aleatoria tnx+n$5" sigue una distribucin t de &tudent con *nx + n$ 6 ", grados de libertad. *ntervalos de confianza para la diferencia entre dos proporciones poblacionales 5muestras !randes6. &upongamos que una muestra de nx observaciones de una poblacin con una proporcin px de KxitosK da lugar a una proporcin muestral \px! $ que se obtiene una proporcin muestral \p$ al examinar una muestra aleatoria independiente de n$ observaciones procedentes de una poblacin con proporcin p$ de JxitosK. Dado que estamos interesados en la diferencia poblacional *px 6 p$,! parece lgico estudiar el comportamiento de la variable aleatoria *\px 5 \p$,. &u media es %*\px 5 \p$, ( %*\px, 6 %*\p$, ( px 6 p$ $! debido a que las muestras se extrajeron independientemente! la varian0a Var*\px 5 \p$, ( px (1 px ) py (1 py ) + Var*\px, + Var*\p$, ( nx ny 1dems! si los tama@os muestrales son grandes! la distribucin de esta variable aleatoria es aproximadamente normal! por lo que si le restamos su media $ la dividimos por la desviacin tpica! el resultado es una variable aleatoria normal estndar. 7or otra parte! para tama@os de muestra grandes! esta aproximacin sigue siendo vlida aun cuando se sustitu$an las proporciones poblacionales desconocidas por sus equivalentes muestrales. 1s pues! la variable aleatoria (^ px ^ py ) ( px py ) Z= ^ px (1^ px ) ^ py (1^ py ) sigue aproximadamente una distribucin normal + nx ny estndar. %ste resultado permite la construccin de intervalos de confian0a para la diferencia entre dos proporciones poblacionales cuando los tama@os de muestra son grandes. Tntervalos de confian0a para la diferencia entre proporcione poblaciones *?uestras grandes,. &ea \px la proporcin de xitos observadas en una muestra aleatoria de tama@o nx procedente de una poblacin con proporcin de xitos px! $ sea \p$ la proporcin de xitos observada en una muestra aleatoria independiente procedente de una poblacin con proporcin p$ de xitos. %ntonces! sui los tama@os muestrales son grandes *al menos B4 observaciones,! un intervalo de confian0a del 44* 5 ,9 viene dado por *\px 5 \p$, 5 0-" ^ px (1^ px ) ^ py (1 ^ py ) ^ px (1^ px ) ^ py (1 ^ py ) + + M px 6 p$ M *\px 5 \p$, + 0-" donde nx ny nx ny Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 0-" es el valor que verifica 7*X : 0-", ( -" $ la variable aleatoria X sigue una distribucin normal estndar.
Cmo estimar el tama7o de la muestra. %n algunas situaciones el investigador puede ser capa0 de fijar por adelantado la amplitud del intervalo de confian0a! eligiendo un tama@o muestral lo suficientemente grande como para garanti0ar dic/a amplitud. *ntervalos para la media de una distribucin normal: varianza poblacional desconocida. Auando tomamos una muestra aleatoria de n observaciones procedentes de una poblacin normal con media $ varian0a conocida "! un intervalo de confian0a del 44* z / 2 z / 2 < < x+ 5 ,9 viene dado por x donde x es la media muestral observada n n $ 0-" es el valor crtico apropiado de la distribucin normal. %ste intervalo est centrado z / 2 en la media muestral $ recorre una distancia L = a cada lado de la media n muestral! de manea que L es la mitad de la longitud del intervalo. &upongamos a/ora que z / 2 el investigador quiere fijar L de antemano. 8enemos que n = $ elevando al L cuadrado de los dos lados de esta ecuacin! obtenemos n ( *0"-"", - L". %sta eleccin del tama@o muestral nos garanti0a que el intervalo de confian0a tendr una amplitud L a cada lado de la media muestral. 8ama@o muestral de los intervalos de confian0a para la media de una distribucin normal' varian0a poblacional conocida. &upongamos que disponemos de una muestra aleatoria de una poblacin normal con varian0a conocida ". entonces! un intervalo de confian0a del 44* 5 ,9 para la media poblacional tiene una amplitud L a cada lado de la media muestral! si el n#mero de observaciones es n ( *0"-"", - L". donde 0-" es el valor para el cual 7*X : 0-", ( -" $ X sigue una distribucin normal estndar. Naturalmente! el n#mero de observaciones de la muestra tiene que ser entero. &i el n#mero n resultante no es un entero! lo redondeamos por exceso para garanti0ar que nuestro intervalo de confian0a no exceda la amplitud requerida. *ntervalos para la proporcin poblacional. %n una muestra aleatoria de n observaciones! un intervalo de confian0a del 44* 5 ,9 ^ px (1^ px ) ^ px (1^ px ) viene dado por \px 5 0-" M p M \px + 0-" , donde \px es la n n proporcin muestral observada. %ste intervalo est centrado en la proporcin muestral $
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION ^ px (1^ px ) recorre una distancia L ( 0-" a cada lado de la proporcin muestral. 1/ora n bien! esta frmula no puede ser aplicada directamente para construir un intervalo de confian0a con una longitud determinada! $a que depende de la proporcin muestral! la cual no se conoce de antemano. &in embargo! independientemente del resultado! \px* 5 \px, no puede ser ma$or que 4!"> cuando el valor de la proporcin muestral es 4!>. de este modo! el ma$or valor que puede alcan0ar L es L U! el cual viene dado por LU ( 0-" 0,25 0,5 z / 2 = n n &upongamos que un investigador quiere elegir un tama@o muestral lo suficientemente grande como para garanti0ar que el intervalo de confian0a no tendr una amplitud ma$or 0,5 z / 2 que LU a cada lado de la proporcin muestral. 8enemos que n = $ elevando L* esta cantidad al cuadrado obtenemos n ( *4!">0"-", - *LU", %sta expresin proporciona el tama@o muestral que buscamos. 8ama@o muestral de los intervalos de confian0a para la proporcin muestral. &upongamos que tomamos una muestra aleatoria procedente de una poblacin. %ntonces! un intervalo de confian0a del 44* 5 ,9 para la proporcin poblacional! que tiene una amplitud mxima L a cada lado de la proporcin muestral! vendr garanti0ado por un n#mero de observaciones n ( *4!">0"-", - *LU", Contraste de #iptesis. Denotemos por el parmetro poblacional de inters. &upongamos que se formula una /iptesis sobre este parmetro $ que esta /iptesis se considerar cierta a no ser que se produ0ca suficiente evidencia en contra! lo cual puede entenderse como mantener la /iptesis. %n el contexto del contraste de /iptesis estadstico! se conoce como hiptesis nula. Auando se recoge informacin muestral! esta /iptesis es ju0gada! o contrastada. &i la /iptesis no es cierta! entonces! debe ser cierta alguna /iptesis alternativa! as cuando el investigador elabora un contraste formula una hiptesis alternativa frente a la cual se contrasta la /iptesis nula. La /iptesis nula se denotar W4 $ la /iptesis alternativa W . Una /iptesis! nula o alternativa! puede designar un #nico valor! llamado 4 para el parmetro poblacional . %n este caso! se dice que la /iptesis es simple. La notacin simblica para una /iptesis de este tipo es W4' ( 4 Una /iptesis tambin puede designar un rango de valores para el parmetro poblacional desconocido. Una /iptesis de este tipo se denomina compuesta $ ser cierta para ms de un valor del parmetro poblacional. %n muc/as aplicaciones! se contrasta una /iptesis nula! digamos! W4' ( 4 frente a una alternativa compuesta. %n algunos casos! slo interesan alternativas a un lado de la /iptesis nula. 7or ejemplo! podemos querer constatar esta /iptesis nula frente a la /iptesis alternativa de que el verdadero valor de es ma$or que 4! lo cual puede escribirse como W ' : 4 7or el contrario! la alternativa de inters puede ser W ' M 4 Las /iptesis alternativas de este tipo se denominan alternativas unilaterales. Ntras posibilidad es que queramos contrastar esta /iptesis nula simple frente a la alternativa general de que el valor de es cualquiera distinto de 4! es decir' W ' 4 `sta se conoce como alternativa bilateral.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Despus de especificar unas /iptesis nula $ alternativa! $ de recoger informacin muestral! debe tomarse una decisin sobre la /iptesis nula. Las dos posibilidades son aceptar la /iptesis nula o rechazarla a favor de la alternativa. Aon el fin de llegar a una de estas conclusiones! se adopta una regla de decisin basada en la evidencia muestral. &i slo se dispone de una muestra de la poblacin! entonces el parmetro poblacional no se conocer con exactitud. 7or consiguiente! no se puede saber con seguridad si la /iptesis nula es cierta o falsa. 7or tanto! cualquier regla de decisin adoptada tiene cierta probabilidad de llegar a una conclusin errnea sobre el parmetro poblacional de inters. De /ec/o! pueden cometerse dos tipos de errores. Wa$ dos posibles estados de la naturale0a 6 la /iptesis nula es cierta o es falsa. Un error que se puede cometer! llamado error de 0ipo I! es rec/a0ar una /iptesis nula cierta. &i la regla de decisin es tal que la probabilidad de rec/a0ar la /iptesis nula cuando es cierta es ! entonces! se llama nivel de significacin del contraste. 7uesto que la /iptesis tiene que ser aceptada o rec/a0ada! la probabilidad de aceptar la /iptesis nula cuando es cierta es * 5 ,. %l otro error posible! llamado error de 0ipo II! ocurre cuando se acepta una /iptesis nula falsa. &upongamos que para una determinada regla de decisin particular! la probabilidad de cometer este error! cuando la /iptesis nula es falsa! se nota por . %ntonces! la probabilidad de rec/a0ar una /iptesis nula falsa es * 5 ,! $ se denomina potencia del contraste. 7or supuesto! lo ideal sera que las probabilidades de los dos tipos de error fuesen lo ms peque@as posible. &in embargo! /a$ una clara compensacin entre los dos. Auando se /a tomado una muestra! cualquier modificacin de la regla de decisin que /aga menos verosmil rec/a0ar una /iptesis nula cierta! inevitablemente! se traducir en ma$or verosimilitud de aceptar esta /iptesis cuando es falsa. 1l disminuir la probabilidad de cometer un error de 8ipo T! /emos aumentado la probabilidad de cometer un error de 8ipo TT. La #nica manera de disminuir simultneamente las dos probabilidades de error ser obtener ms informacin sobre el verdadero parmetro de la poblacin! tomando una muestra ma$or. Wabitualmente lo que se /ace en la prctica! es fijar la probabilidad de cometer un error de 8ipo T a un nivel deseado! es decir! se fija el nivel de significacin. Wemos visto que! puesto que la regla de decisin queda determinada por el nivel de significacin elegido! el concepto de potencia no forma parte directa en la decisin de rec/a0ar la /iptesis nula. 8erminologa de contraste de /iptesis. Wiptesis Nula *W4,' una /iptesis que se mantiene como cierta si no se obtiene suficiente evidencia de lo contrario. Wiptesis 1lternativa *W ,' una /iptesis frente a la cual se contrasta la /iptesis nula $ que se considerar cierta si la nula resulta falsa. Wiptesis &imple' una /iptesis que especifica un #nico valor para el parmetro poblacional de inters. Wiptesis Aompuesta' una /iptesis que especifica un rango de valores para el parmetro poblacional. 1lternativa Unilateral' una /iptesis alternativa que recoge todos los posibles valores de un parmetro poblacional a un lado u otro *es decir! ma$ores que o menores que, del valor especificado por una /iptesis nula simple. 1lternativa Lilateral' una /iptesis alternativa que recoge todos los posibles valores de un parmetro poblacional distintos del valor especificado por una /iptesis nula simple. Decisiones de un Aontraste de Wiptesis' se formula una regla de decisin que conduce al investigador a aceptar o rec/a0ar la /iptesis nula basndose en la evidencia muestral. %rror de 8ipo T' rec/a0ar una /iptesis nula cierta. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %rror de 8ipo TT' aceptar una /iptesis nula falsa. Nivel de significacin' la probabilidad de rec/a0ar una /iptesis nula que es cierta *esta probabilidad a veces se expresa como un porcentaje! con lo que nos referimos a un contraste de nivel de significacin como un contraste de nivel 449,. 7otencia' la probabilidad de rec/a0ar una /iptesis nula que es falsa. Contrastes para la media de una distribucin normal: 2arianza poblacional conocida. Aomencemos con el problema de contrastar la /iptesis nula de que la media poblacional es igual a cierta valor! 4. esta /iptesis se representa W4' ( 4 &upongamos que la /iptesis alternativa de inters es que la media poblacional supera este valor especfico! es decir! W ' : 4 %s natural que el contraste sobre la media poblacional se base en la media muestral X . %n particular! uno desconfiara de la veracidad de una /iptesis nula! frente a esta alternativa! si la media muestral observada fuese muc/o ma$or que 4. buscamos la forma de un contraste con un nivel de significacin prefijado. %s decir! queremos una regla de decisin tal que la probabilidad de rec/a0ar la /iptesis nula! cuando es cierta! X 0 sea . %l contraste se apo$a en el /ec/o de que la variable aleatoria X ( tiene n distribucin normal estndar. 1/ora! se rec/a0ar la /iptesis nula si la media muestral es muc/o ma$or que el valor 4 postulado para la media poblacional. 7or tanto! W4 ser rec/a0ada si se observa un valor alto para la variable aleatoria. [ueremos fijar en la probabilidad de rec/a0ar la /iptesis nula cuando es cierta. Denotamos por 0 el n#mero para el cual 7*X : 0, ( [ue significa que cuando la /iptesis nula es cierta! la probabilidad de que la variable aleatoria sea ma$or que 0 es . 7or tanto! denotando x como la media muestral observada $ suponiendo que adoptamos la siguiente regla de x 0 decisin' 2ec/a0ar W4 si : 0 entonces! la probabilidad de rec/a0ar W4 cuando es n cierta ser ! luego es el nivel de significacin del contraste basado en esta regla de decisin. Un contraste para la media de una poblacin normal' varian0a poblacional conocida. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin normal con media $ varian0a " conocida. &i la media muestral observada es x ! entonces! un contraste con nivel de significacin de de la /iptesis nula W4' ( 4 frente a la alternativa W ' : 4 se obtiene con la regla de decisin 2ec/a0ar W 4 si x 0 : 0 donde 0 es el n#mero para el cual 7*X : 04, ( $ X es una variable n aleatoria normal estndar. 1l rebajar el nivel de significacin! estamos reduciendo la probabilidad de rec/a0ar una /iptesis nula cierta $! en consecuencia! estamos modificando la regla de decisin para /acer menos verosmil que se rec/ace la /iptesis mula! tanto si es cierta como si no. Nbviamente! cuanto menor sea el nivel de significacin al cual puede rec/a0arse una /iptesis nula! ma$or ser la duda sobre su veracidad. %n lugar de contrastar /iptesis con niveles de significacin asignados de antemano! los investigadores suelen denominar el menor nivel de significacin al cual puede rec/a0arse la /iptesis nula. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Definicin. %l menor nivel de significacin al cual puede rec/a0arse una /iptesis nula se denomina valor crtico o p-valor del contraste. &upongamos que en lugar de una /iptesis nula simple! queremos contrastar la /iptesis nula compuesta W4' M 4 frente a la alternativa W ' : 4 al nivel de significacin . 7ara la regla de decisin desarrollada en el caso de la /iptesis nula simple! vimos que si la media de la poblacin es precisamente 4! entonces! la probabilidad de rec/a0ar la /iptesis nula es . 7ara esta misma regla de decisin! si la verdadera media de la poblacin es menor que 4 parece a#n menos verosmil rec/a0ar la /iptesis nula. 7or tanto! usar esta regla de decisin en el presente contexto garanti0a que la probabilidad de rec/a0ar la /iptesis nula compuesta cuando es cierta es como muc/o . Un contraste para la media de una distribucin normal *varian0a conocida,' /iptesis nula $ alternativa compuesta. %l procedimiento adecuado para contrastar! al nivel de significacin de ! la /iptesis nula W4' M 4 frente a la alternativa W ' : 4 es exactamente el mismo que cuando la /iptesis nula es W4' ( 4. Aonsideremos a/ora el problema de contrastar la /iptesis nula simple W 4' ( 4 frente a la alternativa compuesta de que la verdadera media es menor que 4! es decir! W ' M 4 %n esta situacin! se suscitara una duda sobre la /iptesis nula si la media muestral fuese muc/o menor que la media poblacional postulada. Una ve0 ms! si la /iptesis nula fuera cierta! la variable aleatoria seguira una distribucin normal estndar. para conseguir un contraste con nivel de significacin slo necesitamos advertir que 7*X M 50, ( si X es una variable aleatoria normal estndar. 7or tanto! si x es la media x 0 muestral observada! la regla de decisin adecuada es 2ec/a0ar W4 si M 50 n Aontraste para la media de una distribucin normal' varian0a poblacional conocida. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin normal con media $ varian0a conocida ". si la media muestral observada es x ! un contraste con nivel de significacin para cualquiera de las dos /iptesis nula siguientes W4' ( 4 o W4' : 4 frente a la alternativa W ' M 4 se obtiene con la x 0 regla de decisin 2ec/a0ar W4 si M 504 n Aonsideremos a/ora el contraste de la /iptesis nula W4' ( 4 frente a la alternativa bilateral W ' 4 1qu! se asume que el investigador no tiene una poderosa ra0n para sospec/ar desviaciones /acia un solo lado de la media poblacional postulada. &e pondr en duda la /iptesis nula si se observa una media muestral muc/o ma$or o muc/o menor que 4. una ve0 ms! si la /iptesis nula es cierta! la variable aleatoria tiene distribucin normal estndar. para obtener un contraste con nivel de significacin ! obsrvese que bajo la /iptesis nula 7*X : 0-", ( -" $ 7*X M 50-", ( -"
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 7or tanto! la probabilidad de que X sea ma$or que 0-" o menor que 0-" es . De aqu se x 0 sigue que con la regla de decisin 2ec/a0ar W4 si es ma$or que 0-" o menor que n 50-" se obtiene un contraste de nivel . Aontraste para la media de una distribucin normal frente a una alternativa bilateral' varian0a poblacional conocida. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin normal con media $ varian0a conocida ". &i la media muestral observada es x ! entonces! un contraste con nivel de significacin de de la /iptesis nula W4' ( 4 frente a la alternativa bilateral W ' 4 se obtiene con la regla de decisin 2ec/a0ar x 0 x 0 W4 si : 0-" o M 50-" n n Aontrastes para la media' tama@os muestrales grandes. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin con media $ varian0a ". &i el tama@o de la muestra n es grande *C4 o ms,! los procedimientos de contraste desarrollados para el caso en el que la varian0a poblacional es conocida pueden emplearse cuando es desconocida! reempla0ando " por la varian0a muestral observada sx". adems! estos procedimientos resultan aproximadamente vlidos incluso si la distribucin de la poblacin no es normal. Contrastes para la media de una distribucin normal: 2arianza poblacional desconocida. &upongamos el problema de una muestra aleatoria de n observaciones tomadas de una poblacin normal en el que se quiere contrastar una /iptesis sobre la media poblacional . &in embargo! la varian0a poblacional es desconocida. Wemos visto que si la media $ la varian0a muestrales se denotan por X $ sx"! la variable X aleatoria tn5 ( sigue una distribucin t de &tudent con *n 6 , grados de libertad. sx n Aontraste para la media de una distribucin normal' varian0a poblacional desconocida. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin normal con media . &i la media muestral $ la desviacin tpica observadas son x $ sx"! entonces los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' ( 4 o W4' M 4 frente a la x 0 alternativa W ' : 4 la regla de decisin es 2ec/a0ar W4 si : tn5t! sx n 2. 7ara contrastar una de las /iptesis nulas W4' 4 o W4' : 4 frente a la x 0 alternativa W ' M 4 la regla de decisin es 2ec/a0ar W4 si M 5tn5 ! sx n 3. 7ara contrastar la /iptesis nula W4' ( 4 frente a la alternativa bilateral W ' 4 x 0 x 0 la regla de decisin es 2ec/a0ar W4 si : tn5t! o M 5tn5 ! sx n sx n 1qu! tn5 ! es el n#mero para el cual 7*tn5 : tn5 !, ( donde la variable aleatoria tn5 sigue una distribucin t de &tudent con *n 6 , grados de libertad. Contrastes para la varianza de una distribucin normal. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION %s natural basar los contrastes de /iptesis sobre la varian0a poblacional " en la varian0a muestral sx". la base para desarrollar los contrastes particulares se apo$a en el /ec/o de que la variable aleatoria "n5 ( )*n 6 ,sx". - " sigue una distribucin A/i cuadrado con *n 6 , grados de libertad. &i la /iptesis nula es que la varian0a de la poblacin es igual a cierto valor especfico 4"! es decir! W4' " ( 4" entonces! cuando la /iptesis nula es cierta! la variable aleatoria "n5 ( )*n 6 ,sx". - 4" sigue una distribucin A/i cuadrado con *n 6 , grados de libertad. &i la /iptesis alternativa es que la " verdadera varian0a supera a 4 ! deberamos desconfiar de la /iptesis nula si la varian0a muestral observada fuese muc/o ma$or que 4". por tanto! rec/a0aramos la /iptesis nula si observramos un valor alto de "n5 . 7or el contrario! si la /iptesis alternativa es que la varian0a de la poblacin es menor que el valor que se especifica en la /iptesis nula! sta se rec/a0ara para valor bajo. 7or #ltimo! para la alternativa bilateral de que la varian0a poblacional difiere de 4"! rec/a0aramos la /iptesis nula s observramos valores de "n5 inusualmente altos o bajos. Denotamos por "! el n#mero tal que la probabilidad de que una variable aleatoria A/i cuadrado con grados de libertad lo supere es . %s decir! 7*" : "!, ( De donde se deduce que 7*" M "! 5, ( $ que 7*" : "!-", o " M "! 5-", ( Aontraste para la varian0a de una poblacin normal. &upongamos que disponemos de una muestra de n observaciones de una poblacin normal con varian0a ". si la varian0a muestral observada es sx"! entonces! los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' " ( 4" o W4' " M 4" frente a la alternativa W ' " : 4" la regla de decisin es 2ec/a0ar W4 si )*n 6 ,sx". - 4" : "n5 ! 2. 7ara contrastar una de las /iptesis nulas W4' " ( 4" o W4' " : 4" frente a la alternativa W ' " M 4" la regla de decisin es 2ec/a0ar W4 si )*n 6 ,sx". - 4" M "n5 ! 5 3. para contrastar la /iptesis nula W4' " ( 4" frente a la alternativa bilateral W ' " 4" la regla de decisin es 2ec/a0ar W4 si )*n 6 ,sx". - 4" : "n5 !-" o )*n 6 ,sx". - 4" M "n5 ! 5-" 1qu! "n5 ! es el n#mero para el cual 7*"n5 : "n5 !, ( donde la variable aleatoria "n5 sigue una distribucin A/i cuadrado con *n 6 , grados de libertad. Contrastes para la proporcin poblacional 5$uestras !randes6. La inferencia sobre la proporcin poblacional se basa en la proporcin de individuos de una muestra aleatoria que poseen el atributo de inters. Denotando por p la proporcin poblacional $ por \px la proporcin en una muestra aleatoria de n observaciones! sabemos que si el tama@o de la muestra es grande! ^ px p entonces es una buena aproximacin decir que la variable aleatoria X ( tiene p (1. p ) / n una distribucin normal estndar. La distribucin muestral de la proporcin muestral es aproximadamente normal cuando el tama@o muestral es grande! de acuerdo con el teorema central del lmite. &i la /iptesis nula es que la proporcin es igual a cierto valor especfico p 4! resulta que ^ px p 0 cuando esta /iptesis es cierta! la variable aleatoria X ( sigue una p 0(1. p 0) / n distribucin normal estndar. Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION Aontraste para la proporcin poblacional *8ama@os muestrales grandes,. &upongamos que disponemos de una muestra aleatoria de n observaciones de una poblacin! una proporcin p de cu$os miembros posee un atributo particular. %ntonces! si el n#mero de observaciones de la muestra es grande *B4 o ms, $ la proporcin muestral observada es \px! los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' p ( p4 o W4' p M p4 frente a la ^ px p 0 alternativa W ' p : p4 la regla de decisin es 2ec/a0ar W4 si : 0 p 0(1 p 0) / n 2. 7ara contrastar una de las /iptesis nulas W4' p ( p4 o W4' p : p4 frente a la ^ px p 0 alternativa W ' p M p4 la regla de decisin es 2ec/a0ar W4 si M 50 p 0(1 p 0) / n 3. 7ara contrastar la /iptesis nula W4' p ( p4 frente a la alternativa bilateral W ' p p4 ^ px p 0 ^ px p 0 la regla de decisin es 2ec/a0ar W4 si : 0-" o M 50-" p 0(1 p 0) / n p 0(1 p 0) / n 1qu! 0 es el n#mero para el cual 7*X : 0, ( distribucin normal estndar. Contrastes para la diferencia entre dos medias. Contrastes basados en datos pareados. Aontrastes para la diferencia de medias' datos pareados. &upongamos que disponemos de una muestra aleatoria de n pares de observaciones de distribuciones con medias x $ $. Denotemos por d $ por sd la media muestral $ la desviacin tpica observadas para las n diferencias *xi 6 $i,. &i la distribucin poblacional de las diferencias es normal! entonces! los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ M D4 frente a d D0 la alternativa W ' x 5 $ : D4 la regla de decisin es 2ec/a0ar W4 si : tn5 ! sd n 2. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ : D4 frente a d D0 la alternativa W ' x5 $ M D4 la regla de decisin es 2ec/a0ar W4 si M 5tn5 ! sd n 3. 7ara contrastar la /iptesis nula W4' x 5 $ ( D4 frente a la alternativa bilateral W ' x 5 d D0 d D0 $ D4 la regla de decisin es 2ec/a0ar W4 si M 5tn5 !-" o : tn5 !-" sd n sd n 1qu! tn5 ! es el n#mero para el cual 7*tn5 : tn5 !, ( donde la variable aleatoria tn5 sigue una distribucin t de &tudent con *n 6 , grados de libertad. Auando queremos contrastar la /iptesis nula de que las dos medias poblacionales son iguales! tomamos D4 ( 4 en las frmulas. donde la variable aleatoria 0 tiene
Contrastes basados en muestras independientes.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION &upongamos que disponemos de una muestra aleatoria de n x observaciones de una poblacin normal con media x $ varian0a x"! $ una muestra aleatoria! independiente de la anterior de n$ observaciones de una poblacin normal con media $ $ varian0a $". &i se denotan las medias muestrales por X eY ! entonces la variable aleatoria X ( ( X Y ) ( x y ) x 2 y 2 tiene una distribucin normal estndar. aracias al teorema central del + nx ny lmite! si los dos tama@os muestrales son grandes! el resultado sigue siendo una buena aproximacin cuando se sustitu$en las varian0as poblacionales por las muestrales! incluso cuando las distribuciones poblacionales no son normales. Aontrastes para la diferencia de medias' muestras independientes *Varian0as conocidas o tama@os muestrales grandes,. &upongamos que disponemos de muestras independientes de nx $ n$ observaciones de distribuciones normales con medias x $ $! $ varian0as x" $ $". si las medias muestrales observadas son x e y ! entonces! los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ M D4 frente a x y D0 la alternativa W ' x 5 $ : D4 la regla de decisin es 2ec/a0ar W4 si x 2 y 2 : 0 + nx ny 2. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ : D4 frente a x y D0 la alternativa W ' x5 $ M D4 la regla de decisin es 2ec/a0ar W4 si x 2 y 2 M 50 + nx ny 3. 7ara contrastar la /iptesis nula W4' x 5 $ ( D4 frente a la alternativa bilateral W ' x 5 x y D0 x y D0 $ D4 la regla de decisin es 2ec/a0ar W4 si x 2 y 2 M 50-" o x 2 y 2 : 0-" + + nx ny nx ny &i los tama@os muestrales nx $ n$ son grandes *C4 o ms,! entonces! para obtener contrastes al nivel de significacin para la diferencia de medias! resulta una buena aproximacin reempla0ar las varian0as poblacionales por las muestrales! sx" $ s$". para tama@os muestrales grandes! estas aproximaciones resultan satisfactorias incluso cuando las distribuciones poblacionales no son normales. Aontrastes para la diferencia de medias de dos poblaciones normales' muestras independientes! varian0as poblacionales iguales. &upongamos que disponemos de muestras independientes de nx $ n$ observaciones de distribuciones normales con medias x $ $! $ una varian0a com#n. &i las varian0as muestrales observadas son sx" $ s$"! un estimador de la varian0a poblacional com#n se obtiene mediante s" ( )*nx 6 ,sx" + *n$ 6 ,s$". - *nx + n$ 6 ", %ntonces! si las medias muestrales son x e y ! los siguientes contrastes tienen nivel de significacin '
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 1. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ M D4 frente a x y D0 la alternativa W ' x 5 $ : D4 la regla de decisin es 2ec/a0ar W4 si s nx + ny : tnx+n$5 nxny 2. 7ara contrastar una de las /iptesis nulas W4' x 5 $ ( D4 o W4' x 5 $ : D4 frente a x y D0 la alternativa W ' x5 $ M D4 la regla de decisin es 2ec/a0ar W4 si s nx + ny M 5tnx+n$5 nxny 3. 7ara contrastar la /iptesis nula W4' x 5 $ ( D4 frente a la alternativa bilateral W ' x 5 x y D0 x y D0 $ D4 la regla de decisin es 2ec/a0ar W4 si s nx + ny M 5tnx+n$5"!-" o s nx + ny : nxny nxny tnx+n$5"! -" 1qu! tnx+n$5"! es el n#mero para el cual 7*tnx+n$5" : tnx+n$5"!, ( donde tnx+n$5" tiene una distribucin t de &tudent con *nx + n$ 6 ", grados de libertad. Contrastes para la diferencia entre dos proporciones 5muestras !randes6. &upongamos que disponemos de dos muestras aleatorias independientes. La primera consta de n observaciones de una poblacin cu$a proporcin de JxitosK es px $ la proporcin muestral resultante es \px. La segunda consta de n$ observaciones de una poblacin cu$a proporcin de JxitosK es p$ $ la proporcin muestral resultante es \p$. &i los tama@os de las muestras son grandes! entonces es una buena aproximacin (^ px ^ py ) ( px py ) px (1 px ) py (1 py ) tiene una distribucin considerar que la variable aleatoria X ( + nx ny normal estndar! en virtud del teorema central del lmite. &upongamos que queremos contrastar la /iptesis de que las proporciones poblacionales px $ p$ son iguales. &i denotamos por p4 su valor com#n! entonces! bajo esta /iptesis! (^ px ^ py ) (^ px ^ py ) = tenemos que X ( p 0(1 p 0) p 0(1 p 0) nx + ny sigue! aproximadamente! + p 0(1 p 0) nx ny nxny una distribucin normal estndar. Rinalmente! la proporcin com#n desconocida p4 puede estimarse mediante el estimador nx ^ px + ny ^ py \p4 *que utili0a las dos proporciones muestrales, dado por \p4 ( nx + ny 2eempla0ando el valor desconocido p4 por \p4 se obtiene una variable aleatoria cu$a distribucin est prxima a la normal estndar! dado que los tama@os muestrales son grandes. Aontrastes para la igualdad de dos proporciones poblacionales *?uestras grandes,. Denotemos por \px la proporcin de xitos en una muestra aleatoria de nx observaciones de una poblacin cu$a proporcin de xitos es px $ \p$ la proporcin de xitos observados en una muestra aleatoria independiente de n$ observaciones de una poblacin cu$a proporcin de xitos es p$. &i se formula la /iptesis de que las proporciones Cedido por el TURCO
"! "!
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION poblacionales son iguales! un estimador de la proporcin com#n se obtiene mediante \p 4 nx ^ px + ny ^ py ( nx + ny %ntonces! si los tama@os muestrales son grandes *B4 o ms,! los siguientes contrastes tienen nivel de significacin ' 1. 7ara contrastar una de las /iptesis nulas W4' px 5 p$ ( 4 o W4' px 5 p$ M 4 frente a la (^ px ^ py ) alternativa W ' px 5 p$ : 4 la regla de decisin es 2ec/a0ar W4 si nx + ny ^ p 0(1 ^ p 0) nxny
: 0 2. 7ara contrastar una de las /iptesis nulas W4' px 5 p$ ( 4 o W4' px 5 p$ : 4 frente a la (^ px ^ py ) alternativa W ' px5 p$ M 4 la regla de decisin es 2ec/a0ar W4 si nx + ny ^ p 0(1 ^ p 0) nxny
M 50 3. 7ara contrastar la /iptesis nula W4' px 5 p$ ( 4 frente a la alternativa bilateral W ' px 5 (^ px ^ py ) p$ 4 la regla de decisin es 2ec/a0ar W4 si nx + ny M 50-" ^ p 0(1 ^ p 0) nxny o
(^ px ^ py ) nx + ny : 0 -" ^ p 0(1 ^ p 0) nxny Contraste de i!ualdad de varianzas de dos poblaciones normales. &ea sx" la varian0a muestral de una muestra aleatoria de nx observaciones de una poblacin normal con varian0a x"! $ s$" la varian0a muestral de una muestra aleatoria independiente de n$ observaciones de una poblacin normal con varian0a $". %ntonces! la variable aleatoria R ( *sx"-x", - *s$"-$", sigue una distribucin conocida como distribucin 1. 2ecordemos que los grados de libertad asociados con la varian0a muestral s x" son *nx 6 , $ con s$"! *n$ 6 ,. La variable aleatoria R tiene una funcin de densidad asimtrica! definida slo para valores no negativos. La distribucin R. &upongamos que se toman muestras aleatorias independientes de nx $ n$ observaciones de dos poblaciones normales con varian0a x" $ $". si las varian0as muestrales son sx" $ s$"! entonces! la variable aleatoria R ( *sx"-x", - *s$"-$", tiene distribucin 1 con *nx 6 , grados de libertad en el numerador $ *n$ 6 , grados de libertad en el denominador. Una distribucin R con grados de libertad en el numerador $ " grados de libertad en el denominador se denotar R !". Denotaremos por R !"! el n#mero para el cual 7*R !" : R !"!, ( Aontrastes de igualdad de varian0a de dos poblaciones normales. &ean sx" $ s$" las varian0as muestrales observadas en dos muestras aleatorias independientes de nx $ n$ observaciones de poblaciones normales con varian0as x" $ $". &i sx" es ma$or que s$"! entonces los siguientes contrastes tienen nivel de significacin ' Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION 1. 7ara contrastar una de las /iptesis nulas W4' x" ( $" o W4' x" M $" frente a la alternativa W ' x" : $" la regla de decisin es 2ec/a0ar W4 si sx" - s$" : Rnx5 !n$5 ! 2. 7ara contrastar la /iptesis nula W4' x" ( $" frente a la alternativa bilateral W ' x" $" la regla de decisin es 2ec/a0ar W4 si sx"-s$" : Rnx5 !n$5 !-" donde sx" es la ma$or de las dos varian0as muestrales. 1qu! Rnx5 !n$5 ! es el n#mero para el cual 7*Rnx5 ! n$5 : Rnx5 !n$5 !, ( donde Rnx5 !n$5 tiene una distribucin R con *nx 6 , grados de libertad en el numerador $ *n $ 6 , grados de libertad en el denominador. $edicin de la potencia de un contraste. Contrastes para la media de una distribucin normal: varianza poblacional conocida. &upongamos que contrastamos la /iptesis nula de que la media de una poblacin normal es igual a cierto valor especfico 4. La probabilidad! ! de cometer un error de 8ipo TT depender de la verdadera media poblacional. %sta probabilidad puede calcularse como sigue' . 7ara la regla de decisin del contraste! determinar el rango de valores de la media muestral que conducen a la aceptacin de la /iptesis nula. 2. 7ara el valor de inters de la media poblacional! /allar la probabilidad de que la media muestral pertene0ca al intercalo de aceptacin determinada anteriormente! para muestras de n observaciones de una poblacin con media . La funcin de potencia tiene las siguientes propiedades' 1. &i todo lo dems permanece igual! cuanto ms lejos se /alle la verdadera media de la media postulada 4! ma$or ser la potencia del contraste. ". &i todo lo dems permanece igual! cuanto menor sea el nivel de significacin del contraste! menor ser la potencia. %n otras palabras! al reducir la probabilidad de cometer un error de 8ipo T aumentamos la de cometer un error de 8ipo TT. C. &i todo lo dems permanece igual! cuanto ma$or sea la varian0a de la poblacin! menor ser la potencia del contraste. 8enemos menos esperan0as de detectar peque@as desviaciones de la media postulada cuando /a$ muc/a variabilidad en la poblacin. B. si todo lo dems permanece igual! cuanto ma$or sea el tama@o de la muestra! ma$or ser la potencia del contraste. Auanta ms informacin se obtenga de la poblacin! /abr ma$ores posibilidades de detectar cualquier desviacin de la /iptesis nula. Contrastes para proporciones poblacionales 5muestras !randes6. 7odemos contrastar Qa /iptesis nula de que la proporcin de elementos de una poblacin que poseen un atributo es una cantidad especfica p4. La probabilidad ! de incurrir en un error de 8ipo TT para una proporcin poblacional dada se /alla de la siguiente manera' . 1 partir de la regla de decisin del contraste! /allar el intervalo de valores de la proporcin muestral que condice a la aceptacin de a /iptesis nula. 2. 7ara el valor p de inters de la proporcin poblacional! /allar la probabilidad de que la proporcin poblacional se encuentre en el intervalo de aceptacin determinado anteriormente para muestras de n observaciones cuando la proporcin poblacional es p. Cedido por el TURCO
Cedido por el TURCO

Estadística para Los Negocios.: Facultad de Ciencias Economicas Franja Morada - Conduccion

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Estadística para Los Negocios.: Facultad de Ciencias Economicas Franja Morada - Conduccion

Загружено:

Авторское право:

Доступные форматы

FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION

ESTADSTICA PARA LOS NEGOCIOS.

Cedido por el TURCO

Cedido por el TURCO

x valores respecto a su media! es decir' ?D1 (

Cedido por el TURCO

N La varianza es' ( ) fi*mi 5 , . - N ( )* fimi", - N. 5 "

2. 7ara una muestra de n observaciones! tal que n ( La media es x (

n La varianza es' s" ( ) fi*mi 5 x ,". - *n 6 , ( G)* fimi", - N. 5 n x "H- *n 6 ,

Cedido por el TURCO

7*Ni, donde el sumatorio se extiende a todos los resultados bsicos en el espacio

Cedido por el TURCO

7*Ni, donde el sumatorio se

7*Ni, %l lado derec/o de esta ecuacin es 7*1, + 7*L,.

Cedido por el TURCO

Cedido por el TURCO

Cedido por el TURCO

7x*x, donde la notacin indica que la suma es

*x" 5 "xx + x",7x*x, (

x"7x*x, 5 "x x7x*x, + x" 7x*x,

7ero /emos visto que x" (

7x*x, ( ! luego x" (

%ntonces! puesto que el primer sumatoria del lado

derec/o de la ecuacin vale tenemos' %*X, ( a + bx.

$ el segundo sumatoria es! por definicin! la media de S!

)*a + bx, 5 X." 7x*x,

*bx 5 bx,"7x*x, ( b" *x 5 x,"7x*x,

Cedido por el TURCO

1nlogamente! la funcin de probabilidad marginal de la variable aleatoria Y es' 7$*$, (

7x!$*x!$, donde la notacin indica que la suma es sobre

... g*x ! ...! xE,7x

x7x*x, ( *4,* 6 p, + * ,*p,

*x 5 x,"7x*x, ( *4 6 p,"* 6 p, + * 6 p,"p ( p* 6 p,

Cedido por el TURCO

La funcin de distribucin es! pues! la integral' Rx*x4, (

Y el valor esperado de la funcin g*S, como' %)g*S,. (

Cedido por el TURCO

Cedido por el TURCO

( %*S , + %*S", + ... + %*Sn,

7uesto que cada variable aleatoria Si tiene media x!

FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION

Cedido por el TURCO

Cedido por el TURCO

Cedido por el TURCO

como el valor que

Cedido por el TURCO

Cedido por el TURCO

Cedido por el TURCO

Cedido por el TURCO

Cedido por el TURCO

Contrastes basados en muestras independientes.

Cedido por el TURCO

Cedido por el TURCO

FACULTAD DE CIENCIAS ECONOMICAS FRANJA MORADA - CONDUCCION

Cedido por el TURCO

Вам также может понравиться

N La varianza es' ( ) fimi 5 , . - N ( ) fimi", - N. 5 "

n La varianza es' s" ( ) fimi 5 x ,". - n 6 , ( G)* fimi", - N. 5 n x "H- *n 6 ,

7Ni, %l lado derec/o de esta ecuacin es 71, + 7*L,.

x" 5 "xx + x",7xx, (

x"7xx, 5 "x x7xx, + x" 7x*x,

)a + bx, 5 X." 7xx,

bx 5 bx,"7xx, ( b" x 5 x,"7xx,

x7xx, ( 4,* 6 p, + * ,*p,

x 5 x,"7xx, ( 4 6 p," 6 p, + * 6 p,"p ( p* 6 p,

Y el valor esperado de la funcin gS, como' %)gS,. (

( %S , + %S", + ... + %*Sn,