Resumen Berenson

Resumen del libro de estadsticas de Berenson y Levine
Enviado por Hernan Torino

Indice
1. Resumen Captulo 1 del Libro
6. Capitulo 6 del libro
7. Captulo 7 del libro
11. Hiptesis nula y alternativa
16. Aplicaciones estadsticas en administracin de la calidad y productividad
Estadstica Descriptiva: Puede definirse como aquellos mtodos que incluyen la recoleccin,
presentacin y caraterizacin de un conjunto de datos con el fin de describir
apropiadamente las diversas caractersticas de ese conjunto.
Estadstica Inferencial: Puede definirse como aquellos mtodos que hacen posible la
estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una
poblacin basndose slo en los resultados de una muestra.
Para aclara este concepto se necesitan de las siguientes definiciones:
Poblacin: es la totalidad de elementos o cosas bajo consideracin.
Muestra: Es la porcin de la poblacin que se selecciona para su anlisis.
Parmetro: Es una medida de resumen que se calcula para describir una caracterstica de
toda una poblacin.
Estadstica: Es una medida que se calcula para describir una caracterstica de una sola
muestra de la poblacin.
Podemos encontrar dos tipos de estudios estadsticos que se emprenden: los estudios
enumerativos y los estudios analticos.
Los estudios enumerativos involucran la toma de decisiones respecto a una poblacin y/o sus
caractersticas.
Los estudios analticos involucran realizar alguna actividad sobre un proceso para mejorar el
desempeo en el futuro. La atencin de un estudio analtico est puesta sobre la prediccin del
comportamiento futuro de un proceso y sobre la comprensin y perfeccionamiento de ese
proceso. En un estudio analtico no existe un universo identificable, como sucede en un estudio
enumerativo y en consecuencia tampoco hay un marco.
Recoleccin de Datos
La necesidad de datos: los datos se necesitan para:
1. Proporcionar la introduccin imprescindible para un estudio de investigacin.
2. Medir el desempeo en un servicio o proceso de produccin en curso.
3. Ayudar en la formulacin de cursos alternativos de accin en un proceso de toma de
decisiones.
4. Satisfacer nuestra curiosidad.
Que es un dato?
Los datos pueden concebirse como informacin numrica necesaria para ayudarnos a tomar
una decisin con ms bases en una situacin particular.
Cmo obtenemos los datos?
Existen muchos mtodos mediante los cuales podemos obtener los datos necesarios. Primero,
podemos buscar datos ya publicados por fuentes gubernamentales, industriales o individuales.
Segundo, podemos disear un experimento. En tercer lugar, podemos conducir un estudio.
Cuarto, podemos hacer observaciones del comportamiento, actitudes u opiniones de los
individuos en los que estamos interesados.
Utilizacin de fuentes de datos publicadas
Sin importar la fuente utilizada, se hace una distincin entre el recolector original de los datos y
la organizacin o individuos que compilan stos en tablas y diagramas. El recolector de datos es
la fuente primaria; el compilador de los datos es la fuente secundaria.
Diseo de un experimento
En un experimento se ejerce control sobre el tratamiento de los dado a los participantes.
Conduccin de una encuesta
Aqu no se ejerce ningn control sobre el comportamiento de la gente encuestada.
Simplemente se formulan preguntas respecto a sus opiniones, actitudes, comportamiento y
otras caractersticas.
Realizacin de un estudio observacional
El investigador observa el comportamiento de inters directamente, por lo comn en su
entorno natural.
La importancia de obtener buenos datos: GIGO
GIGO: Entra Basura, sale basura. No importa el mtodo utilizado para obtener los datos, si un
estudio ha de ser til, si el desempeo debe controlarse apropiadamente o si el proceso de la
toma de decisiones debe ampliarse, los datos recabados deben ser vlidos: es decir, las
respuestas correctas deben valorarse de manera que se obtengan mediciones significativas.
Obtencin de datos mediante investigacin de encuesta
Tipos de datos
Existen bsicamente dos tipos de variables aleatorias que producen dos tipos de datos:
categricas y numricas. Las variables aleatorias categricas producen respuestas categricas,
mientras que las variables numricas producen respuestas numricas. Las variables numricas
pueden considerarse como discretas o continuas. Los datos discretos son respuestas numricas
que surgen de un proceso de conteo, mientras que los datos continuos son respuestas
numricas que surgen de un proceso de medicin.
La necesidad de definiciones operacionales. Una definicin operacional proporciona un
significado a un concepto o variable que puede comunicarse a otros individuos. Es algo que
tiene el mismo significado ayer, hoy y maana para todos los individuos.
Diseo del cuestionario
El objetivo de un cuestionario es permitirnos recabar informacin significativa que nos ayude
en el proceso de toma de decisiones.
Seleccin de temas amplios - Longitud del cuestionario
Los amplios temas de los cuestionarios deben enumerarse. Mientras ms largo sea el
cuestionario, menor ser el cociente de respuesta. Por tanto, se deben evaluar cuidadosamente
las preguntas. Las preguntas deben ser lo ms cortos posibles.
Modo de Respuesta
Existen tres modos mediante los cuales se realiza el trabajo de encuesta: la entrevista persona,
telefnica y por medio del correo. La personal es la que tiene una tasa de respuesta mayor, pero
es ms costosa.
Formulacin de preguntas
Cada pregunta debe presentarse claramente en el menor nmero de palabras y cada pregunta
debe considerarse esencial para la encuesta. Adems, deben ser libres de ambigedades.
Prueba del cuestionario
Una vez analizadas los pros y contras de cada pregunta se debe realizar una prueba piloto de
manera que puedan examinarse en cuanto a claridad y longitud.
Eleccin del tamao de muestra para la encuesta
Existen tres razones para extraer una muestra. Antes que todo, por lo general lleva demasiado
tiempo realizar un censo completo. En segundo lugar, es demasiado costoso hacer un censo
completo. Tercero, es demasiado molesto e ineficiente obtener un conteo completo de la
poblacin objeto
Seleccin de los sujetos respondientes: tipos de muestras
Existen bsicamente dos tipos de muestras: las muestra no probabilstica y la muestra de
probabilidad.
Una muestra de probabilidad es aquella en la que los sujetos de la muestra se eligen sobre la
base de probabilidades conocidas.
En una muestra aleatoria simple cada individuo o elemento tiene la misma oportunidad de
seleccin que cualquier otro, y la seleccin de un individuo o elemento particular no afecta la
probabilidad de que se elija cualquier otro.
Extraccin de la muestra aleatoria simple
La clave de la seleccin de muestras apropiada es obtener y mantener una lista actualizada de
todos los individuos o elementos de los cuales se extraer la muestra. Tal lista se conoce como
el marco de la poblacin. Este listado de poblacin servir como la poblacin objetivo, de tal
manera que si se extrajeran muchas muestrasde probabilidades diferentes de tal lista, en el
mejor de los casos cada muestra sera una representacin de la poblacin.
- Muestreo con o sin reemplazo de poblaciones finitas
Para seleccionar la muestra pueden usarse dos mtodos bsicos: con reemplazo o sin
reemplazo. Digamos que N representa la poblacin y n la muestra. Al extraer con reemplazo la
probabilidad de cualquier miembro de la poblacin de ser seleccionado en la primera
extraccin es 1/N. La probabilidad de ser seleccionado en otra extraccin sigue siendo 1/N
debido a que una vez registrado el dato, el individuo seguir formando parte de la poblacin.
Sin embargo, al muestrear poblaciones humanas generalmente se considera ms apropiado
tener una muestra de persona diferentes que permitir mediciones repetidas de la misma
persona. La probabilidad en este caso es 1/N en la primera extraccin. La probabilidad de que
cualquier individuo no seleccionado previamente sea seleccionado en la segunda extraccin es
1/N-1.
La encuesta de la muestra
El primer pasa para evaluar una encuesta es determinar si se bas en una muestra de
probabilidad o en una no probabilstico.
Aun cuando las encuestas emplean mtodos de muestreo de probabilidad aleatorios, estn
sujetas a errores potenciales. Existen cuatro tipo de errores de encuesta:
1 - Error de cobertura o sesgo de seleccin. Este error resulta de la exclusin de ciertos sujetos
del listado de poblacin, de tal manera que no tienen oportunidad de ser seleccionados en la
muestra. El error de cobertura provoca el sesgo de seleccin.
2- Error de no-respuesta o sesgo de no-respuesta. El error de no-respuesta resulta del fracaso
de recolectar datos sobre todos los sujetos de la muestra. Y el error de no-respuesta da como
resultado el sesgo de no-respuesta.
3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias de oportunidad de
muestra a muestra basndose en la probabilidad de los sujetos que estn siendo seleccionados
en las muestras particulares. El error de muestreo puede reducirse tomando tamaos de
muestra mayores, aunque esto incrementar el costo de aplicacin de la encuesta.
4- Error de Medicin. Este error se refiere a inexactitudes en las respuestas registradas que
ocurren debido a una mala formulacin de las preguntas, el efecto de un entrevistados sobre el
encuestado o el esfuerzo hecho por el encuestado.
Organizacin y Resumen de Datos
Organizacion, Resumen Y Presentacion De Datos Estadisticos
Conceptos que deben reforzarse
POBLACION: es el conjunto formado por todas las unidades elementales que proporcionarn
las mediciones de inters. Pueden ser personas, cosas, objetos abstractos.
CENSO: Cuando se estudia la totalidad de las unidades elementales que componen la
poblacin.
Desventaja: errores de observacin. Ej.: omisiones, duplicaciones, no-ubicacin (no medibles)
del encuestado, volumen de informacin
MUESTRA: se estudia una parte representativa de la poblacin
Desventaja: errores de observacin (no medibles) errores de estimacin (medible,
cuantificable)
LOS DATOS ESTADISTICOS SON VARIABLES, SU RESULTADO VARIA DE UNA MEDICION
A OTRA.
Debido a ello a los datos estadsticos los denominamos VARIABLES.
Segn se vio, las Variables se clasifican en:
Categricas Ordinales o Nominales Y Numricas Discretas o Contnuas.
Caso Sr. Jurez
Problema: " Aumento en el ndice de rotacin de cobranzas".
Poblacin: Todos los clientes que compran a crdito al seor Jurez en el local A o B.
Supuestos: - Dos Locales A y B.
Datos del ltimo mes.
Muestra Local A: 60 clientes; Local B: 78 clientes.
Hiptesis de Trabajo:
Deudores del local A necesitan menos tiempo para pagar.
Situacin econmica de los clientes peor nosotros > plazo de financiacin.
Locales poseen precios > competencia.
Mal sistema de cobros en cuenta corriente.
Para Cada hiptesis se debe tomar una variable a analizar.
Variable a Utilizar en nuestro Caso: " Cantidad de das transcurridos entre la confeccin de
la factura y el efectivo cobro de la misma.
Definiciones operacionales:
N= Tamao de la poblacin.
n= Tamao de la muestra.
Yi = Variable a analizar
El tamao de muestra es independiente del tamao de la poblacin.
Distribucin de frecuencia:
fi: frecuencia absoluta.
Fi: frecuencia absoluta acumulada.
hi: frecuencia relativa ( cociente entre frecuencia absoluta y la muestra/poblacin ).
Hi: frecuencia relativa acumulada.
El 21,7 % de los clientes del local A pagan el da 20. En el local minorista hay pocos que pagan
los primeros das y pocos los que pagan el ltimo da.
Para comparar se trabaja con frecuencias relativas (cuando los tamaos de muestra son
distintos).
23/03/01
Prctico
Ejercicio 2.35 - Pgina 49
n = 1425
Objetivo: " Medir el grado de satisfaccin de los clientes que compraron una videograbadora en
los ltimos 12 meses.
a. Poblacin: Todos los clientes que compraron una videograbadora en los ltimos 12
meses.
b. Preguntas cualitativas:
1. Qu le pareci el producto?
2. - Excelente.
- Muy Bueno.
- Bueno.
- Malo.
- Si.
- No.
3. Recomendara el Producto.
4. Comprara nuestra marca o producto.
Si.
No.
Preguntas Cuantitativas.
1. Cuantas veces us el servicio tcnico?
Ninguna.
Una.
Dos.
Ms de dos.
1. Diseo y funcionamiento. Califique de uno a diez
2. Cuntas marcas analiz antes de decidir por Xenith?
3. Cuntos productos Xenith posee Ud.?
Ejercicio 3.8 - Pagina 61
b) Diagrama de Tallo y Hoja SPSS lo hace en forma automtica.
Yi= Segundos que tarda un automvil de llegar de 0 a 60 Mph.
Autos Alemanes
Tallo Hoja
4 9
5 5 4 1
6 4 9 4 7 0 9
7 9 1 5
8 6 7 3 5 5 8 9
9

10 0 9
27/03/01
Construccin de Grficos
Nombrar los ejes.
Ttulo del grfico.
Fuente de datos.
Ejercicio 3.70 - Pagina 95
Yi fi hi Fi Hi

1,00 1 0,03 1 0,03
1,50 2 0,07 3 0,10
2,00 3 0,10 6 0,20
2,50 2 0,07 8 0,27
3,00 6 0,20 14 0,47
3,50 5 0,17 19 0,63
4,00 2 0,07 21 0,70
4,50 2 0,07 23 0,77
5,00 3 0,10 26 0,87
5,50 1 0,03 27 0,90
6,00 1 0,03 28 0,93
6,50 1 0,03 29 0,97
7,00 1 0,03 30 1,00

30 1,00

Yi = $ de cada manmetro.
fi = cantidad de veces que se repite la variable.
En este caso se supone que la variable es discreta.
Construccin de Intervalos
Intervalos sirve en especial para variables continuas
Ry = Y max - Y min = Recorrido = Amplitud = Rango
Ry = 7.5 - 1 = 6.5
Cantidad de intervalos 4
C= Amplitud del intervalo = Ry / Cantidad de intervalos = 6.5/4 = 1.625
C = Valor entero = 2
Ry* = c x cantidad de intervalos = 2 x 4 = 8
Yi-1 - Yi Yi fi hi
1 - 3 2 8 0.27
3 - 5 4 15 0.50
5 - 7 6 6 0.20
7 -9 8 1 0.03

30 1
Construccin del intervalo del Caso Jurez.
R = 38 - 14 = 24
Cantidad de Intervalos = 7
Amplitud = Ry / c = 3.43 = 4
Presentacin de datos numricos en tablas y diagramas
Una distribucin de frecuencia es una tabla de resumen en la que los datos se disponen en
agrupamientos o categoras convenientemente establecidas de clases ordenadas
numricamente.
En esta forma las caractersticas ms importantes de los datos se aproximan muy fcilmente,
compensando as el hecho de que cuando los datos se agrupan de ese modo, la informacin
inicial referente a las observaciones individuales de que antes se dispona se pierde a travs del
proceso de agrupamiento o condensacin.
Al construir la tabla de frecuencia-distribucin, debe ponerse atencin a:
1. Seleccionar el nmero apropiado de agrupamientos de clase para la tabla.
2. Obtener un intervalo o ancho de clase de cada agrupamiento de clase.
3. Establecer los lmites de cada agrupamiento de clase para evitar los traslapes.
Seleccin del Nmero de Clases
La distribucin de frecuencia debe tener al menos cinco agrupamiento de clase, pero no ms de
15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendr poca
informacin.
Obtencin de los intervalos de clase
Ancho del intervalo Rango
nmero de agrupamientos de clase deseado
La principal ventaja de usar una de estas tablas de resumen es que las principales
caractersticas de los datos se hacen evidentes inmediatamente para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber como se distribuyen
los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos
originales. El punto medio de la clase, sin embargo, es el valor usado para representar todos los
datos resumidos en un intervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los lmites de cada
clase y es representativo de los datos de esa clase.
Tabulacin de datos numricos: la distribucin de frecuencia relativa y distribucin de
porcentaje
La distribucin relativa de frecuencia se forma dividiendo las frecuencias de cada clase de
distribucin de frecuencia entre el nmero total de observaciones. Entonces puede formarse
una distribucin de porcentaje multiplicando cada frecuencia relativa o proporcin entre 100.
La distribucin de frecuencia relativa o la distribucin de porcentaje se vuelve esencial siempre
que una serie de datos se compara con otra seria de datos, especialmente si difiere el nmero
de observaciones en cada serie de datos.
Graficacin de datos numricos: el histograma y el polgono
Histogramas
Los histogramas son diagramas de barras verticales en los que se construyen barras
rectangulares en los lmites de cada clase. La variable aleatoria o fenmeno de inters se
despliega a lo largo del eje horizontal; el eje vertical representa el nmero, proporcin o
porcentaje de observaciones por intervalo de clase, dependiendo de si el histograma particular,
es un histograma de frecuencia, un histograma de frecuencia relativa o histograma de
porcentaje
Al comparar dos o ms series de datos, ni los diagramas de tallo y hoja ni los histogramas
pueden construirse en la misma grfica. Con respecto a estos ltimos, la sobreposicin de
barras verticales de uno en el otro ocasionara dificultades de interpretacin; en estos casos se
usan los polgonos.
Polgonos
El polgono de porcentaje se forma permitiendo que el punto medio de cada clase represente
los datos de esa clase y luego conectando la sucesin de puntos medios con sus respectivos
porcentajes de clase.
Distribuciones acumulativas y polgonos acumulativos
Una tabla de distribucin de porcentaje acumulativo se construye registrando primero los
lmites inferiores de cada clase a partir de la distribucin de porcentaje y luego insertando un
lmite extra al final.
Polgono de porcentaje acumulativo
Para construir un polgono de porcentaje acumulativo (tambin llamado ojiva), el fenmeno se
grafica en el eje horizontal, mientras que los porcentajes acumulativos se grafican en el eje
vertical.
Resumen y descripcin de los datos numricos
Propiedades de los datos numricos.
Las tres mejores propiedades que describe una serie numrica de datos son:
1. Tendencia central
2. Variacin
3. Forma
Si estas mediciones se calculan a partir de una muestra, se denominan estadsticas, si se
calculan a partir de los datos de una poblacin se denominan parmetros.
Mediciones de tendencia Central
La media aritmtica, es el promedio. Se calcula sumando todas las observaciones y luego
dividiendo el total entre el nmero de elementos involucrados.
La media acta como punto de equilibrio de tal forma que las observaciones menores
compensan a las observaciones que son mayores.
La media aritmtica se ve afectada en gran medida por valores extremos.
La mediana. Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la
mitad de las observaciones sern menores y la otra mitad sern mayores. La mediana no se
ve afectada por valores extremos. Para calcular la mediana, primero se deben poner los
datos en orden. Despus usamos la frmula del punto de posicionamiento.
El clculo del valor de la media se ve afectado por el nmero de observaciones, no por la
magnitud de cualquier extremo.
La moda. Es el valor de una serie de datos que aparece con ms frecuencia. La moda no se
ve afectada por la ocurrencia de cualquier valor extremo.
Cuartiles. Los cuartiles sonmediciones descriptivas que dividen los datos ordenados en
cuatro cuartos.
Mediciones de la Variacin
La variacin es la cantidad de dispersin o propagacin en los datos.
El rango: es la diferencia entre la mayor y la menor observacin en una serie de datos. El
rango mide la propagacin total en la serie de datos. La debilidad del rango es que no logra
tomar en cuenta la forma en que los datos se distribuyen realmente entre el mayor y el
menor valor. Sera impropio usar el rango como una medicin cuando uno de o ambos
componentes son observaciones extremas.
El rango intercuartil: es la diferencia entre el tercer y primer cuartil. No se ve influida por
valores extremos.
La varianza y la desviacin estndar: a diferencia de las mediciones anteriores la varianza y
la desviacin estndar toman en cuenta como se distribuyen las observaciones. La Varianza
de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones
de una serie de datos y la media. La desviacin estndar es simplemente la raz cuadrada de
la varianza. La varianza y la desviacin miden la dispersin promedio alrededor de la media,
es decir, como las observaciones mayores fluctan por encima de sta y como las
observaciones menores se distribuyen por debajo de sta.
El Coeficiente de Variacin: es una medida relativa de variacin. Se expresa como
porcentaje antes que en trminos de las unidades de los datos particulares. Mide la
dispersin en los datos relativa a la media.
El coeficiente de variacin es til al comparar la variabilidad de dos o ms series de datos que
se expresan en distintas unidades de medicin.
Forma
Para describir la forma slo necesitamos comparar la media y la mediana. Si estas dos
mediciones son iguales, por lo general podemos considerar que los datos son simtricos. Si la
media excede a la mediana, los datos pueden describirse de sesgo positivo o sesgadas a la
derecha. Si la media es excedida por la mediana, estos datos pueden llamarse de sesgo negativo
o sesgadas a la izquierda. El sesgo positivo surge cuando la media se incrementa en algunos
valores inusualmente altos, el sesgo negativo ocurre cuando la media se reduce en algunos
valores extremadamente bajos.
Clculo de mediciones descriptivas de resumen de una poblacin
Las mediciones de tendencia central para una poblacin se calculan igual que en la muestra
simplemente reemplazamos n por N.
El rango y el rango intercuartil para una poblacin de tamao N se obtienen como si fuera una
muestra reemplazando n por N. La varianza se calcula reemplazando el ( n - 1 ) del
denominador por N.
Uso de la Desviacin Estndar: La regla Emprica
En series de datos simtricos, donde la mediana y la media son iguales, las observaciones
tienden a distribuirse igualmente alrededor de estas mediciones de tendencia central. Cuando
el sesgado extremo no se presenta y tal agrupamiento se observa en una serie de datos,
podemos usar la denominada regla emprica para examinar la propiedad de variabilidad de
datos y obtener una mejor idea de lo que la desviacin estndar est midiendo.
La regla emprica establece que en la mayora de las series de datos encontraremos que
aproximadamente dos de cada tres observaciones (es decir, el 67%), estn contenidas en una
distancia de una desviacin estndar alrededor de la media y aproximadamente 90% a 95% de
las observaciones estn contenidas a una distancia de 2 desviaciones estndar alrededor de la
media.
Uso de la desviacin estndar: La regla de Bienaym Chebyshev
No importa como se distribuyen los datos. el porcentaje de las distribuciones estn contenidas
dentro de las dsitancias de k desviaciones estndar alrededor de la media debe ser al menos
1 - 1 / k2
Al menos 75% de las observaciones deben estar contenidas dentro de distancias de +/-2
desviaciones estndar alrededor de la media. Al menos 88,89% de las observaciones deben
estar contenidas dentro de una distancia de +/-3 desviaciones estndar alrededor de la media.
Al menos 93.75% de las observaciones deben estar contenidas dentro de distancias de +/-4
desviaciones estndar alrededor de la media.
Presentacin de datos categricos en tablas y diagramas
Graficacin de datos categricos: de barras, de pastel y de punto
Grfica de barras
En la grfica de barras, cada categora se describe mediante una barra, cuya longitud
representa la frecuencia o porcentaje de observaciones que caen en una categora. Para
construir una grfica de barras se hacen las siguientes sugerencias:
1. Las barras deben construirse horizontalmente.
2. Todas las barras deben tener el mismo ancho.
3. Los espacios entre las barras deben variar entre la mitad
4. del ancho de una barra hasta el ancho de una barra.
5. Las escalas y guas son auxiliares tiles en la lectura
6. de una grfica y deben incluirse. El punto cero u origen debe indicarse.
7. Los ejes deben etiquetarse.
Grfica de Pastel
Grfica de Puntos
Graficacin de datos categricos: el Diagrama de Pareto.
El diagrama de Pareto es un tipo especial de grfica de barras verticales en la que las respuestas
categrizadas se grafican en el orden de rango descendiente de sus frecuencias y se combinan
con un polgono acumulativo en la misma escala. El principio bsico detrs de este dispositivo
grfico es su capacidad de distinguir los "pocos vitales" de los "muchos triviales".
Tabulacin de datos categricos: Tabla de contingencias y supertablas.
Las tablas de contingencia se usan para examinar las respuestas a dos variables categricas
simultneamente.
Supertablas. Una supertabla es esencialmente una coleccin de tablas de contingencia, cada
una con las mismas variables y categoras de columna. Sin embargo, se incluyen tantas
variables de fila como se deseen para comparaciones frente a la variable de columna.
Tipos de Grficos
Medidas Estadsticas.
Medidas Estadsticas descriptivas.
Variables Numricas:
Medidas de posicin.
Media.
Mediana.
Moda.
Cuartiles.
Medidas de Variacin.
Rango.
Rango Medio.
Varianza.
Desvo Estndar.
Coeficiente de variacin.
Probabilidad Bsica
La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. La
probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y uno
exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir (es decir, el evento
nulo), tiene una probabilidad de cero, mientras que un evento que seguramente ocurrir (es
decir, el evento cierto), tiene una probabilidad de uno. Ejemplo:
1. La posibilidad de sacar una carta con figura negra de una baraja.
2. La posibilidad de que un individuo seleccionado aleatoriamente de una encuesta este de
acuerdo con X tema.
3. La posibilidad que tenga xito un nuevo producto en el mercado.
Cada uno de los ejemplos anteriores se refiere a uno de los tres planteamientos del tema de la
probabilidad. El primero a menudo se denominacom el planteamiento de la probabilidad
clsica a priori. Aqu la probabilidad de xito se basa en el conocimiento nterior del proceso
involucrado. En el caso ms simple, cuando cada resultado es igualmente posible. Esta
posibilidad puede definirse de la siguiente manera:
En el segundo ejemplo; llamado probabilidad clsica emprica, aunque la probabilidad se sigue
definiendo como la proporcin entre el nmero de resultados favorables y el nmero total de
resultados, estos resultados se basan en datos observados, no en el conocimiento anterior a un
proceso.
El tercer planteamiento de probabilidad se denomina el enfoque de probabilidad subjetiva.
Mientras que en los dos anteriores enfoques la probabilidad de un evento favorable se
calculaba objetivamente, ya fuera de un conocimiento previo o de datos reales, la probabilidad
subjetiva se refiere a la posibilidad de ocurrencia asignada a un evento por un individuo
particular. La probabilidad subjetiva es especialmetne til para la toma de decisiones en
aquellas situaciones en que la probabilidad de diversos eventos no puede determinarse
empricamente.
Conceptos de probabilidad bsica
Espacios de muestra y eventos
Los elementos bsicos de la teora de probabilidades son los resultados del proceso o fenmeno
bajo estudio. Cada tipo posible de ocurrencia se denomina un evento.
Un evento simple puede puede describirse mediante una caracterstica sencilla. la compilacin
de todos los eventos posibles se llama el espacio muestral.
La manera en que se subdivide el espacioi muestral depende de los tipos de probabilidades que
se han de determinar. Tomando esto en cuenta, resulta de inters definir tanto el complemento
de un evento como un evento conjunto de la siguiente manera:
La complemento del evento A incluye todos los elementos que no son parte del evento A. Esta
dado por el smbolo A.
Un evento conjunto es un evento que tiene dos o ms caractersticas.
Tablas de Contingencias y diagramas de Venn
Existen varias formas en las que puede verse un espacio muestral particular. El primer mtodo
implica asignar los eventos apropiados a una tabla de clasificaciones cruzadas. Tal tabla
tambin se denomina tabla de contingencia.

Roja Negro Totales
As 2 2 4
No As 24 24 48
Totales 26 26 52
La segunda forma de presentar el espacio muestral es usando un diagrama de Venn. Este
diagrama se representa grficamente los diversos eventos como "uniones" e "intersecciones" de
crculos.
El rea contenida dentro del crculo A y de crculo B (rea central) es la interseccin de de Ay B
(y se escribe A B) , puesto que esta rea es parte de A y tambien parte de B. El rea total de
los dos crculos es la unin de A y B (y se escribe A B ) y contiene todos los resultados que son
parte del evento A, parte del evento B o parte de ambos A y B. El rea fuera del diagrama fuera
de A B contiene aquelloos resultados que no sonparte de A ni son parte de B.
Probabilidad ( marginal ) simple
La regla mas evidente para las probabilidades es que deben variar en valor de 0 a 1. Un evento
imposible tiene una probabilidad cero de ocurrir, y un evento cierto tiene una probabilidad uno
de ocurrir. La probabilidad simple se refiere a la probabilidad de ocurrencia de un evento
simple.
Ejemplo:
la probabilidad de seleccionar una carta negra;
la probabilidad de seleccionar un As
La probabilidad simple se denomina probabilidad marginal puesto que el nmero total de
xitos puede obtenerse del mrgen apropiado de la table de contingencias.
Probabilidad Conjunta
La probabilidad conjunta se refiere a fenmenos que contienen dos o mas eventos, como la
probabilidad de un as negro, una reina roja o un empleado que este satisfecho con el trabajo y
haya progresado dentro de la organizacin.
P (A)= P ( A y B1 ) + P ( A y B2 ) + .....+ P ( A y Bk )
donde B1, B2, ... Bk son eventos mutuamente excluyentes y colectivamente exhaustivos.
Dos eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir al mismo
tiempo.
Dos eventos son colectivamente exhaustivos si uno de los eventos debe ocurrir.
Por ejemplo, ser hombre y ser mujer son eventos mutuamente excluyentes y colectivamente
exhaustivos. Nadie es ambos ( son mutuamente excluyentes ) y todos son uno u otro ( son
colectivamente exhaustivos ).
Regla de la adicin
La regla de la adicin se usa para encontrar la probabilidad del evento A o B. Esta regla para
obtener la probabilidad de la unin de A y B considera la ocurrencia del evento A o del evento B
o de ambos, A y B.
El clculo de P ( A B ), la probabilidad del evento A o B, puede expresarse en la siguiente
regla de la adicin general:
P ( A B ) = P ( A o B ) = P ( A ) + P ( B ) P ( A y B )
Eventos mutuamente excluyentes
En ciertas circunstancias, sin embargo, la probabilidad conjunta no necesita restarse porque es
igual a cero. Tales circunstancias cuando no existen resultados para un evento particular. Por
ejemplo, suponga que deseamos saber la probabilidad de escoger un corazon o una espada si
estuviramos seleccionando slo una carta de una baraja estndar de 52 cartas de juego.
Usando la regla de la adicin, tenemos lo siguiente:
P ( corazn o espada ) = P ( corazn ) + P ( espada ) P ( corazn y espada )
P = 13/52 + 13/52 0/52 = 26/52
La interseccin en este caso no existe ( llamado el conjunto nulo ) porque no contiene
resultados, puesto que una carta no puede ser corazn y espada simultneamente.
Siempre que la probabilidad conjunta no contenga ningn resultado, los eventos involucrados
se consideran mutuamente excluyentes. Asi la regla general para eventos mutuamente
excluyentes se reduce a:
P ( A o B ) = P ( A ) + P ( B )
Eventos colectivamente exhaustivos
Consideremos la probabilidad de seleccionar una carta negra o rojo. Puesto que son
mutuamente excluyentes al usar la ecuacin: 26/52 + 26/52 = 1
La probabilidad de rojo o negro suma uno. Dado que uno de los eventos debe ocurrir se
consideran mutuamente excluyentes.
Probabilidad Condicional.
Cuando estamos calculando la probabilidad de un evento particular A, dada informacin sobre
la ocurrencia de otro evento B, esta probabilidad se denomina probabilidad condicional, P ( A \
B ). La probabilidad condicional P ( A \ B ) puede definirse de la siguiente manera:
P ( A \ B ) = P ( A y B )
P ( B )
Independencia estadstica Se dice que dos eventos independientes si el conocimiento previo
de la probabilidad de ocurrencia de uno de ellos no afecta la probabilidad del otro. Puede
definirse de la siguiente manera:
P ( A \ B ) = P ( A )
Regla de multiplicacin
La frmula para la probabilidad condicional puede manipularse algebraicamente de forma tal
que la probabilidad conjunta P ( A y B ) puede determinarse a partir de la probabilidad
condicional de un evento.
La regla de multiplicacin para eventos independientes puede expresarse de la siguiente
manera sustituyendo P ( A ) por P ( A \ B ):
P ( A y B ) = P ( A ) * P ( B )
Si esta regla se cumple para dos eventos, A y B entonces A y B son estadsticamente
independientes. Por tanto, hay dos formas de determinar la independencia estadstica:.
1. Los eventos A y B son estadsiticamente independientes si y slo si P ( A \ B )=P (A)
2. Los eventos A y B son estadsticamente independientes si y slo si P ( A y B ) = P ( A ) * P
( B ).
Teorema de Bayes
La probabilidad condicional toma en cuenta informacin respecto a la ocurrencia de un evento
para encontrar la probabilidad de otro evento. Este concepto puede ampliarse para revisar
probabilidaddes basadas en nueva informacin y, as determinar la probabilidad que un efecto
particular se deba a una causa especfica. El procedimiento para revisar estas probabilidades se
conoce como teorema de Bayes.
El teorema de Bayes puede definirse a partir de las definiciones de probabilidad condicional y
probabilidad marginal, asi el teorema de Bayes es:
P ( Bi \ A ) = P ( A \ Bi ) P ( Bi )
P ( A \ B1 ) P ( B1 ) + P ( A \ B2 ) P ( B2 )
Algunas distribuciones importantes de probabilidad discreta
Una distribucin de probabilidad para una variable aleatoria discreta es un listado
mutuamente excluyente de todos los resultadosposibles para esa variable aleatoria, tal que una
probabilidad particular de ocurrencia est asociada con cada resultado.
Esperanza Matemtica
La media de una distribucin de probabilidad es el valor esperado de su variable aleatoria.
El valor esperado de una variable aleatoria discreta puede considerarse como su promedio
pesadoo sobre todos los resultados posibles, siendo los pesos la probabilidad asociada con cada
uno de los resultados.
Esta medicin de resumen puede puede obtenerse multiplicando cada resultado posible Xi, por
su probabilidad correspondiente P (Xi) y luego sumando los productos resultantes. Por tanto,
el valor esperado de la variable aleatoria discreta X, simbolizado como E (X), puede expresarse
de la siguiente manera:
E(X)= Xi * P ( Xi)
Varianza y desviacin estndar de una variable aleatoria discreta
La varianza de una variable aleatoria discreta puede definirse como el promedio pesado de las
diferencias cuadradas entre cada resultado posible y su media, siendo los pesos las
probabilidades de cada uno de los resultados respectivos.
Esta medicin de resumen puede obtenerse multiplicando cada diferencia cuadrada posible (
Xi )2 por su probabilidad correspondiente P (Xi) y luego sumando los productos restantes.
Por lo tanto la varianza de la variable aleatoria discreta X puede expresarse de la siguiente
manera:
( Xi )2 * P (Xi)
Funciones de distribucin de probabilidad discreta
La distribucin de probabilidad para una variable aleatoria discreta puede ser:
1. Un listado terico de resultados y probabilidades que pueden obtenerse de un modelo
matemtico que represente algn fenmeno de inters.
2. Un listado emprico de resultados y sus frecuencias relativas observadas.
3. Un listado subjetivo de resultados asociados con sus probabilidades subjetivas que
representan el grado de conviccin del tomador de decisiones respecto a la probabilidad
de los resultados posibles.
Un modelo se considera una representacin en miniatura de algn fenmeno subyacente. En
particular, un modelo matemtico es una expresin matemtica que representa cierto
fenmeno subyacente. Para variables aleatorias discretas, esta expresin matemtica se conoce
como funcin de distribucin de probabilidad.
La caracterstica escencial de la distribucin uniforme es que es igualmente posible que ocurran
todos los resultados de la variable aleatoria.
Distribucin Binomial
La distribucin binomial es una distribucin de probabilidad discreta que es extremadamente
til para describir muchos fenmenos.
La distribucin binomial posee cuatro propiedades esenciales:
1. Las observaciones posibles pueden obtenerse mediante dos mtodos de muestreo
distintos. Cada observacin puede considerarse como seleccionada de una poblacin
infinita sin reemplazo o de una poblacin finita con reemplazo.
2. Cada observacin puede clasificarse en dos categoras mutuamente excluyentes y
colectivamente exhaustivas, usualmente denominadas xito y fracaso.
3. La probabilidad de que una observacin se clasifique como xito, p, es constante de
observacin a observacin.
4. El resultado de cualquier observacin es independiente del resultado de cualquier
observacin.
Modelo matemtico
P( X= x \ n, p ) = n ! px ( 1 p ) n-x
X ! ( n x ) !
La primera parte de la frmula nos dice cuntas secuencias de arreglos de los x xitos de n
observaciones son posibles. La segunda parte nos dice la probabilidad de obtener exactamente
x xitos de n observaciones en una secuencia particular.
Caractersticas de la distribucin binomial
Forma. Siempre que p= 0.5 la distribucin binomial ser simtrica sin importar que tan
grande o pequeo sea el valor de n. Sin embargo, cuando p 0.5 la distribucin ser
sesgada. Mientras ms cercana este p de 0.5 y mayor sea el nmero de observaciones, n,
menos sesgada ser la distribucin. Con una p pequea la distribucin estara sesgada a la
derecha. Para p muy grandes, la distribucin sera sesgada a la izquierda.
La media. La media de la distribucin binomial puede obtenerse fcilmente como el
producto de sus parmetros, n y p.
La desviacin estndar. La desviacin estndar se
calcula usando la siguiente frmula:

Distribucin de Poisson.
La distribucin de Poisson es otra funcin de distribucin de probabilidad que tiene muchas
aplicaciones prcticas importantres. Un proceso Poisson no slo representa numerosos
fenmenos discretos, sino que el modelo Poisson tambin se usa para proporcionar
aproximaciones a la distribucin binomial.
Se dice que un proceso de Poisson existe si podemos observar eventos discretos en un rea de
oportunidad, un intervalo continuo, de tal manera que si acotamos el rea de oportunidad o
intervalo de manera suficiente:
1. La probabilidad de observar exactamente un xito en el intervalo es estable.
2. La probabilidad de observar exactamente ms de un xito en el intervalo es cero.
3. La ocurrencia de un xito en cualquier intervalo es estadsticamente independiente de
aquella en cualquier otro intervalo.
Caractersticas
Forma. Cada vez que se especifica el parmetro , puede generarse una distribucinde
probabilidad de Poisson espacfica. Una distribucin de Poisson estar sesgada a la derecha
cuando es pequea, y se aproximar a la simetra al crecer.
La media y la desviacin estndar. Una propiedad de esta distribucin es que la media y la
varianza son iguales al parmetro .
Uso de la distribucin de Poisson para aproximar la distribucin binomial
Para aquellas situaciones en las que n es grande ( mayor o igual a 20 ) y p es muy pequea (
menor a 0.05 , la distribucin de Poisson puede usarse para aproximar la distribucin
binomial.
La variable aleatoria de Poisson puede variar tericamente de 0 a . Sin emabrgo, cuando se
usa como una aproximacin a la distribucin binomial, la variable aleatoria de Poisson, el
nmero de xitos de n observaciones, claramente no puede exceder el tamao de la muestra n.
Caractersticas
= = n * p
La distribucin Normal
Modelos matemticos de variables aleatorias continuas:. La funcin de densidad de
probabilidad.
La probabilidad exacta de un valor particular de una distribucin continua es cero. A fin de
eliminar la necesidad de realizar laboriosos clculos matemticos se ha desarrolladola
distribucin gaussiana o normal.
La Distribucin Normal.
Importancia de la distribucin Normal.
La distribucin normal es de vital importancia en estadstica por tres razones principales:
1. Numerosos fenmenos continuos parecen seguirla o pueden aproximarse mediante sta.
2. Podemos usarla para aproximar diversas distribuciones de probabilidad discreta y evitar
as pesados clculos.
3. Proporciona la base de la inferencia estadstica clsica debido a su relacin con el teorema
del lmite central.
Propiedades de la distribucin normal
1. Tiene forma de campana y es simtrica en apariencia.
2. Sus mediciones de tendencia central (media, mediana, moda alcance medio y eje medio)
son todas idnticas.l
3. Su "dispersin media" es igual a 1.33 desviaciones estndar. Es decir, el alcance
intercuartil est contenido dentro de un intervalo de dos tercios de una desviacin
estndar por debajo de la media a dos tercios de una desviacin estndar por encima de la
media.
4. Su variable aleatoria asociada tiene un alcance infinito
El modelo matemtico
Para la distribucinnormal, el modelo usado para obtener las probabilidades deseadas es:

Examinemos los componentes de la funcin: puesto que e y son constantes matemticas, las
probabilidades de la variable aleatoria X dependen slo de dos parmetros de la distribucin
normal, la media de la poblacin y de la desviacin estndar de la poblacin. Cada vez que
especificamos una combinacin particular se generar una distribucin de probabilidad
diferente.
Estandarizacin de la distribucin normal
Afortunadamente, al estandarizar los datos, solo necesitamos una frmula:
Al usar la frmula de transformacin cualquier variable aleatoria normal X
se convierte en una variable aleatoria normal estandarizada Z. Mientras los datos originales
para la variable aleatoria X tenan una media y una desviacin estandar, la variable aleatoria
estandarizada Z siempre tendr una media = 0 y una desviacin = 1.
Uso de las tablas de distribucin de probabilidad normal
La tabla de normal representa las probabilidades o reas bajo la curva normal calculadas desde
la media hasta los valores particulares de inters X. Slo se enumeran en la tabla entradas
positivas de Z, puesto que para una distribucin simtrica de este tipo con una media de cero,
el rea que va desde la media hasta +Z debe ser idntica al rea que va desde la media hasta Z.
Al usar la tabla de normal se puede observar que todos los valores de Z deben registrarse
primero con hasta dos lugares decimales.
Encontrar los valores correspondientes a probabilidades conocidas.
Para encontrar un valor particular asociado con una probabilidad conocida,debemos adoptar
los siguientes pasos:
1. Trazar la curva normal y luego colocar los valores para las medias en las escalas X y Z
respectivas.
2. Dividir la mitad apropiada de la curva normal en dos partes: la porcin de la X deseada a
la media y la porcin de la X deseada al extremo.
3. Sombrear el rea de inters.
4. Usando la tabla de normal determinar el valor Z apropiado correspondiente al rea que
est bajo la curva normal desde la X deseada hasta la media.
5. Usando la ecuacin que se presenta a continuacin encontrar X.

Aproximacin de la distribucin binomial
Mientras ms cerca est p de 0,50 y mientras ms grande sea el nmero de observaciones de la
muestra n, ms simtrica se vuelve la distribucin. Siempre que el tamo de muestra sea
grande, puede usarse la distribucin normal para aproximar las probabilidades exactas de xito
que de otra manera se tendran que haber obtenido mediante laboriosos clculos.
Como regla general, esta aproximacin normal puede usars siempre que n * p y n * ( 1- p ) sean
al menos 5. Entonces la nueva Z sera la que se presenta a continuacin:

Aproximacin de la distribucin de Poisson
La distribucin normal tambin puede usarse para aproximar el modelo de poisson siempre
que el parmetro Lambda sea igual o mayor que cinco. Entonces la formula de Z ser la
siguiente:

Distribuciones de muestreo
Con el fin de poder usar la estadstica de muestra para estimar el parmetro de poblacin,
deberamos examinar cada muestra posible que pudiera ocurrir. Si esta seleccin de todas las
muestras posibles realmente se tuviera que hacer, la distribucin de todos los resultados se
denominara distribucin de muestreo. El proceso de generalizar estos resultados de muestra
para la poblacin se refiere como una inferencia estadstica.
Distribucin de muestreo de la media
Propiedades de la media aritmtica
Entre varias propiedades matemticas importantes de la media aritmtica para una
distribucin normal estn:
1. Imparcialidad
2. Eficiencia
3. Consistencia.
La imparcialidad, implica el hecho de que el promedio de todas las medias de muestras
posibles ser igual a la media de la poblacin. Tomemos como ejemplo una poblacin de N=4
con tamaos de muestra de 2. Si seleccionamos dos muestras con reemplazo, podramos
obtener 16 muestras posibles. El promedio de cada una de las muestras es igual a la media de la
poblacin. Por lo tanto hemos demostrado que la media aritmtica de muestra es un estimador
imparcial de la media de la poblacin. Esto nos dice que an cuando no sepamos qu tan cerca
est el promedio de cualquier muestra particular seleccionada a la media de la poblacin, al
menos estamos seguros que el promedio de todas las medias de muestra que se podran haber
seleccionado ser igual a la media de la poblacin.
La eficiencia, se refiere a la precisin de la muestra estadstica como un estimador del
parmetro de poblacin. La media de muestra se acercar ms estable que otras mediciones de
tendencia central. La media de muestra se acercar ms a la media de la poblacin que
cualquier otro estimador.
La consistencia, se refiere al efecto del tamao de muestra, sobre la utilidad de un estimador.
Al incrementarse el tamao de muestra, la variacin de la media de muestra de la media de la
poblacin se hace ms pequea, de manera que la media aritmtica de muestra se vuelve una
mejor estimacin de la media de la poblacin.
Error estndar de la media
El hecho de que las medias de muestra son menos variables que los datos de poblacin se
desprende directamente de la ley de los grandes nmeros. Una media de muestra particular
promedia conjuntamente todos los valores de la muestra. Una poblacin puede consistir en
resultados individuales que pueden tener un amplio radio de valores, de extremadamente
pequeos a extremadamente grandes. Sin embargo, si un valor extremo cae en la muestra,
aunque tendr un efecto en la media, el efecto se reducir pues se promediar con todos los
dems valores de la muestra. Adems, al incrementarse el tamao de la muestra, el efecto de
un valor extremo se hace cada vez menor, puesto que se est promediando con ms
observaciones. Al muestrearse con reemplazo, el error estndar de la media es igual a la
desviacin estndar de la poblacin dividida entre la raz cuadrada del tamao de muestra.

Muestreo de poblaciones normales
Puede demostrarse que si muestreamos con reemplazo de una poblacin con distribucin
normal, la distribucin de muestreo de la media tambin tendr una distribucin normal para
cualquier tamao de muestra y tendr una desviacin estndar como la que se mostr ms
arriba. Al incrementarse el tamao de muestra el error estndar de la media disminuye, de
forma tal que una mayor proporcin de medias de muestra estn ms cercanas a la media de la
poblacin.

Muestro de poblaciones no normales
En muchos casos no sabremos si la poblacin se distribuye normalmente. Por lo tanto,
necesitamos examinar la distribucin de muestreo de la media para poblaciones que no estn
normalmente distribuidas.
Teorema del lmite central. Al hacerse lo bastante grande el tamao de muestra, la distribucin
de muestreo de la media puede aproximarse mediante la distribucin normal. Esto es cierto no
importando la forma de la distribucin de los valores individuales de la poblacin. Qu
tamao de muestra? Una gran parte de las investigaciones demuestran que una muestra
adecuada de por la menos 30, hace que la distribucin de muestreo se aproxime a la normal.
Para la mayora de las distribuciones de poblacin, sin importar la forma, la distribucin de
muestreo de la media tendr una distribucin aproximadamente normal, si se seleccionan
muestras de al menos 30 observaciones.
Si la distribucin de la poblacin es lo bastante simtrica, la distribucin de muestreo de la
media ser aproximadamente normal si se seleccionan muestras de al menos 15
observaciones.
Si la poblacin se distribuye normalmente, la distribucin de muestreo de la media se
distribuir normalmente sin importar el tamao de la muestra.
Distribucin de muestreo de la proporcin
Cuando trabajamos con variables categricas cada caracterstica puede clasificarse con 1 o 0
para representar la presencia o ausencia de la caracterstica. Al tratar con datos categricos
puede definirse como:

La proporcin tiene la propiedad especial de estar entre 0 y 1. El
error estndar de la proporcin es:
La distribucin de muestreo de la proporcin sigue una distribucin binomial. Sin embargo,
cuando n*p y n*(1-p) son cada uno al menos 5 puede usarse la distribucin normal.
Muestreo de poblaciones finitas
En casi todas las investigaciones el muestreo es conducido sin
reemplazo, por esto debe usarse un factor de correccin de poblacin finita (fpc) en la
definicin tanto del error estndar de la media como del error estndar de la proporcin. El
factor de correccin puede expresarse como:
Estimacin
Introduccin
La inferencia estadstica es el proceso que consiste en utilizar los resultados de una muestra
para llegar a conclusiones acerca de las caractersticas de una poblacin.
Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo. Una
estimacin puntual consiste en una sola estadstica de muestra que se utiliza para estimar el
valor verdadero de un parmetro de poblacin. Puesto que la estadstica de prueba vara de una
muestra a otra necesitamos considerar este hecho con el fin de proporcionar una estimacin
ms significativa y caracterstica de la poblacin. Para lograr esto, debemos desarrollar una
estimacin de intervalo de la media de poblacin verdadera, tomando en consideracin la
distribucin de muestreo de la media. El intervalo que construimos tendr una confianza o
probabilidad especfica de estimar correctamente el valor verdadero del parmetro de
poblacin.
Estimacin de intervalo de confianza de la media (desvo de la poblacin conocido):
En la inferencia estadstica debemos tomar los resultados de una sola muestra y llegar a
conclusiones acerca de la poblacin. En la prctica, la media de la poblacin es la cantidad
desconocida que se va a determinar. Para algunas muestras la estimacin de intervalo de la
media de la poblacin ser correcta y para otras no. Tenemos que recordar que para el clculo
del intervalo trabajamos con una estimacin de intervalo de confianza de 95, por ejemplo, esto
puede interpretarse como si se tomaran todas las muestras posibles del mismo tamao, n, 95%
de ellas incluiran la media de poblacin verdadera en alguna parte del intervalo alrededor de
sus medias de muestra, y solamente 5% de ellas no estaran incluidas. En general el nivel de
confianza se simboliza como (1- ) x 100%, en donde es la porcin que se encuentra en los
extremos de la distribucin que est fuera del intervalo de confianza. Por consiguiente para
obtener la estimacin del intervalo tenemos:

Z es el valor correspondiente a un rea de (1- )/2 desde el centro de una distribucin normal
estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce como el
valor crtico.
Cualquier aumento en el nivel de confianza se logra ampliando simultneamente el intervalo de
confianza obtenido (hacindolo menos preciso y menos til).
Estimacin de intervalo de confianza de la media (desvo desconocido)
Del mismo modo en que la media de la poblacin se desconoce, es probable que la desviacin
estndar real de la poblacin tampoco sea conocida. Por lo tanto, necesitamos obtener una
estimacin de intervalo de confianza utilizando las estadsticas de muestra "X" y "S". Para ello,
utilizamos la distribucin t-student.
De este modo, el intervalo de confianza se establecer a partir de la siguiente frmula:
Estimado del intervalo de confianza de la porcin
Podemos establecer la siguiente estimacin de intervalo de confianza
(1-) para la porcin de la poblacin:

Determinacin del tamao de muestra para la media:
El error de muestreo "e" se puede definir como:

Por consiguiente para determinar el tamao de la muestra, deben conocerse tres factores:
1. El nivel de confianza deseado.
2. EL error de muestreo permitido.
3. La desviacin estndar.
Determinacin del tamao de muestra para una porcin:

Al determinar el tamao de muestra para estimar una porcin se deben definir tres incgnitas:
1. El nivel de confianza.
2. El error de muestreo permitido.
3. La porcin verdadera de xitos.
Estimacin y determinacin del tamao de muestra para poblaciones finitas.
Estimacin de la media

Estimacin de la porcin

Determinacin del tamao de muestra

11. Hiptesis nula y alternativa
La prueba de hiptesis empieza con algo de teora, afirmacin o negacin con respecto a un
parmetro particular de una poblacin. La hiptesis de que el parmetro de la poblacin es
igual a la especificacin de la compaa se conoce como hiptesis nula. Una hiptesis nula es
siempre una de status quo o de no diferencia. Se simboliza con el smbolo Ho.
Siempre que especificamos una hiptesis nula, tambin debemos especificar una hiptesis
alternativa, o una que debe ser verdadera si se encuentra que la hiptesis nula es falsa. La
hiptesis alternativa se simboliza H1. La hiptesis alternativa representa la conclusin a la que
se llegara si hubiera suficiente evidencia de la informacin de la muestra para decidir que es
improbable que la hiptesis nula sea verdadera, y por tanto rechazarla. El hecho de no rechazar
la hiptesis nula no es una prueba de que sta sea verdadera. Nunca podemos probar que tal
hiptesis sea correcta porque estamos basando nuestra decisin nicamente en la informacin
de la muestra, no en la poblacin entera.
Resumen:
La hiptesis nula se refiere siempre a un valor especificado del parmetro de poblacin, no a
una estadstica de muestra.
El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto al
valor especificado del parmetro.
El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con
respecto al valor especificado del parmetro.
Regiones de rechazo y de no rechazo
La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de
rechazo (conocida como regin crtica) y una regin de no rechazo. Si la estadstica de prueba
cae dentro de la regin de no rechazo, no se puede rechazar la hiptesis nula.
La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de
prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado,
estos valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico
separa la regin de no rechazo de la de rechazo.
Riesgos en la toma de decisiones al utilizar la metodologa de prueba de hiptesis.
Se pueden presentar dos tipos diferentes de errores:
Un error tipo I se presenta si la hiptesis nula es rechazada cuando de hecho es verdadera y
deba ser aceptada.
Un error tipo II se presenta si la hiptesis nula es aceptada cuando de hecho es falsa y deba
ser rechazada.
Nivel de Significacin. La probabilidad de cometer un error tipo I denotada con la letra griega
alfa, se conoce como nivel de significacin de la prueba estadstica. Est bajo el control directo
del individuo que lleva a cabo la prueba. Ya que se ha especificado el valor de alfa, se conoce el
tamao de la regin de rechazo, puesto que alfa es la probabilidad de un rechazo de la hiptesis
nula.
Coeficiente de confianza. EL complemento ( 1-a ) de la probabilidad de cometer un error de
tipo I se conoce como coeficiente de confianza.
El coeficiente de confianza es la probabilidad de que la hiptesis nula no sea rechazada cuando
de hecho es verdadera y debera ser aceptada.
Riesgo b . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo del
consumidor. A diferencia del error tipo I, en el cual las pruebas estadsticas nos permiten
controlar nuestra eleccin de a , la probabilidad de cometer un error del tipo II depende de la
diferencia entre los valores supuesto y real del parmetro de poblacin. Como es ms fcil
encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el
correspondiente parmetro de poblacin es grande, b la probabilidad de cometer un error del
tipo II, probablemente sea pequea.
Potencia de una prueba. El complemento (1-b ) de la probabilidad de cometer un error del tipo
II se conoce como potencia de una prueba estadstica.
La potencia de una prueba es a probabilidad de rechazar la hiptesis nula cuando de hecho
esta es falsa y debera ser rechazada.
Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un
estudio, consiste en aumentar el tamao de la muestra. Tamaos ms grandes de muestra, nos
permitirn detectar diferencias incluso muy pequeas entre las estadsticas de muestra y los
parmetros de la poblacin. Cuando se disminuye a , b aumentar de modo que una reduccin
en el riesgo de cometer un error de tipo I tendr como resultado un aumento en el riesgo de
cometer un error tipo II.
Prueba de hiptesis Z para la media (desvo de la poblacin conocido)
El estadstico de prueba a utilizar es:

La Potencia de una prueba
representa la probabilidad de que la hiptesis nula no sea rechazada cuando de hecho es falsa
y debera rechazrsele. La potencia de prueba 1- representa la sensibilidad de la prueba
estadstica para detectar cambios que se presentan al medir la probabilidad de rechazar la
hiptesis nula cuando de hecho es falsa y debera ser rechazada. La potencia de prueba
estadstica depende de qu tan diferente en realidad es la media verdadera de la poblacin del
valor supuesto.
Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera utilizar
siempre que sea adecuado especificar la direccin de la hiptesis alternativa.
Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error
tipo II tienen una relacin inversa y esta ltima es el complemento de la potencia de prueba (1-
), entonces y la potencia de la prueba varan en proporcin directa. Un aumento en el valor
del nivel de significacin escogido, tendra como resultado un aumento en la potencia y una
disminucin en tendra como resultado una disminucin en la potencia.
Un aumento en el tamao de la muestra escogida tendra como resultado un aumento en la
potencia de la prueba, una disminucin en el tamao de la muestra seleccionada tendra como
resultado una disminucin en la potencia.
Pruebas de una muestra con datos numricos
Eleccin del procedimiento de prueba apropiada
Procedimientos paramtricos
Todos los procedimientos paramtricos tienen tres caractersticas distintivas: Los
procedimientos de prueba paramtricos pueden definirse como aquellos 1)que requieren que el
nivel de medicin obtenido con los datos recolectados est en forma de una escala de intervalo
o de una escala de cociente; 2)implican la prueba de hiptesis de valores de parmetros
especificados 3) y por ltimo requieren un conjunto limitante de suposiciones.
Procedimientos sin distribucin y no paramtricos
Los procedimientos de prueba sin distribucin pueden definirse ampliamente como 1) aquellos
cuya estadstica de prueba no depende de la forma de la distribucin de la poblacin
subyacente de la cual se tom la muestra de datos o como 2) aquellos para los cuales los datos
no tienen fuerza suficiente para garantizar operaciones aritmticas significativas.
Los procedimientos no paramtricos pueden definirse como aquellos que no tienen que ver con
los parmetros de una poblacin.
Prueba t de hiptesis para la media (2 desconocida)
En ocasiones se desconoce la desviacin estndar de la poblacin. Sin embargo,
se la puede estimar con el clculo de S, la desviacin estndar de la muestra. Recordemos de
muestreo de la media seguir una distribucin t con n-1 grado de libertad.
Aproximacin del valor p
Suposiciones de la prueba t de una muestra
La prueba t est considerada como un procedimiento paramtrico clsico. Supuestos: los datos
numricos obtenidos son tomados de manera independiente y representan una muestra
aleatoria de la poblacin que est distribuida normalmente.
Prueba de hiptesis 2 para la varianza (o desviacin estndar)
Al intentar llegar a conclusiones con respecto a la variabilidad de la poblacin, primero
debemos determinar que estadstica de prueba puede utilizarse para representar la distribucin
de la variabilidad de los datos de la muestra. Si la variable se supone que est distribuida
normalmente, entonces la estadstica de prueba para probar si la varianza de la poblacin es
igual o no a un valor especificado es:
Una distribucin chi-cuadrado es una distribucin sesgada cuya forma
depende exclusivamente del nmero de grados de libertad. Conforma este aumenta, la
distribucin se vuelve ms simtrica.

Pruebas de dos muestras con datos numricos
Prueba t de varianza conjunta para diferencias entre dos medias
Supongamos que consideramos dos poblaciones
independientes, cada una con una media y una desviacin estndar. La estadstica de prueba
utilizada para determinar la diferencia entre las medias de las poblaciones est basada en la
diferencia entre las medias de las muestras (X1 X2). Debido al teorema del lmite central esta
estadstica seguir la distribucin normal. La estadstica de prueba Z es:
En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es el
tamao de la muestra y por ltimo tenemos la varianza de la muestra.
Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera
aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para determinar
si existe alguna diferencia significativa entre las medias de las poblaciones. Si puede calcular la
siguiente estadstica de prueba t de varianza conjunta:

Donde:

La estadstica de prueba t de varianza conjunta sigue una distribucin t con n-2 grados de
libertad.
Prueba t`de varianza separada para diferencias entre dos medias
Si suponemos que las varianzas no son iguales como en el
caso anterior debemos replantear el estadstico a utilizar.

La estadstica de prueba t`puede ser aproximada con la frmula de v, mostrada anteriormente.
Prueba t para la diferencia de medias
Con el propsito de determinar cualquier diferencia que exista entre dos grupos relacionados,
deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviacin
estndar de la poblacion de la diferencia es conocida y el tamao de muestra es lo
suficientemente grande. La estadstica de prueba Z es:

Sin embargo, en la mayora de los casos no conocemos la desviacin estndar real de la
poblacin. La nica informacin que se puede obtener son las estadsticas sumarias como la
media y la desviacin estndar de muestra. Si se supone que la muestra de resultados es
tomada de manera aleatoria e independiente se puede realizar una prueba t para determinar si
existe una diferencia media de poblacin significativa. La estadstica seguir una distribucin t
con n-1 grados de libertad.
Ho= d = 0 donde d= 1-2
H1= d 0
Se puede calcular el siguiente estadstico de prueba:

Prueba de hiptesis con datos categricos
Prueba Z de una muestra para la proporcin
Para evaluar la magnitud de la diferencia entre la porcin de la muestra y la porcin de la
poblacin supuesta la estadstica de prueba est dada por la ecuacin siguiente:

La estadstica de prueba Z est distribuida de manera aproximadamente normal.
Prueba Z para diferencias entre dos porciones (muestras independientes)
Cuando se evalan diferencias entre dos porciones basndose en muestras independientes se
puede emplear una prueba Z. La estadstica de prueba es:

Se supone que las dos porciones de poblacin son iguales.
Ho= p1=p2
H1= p1 p2
Prueba X2 de independencia
Sirve para evaluar diferencias potenciales entre la porcin de xitos en cualquier nmero de
poblaciones. Para una tabla de contingencias que tiene r renglones y c columnas, la prueba
mencionada puede generalizarse como una prueba de independencia.
Como prueba de hiptesis las hiptesis nula y alternativa son:
H0= Las dos variables categricas son independientes.
H1= Las dos variables categricas estn relacionadas.
La estadsitica de prueba es la siguiente:

La regla de decisin consiste en rechazar a hiptesis nula a un nivel de significacin si el valor
calculado de la estadstica de prueba es mayor que el valor crtico de extremo superior de una
distribucin chi-cuadrada que posee (r-1)*(c-1) grados de libertad.
Regresin lineal simple y correlacin
El anlisis de regresin se utiliza principalmente con el propsito de hacer predicciones.
El anlisis de correlacin se utiliza para medir la intensidad de la asociacin entre las variables
numricas.
Diagrama de dispersin: cada valor es graficado en sus coordenadas particulares X, Y.
Tipos de modelos de regresin. El modelo de lnea recta puede representarse como:

El primer termino (B0), es la interseccin Y para la poblacin; B1 es la pendiente de la
poblacin y E es el error aleatorio en Y para la observacin i. En este modelo, la pendiente de la
recta B1 representa el cambio esperado en Y por unidad de cambio en X; esto es, representa la
cantidad que cambia la variable Y con respecto a una unidad de cambio particular en X. B0
representa el valor promedio de Y cuando X es igual a cero. El modelo matemtico est
influenciado por la distribucin de los valores X y Y en el diagrama de dispersin.
Determinacin de la ecuacin de regresin lineal simple. El mtodo de mnimos cuadrados.
A b0 y b1 se los puede considerar como estimaciones de B0 y B1. Por consiguiente, la ecuacin
de regresin de muestra sera:
Yi es el valor predicho de Y para la observacin i, y Xi es el valor de X para la
observacin i.
El anlisis de regresin lineal simple tiene que ver con la bsqueda de la lnea recta que mejor
se ajusta a los datos. El mejor ajuste significa que deseamos encontrar la lnea recta para la cual
las diferencias entre los valores reales (Yi) y los valores que seran predichos a partir de la lnea
ajustada de regresin (Yi estimada) sean lo ms pequeas posibles. Debido a que tales
diferencias sern positivas y negativas para las diferentes observaciones, minimizamos
matemticamente la expresin:
Una tcnica matemtica utilizada para determinar los
valores de bo y b1 que mejor se ajusten a los datos observados se conoce como mtodo de
mnimos cuadrados. Al utilizar este mtodo surgen dos ecuaciones normales:

I.
II.

El error estndar de estimacin.
El error estndar de la estimacin,
representado como Syx se define como:
Mediciones de variacin en regresin y correlacin. Con el fin de examinar que tan bien una
variable independiente predice a la variable dependiente, necesitamos desarrollar algunas
medidas de variacin. La primera: la suma total de cuadrados, esta puede dividirse en dos
partes: la variacin explicada o suma de cuadrados debida a la regresin (SSR) y la variacin no
explicada o suma de cuadrados de error (SSE). La suma de cuadrados debida a la regresin. La
SSR representa la diferencia entre el valor promedio de Y y el valor promedio de Y que sera
predicho a partir de la relacin de regresin).La SSE representa aquella parte de la variacin de
Y que noo es explicada por la regresin.
SST = SSR + SSE

En la que SST =

Podemos ahora definir el coeficiente de determinacin r2: mide la porcin de variacin que es
explicada por la variable independiente del modelo de regresin:
Algunos investigadores sugieren que se calcule
un coeficiente r2 ajustado para reflejar tanto el nmero de variables explicatorias del modelo
como el tamao de la muestra. El coeficiente r2 ajustado se calcula de la siguiente manera:
Correlacin: medicin de la intensidad de la asociacin
En el anlisis de correlacin estamos interesados en medir el grado de asociacin entre dos
variables. La intensidad de la
relacin se mide mediante el coeficiente de correlacin r , cuyos valores van de 1 a +1. El
coeficiente de correlacin en casos de regresin lineal simple toma el signo de b1.

Suposiciones de regresin y correlacin. Las cuatro principales suposiciones acerca de la
regresin son: 1.Normalidad. 2. Homoscedasticidad. 3. Independencia de error. 4. Linealidad.
La primera suposicin, normalidad, requiere que los valores de Y estn distribuidos
normalmente en cada valor de X. Siempre y cuando la distribucin de los valores de Yi
alrededor de cada nivel de X no sea extremadamente diferente de una distribucin normal, las
inferencias acerca de la lnea de regresin y de los coeficientes de regresin no se vern
seriamente afectadas. La segunda suposicin, homoscedasticidad, requiere que la variacin
alrededor de la lnea de regresin sea constante para todos los valores de X. La tercera
suposicin, independencia de error, requiere que el error sea independiente de cada valor de X.
Por ltimo, la linealidad establece que la relacin entre las variables es lineal.
Estimacin del intervalo de confianza para predecir m yx.

Intervalo de prediccin para una respuesta individual Yi

Inferencias respecto a los parmetros de poblacin en regresin y correlacin
Ho= 1=0 (No hay relacin)
H1= 1 0 (Hay relacin)
Y la estadstida de prueba para probar la hiptesis est dada por:

La estadstica de prueba sigue una distribucin t con n-2 grados de libertad.
Un segundo mtodo equivalente para probar la existencia de una relacin lineal entre las
variables consiste en establecer una estimacin de intervalo de confianza de 1 y determinar si
el valor supuesto est incluido en el intervalo. La estimacin del intervalo de confianza se
obtendra de la siguiente manera:

Un tercer mtodo para examinar la existencia de una relacin lineal entre dos variables implica
al coeficiente de correlacin de la muestra, r. Para ello se realiza lo siguiente:
Ho: = 0 ( No hay relacin)
H1: 0 (Hay relacin)
La estadstica de prueba para determinar la existencia de una correlacin esta dada por:

La estadstica de prueba sigue una distribucin t con n-2 grados de libertad.
Dificultades de la regresin y cuestiones ticas
Las dificultades que surgen con frecuencia son:
1. Falta de conciencia sobre las suposiciones de la regresin de mnimos cuadrados.
2. Conocimiento de cmo evaluar las suposiciones de la regresin de mnimos cuadrados.
3. Conocimientos de cules son las alternativas de la regresin de mnimos cuadrados si no
se cumple alguna suposicin individual.
4. La creencia de que la correlacin implica causalidad.
5. El uso del modelo de regresin sin conocer de qu se trata.
16. Aplicaciones estadsticas en administracin de la calidad y productividad
Calidad y productividad: Una perspectiva histrica. Al tema de calidad y productividad lo
podemos dividir en cuatro fases histricas: 1. Podemos pensar en una administracin de
primera generacin como administracin mediante la accin, el tipo administracin practicada
por las sociedades cazadoras-recolectoras primitivas en que los individuos producan algo para
s mismos o para su unidad tribal, siempre que el producto fuera necesario. 2. Luego
encontramos la administracin por direccin. Es la poca del surgimiento de los gremios
en Europa (Edad Media). Los gremios administraban el entrenamiento de aprendices y
trabajadores y determinaban las normas de calidad y fabricacin de los productos hechos por el
gremio. 3. La administracin por control, surge aproximadamente con Henry Ford, en el cual
los trabajadores estaban divididos entre aquellos que en realidad hacan el trabajo y aquellos
que planeaban y supervisaban el trabajo. Esto le quit responsabilidad al trabajador individual
con respecto al tema calidad y dej el tema en manos de inspectores. El estilo de
administracin por control contena una estructura jerrquica que pona nfasis en la
responsabilidad individual por la obtencin de un conjunto de objetivos predeterminados. 4.
Por ltimo encontramos la administracin por proceso. Llamada a menudo TQM o
Administracin de Calidad Total. Una de las caractersticas principales de este planteamiento
consiste en centrar la atencin en una continua mejora de los procesos. Se le da importancia al
trabajo en equipo, atencin al cliente y rpida reaccin a los cambios. Tiene fuerte
fundamentacin estadstica.
La teora de los diagramas de control. El diagrama de control es un medio para revisar la
variacin de la caracterstica de un producto o servicio mediante 1. la consideracin de la
dimensin temporal en la cual el sistema fabrica productos y 2. el estudio de la naturaleza de la
variabilidad del sistema. El diagrama de control puede utilizarse para estudiar desempeos
pasados o evaluar las condiciones presentes o ambas cosas. Los diagramas de control pueden
utilizarse para diferentes tipos de variables: para las variables categricas y para las variables
discretas. La atencin principal del diagrama de control se enfoca en el intento de separar las
causas especiales o asignables de la variacin de las causas comunes o debidas al azar.
Las causas especiales o asignables representan grandes fluctuaciones en los datos que no
son inherentes a un proceso. Tales fluctuaciones son ocasionadas por cambios en un
sistema.
Las causas comunes o debidas al azar representan la variabilidad inherente que se presenta
en un sistema.
Las causas especiales se consideran aquellas que no forman parte de un proceso y son
susceptibles de corregir; mientras que las causas comunes pueden reducirse solo cambiando el
sistema. Existen dos tipos de errores que los diagramas de control ayudan a prevenir. El primer
tipo de error implica la creencia de que un valor observado representa una causa especial de la
variacin cuando de hecho se debe a una causa comn de variacin del sistema. El segundo
error implica tratar a una causa especial como si fuera una causa comn y no tomar medidas
correctivas cuando son necesarias.
La forma ms tpica de un diagrama de control establece lmites de control que se encuentran
dentro de +/-3 desviaciones estndar de la medida de estadstica de inters. En general puede
establecerse como:

Algunas herramientas para estudiar un proceso: diagrama de esqueleto de pescado (Ishikawa)
y de flujo de procesos. Un proceso es una secuencia de pasos que describen una actividad desde
el inicio hasta su terminacin.
El diagrama de esqueleto de pescado (o Ishikawa): El nombre viene de la manera en que las
diferentes causas estn ordenadas en el diagrama. El problema se muestra en la parte
derecha y las principales causas se colocan en la parte izquierda. Estas causas a menudo se
subdividen.
Diagrama de flujo de proceso. Este diagrama nos permite ver un flujo de pasos de un
proceso, desde su inicio hasta su terminacin.
Los catorce puntos de Deming: una teora de la administracin por proceso. Deming desarrollo
su enfoque basndose en los siguientes catorce puntos:
1. Crear una constancia en el propsito de mejorar el producto y el servicio.
2. Adoptar la nueva filosofa.
3. Dejar de ser dependientes de la inspeccin para lograr la calidad.
4. Terminar con la prctica de otorgar contratos sobre la nica base del precio. En vez de
ello minimizar el costo total trabajando con un solo proveedor.
5. Mejorar constantemente y para siempre cada proceso de planeacin, produccin y
servicio.
6. Instituir el entrenamiento en el trabajo.
7. Adoptar e instituir el liderazgo.
8. Eliminar el miedo.
9. Derribar las barreras entre reas de personal.
10. Eliminar lemas, exhortaciones y metas destinados a la fuerza laboral.
11. Eliminar cuotas numricas para la fuerza laboral y objetivos numricos para la
administracin.
12. Retirar barreras que le restan orgullo a la gente respecto a su trabajo. Eliminar el sistema
de evaluacin anual o de mrito.
13. Instituir un vigoroso programa de educacin y autodesarrollo para todos.
14. Poner a todo el que trabaje en la compaa a trabajar en el logro de la transformacin.
Diagramas de control para la proporcin y el nmero de elementos que no se ajustan:. Los
diagramas p y np.
Diagrama p: basado en la porcin de elementos que no cumplen con los requisitos. Para
establecer los lmites de control:

Cualquier valor negativo del lmite de control inferior significar que el lmite de control
inferior no existe.
Diagrama np: basado en el nmero de elementos que no cumplen con los requisitos. Los
lmites de control los establecemos de la siguiente manera:

El diagrama R: Un diagrama de control para la dispersin. Los lmites de este diagrama de
control los obtenemos de la siguiente manera:

Diagrama X. El diagrama de control para X utiliza subgrupos de tamao n que se obtienen
sobre k secuencias consecutivas o periodos. Los lmites de control se obtienen de la siguiente
manera:

Resumen
Pronstico de series de tiempo.
Tipos de mtodos de prediccin: Existen dos planteamientos para la prediccin: cualitativa y
cuantitativa. Los mtodos de prediccin cualitativa son especialmente importantes cuando no
se dispone de datos histricos. Se consideran altamente subjetivos. Los mtodos de prediccin
cuantitativa hacen uso de los datos histricos.
Introduccin al anlisis de series de tiempo.
Una serie de tiempo es un conjunto de datos numricos que se obtienen en perodos regulares a
travs del tiempo. El principal objetivo de una serie de tiempo consiste en identificar y aislar
tales factores de influencia con propsitos de hacer predicciones, as como para efectuar una
planeacin y un control administrativo.
Factores componentes del modelo multiplicativo de series temporales.
Tendencia: impresin a largo plazo.
Componente cclico: representa la oscilacin o los movimientos a la baja y a la alta que se dan a
lo largo de la serie. Los movimientos cclicos varan en longitud, por lo general de dos a 10
aos.
Componente irregular aleatorio: cualquier componente que no sigue la curva de tendencia
modificada por el componente cclico.
Cuando los datos se registran mensual o trimestralmente adems de la tendencia cclica y los
componentes irregulares debemos tomar en cuenta el factor estacional.
El modelo multiplicativo clsico de las series temporales.
Cuando los datos se obtienen anualmente una observacin Yi puede expresarse como:
Yi=Ti*Ci*Ii; en la que Ti es el valor del componente tendencia, Ci= valor del componente
cclico; Ii es el valor del componente irregular.
Por otra parte cuando los datos se obtienen de manera trimestral o mensual una observacin Yi
puede estar dada por:
Yi=Ti*Si*Ci*Ii, en la que Si es el valor del componente estacional.
El primer paso de una serie de tiempo consiste en graficar los datos y observar su tendencia a
travs del tiempo. Primero debemos determinar si parece haber un movimiento a largo plazo
hacia arriba o hacia abajo en la serie. ( es decir una tendencia), o si la serie parece oscilar
alrededor de una lnea horizontal a travs del tiempo. Si este ltimo parece ser el caso entonces
debe emplearse el mtodo de promedios mviles o el suavizado exponencial, para suavizar la
serie y proporcionarnos una impresin global a largo plazo.
Suavizado de las series temporales anuales:. promedios mviles y suavizado exponencial.
Promedios mviles. Este mtodo es altamente subjetivo y dependiente de la longitud del
perodo elegido para la construccin de los promedios. Para eliminar las fluctuaciones cclicas,
el perodo escogido debe ser un valor entero que corresponda a la duracin promedio estimada
de un ciclo.
Los promedios mviles para un perodo elegido de longitud L consisten en una serie de medias
aritmticas calculadas en el tiempo de tal modo que cada media se calcula para una secuencia
de valores observados que tienen esa longitud particular, L.

El promedio mvil puede calcularse de la siguiente manera:
Cuanto ms largo sea el perodo, menor ser el nmero de valores promedio mvil que se
pueden calcular y graficar. Por consiguiente, la seleccin de promedios mviles con perodos de
longitud mayores a siete aos es, por lo general, no deseable puesto que habr demasiados
puntos de datos que faltan al inicio y al final de la serie, haciendo que sea ms difcil de obtener
una impresin global de la serie completa.
Suavizado Exponencial.
El suavizado exponencial puede utilizarse para obtener predicciones a corto plazo. Su nombre
deriva del hecho de que nos proporciona un promedio mvil pesado o ponderado
exponencialmente a travs de la serie de tiempo, esto es, a lo largo de la serie cada clculo de
suavizado o prediccin depende de todos los valores observados anteriormente. Esta es una
ventaja con respecto al otro mtodo. Con este mtodo los pesos asignados a los valores
observados disminuyen con el tiempo, de modo que cuando se hace el clculo, el valor
observado ms reciente recibe el mayor peso.
Para suavizar una serie de tiempo en cualquier periodo i tenemos la siguiente expresin:.

Ei= valor de la serie suavizada exponencialmente que se calcula en el perodo i.
Ei-1= valor de la serie suavizada exponencialmente calculado en el perodo i-1
Yi= valor observado de la serie en el perodo i
W= peso o coeficiente de suavizado que se asigna de manera subjetiva.
W==2/(L+1)
Si deseamos suavizar una serie mediante la eliminacin de las variaciones cclicas e irregular no
deseadas, debemos seleccionar un pequeo valor de W. Si, nuestro objetivo es hacer
predicciones debisemos seleccionar el valor ms grande de W (cercano a uno).
Anlisis de series de datos anuales: ajuste de tendencia de mnimos cuadrados y pronstico.

El modelo lineal:

El modelo cuadrtico:

El modelo exponencial:
Eleccin de un modelo de prediccin apropiado

Leer ms: http://www.monografias.com/trabajos13/beren/beren.shtml#ci#ixzz39HfZzRKm

Resumen Berenson

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Resumen Berenson

Загружено:

Авторское право:

Доступные форматы

Resumen del libro de estadsticas de Berenson y Levine

Enviado por Hernan Torino

Вам также может понравиться