Академический Документы
Профессиональный Документы
Культура Документы
Ludwin
ndice 1. Estadstica Descriptiva. 1.1. Distribuciones de Frecuencias. 1.2. Medidas de Concentracin. 1.3. Medidas de Dispersin. 2. Probabilidad. 2.1. Probabilidad Simple. 2.1.1. Teora de Conjuntos. 2.2. Distribuciones de Probabilidad. 2.2.1. Distribuciones Discretas y Continuas.
Distribucin de Bernoulli. Distribucin Binomial. Distribucin de Poisson. Distribucin Geomtrica Distribuciones Hipergeomtrica. Distribucin Normal. Distribucin T de Student. Distribucin F de Fisher. Distribucin Gama. Distribucin Beta. Distribucin Chi Cuadrado.
4. Estadstica Inferencial. 4.1. Valores Esperados y Momentos. 4.2. Distribuciones Continuas Especiales. 4.3. Distribucin Normal Multivariante. 4.4. Inferencia Estadstica. 4.5. Prueba Estadstica de una Hiptesis. 4.6. Distribucin de la Varianza 4.7. Anlisis de la Varianza e Intervalos de Confianza. 4.8. Aplicaciones de Chi Cuadrado. 4.9. Regresin y Correlacin Multivariante. 4.10. Distribuciones No Paramtricas.
Mat 282
Pgina 1
ESTADSTICA DESCRIPTIVA
DISTRIBUCIN DE FRECUENCIAS. Definicin.La Distribucin de Frecuencias se trata de organizar cierta informacin en clases o categoras donde se determina el nmero de datos que pertenecen acada uno de ellos ocomo un arreglo tabular de datos que muestren sus respectivas frecuencias. Donde se puede generar dos tipos de distribuciones las cuales son:
Distribuciones de frecuencias de Variables Discretas Distribuciones de frecuencias de Variable Continuas
Distribuciones de Frecuencias de Variables Discretas. En este tipo de distribuciones es considerado en funcin al tipo de variable con el cul se est trabajando, es decir, se considerar a todas las variables como variables discretas, por ejemplo:
Cantidad de objetos vendidos Nmero de alumnos de la clase. Numero de clientes en una tienda. Nmero de accidentes en una autopista. Cantidad de libros en una biblioteca. Piezas defectuosas de un determinado lote recibido.
Al generar la distribucin de frecuencias se deber tomar en cuenta intervalos determinados, por ejemplo:
Mat 282
Pgina 2
N de errores 0 1 2 3 4 5
N de pginas 2 4 6 13 20 35
Es tambin posible analizar el numero de clientes que entran a una tienda en un determinada hora
N de clientes 15 18 25 . . 61
Distribucin de frecuencias variables continuas En la distribucin de Variables Continuas es en la que se asumen valores reales, es decir se trabaja con:
Mat 282 Pgina 3
El peso de alumnos en una clase La utilidad de las empresas en el ramo metalrgico El tiempo de duracin de un transformador El tiempo de duracin de una carrera
Este tipo de distribucin es el ms usual en la estadstica Recomendaciones Para realizar esta distribucin se debe seguir una serie de recomendaciones que son
Ordenar los datos en forma creciente o decreciente para su respectivo
anlisis
Escoger al azar la cantidad de datos A la diferencia del Valor Maximo menos el Valor Mnimo se le llama
Rango
Determinar el nmero de intervalos de la clase
Numero de intervalos de clase Para hallar el nmero de intervalos de la clase se siguen tres reglas fundamentales Se utiliza la regla de sturges que nos dice que el nmero de intervalos de clase es el numero entero ms prximo a la relacin:
Donde n es la cantidad de observaciones que hay, por ejemplo si en curso A hay 20 alumnos, en el curso B hay 34 y en el curso C hay 46 alumnos n tomara el valor de n=20+34+46 de modo que n =100.
Mat 282
Pgina 4
Alu
iles
hu siri A. Lu wi
Carrera: . E Sistemas I
Ya una vez calculado el nmero de intervalos de clase, el resultado se debe redondear bajo las normas de redondeo.
Recorri o El recorrido es la diferencia del valor mximo y el valor mnimo mas uno
Se utiliza el uno si se trabaja con nmero enteros y si se trabaja con variables continuas no se considera el nmero 1.
V lor o magnit
de la clase
Se debe redondear el resultado al mismo nmero de cifras si nificativas que los datos observados
Es importante sealar que si X k+1 es menor a xn o si el mximo valor determina es menor al mximo valor obtendo en forma experimental, se debe incrementar el valor de la magnitud de la clase c considerando el numerode cifras significativas dee los datos observados , hasta que el mximo valor determinado se mayor al mximo valor obtenido en forma experimental
Mat 282
i a5
Excedente Una ves que X k+1 cumpla la condici n se halla el excedente. El excedente es la diferencia entre el valor mximo determinado y el valor mximo obtenido se expresa de la siguiente forma
el segmento se recorrer hacia la izquierda en una magnitud equi alente a e/2, y v si el excedente es impar, se buscara la simetra y el segmento se recorrer hacia la izquierda en el menor nmero determinado.
Son todos los datos experimentales distribuidos simtricamente respecto a los valores mximo y mnimo de los datos obtenidos en forma experimental Intervalos de clase Y1 Y 2-i Y2 Y 3-i Y3 Y -i Y Y 5-i Y5 Y 6-i . . . . Yk Y k+1-i Conteo n1 n2 n3 n n5 . . nk Frecuencia fi f1 f2 f3 f4 f5 . . fk
Donde i es la unidad.
Mat 282 P gina 6
Distri
ci n de frecuencias
Conteo Consiste en colocar la cantidad de valores o datos que pertenecen a cada categora, clase o intervalo de clase, que corresponder al valor de la frecuencia de los intervalos de clase.
Frecuencia fi Es la cantidad de valores que pertenecen a cada intervalo de clase o categora. Para cada caso los datos dentro del intervalo de clase deben ser distribuidos uniformemente.
Limites verdaderos de clase. Se determina el valor medio entre el prime y segundo intervalo de clase luego se determina el valor medio entre el segundo y el tercer intervalo, hasta terminar con todos los intervalos de modo tal que se los denomina limites verdaderos de clase se expresa de la siguiente forma:
Frecuencia fi f1 f2 f3 f3 . . fk
Mat 282
Pgina 7
Histograma de frecuencia Es la representacin grfica de la distribucin de frecuencias lo cual se lo realiza utilizando los ejes coordenados, donde en el eje de la x o abscisas se colocan los limites verdaderos de la clase y al eje de la y se colocan las frecuencias
fi
L.V.C
Marcas de clase Las marcas de clase son los valores representativos de cada intervalo de clase, osea el valor medio de los Limites Simples de Clase o Limites verdaderos de clase y se lo denota como Xi Marcas de Clase Xi X1 X2 X3 . . Xk frecuencia fi f1 f2 f3 . . fk
Mat 282
Pgina 8
Polinomio de Frecuencias Es la representacin grafica de la frecuencia fi Vs las marcas de clase, tiene las mismas caractersticas que el histograma de frecuencias pero esta vez en el eje x se coloca las marcas de clases Xi y en el eje de la y la frecuencia fi
fi
Xi
Distribucin de Frecuencias Relativas Es la cantidad de valores que se encuentra en cada intervalo de clase respecto a la cantidad total de valores observados como: Limites Verdaderos de Clase Y1 Y2 Y3 . . . YK[ Y2 Y3 Y4 . . . YK+1 ) Frecuencia fr % (F1/n)*100=fr1 (F2/n)*100=fr2 (F3/n)*100=fr3 . . . (Fk/n)*100=frk
Mat 282
Pgina 9
Histograma de Frecuencias Relativas es la representacin grafica de los Limites Verdaderos de Clase Vs la Frecuencia fr% y tiene las mismas caractersticas que las anteriores, solo que esta vez en el eje y se coloca la fr% y lo mismo en el eje de la x se coloca los L.V.C
%fr
L.V.C
Distribucin de Frecuencias relativas con Marcas de clase Marcas de Clase Xi X1 X2 X3 . . Xk Polinomio de frecuencias relativas Frecuencia fr fr1 fr2 fr3 . . fr k
% fr
Xi
Mat 282
Pgina 10
Distribucin de Frecuencias acumuladas menor que La distribucin acumulada de frecuencias sirve para conocer el total de las observaciones que existen desde la primera clase hasta una categora determinada, como: Frecuencia Acumulada Datos observados menores que Datos observados menores que Datos observados menores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.
L.V.C
Distribucion de Frecuencias Acumuladas mayor que Frecuencia Acumulada Datos observados mayores que Datos observados mayores que Datos observados mayores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.
Mat 282
Pgina 11
fa
L.V.C
Distribucin de Frecuencias Acumuladas relativas mayor que Frecuencia Acumulada Relativa Datos observados mayores que Datos observados mayores que Datos observados mayores que Y1 Y2 Y3 . Yk+1 fa r1. fa r2. fa r3. . fark.
% fa r
L.V.C
Mat 282
Pgina 12
Distribucin de Frecuencias Acumuladas relativas menor que Frecuencia Acumulada Relativa Datos observados menores que Datos observados menores que Datos observados menores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.
% fa r
L.V.C
Mat 282
Pgina 13
MEDIDAS DE CONCENTRACION Las medidas de concentracin son valores representativos, se trata de valores que generan una representacin de un conjunto de datos obtenidos en un determinado experimento. Las medidas de concentracin son las siguientes:
Media Aritmtica La media aritmtica de un conjunto de nmeros, x1, x2, x3 ,x4..xn se denota por de modo que la ecuacin para hallar la media aritmtica es la siguiente:
la media aritmtica es igual a la suma de todos sus valores entre la cantidad de valores n= a la cantidad de valores que se estn sumando si los nmeros estn organizados en una distribucin de frecuencias la media aritmtica seria la siguiente:
Donde la suma de las frecuencias es equivalente a la cantidad total de valores observados, Se puede usar cualquiera de las dos ecuaciones para hallar la media aritmetica Propiedades La Suma Algebraica de las Desviaciones de un conjunto de nmeros, respecto de su Media Aritmtica, es siempre igual a cero.
Mat 282
Pgina 14
La Mediana. Es un valor representativo y se lo puede determinar como el valor que se encuentra en el centro de una serie de valores, siendo estos ordenados en forma creciento o decreciente. Si la cantidad que se analiza de los valores es par, la mediana ser el valor medio de los dos valores que se encuentra en el centro de esa serie de valores Ejemplo: 12, 25 , 34 , 55, 60, 75, 90, 95, 98, 100, 112 La cantidad de valores es =11, es impar de modo que la mediana es el numero del medio La mediana = 75 Si se analiza la distribucin de frecuencia la mediana se calcula de la siguiente forma:
Lm: Es el lmite verdadero de clase inferior de la Clasemediana. La Clase Mediana es aquel intervalo donde su frecuencia acumulada es Equivalente a la mitad de los valores observados. n/2: fl: La mitad de los datos observados. Frecuencia acumulada por debajo de la Clase Mediana, tambin se podra decir que es igual a la suma de las frecuencias hasta el limite de fm. fm: c: Frecuencia de la Clase Mediana. La magnitud del intervalo de clase
Mat 282
Pgina 15
La Moda La Moda es un conjunto de nmeros obtenidos en forma experimental , es aquel valor que ocurre con mayor frecuencia. Ejemplo: el valor mas frecuente de los siguientes nmeros es: 12, 25, 28, 28, 55, 60, 75, 90, 95 Moda = 28
La moda puede no existir o incluso no ser la nica en caso de existir. En una Distribucin de Frecuencias La Moda se determina de la siguiente forma:
Lm: Limite real inferior o limite verdadero de clase inferior de la Clase Modal. Clase Modal. Es aquel intervalo de clase que tiene Mayor Frecuencia. : Es la diferencia de la frecuencia de la Clase Modal sobre la frecuencia de la clase Contigua Inferior. : Es la diferencia de la frecuencia de la Clase Modal sobre la frecuencia de la clase Contigua Superior. C: Magnitud del Intervalo de clase
Mat 282
Pgina 16
La Media Geomtrica La media Geomtrica se denota como G, de un conjunto de nmeros x1, x2, x3,.xn, es la razensima del producto de estos numerode modo que la ecuacin es la siguiente:
Donde se simplifica:
Cuando la cantidad de valores que se esta analizando son muy grandes y los valores altos. Entonces se utiliza la propiedad de logaritmos de la siguiente manera:
Simplificando se llega a:
La Media Armnica La media armnica, lo denotamos como H de un conjunto de nmeros x1, x2, x3, xn, es la recproca de la Media Aritmtica de los reciproco de esos Nmeros. de modo que su ecuacin es la siguiente
Mat 282
Pgina 17
Media Cuadrtica Es un conjunto de nmeros x1, x2 ,x3, x4, xn, la formula para hallar la Media Cuadrtica se halla de la siguiente forma
Cuartil Si a una serie de datos se colocasen en orden creciente de acuerdo a su magnitud, el valor medio que divide al conjunto de datos en dos partes iguales es la Mediana. De ese modo los valores que dividen a los datos son cuatro partes iguales, a estos valores se les denomina Cuartiles y se los escribe como Q1, Q2 y Q3.sus nombres son Primer Cuartil, Segundo Cuartil y Tercer Cuartil como se dijo al comienzo el segundo cuartil corresponde al valor de la mediana
Decil Para los deciles se utiliza el mismo principio de los valores que dividen a los datos observados en diez partes iguales de modo que se los denomina deciles y se los representa de la siguiente forma: D1, D2, D3,D4,D5,D6,D7,D8, D9. Como en el caso del Q2 corresponde al valor de la mediana el D5.
Mat 282
Pgina 18
Percentil De la misma forma la cantidad de valores que dividen a este conjunto de datos son cien partes iguales y son representadas de la siguiente formar: P1, P2, P3, P4,P99. Como se mostr en el cuartil Q2 y en el decil D5, el percentil P50 corresponder al valor de la Mediana y los Percentiles P25, P75 corresponder al Q1 y Q3 respectivamente.
Mat 282
Pgina 19
MEDIDAS DE DISPERSIN Se trata de las medidas que nos permiten determinar el grado de variacin se tiene con los datos que se estn trabajando respecto a una medida referencial Desviacin Media Es el promedio de desviacin de cada valor respecto de la Media Aritmtica. Si se cuenta con una serie de valores como por ejemplo x1, x2, x3,xn, la desviacin de cada uno de los valores seria promedio de todas las desviaciones va a ser:, ,. de modo que el
Desviacin Estndar Se determina cuando se tiene un conjunto de nmeros por ejemplo: x1, x2, x3,xn, se denota por y se define como la Media Cuadratica de las deviaciones dee cada valor respecto a la Media Aritmetica:
Mat 282
Pgina 20
La Varianza Es el cuadrado de la DesviacionEstandar y se denota con hallar la Varianza es la siguiente: , la ecuacin para
Rango El rango es una medida de dispersin tomando en cuenta la diferencia del valor mximo con el valor mnimo
Rango SemiIntercuartilico Es la diferencia entre el tercer cuartil y el primero entre 2, la ecuacin es la siguiente
Mat 282
Pgina 21
Rango SemiPersentil Es la desviacin entre el percentil 10 y el percentil 90 entre dos se podra hallar el Rango Semi Percentil con otros percentiles pero con el percentil 10 y 90 nos da una mayor aproximacin que con los otros su ecuacin es la siguiente
Coeficiente de variacin
Donde la desviacin absoluta es la desviacin estndar , y el promedio es la media , a la desviacin relativa se la denomina como coeficiente de variacin
Mat 282
Pgina 22
PROBABILIDAD.
Es el estudio de experimentos aleatorios o elementos libres de determinacin. Es decir, si se tiene un suceso denotado por E y existe n casos posibles n oportunidades, para todos estos con la misma posibilidad o factibilidad, entonces puede presentarse solo en h de todos los casos.
PROBABILIDAD SIMPLE. Teora de Conjuntos La Teora de Conjuntos es una divisin de las matemticas que estudia las propiedades y relaciones de los conjuntos. El concepto de conjunto es intuitivo y se podra definir como una "agrupacin bien definida de objetos no repetidos y no ordenados"; as, se puede hablar de un conjunto de personas, ciudades, gafas, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto est bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolgrafos azules est bien definido, porque a la vista de un bolgrafo se puede saber si es azul o no. El conjunto de las personas altas no est bien definido, porque a la vista de una persona, no siempre se podr decir si es alta o no, o puede haber distintas personas, que opinen si esa pers ona es alta o no lo es. Se entiende por conjunto a la agrupacin en un todo de objetos bien diferenciados de nuestra intuicin o nuestro pensamiento.
Se llama elemento a cada uno de los objetos que forman parte de un conjunto, estos elementos tienen carcter individual, tienen cualidades que nos permiten
Mat 282
Pgina 23
diferenciarlos, y cada uno de ellos es nico, no habiendo elementos duplicados o repetidos. os representaremos con una letra minscula:
para definir a tal conjunto A. Esta notaci n empleada para definir al conjunto A se llama notaci n por extensi n.
Para representar que un elemento pertenece a un conjunto " en ", " pertenece a " o bien " de se escribe
El conjunto universal, que representaremos como U(u mayscula), es el conjunto de todas las cosas sobre las que estemos tratando. As, si hablamos de nmeros enteros entonces Ues el conjunto de los nmeros enteros; si hablamos de ciudades, U es el conjunto de todas las ciudades. Todos los elementos posibles estn en este conjunto: Este conjunto universal puede mencionarse explcitamente, o puede darse por supuesto segn el contexto que estemos tratando. Existe adems, un nico conjunto que no tiene elementos, al que se le llama conjunto vaco y que se denota por , esto es: .
a caracterstica
Mat 282
P gina 24
, escribimos
importante de este conjunto es que todos los elementos posibles no estn contenidos en l: Por otro lado, si todos los elementos de un conjunto satisfacen alguna
propiedad, misma que pueda ser expresada como una proposici np(x), con la indeterminada x, usamos la notaci n por comprensi n, y se puede definir:
p(x)". El smbolo ":" se lee "que cumplen la propiedad" o "tal que"; este smbolo puede ser remplazado por una barra /. Por ejemplo, el conjunto:
Puede definirse por: Donde el smbolo N representa al conjunto de los nmeros naturales.
Igualdad de conjuntos Dos conjuntos A y B se dicen iguales, lo que se escribe A = B si constan de los mismos elementos. Es decir, si y solo si todo elemento de A est tambin contenido en B y todo elemento de B est contenido en A. En smbolos:
Mat 282
P gina 25
Subconjuntos Un subconjunto es un Conjunto que consta de elementos en el cual cada elemento que posee esta tambin en otro conjunto como en elgrafico
Un conjunto A se dice que es subconjunto de otro B, si cada elemento de A es tambin elemento de B, y se denota .y se lee de la siguiente forma el
Cabe sealar que, por definici n, no se excluye la posibilidad de que si A B, se cumpla A = B. Si, siendo A un subconjunto de B, B tiene por lo menos un elemento que no pertenezca al conjunto A, entonces decimos que subconjunto propio de B, lo que se representa por Operaciones con conjuntos Uni n Es la uni n de los elementos que tienen esos conjuntos por ejemplos en el grafico esta pitado de celeste todos los elementos de A y B es la uni n de esos conjuntos . Es decir es un
Mat 282
"
"
P gina 26
si y slo si
Diagrama de Venn que ilustra Para cada par de conjuntos A y B existe un conjunto unin de los dos, que se denota como el cual contiene todos los elementos de A y de B.
Interseccin
Son los elementos que se encuentran en un conjunto y a la vez en otro Esto significa que si y slo si y
Mat 282
Pgina 27
Diferencia Los elementos de un conjunto A que no se encuentran en otro conjunto B, forman otro conjunto llamado diferencia de A y B, representado por Lo que significa que A B si y slo si
. Es decir:
y A
.
El conjunto complemento siempre lo es respecto al conjunto universal que estamos tratando, esto es, si hablamos de nmeros enteros, y definimos el conjunto de los nmeros pares, el conjunto complemento de los nmeros pares es el formado por los nmeros impares. Si estamos hablando de estudiantes y se define al conjunto a los estudiantes que han pasado la materia de probabilidad II, el conjunto complementario es el de los estudiantes que reprobaron la materia.
Mat 282
ByB
A respectivamente.
Pgina 28
Diferencia simtrica La diferencia simtrica de dos conjuntos A y B viene dada por los elementos que pertenecen a uno y slo uno de los dos:
Mat 282
Pgina 29
DISTRIBUCIONES DE PROBABILIDADES En teora de la probabilidad y estadstica, la distribucin de probabilidad de una variable aleatoria es una funcin que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribucin de probabilidad est definida sobre el conjunto de todos los eventos rango de valores de la variable aleatoria. Cuando la variable aleatoria toma valores en el conjunto de los nmeros reales, la distribucin de probabilidad est completamente especificada por la funcin de distribucin, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x. DISTRIBUCIONES DISCRETAS Y CONTINUAS. Distribucin de Bernoulli. El experimento de Bernoulli es aquel en el que interesan solamente dos resultados: El evento A ocurre o no ocurre, algunos ejemplos de esta prueba incluye el lanzamiento de una moneda, la prueba de un producto sano o defectuoso o tambin el sexo de una persona que puede ser hombre o mujer, lo cual se trata de una misin de xito o de fracaso. La funcin indicadora de un evento es una variable aleatoria de Bernoulli
0 --- fracaso (el evento A no ocurre) Por lo tanto el espacio muestral de la distribucin de Bernoulli (w) es discreto mostrando solamente dos valores, queda definida conociendo la pr obabilidad de A y la probabilidad de A complemento
P(A)=P
X(w):1 0
Mat 282
Pgina 30
P(
)=1-p=q
P(w): p q
Donde la variable aleatoria de bernoulli tiene un rango o recorrido de 0 y 1 lo cual resulta en una bicotomica del espacio muestral original Por ejemplo Una urna contiene 4 bolillos blancos y 6 negros. Cuando seleccionamos un bolillo al azar este puede clasificarse como blanco o negro y la variable aleatoria ser 1 --- si el bolillo es blanco X(w)= 0 --- si el bolillo es negro
Distribucin binomial si definimos una variable aleatoria X en el espacio muestral omega asociada a un espacio de probabilidad, se dice que X es binomial si y solo si:
i) r(x)=(0,1,2,3.n)
ii) P(x=x) =
Condiciones para emplear la distribucin binomial a) El experimento aleatorio tiene un carcter dicotmico y puede ser repetido independientemente mil veces, por tanto si A es el experimento aleatorio entonces la probabilidad de A es igual a p es decir: P(A)=p P( )=1-p=q )=q permanecen constantes para todas y
Mat 282
Pgina 31
Figura es la grfica de una distribuci n binomial(n, 0.5) para n = 20, 40, 60, 80, 100.
P
Mat 282
&
P gina 32
En este caso muchos fenmenos aleatorias se explican mediante el manejo de distribucin binomial y Poisson por ejemplo el nmero de llamadas telefnicas que reciben cada da, nmero de accidentes ocurridos
k de eventos un tiempo fijo eventos una frecuencia conocida y son independientes discurrido ltimo evento.
Distribuci n geomtrica. En este caso estamos interesados en la concurrencia o no de un evento A y como en el caso de la distribucin binomial para cada repeticin permanecen constantes
Se repite el experimento hasta la ocurrencia de A por primera vez por tanto el numero de repeticiones constituye una variable aleatoria. Asi determinamos la variable aleatoria como el numero de repeticiones requeridas hasta la ocurrencia o primera vez. Entonces la funcin de distribucin de la probabilidad es: ;
Mat 282
'
P(A)=p
P(
)= q=1-p
P gina 33
Distribuci nhipergeomtrica Esta distribucin se dice que X es una variable aleatoria hipergeometrica si: i) r(x)={0,1,2,3....n} Donde las variables M y N son enteros positivos y N es mayor o igual a n y N es mayor o igual a M si se considera el problema de elegir una muestra de tamao n de un lote que contiene N objetos de una clase y N-M de otra clase entonces la definicin establece la probabilidad de obtener exactamente x objetos de la primera clase en la muestra
Mat 282
Graficos de la DistribucionHipergeometrica
P gina 34
Distribucin Normal Una variable aleatoria continua X sigue una distribucin normal de media y desviacin tpica si su funcin de densidad es:
De esta forma, una vez que se especifican y la distribucin queda determinada completamente. La distribucin de probabilidad normal tie nen forma de campana (llamada campana de gauss, o curva normal), simtrica (por depender de x a travs del termino proporcional a . Sabemos que la curva de cualquier distribucin continua de probabilidad o funcin de densidad esta construya de forma que el rea bajo la curva limitada por los puntos x = x1 y x = x2 es igual a la probabilidad de que la variable aleatoria X asuma un valor entre x = x1 y x = x2. Como la resolucin de las integrales para cada curva normal no es fcil, es aconsejable utilizar tablas. Para no tener que presentar estas tablas para todos los posibles valores de y se utiliza una variable normal tipificada Z definida como Z = (X .)/ con lo que sustituyendo nos queda la funcin de densidad de X: centrada en y con anchura
La distribucin normal es la distribucin de probabilidad ms importante del Clculo de probabilidades. la importancia de la distribucin normal queda totalmente consolidada por ser la distribucin lmite de numerosas variables aleatorias, discretas y continuas, como se demuestra a travs de los teoremas centrales del lmite. Las consecuencias de estos teoremas implican la casi universal presencia de la distribucin normal en todos los campos de las ciencias empricas.
Mat 282
Pgina 35
La distribucin normal queda totalmente definida mediante dos parmetros: la media (Mu) la desviacin estndar (Sigma).
Grfico de la distribucin Normal
Grafico N2
Como se puede observar en el 2do grafico la Distribucin Normal y la Binomial tienen una cierta similitud
Distribuci n T de Student. En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de
Mat 282
P gina 36
Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias mustrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. La distribucin t de Student es la distribucin de probabilidad del cociente
Donde:
Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes
Si
la distribucin t de Student no central con parmetro de no-centralidad . Supongamos que X1,..., Xnson variables aleatorias independientes distribuidas normalmente, con media y varianza 2. Sea
sigue una distribucin normal de media 0 y varianza 1. Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi un cociente relacionado,
Mat 282
Pgina 37
Donde:
parmetro representa el nmero de grados de libertad. La distribucin depende de , pero no de o , lo cual es muy importante en la prctica.
Mat 282
P gina 38
una distribucin
probabilidad
Tambin
comodistribucin F de Snedecor (por George Snedecor) o como distribucin F de Fisher-Snedecor. Una variable aleatoria de distribucin F se construye como el siguiente cociente:
Donde:
La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica, especialmente en el anlisis de varianza. Vase el test F. La funcin de densidad de una F(d1, d2) viene dada por
para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta.
Mat 282
Pgina 39
Distribuci n Gama. Los tiempos que tardan en revisar un motor de un automvil avin tienen una distribucin de frecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias frecuentemente tienen distribuciones que se pueden modelar adecuadamente por la funcin de densidad tipo gamma. Funci n de densidad de probabilidad para una variable aleatoria tipo gamma:
f ( y) !
y E 1e y / F F E X (E ) 0
En donde:
X (E ) !
E 1
La cantidad de la de la funcin alfa se conoce como la funcin gamma. La integracin directa nos da que la funcin uno igual a uno. La integracin por partes nos da que la funcin de alfa menos uno alfa menos uno por la funcin alfa menos uno para cualquier intervalo de alfa ma or o igual a uno
Mat 282
P gina 40
3 42
2 3
1 1
E , F " 0;0 e y e E
que la
En el caso especial cuando alfa es un nmero entero, se puede expresar la funcin de distribucin de una variable aleato ria tipo gamma como una suma de ciertas variables aleatorias de Poisson.
donde
Y por lo tanto es importante obtener las reas bajo la funcin de densidad tipo gamma mediante integracin directa. Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideracin particular: Una variable aleatoria tipo gamma que tiene una funcin de densidad con parmetros alfa igual a v entre dos y beta igual a dos se denomina variable aleatoria ji - cuadrada.
Ji - cuadrada se presenta con frecuencia en la teora de la estadstica. El parmetro v se denomina nmero de grados de libertad asociado a la variable aleatoria ji - cuadrada. La funcin de densidad gamma para el caso especial v = 1 se denomina funcin de densidad exponencial.
F " 0;0 e y g
Mat 282
1
ey/ dy X( )
87 8
Pgina 41
f ( y) ! 0
1 y / F e F
En cualquier punto. La funcin de densidad exponencial muchas veces es til en los modelos de duracin de componentes elctricos. Un fusible es un ejemplo de un componente para el cual este supuesto suele cumplirse.
Grafica 1 En funcin a los parmetros
Grafica N 2
Mat 282
P gina 42
Distribucin Beta. La distribucin de probabilidad beta es una funcin de densidad con dos parmetros definida en el intervalo cerrado 0 <= y <= 1. Se utiliza frecuentemente como modelo para fracciones, tal como la proporcin de impurezas en un producto qumico o la fraccin de tiempo que una maquina est en reparacin.
E, F " 0;0 e y e 1
y E 1 (1 y ) F 1 f ( y) ! { B (E , F )
(E , F ) ! y E 1 (1 y) F 1 dy !
X (E )X ( F ) X (E F )
Ntese que la definicin de (y) sobre el intervalo 0<= y <= 1 restringe su aplicacin. Si c<= y <= d, y = (y- c) / (d- c) definir una nueva variable en el intervalo 0<= y <= 1. As la funcin de densidad beta se puede aplicar a una variable aleatoria definida en el intervalo c<= y <= d mediante una traslacin y una medicin en la escala.
La funcin de distribucin acumulativa para la variable aleatoria beta se llama comnmente funcin beta y esta dada por
Mat 282
Pgina 43
F ( y) !
probabilidad continua con un parmetro k que representa losgrados de libertad de la variable aleatoria:
Donde Zson variables de distribucin normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: . se transcribe
Es conveniente tener en cuenta que la letra griega al latn como chi1 y se pronuncia en castellano como ji.2 3 La distribucin
Mat 282
B B
t E 1 (1 t ) F 1 t ! I y (E , F ) B(E , F )
B B
P gina 44
como prueba de bondad de ajuste y en la estimacin de varianzas. Tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta deregresin lineal, a travs de su papel en la distribucin t de Student, y participa en todos los problemas de anlisis de varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin . tra forma de definir la distribucin es la siguiente: Supongamos que
i
tenemos n variables aleatorias normales independientes, X1,..., Xn, con media varianza (i = 1 ... n), la variable definida como
Mat 282
P gina 45
REGRESIN Y CORRELACIN.
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple. "Y es una funcin de X" Y = f(X) Como Y depende de X, Y es la variable dependiente, y X es la variable independiente. En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente.
Mat 282
Pgina 46
REGRESIN SIMPLE.
Son cuando se dan dos variables numricas continuas X e Y, se dice que estn correlacionadas si entre ambas variables hay cierta relacin, de modo que puede predecirse (aproximadamente) el valor de una de ellas conocido el valor de la otra en este sentido decimos que la correlacin es positiva al aumentar una de las variables aumenta tambin otra y negativa en caso contrario
Si queremos predecir el valor de Y a partir de X, decimos que X es el regresor, e Y la variable explicada. Si X e Y no estn relacionas en modo alguno se dice que son incorreladas.
Si X e Y estn correlaciones tiene sentido buscar la formula que permita aproximar una de ellas, digamos Y, conocida la otra. Segn el tipo de frmula que mejor se adapte a los datos, hablamos de correlacin lineal(Y=a+bX),
Mat 282
Pgina 47
REGRESIN M TIPLE. El principio de la regresin multiple, se buscar aislar en una familia de funciones de varios parmetros, una funcin que ''explique'' por la relacin:
Como criterio de seleccin se minimiza sobre todas las funciones de la familia el error cuadrtico definido por:
En ciertos casos clsicos, sabemos resolver explcitamente este problema de minimizacin, y las soluciones estn implementadas en los sistemas de clculo estadstico. Es el caso de los ejemplos que vamos a dar a continuacin. Cuando una respuesta explcita es imposible, se recurre a algoritmos de minimizacin , como el algoritmo del gradiente. Regresi n lineal mltiple.Es la generalizacin directa de la regresin lineal simple del prrafo precedente. Las funciones son afines:
. Si el tamao de la poblacin (n) es inferior o igual a k, el error cuadrticominimal es en consecuencia 0. En la prctica la regresin slo podr ser significativa si es mucho mayor que k.
Mat 282
parmetros
P gina 48
Polinomial. Es cuando varios caracteres son explicativos se puede an realizar una regresin sobre una familia de polinomios en los diferentes caracteres, con grado fijo. Los trminos que hacen intervenir productos del tipo sern
interpretados como trminos de interaccin entre los caracteres explicativos. En la prctica, uno se limita a polinomios de grado 1o 2. Presentamos para dos caracteres explicativos Modelo de orden y , los modelos ms frecuentemente utilizados.
, sin interaccin:
Modelo de orden
, sin interaccin:
Modelo de orden
, con interaccin:
Modelo de orden
, con interaccin:
Potencial. Es aquella en la que la funcin de ajuste sea una funcin potencial del tipo: y = a. xb Tambin en este caso se resuelve linealizando la funcin tomando logaritmos ya que: log y = log a + b log x Considerando las nuevas variables v = log y u= log x resolveramos la regresin lineal entre ellas de forma que si el resultado fuera: v*= A +B u
Mat 282
P gina 49
Exponencial. Es aquella en la que la funcin de ajuste ser una funcin exponencial del tipo y = a*bx La regresin exponencial aunque no es lineal es linealizable tomando logaritmos ya que haciendo el cambio de variable v = log y tendremos que la funcin anterior nos generara:
la solucin de nuestro problema vendra de resolver la regresin lineal entrev x, y una vez obtenida supuesta sta: v* = A + B x ; obviamente la solucin final ser: a = antilog A y b = antilog B.
Logartmica. La curva logartmica es tambin una recta, pero en lugar de e , est referida a ya
Multinomial. La regresin multinomial analiza datos distribuidos binomial mente dela forma donde los nmeros de ensayos Bernoulli ni son conocidos y las probabilidades de xito pi son desconocidas. Un ejemplo de esta distribucin es el porcentaje de semillas (pi) que germinan despus de que ni son plantadas.
Mat 282
P gina 50
El modelo es entonces obtenido a base de lo que cada ensayo (valor de i) y el conjunto de variables explicativas/independientes puedan informar acerca de la probabilidad final. Estas variables explicativas pueden pensarse como un vector Xi k-dimensional y el modelo toma entonces la forma
Los logits de las probabilidades binomiales desconocidas (i.e., los logaritmos de los odds) son modeladas como una funcin lineal de los Xi.
Note que un elemento particular de Xi puede ser ajustado a 1 para todo i obtenindose desconocidos
j
un intercepto en
el
modelo.
Los
parmetros
en el log odds ratio para una unidad de cambio en la jsima variable explicativa. En el caso de una variable explicativa dicotmica, por ejemplo gnero, e es la estimacin del odds ratio de tener el resultado para, por decir algo, hombres comparados con mujeres. El modelo tiene una formulacin equivalente dada por
Esta forma funcional es comnmente identificada como un "perceptrn" de una capa simple orred neuronal artificial de una sola capa. Una red neuronal de una sola capa calcula una salida continua en lugar de una funcin por pedazos. La derivada de pi con respecto a X = x1...xkes calculada de la forma general:
Mat 282
Pgina 51
ESTADSTICA INFERENCIAL Valores Esperados y Momentos. Valores Esperados El valor esperado es un concepto fundamental en el estudio de las distribuciones de probabilidad. Desde hace muchos aos este concepto ha sido aplicado ampliamente en el negocio de seguros y en los ltimos veinte aos ha sido aplicado por otros profesionales que casi siempre toman decisiones en condiciones de incertidumbre. Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que sta puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos. Es un promedio ponderado de los resultados que se esperan en el futuro. Sea X una Variable Aleatoria que toma valores en un conjunto discreto (en un conjunto finito de nmeros en uno infinito como: los naturales, los enteros o los racionales), por ejemplo si la variable aleatoria X toma los siguientes valores: X = 0, 1, 2, 3, decimos que es discreta La probabilidad de que X tome cada uno de sus valores viene dada por la funcin de probabilidad: P(X = i ), para i = 0, 1, 2, 3, ; Sea P(X = i ) = pi para i = 0, 1, 2, 3, Se tiene que p1 + p2 + p3 ++ pn + =1 13. Valor Esperado, Varianza y Desviacin Estndar de Variables Aleatorias Se define el Valor Esperado de una Variable Aleatoria con distribucin discreta como: = E(X) = x xf (x)
Y para una variable aleatoria con distribucin continua como = E(X) = ( ) xf x dx Momento
Mat 282
Pgina 52
En estadsticael momentode orden k de una variable aleatoriaX es la esperanza matemticaE[(X E[X])k] donde E es el operador de la esperanza. Si una variable aleatoria no tiene media el momento es indefinido. Normalmente la letra griega para el momento central es . El primer momento central es cero y el segundo se llama varianza ( ) donde es la desviacin
estndar. El tercer y cuarto momentos centrales sirven para definir los momentos estndar denominados de asimetr y de curtosis. a
DistribucionesContinuasEspeciales. 1. Funci n de distribuci n acumulada (fda) La funcin de distribucin acumulada (FDA) de una variable aleatoria continua X, es el modelo terico de la curva de frecuencias acumuladas que se espera obtener para X. La probabilidad de que una variable aleatoria continua X, asuma un valor menor o igual a xi, se llama FDA y se representa por: F (x) = P (X " xi)
y y y
Para a < b : P (a " x " b) = F (b) - F (a) F (-") = P (x " -") = 0 F (+") = P (x " +") =1
Mat 282
P gina 53
2. Distribuci n normal est ndar Una distribucin de una variable aleatoria normal con media, = 0 y varianza, =1, se llama distribucin normal estndar y es el miembro ms importante de la familia de distribuciones normales. Esta distribucin se obtiene creando una variable aleatoriaZ Cada valor z es el nmero de desviaciones estndar separado de la media.
Distribuci n normal Multivariante En probabilidad y estadstica, una distribucin normal Multivariante, tambin llamada distribucin gaussiana Multivariante, es una generalizacin de la distribucin normal unidimensional a dimensiones superiores.
Caso general
Un vector aleatorio
Mat 282
est normalmente
P gina 54
tal que
Hay un vector y una matriz semidefinida positiva simtrica tal que la funcin caracterstica de X es
Si
donde
la distribucin normal si es un escalar (es decir, una matriz 1x1). El vector en estas circunstancias es la esperanza de X y la matriz
es la matriz de covarianza de las componentes Xi. Es importante comprender que la matriz de covarianza debe ser singular (aunque no est as descrita por la frmula de arriba, para la cual definida). Este caso aparece con frecuencia en estadstica; por ejemplo, en la distribucin del vector de residuos en problemas ordinarios de regresin lineal. Ntese tambin que los Xi son en general no independientes; pueden verse como el resultado de aplicar la transformacin lineal Aa una coleccin de variables normales Z. Esta distribucin de un vector aleatorio X que sigue una distribucin normal multivariante puede ser descrita con la siguiente notacin: 1 est
Mat 282
P gina 55
Inferencia Estadstica. La inferencia estadstica o estadstica inferencial es una parte de la Estadstica que comprende los mtodos y procedimientos para deducir propiedades (hacerinferencias) de una poblacin, a partir de una pequea parte de la misma (muestra).
y y y y y y
La Teora de muestras. La estimacin de parmetros. El Contraste de hiptesis. El Diseo experimental. La Inferencia bayesiana. Los mtodos no paramtricos
Planteamiento del problema Suele iniciarse con una fijacin de objetivos o algunas preguntas como cul ser la media de esta poblacin respecto a tal caracterstica?, se parecen estas dos poblaciones?, hay alguna relacin entre..? En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables, etctera. Se analizan tambin en este punto los medios de los que se dispone y el procedimiento.la poblacin y caractersticas de estudio.
Mat 282
Pgina 56
Prueba Estadstica de una Hiptesis. El problema del contraste de hiptesis consiste bsicamente en comprobar cotejar, decidir, en definitiva, sobre la veracidad de una hiptesis prefijada previamente como supuestamente cierta. En trminos estadsticos, la o las hiptesis que formulamos lo sern lgicamente sobre la poblacin. Bien afectando a algn parmetro de sta, lo que da origen a los contrastes paramtricos o bien a otras caractersticas de la mismas que no lo sean estrictamente, lo que origina contrates "no" paramtricos. La solucin estadstica del problema de contrastacin se basar en los datos mustrales y la base estadstica (probabilstica) de la que arrancar el contraste, de algn estadstico muestral. Pasemos a definir los principales conceptos implicados en nuestro problema: Regin crtica: Ser aquella regin del campo de variacin del estadstico tal que si contiene al valor evaluado del mismo con los datos mustrales nos llevar a rechazar la hiptesis. La designaremos por R 1 Regin de aceptacin: Es la regin complementaria de la anterior. Si el valor evaluado del estadstico pertenece a ella No rechazamos la hiptesis (las hiptesis nunca se aceptan de forma definitiva, slo se aceptan
provisionalmente, es decir, no se rechazan, a la espera de una nueva informacin que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0. Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.
Una hiptesis estadstica (paramtrica): Es una conjetura sobre el valor concreto que tiene en realidad. El establecer una hiptesis sobre un parmetro H0, supone dividir los posibles valores del parmetro en dos grupos disjuntos tales que unos son hipotticamente ciertos (H0) y los otros (H1) no lo son. A la hiptesis que se desea contrastar se la denomina "hiptesis nula", siendo, por tanto, el valor o valores H0 que hipotticamente consideramos reales, dicha
Mat 282
Pgina 57
hiptesis viene expresada como H0. Alternativamente y consecuentemente se establece la denominada "hiptesis alternativa" (H 1) compuesta sta por el valor o valores
1
los de la hiptesis nula, son los que, en principio, no co nsideramos cmo hipotticamente reales.
El hecho de que las hiptesis, tanto la nula cmo la alternativa puedan recoger en sus planteamientos uno o varios valores, da lugar a hiptesis de carcter simple, si el nmero de valores plausibles e hipotticos es de uno en ambas, o bien a hiptesis compuestas si dicho valor no es nico en alguna de ellas.
Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hiptesis puede plantearse como un problema de decisin, en el que evidentemente existe la posibilidad de fracasar o acertar en la eleccin o decisin a la hora de concluir que la hiptesis, bien nula o bien alternativa, son rechazables o no.
El problema de decisin: rechazo/no rechazo, vendra expresado en las siguientes opciones en forma de tabla:
Procedimiento para una prueba de hiptesis Los pasos a seguir son: 1. Formular la hiptesis nula H 0 y la alternativa H1, de acuerdo al problema. 2. Escoger un nivel de significacin o riesgos . 3. Elegir la estadstica de prueba apropiada, cuya distribucin por muestreo sea conocida en el supuesto de que Ho es cierta. 4. En base a H0 y H1, determinar el valor (o los valores) crticos y con ello se establecen las regiones de aceptacin o rechazo. 5. Calcular los valores de la prueba estadstica a partir de una muestra aleatoria de tamao n, Ho y reemplazarlos en la estadstica de prueba elegida en el paso 3, para hallar el valor experimental. 6. Tomar la decisin de aceptar Ho si el valor experimental cae en la regin de aceptacin y rechazarla si dicho valor cae en la regin crtica o de rechazo. 7. Opcional: Si se rechaza H0, se puede hallar un intervalo de confianza para el parmetro de inters. As: conocemos que de forma que la hiptesis nula es H0 De modo que la forma estadstica seria: :. de lo que deducimos que
Mat 282
Pgina 59
Distribucin de la Varianza La distribucin de la varianza de una distribucin se representa mediante define por
y se
] dondef(X) representa a la funcin de probabilidad y a la funcin densidad de probabilidad, respectivamente, de la variable aleatoria. Claramente 0 porque , para todo X, y
, para todo X.
En palabras, la varianza es una medida de dispersin o variabilidad que no tiene interpretacin fsica ya que est en unidades cuadradas. Si en las frmulas anteriores desarrollamos el cuadrado del binomio y aplicamos propiedades de las sumatorias (integrales) se llega a una expresin ms conveniente para realizar los clculos
Anlisis de la Varianza e Intervalos de Confianza. 1. Analisis de la varianza El anlisis de varianza es una prueba que nos permite medir la variacin de las respuestas numricas como valores de evaluacin de diferentes variables nominales. La prueba a realizar es de s existe diferencia en los promedios para la los diferentes valores de las variables nominales; esta prueba se realiza para variables donde una tiene valores nominales y la otra tiene valores numricos.
Mat 282
Pgina 60
En el siguiente ejemplo, se tiene la calificacin de una prueba a personas con diferentes grados de escolaridad, lo que se intenta es probar si existe o no diferencia entre el grado escolar (variable nominal ) y el promedio de la calificacin ( variable numrica ). Para analizar si existe diferencia en los promedios se procede a realizar una prueba F que se explica posteriormente.
2. Intervalo de confianza En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1 y se denomina nivel de confianza. En estas circunstancias, es el
llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilid ades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad de Chebyshov. En definitiva, un intervalo de confianza al 1 un parmetro poblacional por ciento para la estimacin de
tal que P[
2]
=1- ,
Mat 282
Pgina 61
Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:2 Pero adems, si el tamao de las muestras es lo suficientemente grande,3 la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin:
En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones.
Aplicaciones de chi - cuadrado La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student.
Mat 282
P gina 62
Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .
Regresin y Correlacin Multivariante. Con la Regresin Lineal Simple analizamos si puede admitirse o no una relacin de tipo lineal entre la variable independiente X y la dependiente Y . No obstante, lo habitual es que la variable dependiente trate de expresarse en funcin de varias variables independientes X1 , X2 , ... , Xk tambin de forma lineal Y = a + b1 X1+ b2 X2+ ... + bkXk El propsito ahora de Regresin Lineal Mltiple sigue siendo, por un lado, determinar cules de las covariables independientes X1 , X2 , ... , X k son significativas a la hora de explicar a la variable dependiente y, luego, estimar los parmetros b1 , b2 , ...,bk Con la Correlacin Multivariante estudiaremos el grado o fuerza de esa relacin; primero, con la Correlacin Mltiple el grado de la relacin existente entre la variable dependiente y las covariables independientes y, luego, con la Correlacin Parcial, la fuerza de la relacin existente entre dos variables determinadas, una vez eliminada la influencia de las dems. Ambos anlisis estn basados, fundamentalmente, en tests de hiptesis en los que la suposicin de normalidad de las variables en estudio, es fundamental, por lo que, en caso de que no pueda admitirse dicha suposicin, la utilizacin de Mtodos Robustos, se hace imprescindible.
Mat 282
Pgina 63
Distribuciones No Paramtricas. Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre. En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin.
Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no para mtricas. El parmetro de centralizacin es la mediana, que es aquel punto para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.
Mat 282
Pgina 64