Вы находитесь на странице: 1из 64

Alumno: Siles Cahuasiri A.

Ludwin
ndice 1. Estadstica Descriptiva. 1.1. Distribuciones de Frecuencias. 1.2. Medidas de Concentracin. 1.3. Medidas de Dispersin. 2. Probabilidad. 2.1. Probabilidad Simple. 2.1.1. Teora de Conjuntos. 2.2. Distribuciones de Probabilidad. 2.2.1. Distribuciones Discretas y Continuas.
          

Carrera: Ing. En Sistemas

Distribucin de Bernoulli. Distribucin Binomial. Distribucin de Poisson. Distribucin Geomtrica Distribuciones Hipergeomtrica. Distribucin Normal. Distribucin T de Student. Distribucin F de Fisher. Distribucin Gama. Distribucin Beta. Distribucin Chi Cuadrado.

3. Regresin y Correlacin. 3.1. Regresin Simple. 3.2. Regresin Mltiple.


    

Polinomial. Potencial. Exponencial. Logartmica. Multinomial.

4. Estadstica Inferencial. 4.1. Valores Esperados y Momentos. 4.2. Distribuciones Continuas Especiales. 4.3. Distribucin Normal Multivariante. 4.4. Inferencia Estadstica. 4.5. Prueba Estadstica de una Hiptesis. 4.6. Distribucin de la Varianza 4.7. Anlisis de la Varianza e Intervalos de Confianza. 4.8. Aplicaciones de Chi Cuadrado. 4.9. Regresin y Correlacin Multivariante. 4.10. Distribuciones No Paramtricas.

Mat 282

Pgina 1

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

ESTADSTICA DESCRIPTIVA
DISTRIBUCIN DE FRECUENCIAS. Definicin.La Distribucin de Frecuencias se trata de organizar cierta informacin en clases o categoras donde se determina el nmero de datos que pertenecen acada uno de ellos ocomo un arreglo tabular de datos que muestren sus respectivas frecuencias. Donde se puede generar dos tipos de distribuciones las cuales son:
 Distribuciones de frecuencias de Variables Discretas  Distribuciones de frecuencias de Variable Continuas

Distribuciones de Frecuencias de Variables Discretas. En este tipo de distribuciones es considerado en funcin al tipo de variable con el cul se est trabajando, es decir, se considerar a todas las variables como variables discretas, por ejemplo:
 Cantidad de objetos vendidos  Nmero de alumnos de la clase.  Numero de clientes en una tienda.  Nmero de accidentes en una autopista.  Cantidad de libros en una biblioteca.  Piezas defectuosas de un determinado lote recibido.

Al generar la distribucin de frecuencias se deber tomar en cuenta intervalos determinados, por ejemplo:

la variable discre ser:

que en este caso ser el numero de errores que existe

en una cierta cantidad de libros.

Mat 282

Pgina 2

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

N de errores 0 1 2 3 4 5

N de pginas 2 4 6 13 20 35

Es tambin posible analizar el numero de clientes que entran a una tienda en un determinada hora

N de clientes 15 18 25 . . 61

Hora de atencion 09:00-11:00 11:00-13:00 13:00-15:00 . . 20:00-22:00

Distribucin de frecuencias variables continuas En la distribucin de Variables Continuas es en la que se asumen valores reales, es decir se trabaja con:
Mat 282 Pgina 3

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

 El peso de alumnos en una clase  La utilidad de las empresas en el ramo metalrgico  El tiempo de duracin de un transformador  El tiempo de duracin de una carrera

Este tipo de distribucin es el ms usual en la estadstica Recomendaciones Para realizar esta distribucin se debe seguir una serie de recomendaciones que son
 Ordenar los datos en forma creciente o decreciente para su respectivo

anlisis
 Escoger al azar la cantidad de datos  A la diferencia del Valor Maximo menos el Valor Mnimo se le llama

Rango
 Determinar el nmero de intervalos de la clase

Rango Es la diferencia de entre el mximo valor y el minimo

Numero de intervalos de clase Para hallar el nmero de intervalos de la clase se siguen tres reglas fundamentales Se utiliza la regla de sturges que nos dice que el nmero de intervalos de clase es el numero entero ms prximo a la relacin:


Donde n es la cantidad de observaciones que hay, por ejemplo si en curso A hay 20 alumnos, en el curso B hay 34 y en el curso C hay 46 alumnos n tomara el valor de n=20+34+46 de modo que n =100.

Mat 282

Pgina 4

Alu

iles

hu siri A. Lu wi

Carrera: . E Sistemas I

Ya una vez calculado el nmero de intervalos de clase, el resultado se debe redondear bajo las normas de redondeo.

Recorri o El recorrido es la diferencia del valor mximo y el valor mnimo mas uno

Se utiliza el uno si se trabaja con nmero enteros y si se trabaja con variables continuas no se considera el nmero 1.

V lor o magnit

de la clase

que es la divisi n del recorrido con el nmero de intervalos de clase

Se debe redondear el resultado al mismo nmero de cifras si nificativas que los datos observados

uego de hallar todos los datos anteriores se genera un segmento donde se

determina valores de cada intervalo de clase y se expre de la siguiente forma sa

Es importante sealar que si X k+1 es menor a xn o si el mximo valor determina es menor al mximo valor obtendo en forma experimental, se debe incrementar el valor de la magnitud de la clase c considerando el numerode cifras significativas dee los datos observados , hasta que el mximo valor determinado se mayor al mximo valor obtenido en forma experimental

Mat 282

i a5

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Excedente Una ves que X k+1 cumpla la condici n se halla el excedente. El excedente es la diferencia entre el valor mximo determinado y el valor mximo obtenido se expresa de la siguiente forma

uego se analiza el excedente, es decir si el excedente es par, se divide entre 2 y

el segmento se recorrer hacia la izquierda en una magnitud equi alente a e/2, y v si el excedente es impar, se buscara la simetra y el segmento se recorrer hacia la izquierda en el menor nmero determinado.

De este segmento generado se genera la distribuci n de frecuencias

Son todos los datos experimentales distribuidos simtricamente respecto a los valores mximo y mnimo de los datos obtenidos en forma experimental Intervalos de clase Y1 Y 2-i Y2 Y 3-i Y3 Y -i Y Y 5-i Y5 Y 6-i . . . . Yk Y k+1-i Conteo n1 n2 n3 n n5 . . nk Frecuencia fi f1 f2 f3 f4 f5 . . fk

Donde i es la unidad.
Mat 282 P gina 6

Distri

ci n de frecuencias

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Conteo Consiste en colocar la cantidad de valores o datos que pertenecen a cada categora, clase o intervalo de clase, que corresponder al valor de la frecuencia de los intervalos de clase.

Frecuencia fi Es la cantidad de valores que pertenecen a cada intervalo de clase o categora. Para cada caso los datos dentro del intervalo de clase deben ser distribuidos uniformemente.

Limites verdaderos de clase. Se determina el valor medio entre el prime y segundo intervalo de clase luego se determina el valor medio entre el segundo y el tercer intervalo, hasta terminar con todos los intervalos de modo tal que se los denomina limites verdaderos de clase se expresa de la siguiente forma:

Limites verdaderos de clase(L.V.C) Y 1Y2Y 3Y 4. . YK[) Y 2 Y 3 Y 4 Y 5 . . YK+1

Frecuencia fi f1 f2 f3 f3 . . fk

Mat 282

Pgina 7

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Histograma de frecuencia Es la representacin grfica de la distribucin de frecuencias lo cual se lo realiza utilizando los ejes coordenados, donde en el eje de la x o abscisas se colocan los limites verdaderos de la clase y al eje de la y se colocan las frecuencias

fi

L.V.C

Marcas de clase Las marcas de clase son los valores representativos de cada intervalo de clase, osea el valor medio de los Limites Simples de Clase o Limites verdaderos de clase y se lo denota como Xi Marcas de Clase Xi X1 X2 X3 . . Xk frecuencia fi f1 f2 f3 . . fk

Mat 282

Pgina 8

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Polinomio de Frecuencias Es la representacin grafica de la frecuencia fi Vs las marcas de clase, tiene las mismas caractersticas que el histograma de frecuencias pero esta vez en el eje x se coloca las marcas de clases Xi y en el eje de la y la frecuencia fi

fi

Xi

Distribucin de Frecuencias Relativas Es la cantidad de valores que se encuentra en cada intervalo de clase respecto a la cantidad total de valores observados como: Limites Verdaderos de Clase Y1 Y2 Y3 . . . YK[ Y2 Y3 Y4 . . . YK+1 ) Frecuencia fr % (F1/n)*100=fr1 (F2/n)*100=fr2 (F3/n)*100=fr3 . . . (Fk/n)*100=frk

Mat 282

Pgina 9

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Histograma de Frecuencias Relativas es la representacin grafica de los Limites Verdaderos de Clase Vs la Frecuencia fr% y tiene las mismas caractersticas que las anteriores, solo que esta vez en el eje y se coloca la fr% y lo mismo en el eje de la x se coloca los L.V.C

%fr

L.V.C

Distribucin de Frecuencias relativas con Marcas de clase Marcas de Clase Xi X1 X2 X3 . . Xk Polinomio de frecuencias relativas Frecuencia fr fr1 fr2 fr3 . . fr k

% fr

Xi

Mat 282

Pgina 10

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin de Frecuencias acumuladas menor que La distribucin acumulada de frecuencias sirve para conocer el total de las observaciones que existen desde la primera clase hasta una categora determinada, como: Frecuencia Acumulada Datos observados menores que Datos observados menores que Datos observados menores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.

Polinomio de Frecuencias Acumuladas menores que fa

L.V.C

Distribucion de Frecuencias Acumuladas mayor que Frecuencia Acumulada Datos observados mayores que Datos observados mayores que Datos observados mayores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.

Mat 282

Pgina 11

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Polinomio de Frecuencias Acumuladas mayor que

fa

L.V.C

Distribucin de Frecuencias Acumuladas relativas mayor que Frecuencia Acumulada Relativa Datos observados mayores que Datos observados mayores que Datos observados mayores que Y1 Y2 Y3 . Yk+1 fa r1. fa r2. fa r3. . fark.

Polinomio de Frecuencias Acumuladas relativas mayor que

% fa r

L.V.C

Mat 282

Pgina 12

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin de Frecuencias Acumuladas relativas menor que Frecuencia Acumulada Relativa Datos observados menores que Datos observados menores que Datos observados menores que Y1 Y2 Y3 . . Yk+1 fa1. fa2. fa3. . . fa k.

Polinomio de Frecuencias Acumuladas relativa menor que

% fa r

L.V.C

Mat 282

Pgina 13

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

MEDIDAS DE CONCENTRACION Las medidas de concentracin son valores representativos, se trata de valores que generan una representacin de un conjunto de datos obtenidos en un determinado experimento. Las medidas de concentracin son las siguientes:

Media Aritmtica La media aritmtica de un conjunto de nmeros, x1, x2, x3 ,x4..xn se denota por de modo que la ecuacin para hallar la media aritmtica es la siguiente:

la media aritmtica es igual a la suma de todos sus valores entre la cantidad de valores n= a la cantidad de valores que se estn sumando si los nmeros estn organizados en una distribucin de frecuencias la media aritmtica seria la siguiente:

Donde la suma de las frecuencias es equivalente a la cantidad total de valores observados, Se puede usar cualquiera de las dos ecuaciones para hallar la media aritmetica Propiedades La Suma Algebraica de las Desviaciones de un conjunto de nmeros, respecto de su Media Aritmtica, es siempre igual a cero.

Mat 282

Pgina 14

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

La Mediana. Es un valor representativo y se lo puede determinar como el valor que se encuentra en el centro de una serie de valores, siendo estos ordenados en forma creciento o decreciente. Si la cantidad que se analiza de los valores es par, la mediana ser el valor medio de los dos valores que se encuentra en el centro de esa serie de valores Ejemplo: 12, 25 , 34 , 55, 60, 75, 90, 95, 98, 100, 112 La cantidad de valores es =11, es impar de modo que la mediana es el numero del medio La mediana = 75 Si se analiza la distribucin de frecuencia la mediana se calcula de la siguiente forma:

Lm: Es el lmite verdadero de clase inferior de la Clasemediana. La Clase Mediana es aquel intervalo donde su frecuencia acumulada es Equivalente a la mitad de los valores observados. n/2: fl: La mitad de los datos observados. Frecuencia acumulada por debajo de la Clase Mediana, tambin se podra decir que es igual a la suma de las frecuencias hasta el limite de fm. fm: c: Frecuencia de la Clase Mediana. La magnitud del intervalo de clase

Mat 282

Pgina 15

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

La Moda La Moda es un conjunto de nmeros obtenidos en forma experimental , es aquel valor que ocurre con mayor frecuencia. Ejemplo: el valor mas frecuente de los siguientes nmeros es: 12, 25, 28, 28, 55, 60, 75, 90, 95 Moda = 28

La moda puede no existir o incluso no ser la nica en caso de existir. En una Distribucin de Frecuencias La Moda se determina de la siguiente forma:

Lm: Limite real inferior o limite verdadero de clase inferior de la Clase Modal. Clase Modal. Es aquel intervalo de clase que tiene Mayor Frecuencia. : Es la diferencia de la frecuencia de la Clase Modal sobre la frecuencia de la clase Contigua Inferior. : Es la diferencia de la frecuencia de la Clase Modal sobre la frecuencia de la clase Contigua Superior. C: Magnitud del Intervalo de clase

Mat 282

Pgina 16

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

La Media Geomtrica La media Geomtrica se denota como G, de un conjunto de nmeros x1, x2, x3,.xn, es la razensima del producto de estos numerode modo que la ecuacin es la siguiente:

Donde se simplifica:

Cuando la cantidad de valores que se esta analizando son muy grandes y los valores altos. Entonces se utiliza la propiedad de logaritmos de la siguiente manera:
  

Simplificando se llega a:

La Media Armnica La media armnica, lo denotamos como H de un conjunto de nmeros x1, x2, x3, xn, es la recproca de la Media Aritmtica de los reciproco de esos Nmeros. de modo que su ecuacin es la siguiente

Mat 282

Pgina 17

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Media Cuadrtica Es un conjunto de nmeros x1, x2 ,x3, x4, xn, la formula para hallar la Media Cuadrtica se halla de la siguiente forma

Cuartil Si a una serie de datos se colocasen en orden creciente de acuerdo a su magnitud, el valor medio que divide al conjunto de datos en dos partes iguales es la Mediana. De ese modo los valores que dividen a los datos son cuatro partes iguales, a estos valores se les denomina Cuartiles y se los escribe como Q1, Q2 y Q3.sus nombres son Primer Cuartil, Segundo Cuartil y Tercer Cuartil como se dijo al comienzo el segundo cuartil corresponde al valor de la mediana

Decil Para los deciles se utiliza el mismo principio de los valores que dividen a los datos observados en diez partes iguales de modo que se los denomina deciles y se los representa de la siguiente forma: D1, D2, D3,D4,D5,D6,D7,D8, D9. Como en el caso del Q2 corresponde al valor de la mediana el D5.

Mat 282

Pgina 18

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Percentil De la misma forma la cantidad de valores que dividen a este conjunto de datos son cien partes iguales y son representadas de la siguiente formar: P1, P2, P3, P4,P99. Como se mostr en el cuartil Q2 y en el decil D5, el percentil P50 corresponder al valor de la Mediana y los Percentiles P25, P75 corresponder al Q1 y Q3 respectivamente.

Mat 282

Pgina 19

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

MEDIDAS DE DISPERSIN Se trata de las medidas que nos permiten determinar el grado de variacin se tiene con los datos que se estn trabajando respecto a una medida referencial Desviacin Media Es el promedio de desviacin de cada valor respecto de la Media Aritmtica. Si se cuenta con una serie de valores como por ejemplo x1, x2, x3,xn, la desviacin de cada uno de los valores seria promedio de todas las desviaciones va a ser:, ,. de modo que el

Si se trabaja con una distribuion de frecuencias seria de la siguiente forma

Donde n es la suma de las frecuencias

Desviacin Estndar Se determina cuando se tiene un conjunto de nmeros por ejemplo: x1, x2, x3,xn, se denota por y se define como la Media Cuadratica de las deviaciones dee cada valor respecto a la Media Aritmetica:

Si se trabaja con una distribucin de frecuencias la ecuacin es de la siguiente forma:

Mat 282

Pgina 20

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Donde n seria la sumatoria de sus frecuencias.

La Varianza Es el cuadrado de la DesviacionEstandar y se denota con hallar la Varianza es la siguiente: , la ecuacin para

Si se trabaja con una distribucin de frecuencias la ecuacin seria la siguiente:

Como se dijo anteriormente n seria la sumatoria de todas las frecuencias.

Rango El rango es una medida de dispersin tomando en cuenta la diferencia del valor mximo con el valor mnimo

Rango SemiIntercuartilico Es la diferencia entre el tercer cuartil y el primero entre 2, la ecuacin es la siguiente

Mat 282

Pgina 21

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Rango SemiPersentil Es la desviacin entre el percentil 10 y el percentil 90 entre dos se podra hallar el Rango Semi Percentil con otros percentiles pero con el percentil 10 y 90 nos da una mayor aproximacin que con los otros su ecuacin es la siguiente

Se lo llama Rango de Percentiles.

Coeficiente de variacin

Donde la desviacin absoluta es la desviacin estndar , y el promedio es la media , a la desviacin relativa se la denomina como coeficiente de variacin

y se lo denota por V su ecuacin es la siguiente:

Pero se la expresa en forma de porcentaje de modo que la ecuacin seria la siguiente

Mat 282

Pgina 22

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

PROBABILIDAD.
Es el estudio de experimentos aleatorios o elementos libres de determinacin. Es decir, si se tiene un suceso denotado por E y existe n casos posibles n oportunidades, para todos estos con la misma posibilidad o factibilidad, entonces puede presentarse solo en h de todos los casos.

PROBABILIDAD SIMPLE. Teora de Conjuntos La Teora de Conjuntos es una divisin de las matemticas que estudia las propiedades y relaciones de los conjuntos. El concepto de conjunto es intuitivo y se podra definir como una "agrupacin bien definida de objetos no repetidos y no ordenados"; as, se puede hablar de un conjunto de personas, ciudades, gafas, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto est bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolgrafos azules est bien definido, porque a la vista de un bolgrafo se puede saber si es azul o no. El conjunto de las personas altas no est bien definido, porque a la vista de una persona, no siempre se podr decir si es alta o no, o puede haber distintas personas, que opinen si esa pers ona es alta o no lo es. Se entiende por conjunto a la agrupacin en un todo de objetos bien diferenciados de nuestra intuicin o nuestro pensamiento.

Notacin Usualmente los conjuntos se representan con una letra mayscula:

Se llama elemento a cada uno de los objetos que forman parte de un conjunto, estos elementos tienen carcter individual, tienen cualidades que nos permiten

Mat 282

Pgina 23

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

diferenciarlos, y cada uno de ellos es nico, no habiendo elementos duplicados o repetidos. os representaremos con una letra minscula:

De esta manera, si escribir:

para definir a tal conjunto A. Esta notaci n empleada para definir al conjunto A se llama notaci n por extensi n.

Para representar que un elemento pertenece a un conjunto " en ", " pertenece a " o bien " de se escribe

es un elemento de ". a negaci n

y se lee de la siguiente forma " no pertenece a

El conjunto universal, que representaremos como U(u mayscula), es el conjunto de todas las cosas sobre las que estemos tratando. As, si hablamos de nmeros enteros entonces Ues el conjunto de los nmeros enteros; si hablamos de ciudades, U es el conjunto de todas las ciudades. Todos los elementos posibles estn en este conjunto:  Este conjunto universal puede mencionarse explcitamente, o puede darse por supuesto segn el contexto que estemos tratando. Existe adems, un nico conjunto que no tiene elementos, al que se le llama conjunto vaco y que se denota por , esto es: .

a caracterstica

Mat 282

P gina 24

es un conjunto, y a,b,c,d,etodos sus elementos, es comn

, escribimos

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

importante de este conjunto es que todos los elementos posibles no estn contenidos en l:  Por otro lado, si todos los elementos de un conjunto satisfacen alguna

propiedad, misma que pueda ser expresada como una proposici np(x), con la indeterminada x, usamos la notaci n por comprensi n, y se puede definir:

o anterior se lee "A es el conjunto de elementos x, que cumplen la propiedad

p(x)". El smbolo ":" se lee "que cumplen la propiedad" o "tal que"; este smbolo puede ser remplazado por una barra /.   Por ejemplo, el conjunto:

Puede definirse por:  Donde el smbolo N representa al conjunto de los nmeros naturales.

Igualdad de conjuntos Dos conjuntos A y B se dicen iguales, lo que se escribe A = B si constan de los mismos elementos. Es decir, si y solo si todo elemento de A est tambin contenido en B y todo elemento de B est contenido en A. En smbolos:   

Mat 282

P gina 25

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Subconjuntos Un subconjunto es un Conjunto que consta de elementos en el cual cada elemento que posee esta tambin en otro conjunto como en elgrafico

Diagrama de Venn que muestra

Un conjunto A se dice que es subconjunto de otro B, si cada elemento de A es tambin elemento de B, y se denota .y se lee de la siguiente forma el   

conjunto A es un subconjunto de B Es decir:

Cabe sealar que, por definici n, no se excluye la posibilidad de que si A B, se cumpla A = B. Si, siendo A un subconjunto de B, B tiene por lo menos un elemento que no pertenezca al conjunto A, entonces decimos que subconjunto propio de B, lo que se representa por   Operaciones con conjuntos Uni n Es la uni n de los elementos que tienen esos conjuntos por ejemplos en el grafico esta pitado de celeste todos los elementos de A y B es la uni n de esos conjuntos . Es decir es un

Mat 282

"

"

P gina 26

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Esto significa que

si y slo si

Diagrama de Venn que ilustra   Para cada par de conjuntos A y B existe un conjunto unin de los dos, que se denota como el cual contiene todos los elementos de A y de B.
       

Interseccin


Son los elementos que se encuentran en un conjunto y a la vez en otro Esto significa que si y slo si y

Los elementos comunes a A y B forman un conjunto denominado interseccin de A y B, representado por


 

Diagrama de Venn que ilustra  . Es decir,


 

es el conjunto que contiene a




todos los elementos de A que al mismo tiempo estn en B:


   

Mat 282

Pgina 27

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Diferencia Los elementos de un conjunto A que no se encuentran en otro conjunto B, forman otro conjunto llamado diferencia de A y B, representado por Lo que significa que  A B si y slo si 
   

. Es decir:

y  A

.

Complemento El complemento de un conjunto A es el conjunto de todos los elementos que no pertenecen a A.

El conjunto complemento siempre lo es respecto al conjunto universal que estamos tratando, esto es, si hablamos de nmeros enteros, y definimos el conjunto de los nmeros pares, el conjunto complemento de los nmeros pares es el formado por los nmeros impares. Si estamos hablando de estudiantes y se define al conjunto a los estudiantes que han pasado la materia de probabilidad II, el conjunto complementario es el de los estudiantes que reprobaron la materia.

Mat 282

Diagramas de Venn que muestran A

ByB

A respectivamente.

Pgina 28

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Diagrama de Venn que ilustra el complemento de A, AC.

Diferencia simtrica La diferencia simtrica de dos conjuntos A y B viene dada por los elementos que pertenecen a uno y slo uno de los dos:
       

Diagrama de Venn que ilustra la diferencia simtrica de A y B, A B.

Mat 282

Pgina 29

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

DISTRIBUCIONES DE PROBABILIDADES En teora de la probabilidad y estadstica, la distribucin de probabilidad de una variable aleatoria es una funcin que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribucin de probabilidad est definida sobre el conjunto de todos los eventos rango de valores de la variable aleatoria. Cuando la variable aleatoria toma valores en el conjunto de los nmeros reales, la distribucin de probabilidad est completamente especificada por la funcin de distribucin, cuyo valor en cada real x es la probabilidad de que la variable aleatoria sea menor o igual que x. DISTRIBUCIONES DISCRETAS Y CONTINUAS. Distribucin de Bernoulli. El experimento de Bernoulli es aquel en el que interesan solamente dos resultados: El evento A ocurre o no ocurre, algunos ejemplos de esta prueba incluye el lanzamiento de una moneda, la prueba de un producto sano o defectuoso o tambin el sexo de una persona que puede ser hombre o mujer, lo cual se trata de una misin de xito o de fracaso. La funcin indicadora de un evento es una variable aleatoria de Bernoulli

1 --- xito X(w)=

(el evento A ocurre)

0 --- fracaso (el evento A no ocurre) Por lo tanto el espacio muestral de la distribucin de Bernoulli (w) es discreto mostrando solamente dos valores, queda definida conociendo la pr obabilidad de A y la probabilidad de A complemento

P(A)=P

X(w):1 0

Mat 282

Pgina 30

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

P(

)=1-p=q

P(w): p q

Donde la variable aleatoria de bernoulli tiene un rango o recorrido de 0 y 1 lo cual resulta en una bicotomica del espacio muestral original Por ejemplo Una urna contiene 4 bolillos blancos y 6 negros. Cuando seleccionamos un bolillo al azar este puede clasificarse como blanco o negro y la variable aleatoria ser 1 --- si el bolillo es blanco X(w)= 0 --- si el bolillo es negro

Distribucin binomial si definimos una variable aleatoria X en el espacio muestral omega asociada a un espacio de probabilidad, se dice que X es binomial si y solo si:

i) r(x)=(0,1,2,3.n)

ii) P(x=x) =

Condiciones para emplear la distribucin binomial a) El experimento aleatorio tiene un carcter dicotmico y puede ser repetido independientemente mil veces, por tanto si A es el experimento aleatorio entonces la probabilidad de A es igual a p es decir: P(A)=p P( )=1-p=q )=q permanecen constantes para todas y

b) Las probabilidades(A)=p y P( cada una de las repeticiones

c) La variable aleatoria X denota el nmero de veces que el evento A ocurre

Mat 282

Pgina 31

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Figura es la grfica de una distribuci n binomial(n, 0.5) para n = 20, 40, 60, 80, 100.

Se puede ver la aproximaci n a la distribuci n normal.

Distribuci n de Poisson Se dice que X es una variable aleatoria tipo Poisson si :

 P



Mat 282

&

 

P gina 32

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

En este caso muchos fenmenos aleatorias se explican mediante el manejo de distribucin binomial y Poisson por ejemplo el nmero de llamadas telefnicas que reciben cada da, nmero de accidentes ocurridos

Grfico de la Distribucin de Poisson.

k de eventos un tiempo fijo eventos una frecuencia conocida y son independientes discurrido ltimo evento.

ocurriendo en si estos ocurren con media

del tiempo desde el

Distribuci n geomtrica. En este caso estamos interesados en la concurrencia o no de un evento A y como en el caso de la distribucin binomial para cada repeticin permanecen constantes

Se repite el experimento hasta la ocurrencia de A por primera vez por tanto el numero de repeticiones constituye una variable aleatoria. Asi determinamos la variable aleatoria como el numero de repeticiones requeridas hasta la ocurrencia o primera vez. Entonces la funcin de distribucin de la probabilidad es: ; 

Que se denomina distribucin geomtrica con parmetros P

Mat 282

'

P(A)=p

P(

)= q=1-p

P gina 33

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Grafica de la Distribucin Geomtrica con diferentes probabilidades

Distribuci nhipergeomtrica Esta distribucin se dice que X es una variable aleatoria hipergeometrica si: i) r(x)={0,1,2,3....n}  Donde las variables M y N son enteros positivos y N es mayor o igual a n y N es mayor o igual a M si se considera el problema de elegir una muestra de tamao n de un lote que contiene N objetos de una clase y N-M de otra clase entonces la definicin establece la probabilidad de obtener exactamente x objetos de la primera clase en la muestra

Mat 282

Graficos de la DistribucionHipergeometrica

P gina 34

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin Normal Una variable aleatoria continua X sigue una distribucin normal de media y desviacin tpica si su funcin de densidad es:

De esta forma, una vez que se especifican y la distribucin queda determinada completamente. La distribucin de probabilidad normal tie nen forma de campana (llamada campana de gauss, o curva normal), simtrica (por depender de x a travs del termino proporcional a . Sabemos que la curva de cualquier distribucin continua de probabilidad o funcin de densidad esta construya de forma que el rea bajo la curva limitada por los puntos x = x1 y x = x2 es igual a la probabilidad de que la variable aleatoria X asuma un valor entre x = x1 y x = x2. Como la resolucin de las integrales para cada curva normal no es fcil, es aconsejable utilizar tablas. Para no tener que presentar estas tablas para todos los posibles valores de y se utiliza una variable normal tipificada Z definida como Z = (X .)/ con lo que sustituyendo nos queda la funcin de densidad de X: centrada en y con anchura

La distribucin normal es la distribucin de probabilidad ms importante del Clculo de probabilidades. la importancia de la distribucin normal queda totalmente consolidada por ser la distribucin lmite de numerosas variables aleatorias, discretas y continuas, como se demuestra a travs de los teoremas centrales del lmite. Las consecuencias de estos teoremas implican la casi universal presencia de la distribucin normal en todos los campos de las ciencias empricas.

Mat 282

Pgina 35

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

La distribucin normal queda totalmente definida mediante dos parmetros:  la media (Mu)  la desviacin estndar (Sigma).
Grfico de la distribucin Normal

Grafico N2

Como se puede observar en el 2do grafico la Distribucin Normal y la Binomial tienen una cierta similitud

Distribuci n T de Student. En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de

una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.

Mat 282

P gina 36

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias mustrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. La distribucin t de Student es la distribucin de probabilidad del cociente

Donde:
  

Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes

Si

es una constante no nula, el cocientees una variable aleatoria que sigue

la distribucin t de Student no central con parmetro de no-centralidad . Supongamos que X1,..., Xnson variables aleatorias independientes distribuidas normalmente, con media y varianza 2. Sea

la media muestral. Entonces:

sigue una distribucin normal de media 0 y varianza 1. Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi un cociente relacionado,

Mat 282

Pgina 37

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Donde:

Es la varianza muestral y demostr que la funcin de densidad deT es

donde es igual a n 1. La distribucin de T se llama ahora la distribucin-t de Student. El

parmetro representa el nmero de grados de libertad. La distribucin depende de , pero no de o , lo cual es muy importante en la prctica.

Funcin de distribucin de probabilidad

Mat 282

P gina 38

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin F de Fisher. Usada en teora de de probabilidad y estadstica, continua . la distribucin se la F es conoce

una distribucin

probabilidad

Tambin

comodistribucin F de Snedecor (por George Snedecor) o como distribucin F de Fisher-Snedecor. Una variable aleatoria de distribucin F se construye como el siguiente cociente:

Donde:


U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad respectivamente, y

U1 y U2 son estadsticamente independientes.

La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica, especialmente en el anlisis de varianza. Vase el test F. La funcin de densidad de una F(d1, d2) viene dada por

para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta.

La funcin de distribucin es:

Mat 282

Pgina 39

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Donde I es la funcin beta incompleta regularizada.

Distribuci n Gama. Los tiempos que tardan en revisar un motor de un automvil avin tienen una distribucin de frecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias frecuentemente tienen distribuciones que se pueden modelar adecuadamente por la funcin de densidad tipo gamma. Funci n de densidad de probabilidad para una variable aleatoria tipo gamma:

f ( y) !

y E 1e y / F F E X (E ) 0

En donde:
X (E ) !

E 1

La cantidad de la de la funcin alfa se conoce como la funcin gamma. La integracin directa nos da que la funcin uno igual a uno. La integracin por partes nos da que la funcin de alfa menos uno alfa menos uno por la funcin alfa menos uno para cualquier intervalo de alfa ma or o igual a uno

funcin de n sea igual a n menos uno factorial, para un nmero entero n.

Mat 282

P gina 40

3 42

2 3

1 1

E , F " 0;0 e y e E

que la

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

En el caso especial cuando alfa es un nmero entero, se puede expresar la funcin de distribucin de una variable aleato ria tipo gamma como una suma de ciertas variables aleatorias de Poisson.

Si alfa no es un nmero entero, es imposible encontrar la antiderivada del integrando de la expresin:


0 c d E

donde

Y por lo tanto es importante obtener las reas bajo la funcin de densidad tipo gamma mediante integracin directa. Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideracin particular: Una variable aleatoria tipo gamma que tiene una funcin de densidad con parmetros alfa igual a v entre dos y beta igual a dos se denomina variable aleatoria ji - cuadrada.

Ji - cuadrada se presenta con frecuencia en la teora de la estadstica. El parmetro v se denomina nmero de grados de libertad asociado a la variable aleatoria ji - cuadrada. La funcin de densidad gamma para el caso especial v = 1 se denomina funcin de densidad exponencial.

F " 0;0 e y g

Mat 282

1

ey/ dy X( )

87 8

Pgina 41

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

f ( y) ! 0

1 y / F e F

En cualquier punto. La funcin de densidad exponencial muchas veces es til en los modelos de duracin de componentes elctricos. Un fusible es un ejemplo de un componente para el cual este supuesto suele cumplirse.
Grafica 1 En funcin a los parmetros

Grafica N 2

Mat 282

P gina 42

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin Beta. La distribucin de probabilidad beta es una funcin de densidad con dos parmetros definida en el intervalo cerrado 0 <= y <= 1. Se utiliza frecuentemente como modelo para fracciones, tal como la proporcin de impurezas en un producto qumico o la fraccin de tiempo que una maquina est en reparacin.

Funcin de densidad probabilidad:

E, F " 0;0 e y e 1
y E 1 (1  y ) F 1 f ( y) ! { B (E , F )

En cualquier otro punto donde

(E , F ) ! y E 1 (1  y) F 1 dy !

X (E )X ( F ) X (E  F )

Ntese que la definicin de (y) sobre el intervalo 0<= y <= 1 restringe su aplicacin. Si c<= y <= d, y = (y- c) / (d- c) definir una nueva variable en el intervalo 0<= y <= 1. As la funcin de densidad beta se puede aplicar a una variable aleatoria definida en el intervalo c<= y <= d mediante una traslacin y una medicin en la escala.

La funcin de distribucin acumulativa para la variable aleatoria beta se llama comnmente funcin beta y esta dada por

Mat 282

Pgina 43

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

F ( y) !

funcin e probabili a binomial. Cuan o y = p, se pue e emostrar que


F ( p) !
n y E 1 (1  y ) F 1 y ! p y (1  p) n  y B(E , F ) y !E

En donde 0< p < 1 y n igual a alfa ms beta menos uno.


Grafica de la Distribucion Beta en funfion a la probabilidad

Distribuci n Chi Cuadrado. En estadstica, la distribucin (de Pearson) es una distribucin de

probabilidad continua con un parmetro k que representa losgrados de libertad de la variable aleatoria:

Donde Zson variables de distribucin normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: . se transcribe

Es conveniente tener en cuenta que la letra griega al latn como chi1 y se pronuncia en castellano como ji.2 3 La distribucin

tiene muchas aplicaciones en inferencia estadstica, por

ejemplo en la denominada prueba utilizada como prueba de independencia y

Mat 282

B B

Para valores enteros

e alfa y beta, Iy (alfa, beta) est relaciona a con la

t E 1 (1  t ) F 1 t ! I y (E , F ) B(E , F )

B B

P gina 44

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

como prueba de bondad de ajuste y en la estimacin de varianzas. Tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta deregresin lineal, a travs de su papel en la distribucin t de Student, y participa en todos los problemas de anlisis de varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin . tra forma de definir la distribucin es la siguiente: Supongamos que
i

tenemos n variables aleatorias normales independientes, X1,..., Xn, con media varianza (i = 1 ... n), la variable definida como

Mat 282

Grafica de la Distribucion Chi Cuadrado

Cuando son mayores son menos asimtricas.

P gina 45

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

REGRESIN Y CORRELACIN.
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple. "Y es una funcin de X" Y = f(X) Como Y depende de X, Y es la variable dependiente, y X es la variable independiente. En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente.

Mat 282

Pgina 46

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

REGRESIN SIMPLE.

Son cuando se dan dos variables numricas continuas X e Y, se dice que estn correlacionadas si entre ambas variables hay cierta relacin, de modo que puede predecirse (aproximadamente) el valor de una de ellas conocido el valor de la otra en este sentido decimos que la correlacin es positiva al aumentar una de las variables aumenta tambin otra y negativa en caso contrario

Si queremos predecir el valor de Y a partir de X, decimos que X es el regresor, e Y la variable explicada. Si X e Y no estn relacionas en modo alguno se dice que son incorreladas.

Si X e Y estn correlaciones tiene sentido buscar la formula que permita aproximar una de ellas, digamos Y, conocida la otra. Segn el tipo de frmula que mejor se adapte a los datos, hablamos de correlacin lineal(Y=a+bX),

Mat 282

Pgina 47

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

REGRESIN M TIPLE. El principio de la regresin multiple, se buscar aislar en una familia de funciones de varios parmetros, una funcin que ''explique'' por la relacin:

Como criterio de seleccin se minimiza sobre todas las funciones de la familia el error cuadrtico definido por:

En ciertos casos clsicos, sabemos resolver explcitamente este problema de minimizacin, y las soluciones estn implementadas en los sistemas de clculo estadstico. Es el caso de los ejemplos que vamos a dar a continuacin. Cuando una respuesta explcita es imposible, se recurre a algoritmos de minimizacin , como el algoritmo del gradiente. Regresi n lineal mltiple.Es la generalizacin directa de la regresin lineal simple del prrafo precedente. Las funciones son afines: 

El error cuadrtico a minimizar es una funcin de los desconocidos :

Siempre se puede trazar un hiperplano por

. Si el tamao de la poblacin (n) es inferior o igual a k, el error cuadrticominimal es en consecuencia 0. En la prctica la regresin slo podr ser significativa si es mucho mayor que k.

Mat 282

parmetros

puntos en un espacio de dimensin

P gina 48

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Polinomial. Es cuando varios caracteres son explicativos se puede an realizar una regresin sobre una familia de polinomios en los diferentes caracteres, con grado fijo. Los trminos que hacen intervenir productos del tipo sern

interpretados como trminos de interaccin entre los caracteres explicativos. En la prctica, uno se limita a polinomios de grado 1o 2. Presentamos para dos caracteres explicativos Modelo de orden y , los modelos ms frecuentemente utilizados.

, sin interaccin:

Modelo de orden

, sin interaccin:

Modelo de orden

, con interaccin:

Modelo de orden

, con interaccin:

Potencial. Es aquella en la que la funcin de ajuste sea una funcin potencial del tipo: y = a. xb Tambin en este caso se resuelve linealizando la funcin tomando logaritmos ya que: log y = log a + b log x Considerando las nuevas variables v = log y u= log x resolveramos la regresin lineal entre ellas de forma que si el resultado fuera: v*= A +B u

Mat 282

P gina 49

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

La solucin final quedara como a= antilog A y b= B

Exponencial. Es aquella en la que la funcin de ajuste ser una funcin exponencial del tipo y = a*bx La regresin exponencial aunque no es lineal es linealizable tomando logaritmos ya que haciendo el cambio de variable v = log y tendremos que la funcin anterior nos generara:              

la solucin de nuestro problema vendra de resolver la regresin lineal entrev x, y una vez obtenida supuesta sta: v* = A + B x ; obviamente la solucin final ser: a = antilog A y b = antilog B.

Logartmica. La curva logartmica es tambin una recta, pero en lugar de e , est referida a ya

estar referida a las variables originales

Multinomial. La regresin multinomial analiza datos distribuidos binomial mente dela forma  donde los nmeros de ensayos Bernoulli ni son conocidos y las probabilidades de xito pi son desconocidas. Un ejemplo de esta distribucin es el porcentaje de semillas (pi) que germinan despus de que ni son plantadas.

Mat 282

P gina 50

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

El modelo es entonces obtenido a base de lo que cada ensayo (valor de i) y el conjunto de variables explicativas/independientes puedan informar acerca de la probabilidad final. Estas variables explicativas pueden pensarse como un vector Xi k-dimensional y el modelo toma entonces la forma


Los logits de las probabilidades binomiales desconocidas (i.e., los logaritmos de los odds) son modeladas como una funcin lineal de los Xi.

Note que un elemento particular de Xi puede ser ajustado a 1 para todo i obtenindose desconocidos
j

un intercepto en

el

modelo.

Los

parmetros

son usualmente estimados a travs de mxima verosimilitud.


j

La interpretacin de los estimados del parmetro

es como los efectos aditivos

en el log odds ratio para una unidad de cambio en la jsima variable explicativa. En el caso de una variable explicativa dicotmica, por ejemplo gnero, e es la estimacin del odds ratio de tener el resultado para, por decir algo, hombres comparados con mujeres. El modelo tiene una formulacin equivalente dada por


Esta forma funcional es comnmente identificada como un "perceptrn" de una capa simple orred neuronal artificial de una sola capa. Una red neuronal de una sola capa calcula una salida continua en lugar de una funcin por pedazos. La derivada de pi con respecto a X = x1...xkes calculada de la forma general:

Mat 282

Pgina 51

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

ESTADSTICA INFERENCIAL Valores Esperados y Momentos. Valores Esperados El valor esperado es un concepto fundamental en el estudio de las distribuciones de probabilidad. Desde hace muchos aos este concepto ha sido aplicado ampliamente en el negocio de seguros y en los ltimos veinte aos ha sido aplicado por otros profesionales que casi siempre toman decisiones en condiciones de incertidumbre. Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que sta puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos. Es un promedio ponderado de los resultados que se esperan en el futuro. Sea X una Variable Aleatoria que toma valores en un conjunto discreto (en un conjunto finito de nmeros en uno infinito como: los naturales, los enteros o los racionales), por ejemplo si la variable aleatoria X toma los siguientes valores: X = 0, 1, 2, 3, decimos que es discreta La probabilidad de que X tome cada uno de sus valores viene dada por la funcin de probabilidad: P(X = i ), para i = 0, 1, 2, 3, ; Sea P(X = i ) = pi para i = 0, 1, 2, 3, Se tiene que p1 + p2 + p3 ++ pn + =1 13. Valor Esperado, Varianza y Desviacin Estndar de Variables Aleatorias Se define el Valor Esperado de una Variable Aleatoria con distribucin discreta como: = E(X) = x xf (x)

Y para una variable aleatoria con distribucin continua como = E(X) = ( ) xf x dx Momento

Mat 282

Pgina 52

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

En estadsticael momentode orden k de una variable aleatoriaX es la esperanza matemticaE[(X E[X])k] donde E es el operador de la esperanza. Si una variable aleatoria no tiene media el momento es indefinido. Normalmente la letra griega para el momento central es . El primer momento central es cero y el segundo se llama varianza ( ) donde es la desviacin

estndar. El tercer y cuarto momentos centrales sirven para definir los momentos estndar denominados de asimetr y de curtosis. a

DistribucionesContinuasEspeciales. 1. Funci n de distribuci n acumulada (fda) La funcin de distribucin acumulada (FDA) de una variable aleatoria continua X, es el modelo terico de la curva de frecuencias acumuladas que se espera obtener para X. La probabilidad de que una variable aleatoria continua X, asuma un valor menor o igual a xi, se llama FDA y se representa por: F (x) = P (X " xi)
y y y

Para a < b : P (a " x " b) = F (b) - F (a) F (-") = P (x " -") = 0 F (+") = P (x " +") =1

Distribucin acumulada (FDA)

Mat 282

P gina 53

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

2. Distribuci n normal est ndar Una distribucin de una variable aleatoria normal con media, = 0 y varianza, =1, se llama distribucin normal estndar y es el miembro ms importante de la familia de distribuciones normales. Esta distribucin se obtiene creando una variable aleatoriaZ Cada valor z es el nmero de desviaciones estndar separado de la media.

Distribuci n normal Multivariante En probabilidad y estadstica, una distribucin normal Multivariante, tambin llamada distribucin gaussiana Multivariante, es una generalizacin de la distribucin normal unidimensional a dimensiones superiores.
Caso general

Un vector aleatorio

si satisface las siguientes condiciones equivalentes:


y

Toda combinacin lineal distribuida.

Mat 282

sigue una distribucin normal multivariante

est normalmente

P gina 54

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Hay un vector aleatorio

, cuyas componentes son y una matriz 

independientes son variables aleatorias distribuidas segn la normal estndar, un vector .


y

tal que

Hay un vector y una matriz semidefinida positiva simtrica tal que la funcin caracterstica de X es 

Si

es una matriz no singular, entonces la distribucin puede describirse por la

siguiente funcin de densidad:

donde

es el determinante de . Ntese como la ecuacin de arriba se reduce a

la distribucin normal si es un escalar (es decir, una matriz 1x1). El vector en estas circunstancias es la esperanza de X y la matriz

es la matriz de covarianza de las componentes Xi. Es importante comprender que la matriz de covarianza debe ser singular (aunque no est as descrita por la frmula de arriba, para la cual definida). Este caso aparece con frecuencia en estadstica; por ejemplo, en la distribucin del vector de residuos en problemas ordinarios de regresin lineal. Ntese tambin que los Xi son en general no independientes; pueden verse como el resultado de aplicar la transformacin lineal Aa una coleccin de variables normales Z. Esta distribucin de un vector aleatorio X que sigue una distribucin normal multivariante puede ser descrita con la siguiente notacin: 1 est

Mat 282

P gina 55

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

o hacer explcito que X es n-dimensional,

Inferencia Estadstica. La inferencia estadstica o estadstica inferencial es una parte de la Estadstica que comprende los mtodos y procedimientos para deducir propiedades (hacerinferencias) de una poblacin, a partir de una pequea parte de la misma (muestra).
y y y y y y

La Teora de muestras. La estimacin de parmetros. El Contraste de hiptesis. El Diseo experimental. La Inferencia bayesiana. Los mtodos no paramtricos

Planteamiento del problema Suele iniciarse con una fijacin de objetivos o algunas preguntas como cul ser la media de esta poblacin respecto a tal caracterstica?, se parecen estas dos poblaciones?, hay alguna relacin entre..? En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables, etctera. Se analizan tambin en este punto los medios de los que se dispone y el procedimiento.la poblacin y caractersticas de estudio.

Mat 282

Pgina 56

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Prueba Estadstica de una Hiptesis. El problema del contraste de hiptesis consiste bsicamente en comprobar cotejar, decidir, en definitiva, sobre la veracidad de una hiptesis prefijada previamente como supuestamente cierta. En trminos estadsticos, la o las hiptesis que formulamos lo sern lgicamente sobre la poblacin. Bien afectando a algn parmetro de sta, lo que da origen a los contrastes paramtricos o bien a otras caractersticas de la mismas que no lo sean estrictamente, lo que origina contrates "no" paramtricos. La solucin estadstica del problema de contrastacin se basar en los datos mustrales y la base estadstica (probabilstica) de la que arrancar el contraste, de algn estadstico muestral. Pasemos a definir los principales conceptos implicados en nuestro problema: Regin crtica: Ser aquella regin del campo de variacin del estadstico tal que si contiene al valor evaluado del mismo con los datos mustrales nos llevar a rechazar la hiptesis. La designaremos por R 1 Regin de aceptacin: Es la regin complementaria de la anterior. Si el valor evaluado del estadstico pertenece a ella No rechazamos la hiptesis (las hiptesis nunca se aceptan de forma definitiva, slo se aceptan

provisionalmente, es decir, no se rechazan, a la espera de una nueva informacin que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0. Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.

Una hiptesis estadstica (paramtrica): Es una conjetura sobre el valor concreto que tiene en realidad. El establecer una hiptesis sobre un parmetro H0, supone dividir los posibles valores del parmetro en dos grupos disjuntos tales que unos son hipotticamente ciertos (H0) y los otros (H1) no lo son. A la hiptesis que se desea contrastar se la denomina "hiptesis nula", siendo, por tanto, el valor o valores H0 que hipotticamente consideramos reales, dicha

Mat 282

Pgina 57

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

hiptesis viene expresada como H0. Alternativamente y consecuentemente se establece la denominada "hiptesis alternativa" (H 1) compuesta sta por el valor o valores
1

que en consecuencia de la eleccin y de la complementariedad de

los de la hiptesis nula, son los que, en principio, no co nsideramos cmo hipotticamente reales.

El hecho de que las hiptesis, tanto la nula cmo la alternativa puedan recoger en sus planteamientos uno o varios valores, da lugar a hiptesis de carcter simple, si el nmero de valores plausibles e hipotticos es de uno en ambas, o bien a hiptesis compuestas si dicho valor no es nico en alguna de ellas.

Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hiptesis puede plantearse como un problema de decisin, en el que evidentemente existe la posibilidad de fracasar o acertar en la eleccin o decisin a la hora de concluir que la hiptesis, bien nula o bien alternativa, son rechazables o no.

El problema de decisin: rechazo/no rechazo, vendra expresado en las siguientes opciones en forma de tabla:

Hiptesis/Accin Es cierta Es falsa

No Rechazamos Correcto Error Tipo II

Rechazamos Error Tipo I Correcto

y Si la hiptesis nula (H 0) es cierta y nuestra decisin es no rechazarla, la

decisin ha sido correcta.


y Si la hiptesis nula (H0) es cierta y nuestra decisin es rechazarla, la

decisin provoca un error. Dicho error se denomina error tipo I.


Mat 282 Pgina 58

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

y Si la hiptesis nula (H0) es falsa y nuestra decisin es no rechazarla, la

decisin provoca un error. Dicho error se denomina error tipo II.


y Si la hiptesis nula (H 0) es falsa y nuestra decisin es rechazarla, la

decisin ha sido correcta.

Procedimiento para una prueba de hiptesis Los pasos a seguir son: 1. Formular la hiptesis nula H 0 y la alternativa H1, de acuerdo al problema. 2. Escoger un nivel de significacin o riesgos . 3. Elegir la estadstica de prueba apropiada, cuya distribucin por muestreo sea conocida en el supuesto de que Ho es cierta. 4. En base a H0 y H1, determinar el valor (o los valores) crticos y con ello se establecen las regiones de aceptacin o rechazo. 5. Calcular los valores de la prueba estadstica a partir de una muestra aleatoria de tamao n, Ho y reemplazarlos en la estadstica de prueba elegida en el paso 3, para hallar el valor experimental. 6. Tomar la decisin de aceptar Ho si el valor experimental cae en la regin de aceptacin y rechazarla si dicho valor cae en la regin crtica o de rechazo. 7. Opcional: Si se rechaza H0, se puede hallar un intervalo de confianza para el parmetro de inters. As: conocemos que de forma que la hiptesis nula es H0 De modo que la forma estadstica seria: :. de lo que deducimos que

Mat 282

Pgina 59

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribucin de la Varianza La distribucin de la varianza de una distribucin se representa mediante define por
         

y se

] dondef(X) representa a la funcin de probabilidad y a la funcin densidad de probabilidad, respectivamente, de la variable aleatoria. Claramente 0 porque , para todo X, y

, para todo X.

En palabras, la varianza es una medida de dispersin o variabilidad que no tiene interpretacin fsica ya que est en unidades cuadradas. Si en las frmulas anteriores desarrollamos el cuadrado del binomio y aplicamos propiedades de las sumatorias (integrales) se llega a una expresin ms conveniente para realizar los clculos
         

Anlisis de la Varianza e Intervalos de Confianza. 1. Analisis de la varianza El anlisis de varianza es una prueba que nos permite medir la variacin de las respuestas numricas como valores de evaluacin de diferentes variables nominales. La prueba a realizar es de s existe diferencia en los promedios para la los diferentes valores de las variables nominales; esta prueba se realiza para variables donde una tiene valores nominales y la otra tiene valores numricos.

Mat 282

Pgina 60

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

En el siguiente ejemplo, se tiene la calificacin de una prueba a personas con diferentes grados de escolaridad, lo que se intenta es probar si existe o no diferencia entre el grado escolar (variable nominal ) y el promedio de la calificacin ( variable numrica ). Para analizar si existe diferencia en los promedios se procede a realizar una prueba F que se explica posteriormente.

2. Intervalo de confianza En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1 y se denomina nivel de confianza. En estas circunstancias, es el

llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilid ades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad de Chebyshov. En definitiva, un intervalo de confianza al 1 un parmetro poblacional por ciento para la estimacin de

que sigue una determinada distribucin de


2]

probabilidad, es una expresin del tipo [ 1,

tal que P[

2]

=1- ,

donde P es la funcin de distribucin de probabilidad de .

Mat 282

Pgina 61

Alumno: Siles Cahuasiri A. Lu win

Carrera: En Sistemas Ing.

Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:2 Pero adems, si el tamao de las muestras es lo suficientemente grande,3 la distribucin de medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin:

. Esto se representa como : Si estandarizamos:

En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones.

Aplicaciones de chi - cuadrado La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student.

Mat 282

P gina 62

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .

Regresin y Correlacin Multivariante. Con la Regresin Lineal Simple analizamos si puede admitirse o no una relacin de tipo lineal entre la variable independiente X y la dependiente Y . No obstante, lo habitual es que la variable dependiente trate de expresarse en funcin de varias variables independientes X1 , X2 , ... , Xk tambin de forma lineal Y = a + b1 X1+ b2 X2+ ... + bkXk El propsito ahora de Regresin Lineal Mltiple sigue siendo, por un lado, determinar cules de las covariables independientes X1 , X2 , ... , X k son significativas a la hora de explicar a la variable dependiente y, luego, estimar los parmetros b1 , b2 , ...,bk Con la Correlacin Multivariante estudiaremos el grado o fuerza de esa relacin; primero, con la Correlacin Mltiple el grado de la relacin existente entre la variable dependiente y las covariables independientes y, luego, con la Correlacin Parcial, la fuerza de la relacin existente entre dos variables determinadas, una vez eliminada la influencia de las dems. Ambos anlisis estn basados, fundamentalmente, en tests de hiptesis en los que la suposicin de normalidad de las variables en estudio, es fundamental, por lo que, en caso de que no pueda admitirse dicha suposicin, la utilizacin de Mtodos Robustos, se hace imprescindible.

Mat 282

Pgina 63

Alumno: Siles Cahuasiri A. Ludwin

Carrera: Ing. En Sistemas

Distribuciones No Paramtricas. Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre. En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin.

Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no para mtricas. El parmetro de centralizacin es la mediana, que es aquel punto para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.

Mat 282

Pgina 64

Вам также может понравиться