Вы находитесь на странице: 1из 97

N

D
A
ID

1.

Cada uno de
POBLACIN Y MUESTRAlos
ALEATORIA.
elementos
POBLACIN.
M U E S T RA A L E AT O R I A.
de la
poblacin.
Es el conjunto
El nmero
de elementos
total de
que son
objeto de
individuos
estudio
de la
estadstico.
poblacin
se suele
representar
por la letra
N.

OBTENCIN DE DATOS ESTADSTICOS.


Son nmeros que pueden ser comparados, analizados e interpretados y el campo del
cual son tomados se identifica como poblacin o universo.

Para qu necesitamos recolectar datos?


Proporciona la introduccin imprescindible para un estudio de investigacin.
Medir el desempeo en un servicio o proceso de produccin.
Ayudar en la formulacin de alternativas para la toma de decisiones.
Satisfacer nuestra curiosidad.

Hay, por lo menos, tres maneras de obtener datos y son los siguientes:
Utilizar los datos publicados por fuentes gubernamentales, industriales o particulares.
A travs de la experimentacin.
Realizando encuestas.

EJEMPLO
La profesora ha hecho una encuesta a
los veinte estudiantes de su clase.
Los nmeros que ves en la tabla son
el resultado de realizar el recuento, y
se denominan datos estadsticos: 2,
5, 7,...

MEDIDAS DE TENDENCIA CENTRAL


La medidas de centralizacin nos indican en torno a qu valor (centro) se distribuyen los
datos.
La medidas de centralizacin son:
Moda
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio
de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4

MEDIDAS DE DISPERSIN
Las medidas de centralizacin ayudan a determinar el centro de gravedad
de una distribucin estadstica. Para describir el comportamiento general
de la serie se necesita, sin embargo, una informacin complementaria
para saber si los datos estn dispersos o agrupados.
As, las medidas de dispersin pueden definirse como los valores numricos
cuyo objeto es analizar el grado de separacin de los valores de una serie
estadstica con respecto a las medidas de tendencia central consideradas.
Las medidas de dispersin son de dos tipos:
Medidas de dispersin absoluta: como recorrido, desviacin media, varianza y
desviacin tpica, que se usan en los anlisis estadsticos generales.
Medidas de dispersin relativa: que determinan la dispersin de la
distribucin estadstica independientemente de las unidades en que se
exprese la variable. Se trata de parmetros ms tcnicos y utilizados en
estudios especficos, y entre ellas se encuentran los coeficientes de
apertura, el recorrido relativo, el coeficiente de variacin (ndice de
dispersin de Pearson) y el ndice de dispersin mediana.

EJEMPLO.
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18
Solucin
Se calcula la media aritmtica:

Se calcula la desviacin media.

CUARTILES
Cuartiles
Los cuartiles son los valores de la variable que dividen los datos en cuatro
partes, por su puesto, una vez ordenados de menor a mayor.
Los cuartiles son:
Q1primer cuartil o cuartil inferior, hay un cuarto de los datos menores que l, dicho
de otro modo el 25% de los datos son menores. Coincide con P 25.
Q2segundo cuartil o cuartil intermedio, el 50% de los datos son menores que l.
Coincide con la mediana, D5 y P50.
Q3 tercer cuartil o cuartil superior, deja el 75% de los datos de debajo. Coincide con
P75.
En el caso de variables discretas para obtener Q 1buscamos la primera observacin
que supere el 25% de los datos, esta observacin ocupar el lugar donde nes el
total de observaciones y E representa la parte entera. Q 2 coincide con la Mediana
por tanto al calcular la mediana lo estamos calculando yQ 3ocupar el lugar .
En el caso en que tengamos una variable continua, como conocemos la relacin
existente entre los percentiles y los cuartiles la frmula a usar ser una
adaptacin:
donde k=1,2,3.

EJEMPLO
Calcular los cuartiles las series estadsticas:
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
1

3
26/4 = 6.5 Q1 = 7
Q2 = Me = 10
(26 3)/4 = 19.5 Q3 = 14

2.Una distribucin estadstica viene dada por la siguiente tabla:


Hallar los cuartiles 1 y 3.

[10, 15)

[15, 20)

[20, 25)

[25, 30)

[30, 35)

fi

xi

fi

Fi

[10, 15)

12.5

[15, 20)

17.5

[20, 25)

22.5

15

[25, 30)

27.5

19

[30, 35)

32.5

21

21

Calcular los Cuartiles 2 y 3:

xi

fi

Fi

[0, 5)

2.5

[5, 10)

7.5

[10, 15)

12.5

15

[15, 20)

17.5

23

[20, 25)

22.5

25

[25, )

31.4

31

31

4.El histograma de la distribucin correspondiente al


peso de 100 alumnos de Bachillerato es el siguiente:

GRFICOS
Lasrepresentacionesgrficasdebenconseguirqueunsimpleanlisis
visualofrezcalamayorinformacinposible.
Segneltipodelcarcterqueestemosestudiando,usaremosuna
representacingrficauotra.
Segnsealavariable,losgrficosmsutilizadosson:
Diagramasdebarra.
Diagramasdesectores.
Histogramas

DIAGRAMASDEBARRAS
Esuntipodegrficoestadsticoqueseutilizaparavariablescualitativasy

discretas.
EnelejeXsesitan:

Lasmodalidadesdelavariablecualitativa.

Losvaloresdelavariablecualitativadiscreta.
ysobreellosselevantanbarrascuyaalturaseaproporcionalasusfrecuen
cias.
Siseunenlosextremossuperioresdelasbarrasconunalneapoligonals
e
obtieneel
polgonodefrecuencias
.

EJEMPLO
Ejemplo1
:Unestudiohechoenunconjuntode25personasconobjetode
determinarsugruposanguneohaconducidoalossiguientesresultado
s
A,B,A,A,A,AB,O,A,A,A,O,B,O,A,B,O,B,O,A,B,B,A,A,O,B.

CAJAS Y ALAMBRES
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin
visual que describe varias caractersticas importantes, al mismo tiempo, tales como
la dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de
los datos, sobre un rectngulo, alineado horizontal o verticalmente.
Construccin:
Comparar distribuciones
Diagrama de Caja a travs de Excel
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos
muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento
vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los
cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la
mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman
bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier
dato o caso que no se encuentre dentro de este rango es marcado e identificado
individualmente

EJEMPLO
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que
representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de Cuartiles
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin.
Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de
dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor
de la variable que ocupa el lugar central en un conjunto de datos ordenados.
Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribucin. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39

DIAGRAMA DE PARETO
El Diagrama de Pareto consiste en un grfico de barras
similar al histograma que se conjuga con una ojiva o
curva de tipo creciente y que representa en forma
decreciente el grado de importancia o peso que
tienen los diferentes factores que afectan a un
proceso, operacin o resultado.

EJEMPLO
Precio del foco para la venta: $8.90
Total de foco devueltos:167 unidades.
De los 82 clientes directos que adquieren el producto, determinamos que 19
clientes son los que nos han devuelto el producto en el transcurso del ao 2005
DEVOLUCIN DE FOCO AHORRADOR DE 65W EN UNIDADES
El objetivo del ejemplo es obtener las posibles causas de la devolucin del producto,
lo cual analizaremos a los 19 clientes de acuerdo al Principio y Diagrama de
Pareto.
PRIMER PASO: Ordenar a los clientes de acuerdo a la frecuencia de devolucin en
forma descendente.
SEGUNDO PASO: Calcular el porcentaje, en lo cual debemos dividir el valor de la
frecuencia de cada cliente por el total de devolucin.

USO DEL SOFTWARE


El uso de ordenadores y calculadoras
facilita el que los alumnos comprendan
mejor temas complejos de
matemticas. Es evidente que en
muchos casos la tecnologa agiliza y
supera, la capacidad de clculo de la
mente humana, con ayuda de la
tecnologa, los alumnos tienen ms
tiempo para concentrarse en
enriquecer su aprendizaje matemtico.

N
U

D
A
ID

.
2

PROBABILIDAD DE EVENTOS
Un experimento o fenmeno aleatorio es un proceso o accin cuyo
resultado incierto.
Ejemplos:

Lanzar una moneda al aire y observar la cara


superior.

Marcar un telfono al azar del directorio y


observar si contestan, no contestan o est
ocupado

ESPACIO MUESTRAL
Es el conjunto de
todos los
posibles
resultados de
una experiencia
aleatoria, lo
representaremos
por E (o bien por
la letra griega ).

EJEMPLO
Espacio muestral de una moneda:
E = {C, X}.
Espacio muestral de un dado:
E = {1, 2, 3, 4, 5, 6}.
Suceso aleatorio
Suceso aleatorio es cualquier subconjunto del espacio
muestral.
Por ejemplo al tirar un dado un suceso sera que saliera
par, otro, obtener mltiplo de 3, y otro, sacar 5.
Ejemplos de espacios muestrales
1. Una bolsa contiene bolas blancas y negras. Se extraen
sucesivamente tres bolas.
E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n
,b); (n, n,n)}
2. El suceso A = {extraer tres bolas del mismo color}.
A = {(b,b,b); (n, n,n)}
3. El suceso B = {extraer al menos una bola blanca}.
B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n);
(n,n ,b)}
4. El suceso C = {extraer una sola bola negra}.

OCURRENCIA DE EVENTOS
La unin de dos eventos es el evento que esta formado por
todos los resultados contenidos en cualquiera de los eventos.
La unin se denota por :
La interseccin de dos eventos es el evento que esta formado
por los resultados contenidos en ambos eventos.
La interseccin se denota por:
El complemento de un evento en un espacio muestral es el
conjunto de resultados en el espacio muestral que no estn
en el evento. Este componente del evento E se denota como
E'

EJEMPLO

PERMUTACIONES Y COMBINACIONES
Hay dos tipos de permutaciones:
Se permite repetir: como la cerradura de
arriba, podra ser "333".
Sin repeticin: por ejemplo los tres
primeros en una carrera. No puedes
quedar primero y segundo a la vez.

DIAGRAMAS DE ARBOL
Para la construccin de un diagrama en rbol se partir
poniendo una rama para cada una de las
posibilidades, acompaada de su probabilidad.
En el final de cada rama parcial se constituye a su vez,
un nudo del cual parten nuevas ramas, segn las
posibilidades del siguiente paso, salvo si el nudo
representa un posible final del experimento (nudo
final).
Hay que tener en cuenta: que la suma de probabilidades
de las ramas de cada nudo ha de dar 1.

AXIOMAS DE PROBABILIDAD
Los axiomas de probabilidad
son las condiciones
mnimas que deben
verificarse para que una
funcin definida sobre un
conjunto de sucesos
determine
consistentemente sus
probabilidades.

EJEMPLO.

INDEPENDENCIA Y PROBABILIDAD
CONDICIONAL

EJEMPLO.

TEOREMA DE BAYES.
El Teorema de Bayes viene a seguir el proceso inverso al que hemos
visto en el Teorema de la probabilidad total:
Teorema de la probabilidad total: a partir de las probabilidades del
suceso A (probabilidad de que llueva o de que haga buen tiempo)
deducimos la probabilidad del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido
un accidente) deducimos las probabilidades del suceso A (estaba
lloviendo o haca buen tiempo?).
La frmula del Teorema de Bayes es:

EJEMPLO

Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el


fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra
un accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 10%.
b) Si nieva: probabilidad de accidente del 20%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estabamos en la
ciudad no sabemos que tiempo hizo (nev, llovo o hubo niebla). El
teorema de Bayes nos permite calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un
accidente se denominan "probabilidades a priori" (lluvia con el 60%,
nieve con el 30% y niebla con el 10%).
Una vez que incorporamos la informacin de que ha ocurrido un accidente,
las probabilidades del suceso A cambian: son probabilidades
condicionadas P (A/B), que se denominan "probabilidades a posteriori".
Vamos a aplicar la frmula:

N
U

D
A
ID

.
3

VARIABLES ALEATORIAS.
La variable que asocia un nmero con el resultado de un experimento
aleatorio se le denomina como variable aleatoria.
En otras palabras:
"Una variable aleatoria es una funcin que asigna un nmero real a
cada resultado en el espacio muestral de un experimento aleatorio."
La variable aleatoria se denota tal como la letra mayscula X y con una
letra minscula como x, el valor posible de X. El conjunto de los posibles
valores de la variable aleatoria X recibe el nombre de rango de X.
Por ejemplo: El sistema de comunicacin por voz de una empresa tiene 48
lneas externas. En un determinado momento, se observa el sistema y
algunas lneas estn ocupadas. Sea X la variable aleatoria que denota el
nmero de lneas en uso. Entonces X puede tomar cualquier valor
entero de cero a 48
Ntese que sobre un espacio muestral puede definirse mas de una
variable aleatoria.

EJEMPLO
Se sacan dos bolas de manera sucesiva sin reemplazo
de una urna que contiene cuatro bolas rojas y tres negras. Los
posibles resultados y los valores y de la variable aleatoria Y, donde
Y es el nmero de bolas rojas, son:
EM

RR

RN

NR

NN

DISTRIBUCIN DE PROBABILIDAD
DISCRETA.
Se denomina distribucin de variable discreta a aquella cuya funcin de
probabilidad slo toma valores positivos en un conjunto de valores
de finitooinfinito numerable. A dicha funcin se le llama funcin
de masa de probabilidad. En este caso la distribucin de
probabilidad es la suma de la funcin de masa, por lo que tenemos
entonces que:

Y, tal como corresponde a la definicin de distribucin de probabilidad,


esta expresin representa la suma de todas las probabilidades
desde hasta el valor .

EJEMPLO.
Se lanza un par de dados. Se define la variable aleatoria X como la suma de las puntuaciones obtenidas. Hallar la funcin de
probabilidad, la esperanza matemtica y la varianza

pi

x pi

x2 pi

1/36

2/36

4/36

2/36

6/36

18/36

3/36

12/36

48/36

4 /36

20/3 6

100/36

5/36

30/36

180/36

6/36

42/36

294/36

5/36

40/36

320/36

4 /36

36/36

324/36

10

3/36

30/36

300/36

11

2/36

22/36

242/36

12

1/36

12/36
7

144/36
54.83

DISTRIBUCIN HIPERGEOMTRICA
Enteora de la probabilidadladistribucin hipergeomtricaes una
distribucindiscreta relacionada conmuestreos aleatoriosy sin
reemplazo. Supngase que se tiene una poblacin deNelementos
de los cuales,dpertenecen a la categoraAyN-da laB. La
distribucin hipergeomtrica mide la probabilidad de obtenerx( )
elementos de la categoraAen una muestra sin reemplazo
denelementos de la poblacin original.
La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo
y labinomiala muestreos con reemplazo. En situaciones en las que
el nmero esperado de repeticiones en el muestreo es
presumiblemente bajo, puede aproximarse la primera por la
segunda. Esto es as cuandoNes grande y el tamao relativo de la
muestra extrada,n/N, es pequeo.

En una urna o recipiente hay un total deNobjetos, entre los cuales hay una cantidadade objetos que son defectuosos,
si se seleccionan de esta urnanobjetos al azar, y sin reemplazo, cul es la probabilidad de obtenerxobjetos
defectuosos?
Solucin:

Luego;

donde:
p(x,n) = probabilidad de obtenerxobjetos defectuosos de entrenseleccionados

muestras denobjetos en donde hayxque son defectuosos yn-xbuenos

todas las muestras posibles de seleccionar denobjetos tomadas de entreNobjetos en total = espacio muestral

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al
azar, cul es la probabilidad de que 2 sean defectuosos?

Solucin:

N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra

donde:

probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son
constantes

formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4


objetos entre los que 2 son defectuosos
Como se observa en el desarrollo de la solucin del problema, la pretensin es demostrar que las
probabilidades asociadas a cada uno de los resultados no son constantes.
Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sera:

DISTRIBUCIN DE POSICIN
Es unadistribucin de probabilidaddiscretaque expresa, a partir de una
frecuencia de ocurrencia media, la probabilidad de que ocurra un
determinado nmero de eventos durante cierto perodo de tiempo.
La funcin de masa o densidad de la distribucin de Poisson es
Donde

kes el nmero de ocurrencias del evento o fenmeno (la funcin nos


da la probabilidad de que el evento suceda precisamentekveces).
es un parmetro positivo que representa el nmero de veces que se
espera que ocurra el fenmeno durante un intervalo dado.

EJEMPLO
Un agente de seguros vende plizas a cinco personas de la misma edad
y que disfrutan de buena salud. Segn las tablas actuales, la
probabilidad de que una persona en estas condiciones viva 30 aos
o ms es 2/3. Hllese la probabilidad de que, transcurridos 30 aos,
vivan:
Soluciones:
1Las cinco personas
B(5, 2/3)p = 2/3q = 1/3

2Al menos tres personas

3Exactamente dos personas

DISTRIBUCIN DE PROBABILIDAD
CONTINUA
Enteora de la probabilidadunadistribucin de probabilidadse
llamacontinuasi sufuncin de distribucinescontinua. Puesto que
la funcin de distribucin de unavariable aleatoriaX viene dada
por , la definicin implica que en una distribucin de probabilidad
continuaXse cumple P[X=a] = 0 para todonmero reala, esto es,
la probabilidad de queXtome el valoraes cero para cualquier valor
dea. Si la distribucin deXes continua, se llama aX
variable aleatoria continua.
En las distribuciones de probabilidad continuas, la distribucin de
probabilidad es la integral de lafuncin de densidad, por lo que
tenemos entonces que:

EJEMPLO
Los trenes de una cierta lnea de cercanas pasan cada 20 minutos. Cuando
llegamos a la estacin, ignoramos cundo pas el ltimo.
La medida de la probabilidad del tiempo que tendremos que esperar a que pase
el siguiente tren (TIEMPO DE ESPERA), se obtiene con la ayuda de la grfica adjunta.
Observa que bajo ella hay 100 cuadritos.
La probabilidad de que tengamos que esperar entre 10 y 16 minutos es del 30%
(30 cuadritos de un total de 100).
Es decir: P[10 x 16] = 0,30
Procediendo de forma similar, halla las siguientes probabilidades e interpreta
lo que significan:
a) P[x 2] b) P[5 x 10] c) P[x 10] d) P[5 x 6]
a) P[x 2] = = 0,10
La probabilidad de tener que esperar menos de 2 minutos es 0,10 (del 10%).
b)P[5 x 10] = = 0,25
La probabilidad de tener que esperar entre 5 y 10 minutos es del 25%.
c) P[x 10] = = 0,50
La probabilidad de tener que esperar menos de 10 minutos es del 50%.
d)P[5 x 6] = = 0,05
La probabilidad de tener que esperar entre 5 y 6 minutos es del 5%.

grados de confianza
oyzsonindependientes

DISTRIBUCIN T

Es unadistribucin de probabilidadque surge del problema deestimar


lamediade unapoblacinnormalmente distribuidacuando el
tamao de la muestraes pequeo.
Aparece de manera natural al realizar laprueba t de Studentpara la
determinacin de las diferencias entre dos medias muestrales y
para la construccin delintervalo de confianzapara la diferencia
entre las medias de dos poblaciones cuando se desconoce la
desviacin tpicade una poblacin y sta debe ser estimada a partir
de los datos de una muestra.
La distribucin t de Student es la distribucin de probabilidad del
cociente

donde
Ztiene unalateralde media nula ymediana1
xtiene una [[distribucin bilateral] con

EJEMPLO
Los valores de las matriculas de estudiantes en una universidad privada tienen un comportamiento
aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8 liquidaciones,
siendo los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000, 2.250.000,
1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que:
El promedio sea menor de 2.000.000.
El promedio se encuentre entre 2.000.000 y 2.200.000
El promedio sea mayor o igual a 2.500.000
Solucin :
Sea X = Liquidacin matriculas.
m = 2.100.000 ; s = ?
=2.098.750 s=168.644.8085 n=8
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, segn la tabla T que se encuentra ms adelante, no
obstante, al t ser negativo, la probabilidad est entre 0.1 y 0.05, es decir, los valores
complementarios.
b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( 2.000.000).
Luego de tipificar, se tiene:
P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92

c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0


Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y corresponde a
0.995, es claro, entonces, que para valores mayores de 3.49, la probabilidad ser de 1.

DISTRIBUCIN CHI-CUADRADA
Llamada Chi cuadrado o Ji cuadrado, es una
distribucin de probabilidad continuacon un parmetro que
representa losgrados de libertadde lavariable aleatoria

donde son variables aleatoriasnormalesindependientesdemediacero


yvarianzauno. El que la variable aleatoria tenga esta distribucin
se representa habitualmente as: .

Es conveniente tener en cuenta que la letra griega se transcribe al


latncomochi1y se pronuncia encastellanocomoji.23

EJEMPLO
Suponga que los tiempos requeridos por un cierto autobs para
alcanzar un de sus destinos en una ciudad grande forman una
distribucin normal con una desviacin estndar =1 minuto. Si se
elige al azar una muestra de 17 tiempos, encuentre la probabilidad
de que la varianza muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2
como sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados


de libertad y se encuentra que a este valor le corresponde un rea a
la derecha de 0.01. En consecuencia, el valor de la probabilidad es
P(s2>2)

DISTRIBUCIN F.
Es unadistribucin de probabilidad continua. Tambin se le conoce
comodistribucin F de Snedecor(porGeorge Snedecor) o comodistribucin
F de Fisher-Snedecor.
Unavariable aleatoriade distribucinFse construye como el siguiente
cociente:

Donde
U1yU2siguen unadistribucin chi-cuadradocond1yd2grados de libertad
respectivamente, y
U1yU2son estadsticamente independientes.
La distribucinFaparece frecuentemente como ladistribucin nulade una
prueba estadstica, especialmente en el anlisis de varianza

EJEMPLO
Un fabricante de automviles pone a prueba dos nuevos mtodos de ensamblaje de motores respecto al tiempo en
minutos. Los resultados se muestran el la tabla:
Construya un intervalo de confianza del 90% para
.
Solucin:
Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:
2
2

2
1

Mtodo 1

Mtodo 2

n1= 31

n2= 25

s12= 50

s22= 24

Por la recomendacin de que la varianza muestral mayor va en el numerador se tiene la siguiente frmula:

al despejar:
.
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de
libertad uno valen 30 y los grados de libertad dos 24.

Estos resultados los podemos interpretar de la siguiente manera:


Con un nivel de confianza del 90% se sabe que la relacin de varianzas
2
/
1

esta entre 1.07 y 3.93. Esto supondra que la varianza de la poblacin 1 es mayor a la varianza de la poblacin 2 entre 1.07 y 3.93.

2
2

ESPERANZA MATEMTICA
Es el nmero que formaliza la idea devalor mediode un fenmeno
aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la
suma de la probabilidad de cada posiblesuceso aleatorio
multiplicado por el valor de dicho suceso. Por lo tanto, representa la
cantidad media que se "espera" como resultado de un experimento
aleatorio cuando la probabilidad de cada suceso se mantiene
constante y el experimento se repite un elevado nmero de veces.
Cabe decir que el valor que toma la esperanza matemtica en
algunos casos puede no ser "esperado" en el sentido ms general
de la palabra - el valor de la esperanza puede ser improbable o
incluso imposible.

EJEMPLO
Dada la experiencia aleatora de anotar las puntuaciones obtenidas al lanzar un dado, calcular:
1La funcin de probabilidad y su representacin

2La funcin de distribucin y su


representacin

N
U

D
A
ID

.
4

MUESTREO ESTADSTICO
Es una herramienta de la investigacin cientfica. Su funcin bsica es
determinar que parte de una realidad en estudio (poblacin o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacin.
El Muestreo es ms que el procedimiento empleado para obtener una o ms
muestras de una poblacin; el muestreo es una tcnica que sirve para
obtener una o ms muestras de poblacin.
Este se realiza una vez que se ha establecido un marco muestral representativo
de la poblacin, se procede a la seleccin de los elementos de la muestra
aunque hay muchos diseos de la muestra.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para
cada muestra no necesariamente seran iguales, y lo ms probable es que
variaran de una muestra a otra.
TIPOS FUNDAMENTALES DE MUESTREO.Muestreo no probabilstico: En este tipo de muestreo, puede haber clara
influencia de la persona o personas que seleccionan la muestra o
simplemente se realiza atendiendo a razones de comodidad.
Ejemplo: si hacemos una encuesta telefnica por la maana, las personas que no
tienen telfono o que estn trabajando, no podrn formar parte de la
muestra.
Muestreo probabilstico: En este tipo de muestreo, todos los individuos de la
poblacin pueden formar parte de la muestra, tienen probabilidad positiva de
formar parte de la muestra. Por lo tanto es el tipo de muestreo que
deberemos utilizar en nuestras investigaciones, por ser el riguroso y

ESTIMADORES
Enestadstica, unestimadores unestadstico(esto es, una funcin de
la muestra) usado para estimar un parmetro desconocido de
lapoblacin. Por ejemplo, si se desea conocer el precio medio de
un artculo (el parmetro desconocido) se recogern observaciones
del precio de dicho artculo en diversos establecimientos
(lamuestra) y lamedia aritmticade las observaciones puede
utilizarse como estimador del precio medio.
Para cada parmetro pueden existir varios estimadores diferentes. En
general, escogeremos el estimador que posea mejores propiedades
que los restantes, comoinsesgadez,
eficiencia,convergenciayrobustez(consistencia).
El valor de un estimador proporciona lo que se denomina en
estadstica unaestimacin puntualdel valor del parmetro en
estudio. En general, se suele preferir realizar un estimacin
mediante unintervalo, esto es, obtener un intervalo[a,b]dentro
del cual se espera est el valor real delparmetrocon un
ciertonivel de confianza.

EJEMPLO
En la prctica, losintervalosde estimadores con distribuciones
simtricas suelen indicarse dando el valor del estimador puntual
utilizado como centro del intervalo y un valor que debe sumarse y
restarse para obtener el lmite superior e inferior; por ejemplo:

ESTIMACIN PUNTUAL
Cuando queremos realizar un estudio de una poblacin cualquiera de la
que desconocemos sus
parmetros, por ejemplo su media poblacional o la probabilidad de
xito si la poblacin sigue una
distribucin binomial, debemos tomar una muestra aleatoria de dicha
poblacin a travs de la cual podremos calcular una aproximacin a
dichos parmetros que desconocemos y queremos estimar. Bien,
pues esa aproximacin se llama estimacin.
Una estimacin puntual del valor de un parmetro poblacional
desconocido (como puede ser la
media , o la desviacin estndar ), es un nmero que se utiliza para
aproximar el verdadero
valor de dicho parmetro poblacional. A fin de realizar tal estimacin,
tomaremos una muestra de
la poblacin y calcularemos el parmetro maestral asociado ( x para la
media, s para la
desviacin estndar, etc.). El valor de este parmetro maestral ser la
estimacin puntual del
parmetro poblacional.

EJEMPLO
Una estimacin es puntual cuando se usa un solo valor
extrado de la muestra para estimar el parmetro
desconocido de la poblacin. Al valor usado se le llama
estimador.
La media de la poblacin se puede estimar puntualmente
mediante la media de la muestra:
x=
La proporcin de la poblacin se puede estimar
puntualmente mediante la proporcin de la muestra:
p=p

La desviacin tpica de la poblacin se puede estimar


puntualmente mediante la desviacin tpica de la muestra,
aunque hay mejores estimadores:
s=

ERRORES TIPO 1 & 2


Tipo 1:
El error de tipo I tambin
denominado error de tipo alfa
() o falso positivo, es el error
que se comete cuando el
investigador no acepta la
hiptesis nula siendo sta
verdadera en la poblacin.
Es equivalente a encontrar un
resultado falso positivo, porque
el investigador llega a la
conclusin de que existe una
diferencia entre las hiptesis
cuando en realidad no existe.
Se relaciona con el nivel de
significancia estadstica.

Tipo 2:
El error de tipo II tambin
llamado error de tipo beta () o
falso negativo, es el error que
se comete cuando el
investigador no rechaza la
hiptesis nula siendo sta falsa
en la poblacin.
Es equivalente a la probabilidad
de un resultado falso negativo,
ya que el investigador llega a la
conclusin de que ha sido
incapaz de encontrar una
diferencia que existe en la
realidad.

N
U

D
A
ID

.
5

DIAGRAMA GRFICO DE DISPERSIN


Se utiliza para representar datos cuantitativos
bidimensionales o vicariantes, es decir, aquel tipo de
dato donde una observacin viene dada por una
pareja de valores (x,y). cada observacin constituye
un punto, el cual se representa en el plano cartesiano
utilizando el eje de las abscisas para el primer valor x
y el de ordenadas para el otro miembro del par.
El diagrama de dispersin consiste en la representacin,
en el mismo plano cartesiano, de todos los puntos
constituidos por un grupo de observaciones
bidimensionales.

EJEMPLO
En un estudio sobre la produccin de leche de una regin, se recaba la
informacin sobre el numero de vacas y la cantidad total diaria de leche
producida por ellas en un grupo de 13 fincas. los datos se presentan como
pares de valores (X;Y), donde X representa el numero de vacas y (Y)
representa la produccin diaria, en litros de leche. la informacin es la
siguientes.

la representacin grafica de los datos adecuada


para estos datos es:

REGRESIN LINEAL SIMPLE


Consiste en determinarlos valoresde "a" y "b " a partir de lamuestra,
es decir, encontrar los valores de a y b con losdatosobservados de
la muestra. Elmtodode estimacin es el deMnimos Cuadrados,
mediante el cual se obtiene:

EJEMPLO

DESARROLLO

HIPTESIS

CORRELACIN
La correlacin estadstica determina la relacin o dependencia que
existe entre las dos variables que intervienen en una distribucin
bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en
los cambios de la otra. En caso de que suceda, diremos que las
variables estn correlacionadas o que hay correlacin entre ellas.
El coeficiente de correlacin lineal se expresa mediante la letra r.
Donde r es igual a la covarianza entre las desviaciones tpicas:

DETERMINACIN Y ANLISIS DE LOS


COEFICIENTES

r = 1 indica una relacin lineal exacta positiva


(creciente) o negativa (decreciente),
r = 0 indica la no existencia de relacin lineal
estocstica, pero no indica independencia de las
variables ya que puede existir una relacin no
lineal incluso exacta,
valores intermedios de r (0 < r < 1 -1 < r < 0)
indican la existencia de una relacin lineal
La relacin
lineal entre
estocstica, ms fuerte cuanto
ms prximo
a +1las variables es muy
pequea y no parece que exista otro tipo de
( -1) sea el valor de r.
relacin entre ellas, la nube de puntos indica

que las variables son casi independientes. r =


0'192, R2 = 0'037, recta de regresin: y =
6'317 + 0'086x. Contraste de regresin: R =
0'687

INTERVALOS DE CONFIANZA Y PRUEBAS


DE COEFICIENTE
Enestadstica , se llama a un par o varios pares de nmeros entre los cuales se
estima que estar cierto valor desconocido con una determinada probabilidad
de acierto. Formalmente, estos nmeros determinan unintervalo , que se
calcula a partir de datos de unamuestra , y el valor desconocido es
unparmetro poblacional.
La probabilidad de xito en la estimacin se representa con1 - y se
denominanivel de confianza. En estas circunstancias,es el llamadoerror
aleatorioonivel de significacin, esto es, una medida de las posibilidades de
fallar en la estimacin mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma
que un intervalo ms amplio tendr ms probabilidad de acierto (mayor nivel de
confianza), mientras que para un intervalo ms pequeo, que ofrece una
estimacin ms precisa, aumenta su probabilidad de error.
Coeficiente de correlacin de pearson.Enestadstica , elcoeficiente de correlacin de Pearsones una medida de la
relacin lineal entre dosvariables aleatoriascuantitativas . A diferencia de
lacovarianza , la correlacin dePearsones independiente de la escala de
medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlacin de
Pearson como un ndice que puede utilizarse para medir el grado de relacin de
dos variables siempre y cuando ambas sean cuantitativas.
Coeficiente de correlacin de spearman.Enestadstica , elcoeficiente de correlacin de Spearman,(rho) es una
medida de lacorrelacin(la asociacin o interdependencia) entre dosvariables
aleatoriascontinuas. Para calcular , los datos son ordenados y reemplazados
por su respectivo orden.

ERRORES DE MEDICIN
ES LA INEXACTITUD QUE SE ACEPTA COMO INEVITABLE PARA
COMPARAR UNA MAGNITUD CON SU PATRON DE MEDIDA, EL
ERROR DE MEDIDA DEPENDE DE LA ESCALA DE MEDIDA
EMPLEADA Y TIENE UN LIMITE.
GENERALIDADES.A la estadstica le interesa estudiar las poblaciones que poseen
variaciones entre sus datos en estudio de lo contrario bastara
con estudiar un individua para explicar la poblacin.
Adems de la variacin real inherente a los elementos o individuos
que se estudian, se debe considerar una variacin sobreaadida
o falsa, que solo es en realidad, ERRORES determinados por los
factores que intervienen en la observacin.

EJEMPLO

ERRORES DEPENDIENTES DEL OBSEVADOR.PUEDE OCURRIR POR:


El grado de preparacin o entrenamiento
El estado fsico
El exceso de trabajo
Las condiciones ambientales de trabajo
ERROR ALEATORIO.Es un error al azar, es inevitable, se produce por eventos nicos
imposiblles de controlar durante el proceso de medicin. Es un
estudio de investigacin, por lo general el error aleatorio viene
determinado por el hecho de tomar una sola muestra de una
poblacin para hacer inferencias.
ERROR SISTEMATICO.Es aquel que se produce de igual modo en todas las mediciones que
se realizan de una magnitud, puede estar originado en un defecto
del instrumento o en particularidad del operador o del proceso de
medicin u observacin.
VALORES ANOMALOS.Tambin llamados atpicos u outliers, son aquellos casos u
observaciones irregulares que son numricamente distantes de los
datos que se estn estudiando y por otro no siguen el mismo
modelo.
PRESICION.ES LO CERCA QUE LOS VALORES MEDIDOS ESTAN UNOS DE OTROS
CUANDO MENOS ES LA VARIABILIDAD DE DATOS MAYOR ES LA

Вам также может понравиться