Академический Документы
Профессиональный Документы
Культура Документы
PROBABILIDAD Y
ESTADSTICA
abril 1
2015
CUADERNILLO
DE TRABAJO
Cbtis No. 50
PROBABILIDAD
Competencia: Conocer y aplicar los axiomas y teoremas de probabilidad en la
solucin de problemas.
INTRODUCCIN
Sin tener en cuenta la profesin que se haya elegido, algo s es seguro, en algn
momento se han de tomar decisiones. Con mucha frecuencia esto tendr que
hacerse sin conocer todas las consecuencias de tales decisiones. Por ejemplo,
los inversionistas deben decidir sobre la conveniencia de invertir en una accin
en particular, con base en sus expectativas sobre rendimientos futuros. Los
empresarios al decidir comercializar un producto enfrentan la incertidumbre
sobre la posibilidad de xito. En cada caso, como sucede con la mayora de los
asuntos comerciales, se han de tomar decisiones sin toda la informacin
pertinente.
Todo esfuerzo por reducir el nivel de incertidumbre en el proceso de toma de
decisiones incrementa enormemente la probabilidad de que se tomen
decisiones ms inteligentes y bien informadas. El propsito de esta unidad es
ilustrar las formas en las cuales puede medirse la posibilidad o probabilidad de
ocurrencia de eventos futuros.
2.1
TCNICAS DE CONTEO
n1 n2 n3
(II.1)
Ejemplo 2.1 Supongamos que una placa de automvil consta de dos letras
distintas seguidas de tres dgitos de los cuales el primero no es cero.
Cuntas placas diferentes pueden grabarse?
Cbtis No. 50
Pr
n!
n r !
(II.2)
P3
6!
720
120
6 3! 6
Cbtis No. 50
Por tanto se pueden formar 120 posibles palabras de tres letras sin
repeticin.
2.1.3 Escogencia Mltiple
Muchos problemas del anlisis combinatorio y, en particular, de probabilidad se
relacionan con la escogencia de una bola tomada de una urna que contiene
n bolas (o una carta de una baraja o una persona de una poblacin). Cuando
escogemos una bola tras otra de una urna, r veces, definimos esta escogencia
como una prueba ordenada de tamao r. Se consideran dos casos:
1. Pruebas con sustitucin. En este caso cada bola escogida se regresa a la
urna antes de tomar la siguiente. Ahora puesto que hay n maneras
diferentes para escoger cada bola, segn el principio fundamental del
conteo hay
(II.3)
n
n
n nr
r veces
Pr
n!
n r !
(II.4)
Cbtis No. 50
2.1.4 Combinaciones
Supongamos que tenemos una coleccin de n objetos. Una combinacin de
estos n objetos tomados r a la vez, o una combinacin r, es un subconjunto de r
elementos. En otras palabras, una combinacin r es una seleccin de r o de n
objetos donde el orden no se tiene en cuenta.
n!
(II.5)
n Cr
r ! n r !
Ejemplo 2.3 Considere que dados 10 productos, cuntos subconjuntos de tres
productos podran empacarse juntos y ofrecerse a los clientes? Si se considera
que el orden en el cual se ofrecen los tres productos no influir en los clientes.
Solucin: El nmero de combinaciones de 10 elementos tomados 3 a la vez es
10 C3 120 . Por tanto hay 120 paquetes de tres artculos que se pueden ofrece a
los clientes.
2.2
ENFOQUES DE PROBABILIDAD
0 PE 1
(II.6)
S x1 , x 2 , , xn
(II.7)
Cbtis No. 50
PE
(II.8)
2.3
(II.9)
Axiomas de Probabilidad
Cbtis No. 50
Administrativo
Lnea
Auxiliar
Total
Hombres
120
150
30
300
Mujeres
50
140
10
200
Total
170
290
40
500
Una tabla de probabilidad puede crearse dividiendo cada una de las entradas
de la tabla anterior entre el total, 500 trabajadores. Los resultados se ven en la
tabla.
Cbtis No. 50
H
Mujeres M
Hombres
Total
Administrativo
Lnea
0.24
150
500
50
500
0.10
170
500
0.34
120
500
Auxiliar
Total
0.06
300
500
0.60
10
500
0.02
200
500
0.40
40
500
0.08
500
500
1.00
0.30
30
500
140
500
0.28
290
500
0.58
PL 0.58
y la probabilidad de seleccionar un hombre es
PM 0.60
Las probabilidades conjuntas en las celdas de la estructura principal de la tabla
muestran la probabilidad de la interseccin entre dos eventos. Por ejemplo, la
probabilidad de seleccionar un trabajador que sea parte del personal
administrativo y que sea hombre, es
PH S 0.24
Una probabilidad marginal se encuentra como la suma de las probabilidades
conjuntas correspondientes. Por tanto
PA|B
P A B
PB
(II.10)
Cbtis No. 50
PH 0.60
sin embargo, si se desea calcular la probabilidad de que el trabajador sea
hombre dado que es un miembro del personal administrativo PH| S se puede
hallar as
PH S 0.24
PH| S
0.71
PS
0.34
2.3.4 Las dos reglas de la probabilidad
Para calcular la probabilidad de eventos ms complejos utilizaremos la regla de
la multiplicacin y la regla de la adicin. Cada una se utiliza para propsitos
especficos.
2.3.4.1
Regla de la multiplicacin
PA B PA PB
(II.11)
PA B PA PB| A
(II.12)
PM 0.4
sin considerar si el trabajador es miembro administrativo, lnea o auxiliar. Sin
embargo, la probabilidad conjunta de que sea mujer y miembro de lnea
PM L 0.28
Cbtis No. 50
PM L PM PL|M
el ltimo trmino es
anteriormente como
probabilidad
PL| M
condicional,
la
cual
se
determin
PL M 0.28
0.7
PM
0.4
entonces
Regla de la adicin
PA B PA PB PA B
(II.13)
PA B PA PB
(II.14)
Cbtis No. 50
Calificacin:
accin
cero
conjunto
enfoque clsico
evento
experimento
frecuencia
relativa
probabilidad
resultado
resultados
subjetivo
uno
datos
empricamente
enfoque
frecuencia
muestral
nmero de formas en las
que puede ocurrir un
evento
nmero de veces que ha
ocurrido el evento en el
pasado
nmero
total
de
observaciones
nmero total de posibles
resultados
pasado
afecta
condiconal
dependientes
excluyentes
independientes
nada
no
ocurran
ocurrencia
otro
__________________________________________
__________________________________________
__________________________________________
10
Cbtis No. 50
, xn
P( E )
De los tres mtodos para medir la probabilidad, el modelo clsico es el que se relaciona con
mayor frecuencia con las apuestas y juegos de azar. La probabilidad clsica de un evento E se
determina mediante:
P( E )
Los eventos son _________________, si la ocurrencia de uno _____ tiene _________________ que ver
con la _________________ del otro. Dos eventos son _________________ cuando la ocurrencia o no
ocurrencia de un evento _________________ a la probabilidad de _________________ del otro
evento.
11
Cbtis No. 50
Cuando
dos
eventos
_________________
son
dependientes,
se
emplea
el
concepto
de
probabilidad
Probabilidad de eventos
2. Para cada una de las siguientes situaciones, indique cul de los enfoques de la
probabilidad (el clsico, el de frecuencias relativas o el subjetivo) sera ms til para
determinar el valor de probabilidad requerido.
3. Una bolsa contiene 4 canicas rojas y 3 azules. Si se saca una canica de la bolsa al
azar, cul es la probabilidad de sacar una canica azul?
12
Cbtis No. 50
5. Se escoge una pelota de tenis verde de una bolsa que contiene 4 pelotas verdes, 7
amarillas y 5 blancas.
6. Determine el valor de probabilidad aplicable a cada una de las siguientes
situaciones.
a. La probabilidad de accidentes industriales en una industria en particular en un
plazo anual. Una muestra aleatoria de 10 empresas, las cuales emplean a un
total de 8000 personas, report la ocurrencia de 400 accidentes industriales
durante un periodo reciente de 12 meses.
b. La probabilidad de acertar a un nmero ganador en un juego de ruleta. Los
nmeros de la rueda incluyen un 0, 00 y del 1 al 36.
c. La probabilidad de que un establecimiento de franquicia de comida rpida sea
financieramente exitoso. El probable inversionista obtiene datos de otras
unidades del sistema de franquicias, estudia el desarrollo de la zona residencial
en la que estar ubicado el establecimiento y considera el volumen de ventas
requerido para garantizar el xito financiero con base en la inversin de capital
requerida y los costos operativos. En general, el inversionista juzga que hay un
80% de posibilidades de que el establecimiento sea financieramente exitoso y
20% de que no lo sea.
7. La siguiente tabla muestra el nmero de computadoras vendidas diariamente por
una tienda minorista
Nmero de
computadoras
vendidas
Nmero de das
12
43
18
20
25
Probabilidad
13
Cbtis No. 50
d. Por lo menos 1
Nmero de cajas
Probabilidad
40
27
21
12
c. Ms de 1
d. Ninguno
14
Cbtis No. 50
Pr
n!
n r !
n6 r 3
n4 r2
n 10 r 4
Supongamos que tenemos una coleccin de n objetos. Una combinacin de estos n objetos
tomados r a la vez, o una combinacin r, es un subconjunto de r elementos. En otras palabras,
una combinacin r es una seleccin de r o de n objetos donde el orden no se tiene en cuenta.
Cr
n!
r ! n r !
n6 r 3
n4 r2
n 10 r 4
15
Cbtis No. 50
11. Un caso reciente en la corte del condado de Madison, Kentucky, sobre las
prcticas de contratacin de una compaa de telfonos local. La compaa
plane contratar 3 nuevos empleados. Haba 8 candidatos para los cargos, 6 de los
cuales eran hombres. Los 3 que fueron contratados eran hombres. Un cargo por
discriminacin de sexo se impuso contra la compaa. Cmo decidira usted?
16
Cbtis No. 50
15. Los cinco individuos que componen la direccin de una pequea empresa
manufacturera sern sentados juntos en un banquete. Determine la probabilidad
de que el grupo de tres directivos elegido a partir de los cinco incluya a:
a. Un directivo en particular
16. La revista Forbes (febrero de 1997) clasific las 120 ciudades de estados unidos de
acuerdo con la calidad de vida, con base en parte del porcentaje de empleados
que tenan ttulo universitario. Los resultados se ven en la siguiente tabla de
contingencia parcial, en donde A es menos del 15% con ttulo universitario, B es del
15 al 20% con ttulo universitario y C es ms del 20% con ttulo universitario. Realice
una tabla de probabilidad y responda las preguntas que se presentan en la
siguiente tabla.
Porcentaje
con ttulo
universitario
A
B
C
Total
10
20
40
20
20
10
60
17
20
Cbtis No. 50
Pobre (P)
Bueno (G)
Excelente (E)
Total
Total
P( A) ________
y la probabilidad de seleccionar un empleado con nivel de vida excelente es:
P( E) ________
Las probabilidades conjuntas en las celdas de la estructura principal de la tabla muestran la
probabilidad de la ________________ entre dos eventos. Por ejemplo, la probabilidad de
seleccionar una ciudad con calidad de vida pobre y del 15 al 20% de sus empleados con titulo
universitario, es:
P( P B) __________
Mientras que la notacin
P( E C )
_____________________________________________________________________________
y da:
P( E C) : _______________
18
Cbtis No. 50
Probabilidad condicional
Es la probabilidad de que el evento A ocurra, dado que el evento B ya ocurri. Para ilustrar la
aplicacin de la probabilidad condicional, retomemos la tabla 2 de probabilidades, se puede
observar que la probabilidad de que una ciudad tomada aleatoriamente tenga ms del 20%
de sus empleados con titulo universitario es:
P C
Sin embargo, si se desea calcular la probabilidad de que la ciudad cuente con ms del 20% de
sus empleados con titulo universitario dado que su nivel de vida es excelente se puede hallar
as:
P C | E
Regla de la multiplicacin
P A
P A P A B . Es decir, la probabilidad de A es la
P B P B A
19
Cbtis No. 50
B P A P B
P A
Si los eventos son dependientes, entonces, por definicin, se debe considerar el primer evento al
determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la
condicin que A ya haya ocurrido. Se necesita del principio de probabilidad condicional. La
probabilidad de los eventos conjuntos A y B:
P A
B P A P B | A
Regla de la adicin
La regla de la adicin se utiliza para determinar la probabilidad del evento A o B,
P A
B .
P A
P P A
B P
En el ejemplo de Forbes, la probabilidad de que una ciudad tenga un nivel de vida bueno o
que ms del 20% de sus empleados tengan titulo universitarios es:
La probabilidad del evento A o del evento B cuando los eventos son mutuamente excluyentes
se determina por:
P A
B P
De la tabla 2 de Forbes, los eventos de que una ciudad tenga una calidad de vida pobre o una
calidad de vida excelente son mutuamente excluyentes.
20
Cbtis No. 50
DISTRIBUCIONES DE PROBABILIDAD
INTRODUCCIN
Tal y como lo sugieren estos dos ejemplos, las variables aleatorias pueden ser discretas
o continuas. Una variable aleatoria discreta puede asumir slo ciertos valores, con
frecuencia nmeros enteros, y resulta principalmente del conteo. El nmero de caras
en el experimento del lanzamiento de la moneda es un ejemplo de una variable
aleatoria discreta. Los valores de la variable aleatoria se restringen slo a ciertos
nmeros: 0, 1, 2, y 3. El resultado del lanzamiento de un dado, el nmero de camiones
que llegan por hora al puerto de carga, y el nmero de clientes que estn en fila para
sacar sus libros favoritos, son otros ejemplos de variables aleatorias discretas.
21
Cbtis No. 50
En cada prueba del experimento slo hay dos posibles resultados: xitos o
fracasos.
El resultado obtenido en cada prueba es independiente de los resultados
obtenidos en pruebas anteriores.
La probabilidad de un suceso es constante, la representamos por p, y no
vara de una prueba a otra. La probabilidad del complemento es 1- p y la
representamos por q .
22
Cbtis No. 50
P X ;n, p n C X p X 1 p
n X
donde :
P X ;n, p probabilidad de X-xitos, dadas n y p
n nmero de observaciones
p probabilidad de xitos
1 p probabilidad de fracasos
X nmero de xitos en la muestra X 1,2,
,n
E X n p
n p 1 p
n3
x
0
1
2
3
P(X=x)
23
Cbtis No. 50
Distribucin binomial
0.5
0.4
P(X)
0.3
0.2
0.1
0
0
P(X=x)
0
1
2
3
4
5
6
7
8
9
10
24
Cbtis No. 50
11
12
13
14
15
P(X=x)
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
Cbtis No. 50
Distribucin binomial
0.3
0.25
P(X)
0.2
0.15
0.1
0.05
0
0
10
11
12
13
14
15
Distribucin binomial
0.25
0.2
P(X)
0.15
0.1
0.05
0
1
9 10 11 12 13 14 15 16 17 18 19 20 21
Nmero de xitos (X)
26
Cbtis No. 50
Utilidad:
27
Cbtis No. 50
La expresin matemtica para la distribucin de Poisson para obtener xitos, dado que se espera 1
xito es:
e X
P X ;
X!
P X ; la probabilidad de X eventos en un rea de oportunidad
P(X=x)
P(X=x)
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
28
P(X=x)
Cbtis No. 50
19
20
Distribucin de Poisson
0.4
0.35
0.3
P(X)
0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
29
Cbtis No. 50
Cero?
b.
c.
Entre 3 y 5, inclusive?
14. Un proceso de fabricacin utilizado para hacer artefactos plsticos Incas presenta
una tasa de defectos de 5 por cada 100 unidades. Las unidades se envan a los
distribuidores en lotes de 200. Si la probabilidad de que ms de 3 salgan
defectuosos supera el 30%, usted planea vender en su lugar, camisetas Grateful
Dead. Cul artculo agregar usted al inventario?
30
Cbtis No. 50
15. Usted compra partes para bicicleta de un proveedor en Toledo que tiene 3
defectos por cada 100 partes. Usted est en el mercado para comprar 150 partes
pero no aceptar una probabilidad de ms del 50% de que ms de dos partes sean
defectuosas. Usted le comprara a dicho proveedor?
3.3 Distribucin normal
La funcin de distribucin:
31
Cbtis No. 50
1 X
1
2
f X ; ,
e
2
donde :
es la media
es la desviacin
estndar
3.14159
X es cualquier valor
de la variable
continua
F(X)=P X k
16. Grafique la distribucin normal para los siguientes valores: 50 5,10, 20
P(X)
Distribucin normal
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
20
40
60
X
32
80
100
120
Cbtis No. 50
17. Dada una distribucin normal, encuentre el rea bajo la curva que cae
a. a la izquierda de z 1.43
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4
b. a la derecha de z 0.89
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4
c.
d. a la izquierda de z 1.39
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4
e.
a la derecha de z 1.96
33
Cbtis No. 50
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4
f.
18. Dada una distribucin normal con media igual a 50 y desviacin estndar igual a
10, encuentre la probabilidad de que X asuma un valor entre 45 y 62.
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4
20
14
18
7
10
10
6
8
18
5
19
9
13
7
14
23
13
3
10
15
13
6
32
4
10
12
7
9
27
9
19
10
7
19
6
18
13
10
16
7
34
24
7
11
8
15
Cbtis No. 50
c) menos de 10 segundos.
20. TelCom Satellite presta servicios de comunicacin a los negocios del rea
metropolitana de Chicago. Los funcionarios de la compaa han aprendido que la
transmisin satlite promedio es de 150 segundos, con una desviacin estndar de
15 segundos. Los tiempos parecen estar distribuidos normalmente.
Para estimar de manera apropiada la demanda del cliente por sus servicios y
establecer una estructura de tarifas que maximice las utilidades corporativas,
TelCom debe determinar qu tan probable es que algunas llamadas se presenten.
El director de servicios desea que usted proporcione estimados de la probabilidad
de que una llamada dure:
a.
b.
c.
d.
CONTENIDO DE LA ESTADSTICA
INTRODUCCIN
35
Cbtis No. 50
como una inflacin galopante, el sistema tributario engorroso, etc. Todo nuestro tejido
econmico y social est amenazado por la contaminacin ambiental, la deuda
pblica onerosa, la tasa de criminalidad que siempre va en aumento y las
impredecibles tasas de inters. Esta unidad aportara una visin general sobre lo que es
la estadstica y como puede utilizarse.
36
Cbtis No. 50
La estadstica es la ciencia que tiene que ver con la (1) recoleccin, (2) organizacin,
(3) presentacin, (4) anlisis, e (5) interpretacin de datos. Las dos principales ramas
del anlisis estadstico son:
37
Cbtis No. 50
Recuerde su Jefe espera que usted haga dos cosas: (a) tomar decisiones y (b)
solucionar problemas; estos dos cometidos pueden lograrse a travs de la aplicacin
de procedimientos estadsticos.
Casi todas las reas del saber requieren del pensamiento estadstico. Las disciplinas de
estudios que dependen ampliamente del anlisis estadstico, incluyen pero no se
limitan a, marketing, finanzas, economa e investigacin de operaciones. Los principios
aprendidos en contabilidad y gerencia administrativa tambin se basan en la
preparacin estadstica.
Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el
servicio pblico, el gobierno, a hacia otra fuente de retribucin remunerada, la
experiencia acadmica ser ms completa si se adquiere una slida formacin en
fundamentos de anlisis estadstico.
38
Cbtis No. 50
39
Cbtis No. 50
Hablando en trminos generales, el SQC est diseado para asegurar que los
productos cumplan con unas normas y especificaciones mnimas de produccin. Este
objetivo con frecuencia se promueve a travs del uso del muestreo de aceptacin, el
cual es parte integral del SQC. El muestreo de aceptacin implica probar una muestra
aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo
el envo, o el lote. Esta decisin se basa en parte de un nivel de calidad aceptable
(Aceptable Quality Level, AQL), o nmero mximo de defectos que una empresa est
dispuesta a tolerar.
40
Cbtis No. 50
Estadstico: Elemento que describe una muestra y sirve como una estimacin del
parmetro de la poblacin correspondiente.
1.4.3 Variables
Tipos de variables:
41
Cbtis No. 50
Cuantitativas
(o
numricamente.
numricas):
Pueden
tomar
valores
cuantificables
42
Cbtis No. 50
Comentarios:
ni n
Ni
N
43
(I.1)
Cbtis No. 50
ni n
i Ni
(I.2)
N
i 1
Inconveniente, si los conglomerados son heterogneos entre ellos, puesto que slo se
analizan algunos de ellos, la muestra final puede ser no representativa de la poblacin.
44
Cbtis No. 50
Existen dos causas posibles del error de muestreo. La primera fuente del error de
muestreo es el azar en el proceso del muestreo. Debido al factor azar en la seleccin
de elementos de la muestra, es posible seleccionar sin darse cuenta, elementos que
sean anormalmente grandes o inusualmente pequeos, produciendo una
subestimacin del parmetro. En cualquiera de los dos casos, ha ocurrido un error de
muestreo.
Una forma ms seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre
cuando hay alguna tendencia a seleccionar determinados elementos de muestra en
lugar de otros. Si el proceso de muestreo se disea de manera incorrecta y tiende a
promover la seleccin de demasiadas unidades con una caracterstica en especial, a
expensas de las unidades que no tienen dicha caracterstica, se dice que la muestra
est sesgada.
45
Cbtis No. 50
Las variables pueden clasificarse con base en su escala de medida. La manera en que
se clasifican las variables afecta en gran parte la forma como se utilizan en el anlisis.
Las variables pueden ser (1) nominales, (2) ordinales, (3) de intervalo, o (4) de razn.
Una medida nominal se crea cuando se utilizan nombres para establecer categoras
dentro de las cuales las variables pueden registrarse exclusivamente.
Por ejemplo, el sexo puede clasificarse como hombre o mujer. Se podra codificar
tambin con un 1 o 2, pero los nmeros serviran tan slo para indicar las categoras
y no tendra significado numrico. Es importante recordar que una medida en escala
nominal no indica ningn orden de preferencia, sino que simplemente establece una
disposicin categrica en la cual se puede ubicar cada observacin.
Existen escalas nominales tanto para datos cuantitativos como cualitativos. Una escala
nominal para datos numricos asigna nmeros a las categoras para distinguirlas.
Son las que clasifican las observaciones en categoras con un orden significativo.
Al igual que con los datos nominales, los nmeros pueden utilizarse para ordenar los
rangos. Y al igual que con los datos nominales, la magnitud de los nmeros no es
46
Cbtis No. 50
importante; el rango depende slo del orden de los valores. Por ejemplo se pueden
utilizar los rangos de 1, 2 y 3, o 1, 3 y 12 para este asunto. Las diferencias
aritmticas entre valores carecen de sentido. Un producto con rango 2 no es dos
veces mejor que uno de rango 1.
En una escala de intervalo las variables se miden de manera numrica, y al igual que
los datos ordinales, llevan inherente un rango u ordenamiento. Sin embargo, a
diferencia de los rangos ordinales, la diferencia entre los valores es importante. Por eso,
las operaciones aritmticas de suma y resta, son significativas.
47
Cbtis No. 50
Batera 1 de ejercicios:
1. Describa en sus propios trminos la diferencia entre una poblacin y una muestra;
entre un parmetro y un estadstico.
2. Cul es la diferencia entre una variable cuantitativa y una variable cualitativa. D
ejemplos.
3. Diferencie entre una variable continua y una variable discreta. D ejemplos de
cada una.
4. Seleccione una poblacin cualquiera que sea de su inters. Identifique variables
cuantitativas y cualitativas de esa poblacin que puedan seleccionarse para ser
estudiadas.
5. Analice si las siguientes variables son discretas o continuas:
a. Nmero de cursos que los estudiantes de su colegio estn cursando este
semestre.
b. Nmero de pases atrapados por el beisbolista Tim brown, receptor de los LA
Raiders.
c. Peso de los compaeros de equipo de Tim Brown.
d. Peso del contenido de las cajas de cereal.
e. Nmero de libros que usted ley el ao pasado.
6. En cul escala de medida puede expresarse cada una de estas variables?
Explique sus respuestas.
a. Los estudiantes clasifican a su profesor de estadstica sobre una escala de
terrible, no tan malo, bueno, maravilloso y dios griego.
b. Los estudiantes en una universidad estn clasificados por profesin, tales como
marketing, administracin y contadura.
c. Los estudiantes estn clasificados por cursos utilizando los valores 1, 2 , 3, 4 y 5.
d. Agrupar mediciones de lquidos en octavo, cuarto y galn.
e. Edades de los clientes.
48
Cbtis No. 50
ESTADSTICA DESCRIPTIVA
49
Cbtis No. 50
INTRODUCCIN
Casi todos los trabajos que se hacen en estadstica comienzan con el proceso de
recoleccin de datos necesarios para formar con ellos un conjunto que se utilizar en
el estudio. Para propsitos generales, se adoptar la suposicin conveniente de que
esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos estn
disponibles.
Esta recoleccin de datos originales revela muy poco por s sola. Es extremadamente
difcil determinar el verdadero significado de un grupo de nmeros que simplemente se
han registrado en un papel. Nuestra labor es organizar y describir tales datos de
manera concisa y significativa. Para determinar su significancia, los datos se organizan
de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden
decirnos.
Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de
Estados Unidos. Los datos estn expresados en miles de dlares. Supngase que se
desea analizar, Cul es el ingreso promedio de los ejecutivos de marketing?, Cul
50
Cbtis No. 50
58
64
79
74
69
71
65
55
73
40
76
76
74
38
62
54
79
75
72
50
89
34
56
69
56
31
47
62
64
74
45
65
71
79
38
69
46
57
69
61
67
45
85
61
69
62
77
77
51
69
34
39
87
71
79
39
66
36
50
73
Los mtodos estadsticos de organizacin de datos ofrecen para ello las tcnicas de
agrupacin de los mismos en intervalos o categoras de clases, formando distribuciones
de frecuencias. Cabe aclarar que a los intervalos se les llama indistintamente intervalos
de clase, clases, categoras de clase o categoras.
1.6 DISTRIBUCIN DE FRECUENCIAS TABULARES Y GRFICAS
51
Cbtis No. 50
Ni 3.32 log n
(I.3)
el resultado debe ser un numero entero por lo que si hay una fraccin se
redondea el resultado.
Ti
R
Ni
(I.4)
52
Cbtis No. 50
e. Intervalo de clase: este intervalo est formado por dos valores, los cuales son
la frontera inferior fi y la frontera superior fs . La frontera inferior empieza
con el valor ms pequeo y se le va sumando, suma a suma, el valor del
tamao del intervalo. El total de valores en la frontera inferior es igual al
nmero de intervalos. La frontera superior toma como primer valor el
segundo valor de la frontera inferior restndole una dcima, centsima,
milsima o entero segn la unidad a trabajar. Tambin se irn sumando a los
resultados el valor del tamao del intervalo.
f.
M.C.
fi f s
2
(I.5)
g.1
g.2
g.3
53
Cbtis No. 50
fr
j.
f
n
(I.6)
far
fa
n
(I.7)
La tabla I.1 muestra un resumen de las columnas que forman la tabla de frecuencias
derivada de los pasos antes mencionados. Cabe mencionar que fi1 se lee de la
siguiente manera: frontera inferior de la clase 1(o lmite inferior de la clase 1), es decir el
nmero indica la clase a la que pertenece el valor que ser colocado en esa casilla.
54
Marca de Clase
Lmites de clase
fs
fi
M.C.
Fi
Fs
f f
M.C.1 i1 s1
2
34
0.5
34
0.5
fi1 Vm
34
1
56.7
0.1
f s1 fi 2
ej .
0.01 78.34
0.001 1.235
fi 2 fi1 Ti
fs2 fs1 Ti
f f
M.C.2 i 2 s2
2
0.5
Fi 2 fi 2 0.05
0.005
0.5
Fs2 f s2 0.05
0.005
fi 3 fi 2 Ti
fs3 fs2 Ti
f f
M.C.3 i 3 s3
2
0.5
Fi 3 fi 3 0.05
0.005
0.5
Fs3 f s3 0.05
0.005
Ni
Frecuencia
f
f1
f2
f3
Frecuencia
Relativa
fr
f
fr1 1 100%
n
f2
fr 2
100%
n
f
fr 3 3 100%
n
Frecuencia Acumulada
Menor que
Menos de
fa
Frecuencia Acumulada
Mayor que
o ms
fa
fa1 f1
fa1 f1 f2 f3
fa2 f1 f2
fa2 f2 f3
fa3 f1 f2 f3
fa3 f3
55
Frecuencia Acumulada
Relativa
Menor que
Frecuencia Acumulada
Relativa
Mayor que
f
far1 a1 100%
n
fa2
far 2
100%
n
f
far 3 a3 100%
n
f
far1 a1 100%
n
fa2
far 2
100%
n
f
far 3 a3 100%
n
far %
far %
Los grficos tambin son mtodos tiles para describir conjunto de datos. Un
histograma coloca las clases de una distribucin de frecuencia en el eje horizontal y las
frecuencias en el eje vertical. Su objetivo es revelar detalles y patrones que no se
pueden discernir fcilmente de los datos originales.
60
valor menor
31
valor mayor
89
58
Ni
5.90
Ti
9.67
De acuerdo a los resultados obtenidos, como el valor del tamao de intervalo resulto
un decimal entre 0.5 y 0.9 el nmero de intervalos calculado se acepta y se redondean
las cantidades correspondientes, por tanto la tabla de frecuencias constara de seis
clases con un tamao de intervalo de 10, como se muestra en la tabla I.2.
La tabla I.3 muestra la forma general de la tabla para construir el grafico de histograma
y polgono de frecuencias en la hoja de clculo Excel, mientras que la figura I.1
muestra el grafico obtenido de los datos de los ingresos de 60 ejecutivos de marketing
mostrados en la tabla I.2.
56
Clase
fi
fs
M.C.
Fi
Fs
fr (%)
fa <
fa >
far <
far >
31
40
35.5
30.5
40.5
15%
60
15%
100%
41
50
45.5
40.5
50.5
10%
15
51
25%
85%
51
60
55.5
50.5
60.5
12%
22
45
37%
75%
61
70
65.5
60.5
70.5
17
28%
39
38
65%
63%
71
80
75.5
70.5
80.5
18
30%
57
21
95%
35%
81
90
85.5
80.5
90.5
5%
60
100%
5%
60
100%
Tabla I.3 Datos utilizados para la construccin del Histograma y Polgono de Frecuencias
Fi
Fs
Vi
Fi1
Fs1
f
0
f1
Fi 2
Fs2
f2
fr 2
Fi 3
Fs3
f3
fr 3
T
Vi Fi1 i
2
Vf
fr
Clase
f r1
T
Vf ltimo valor del lmite real superior i
2
57
35%
18
20%
15%
10%
5%
25%
12%
30%
28%
30%
5%
Frecuencia Relativa
17
10%
20
18
16
14
12
10
8
6
4
2
0
15%
Frecuencia (ejecutivos)
0%
25.5
40.5
50.5
60.5
70.5
80.5
90.5
95.5
30.5
40.5
50.5
60.5
70.5
80.5
90.5
Polgono
Figura I.1 Representacin de los ingresos de ejecutivos de marketing en E.U. por medio
de un Histograma y Polgono de frecuencias.
La tabla I.4 ilustra los datos extrados de la tabla de frecuencias para la construccin
del grafico de ojivas: mayor que y menor que utilizando la hoja de clculo Excel, la
figura I.2 muestra el grafico obtenido de los valores de la tabla I.4. Por ejemplo, se
puede leer que de la clase uno 9 ejecutivos gana menos de $31,000 dlares y por otra
parte 60 ejecutivos gana $31,000 dlares o ms.
Una distribucin de frecuencia relativa expresa las frecuencias dentro de una clase
como un porcentaje del nmero total de observaciones.
58
Tabla I.4 Datos utilizados para la construccin de las Ojivas: mayor que y menor que.
Limites
Frontera
de clase
reales
Frecuencia
Acumulada
Menor que
Menos de
fa
Frecuencia
Acumulada
Mayor que
o ms
fa
Frecuencia
Acumulada
Relativa
Menor que
far %
Fi1
fa1
Fs1
fa1
fa2
far1
Fs2
fa2
fa3
far 2
Fs3
fa3
far 3
Frecuencia acumulada
70
60
95%
57
60
51
50
45
40
38
30
65%
39
80%
21
40%
60%
37%
25%
20
10
120%
100%
60 100%
15%
15
20%
0%
22
0
30.5
40.5
50.5
60.5
70.5
80.5
(%) Frecuencia
acumulada relativa
0%
90.5
fa "mayor que"
La tabla I.5 ilustra los datos extrados de la tabla de frecuencias para la construccin
del polgono de frecuencias suavizado por medio de la hoja de clculo Excel, cabe
mencionar que en este grafico se puede observar como se distribuyen los datos de la
muestra y adems en este se localizan las medidas de tendencia central y medidas de
dispersin, la figura I.3 muestra el grafico obtenido de los datos de la tabla I.2.
59
Tabla I.5 Datos utilizados para la construccin del polgono de frecuencias suavizado.
Fi1
Fs1
f
0
f1
Fi 2
Fs2
f2
Fi 3
Fs3
f3
Clase
Fi
Fs
Vi
Vf
Frecuencia (Ejecutivos)
18
18
17
16
14
12
10
8
6
4
2
0
0
25.5
0
40.5
50.5
60.5
70.5
80.5
90.5
95.5
Los datos, al igual que los estudiantes, se congregan alrededor de sus puntos de
encuentro favoritos. Parece que los estudiantes acuden en masa a sitios tales como
partidos de ftbol, fraternidades, bares populares y otros sitios de reunin y en raras
ocasiones hasta la biblioteca. De igual forma, los nmeros parecen disfrutar de la
compaa de otros nmeros y estn propensos a reunirse alrededor de un punto
central denominado medida de tendencia central o ms comnmente, media. Una
medida de tendencia ubica e identifica el punto alrededor del cual se centran los
datos.
60
Un conjunto de datos puede ser rpidamente descrito de manera sucinta con un solo
nmero.
1.7.1 La media
La media toma en cuenta la frecuencia y los puntos medios de cada clase, la siguiente
expresin calcula la media de un conjunto de datos agrupados
Ni
fi MCi
i 1
(I.8)
donde
x es la media muestral,
fi es la frecuencia de la i-sima clase,
MCi es la marca de clase de la i-sima clase,
N i es el nmero de intervalos, y
n es el nmero de datos.
1.7.2 La mediana
Primero debe hallarse la clase que contiene a la mediana, para esto se debe cumplir el
siguiente criterio
fa
61
n
2
(I.9)
Este criterio se debe verificar en cada clase empezando desde el primer intervalo de
clase hasta el ltimo intervalo de clase. La clase que cumpla con la condicin se le
llamar clase mediana. La expresin que calcula la posicin del valor que se
encuentra a la mitad del conjunto de datos es la siguiente
faA
~ F 2
Ti
x
i
f
(I.10)
donde
1.7.3 La moda
Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia, se
hallar en la clase que tenga la frecuencia ms alta, llamada la clase modal. Para
estimar la moda en el caso de datos agrupados, se utiliza la siguiente ecuacin:
1
Ti
x Fi
1 2
donde:
(I.11)
Esto no implica que una medida sea necesariamente mejor que las otras. La medida
que se seleccione depende de la naturaleza de los datos o de la forma como se
utilicen los datos.
1.8.1 El rango
La medida de dispersin ms simple y menos til es el rango o recorrido. El rango es
simplemente la diferencia entre la observacin ms alta y la ms baja. Su ventaja es
que es fcil de calcular. Su desventaja es que considera slo dos de los cientos de
observaciones que hay en un conjunto de datos.
63
s2
Ni
f MC
i
i
Ni
i 1
2
fi MCi
n
i 1
n 1
s var ianza
(I.12)
(I.13)
donde
s 2 es la varianza de la muestra,
1.8.3 Asimetra
64
S k1
Sk2
x
x
s
~
3x x
s
66
(I.14)
(I.15)
Si Sk1 y Sk 2 0 , los datos estn sesgados a la izquierda (-), si Sk1 y Sk 2 0 , los datos
estn sesgados a la derecha (+); si Sk1 y Sk 2 0 estn distribuidos normalmente.
C.V .
s
100%
x
(I.16)
67
Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El
primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones, y sobre
el cual puede encontrarse el 75% restante. El segundo cuartel es justo la mitad. La
mitad de las observaciones estn por debajo y la mitad por encima. El tercer cuartel es
el valor debajo del cual est el 75% de las observaciones y encima del cual puede
encontrarse el 25% restante.
Primero debe hallarse las clases que contienen al primer, segundo y tercer cuartel, para
esto se debe cumplir el siguiente criterio, respectivamente
fa
n
4
(I.17)
fa
2n
4
(I.18)
fa
3n
4
(I.19)
faA
Ti
Q1 Fi 4
f
(I.20)
2n
faA
Ti
Q 2 Fi 4
f
(I.21)
68
3n
faA
Ti
Q 3 Fi 4
f
(I.22)
donde
R.I. Q3 Q1
(I.23)
69
Batera 2 de ejercicios:
n 50
n 35
n 35
n 30
n 30
y
y
y
y
y
R 52
R 820
R 82.01
R 90.1
R 194
76
76
74
38
62
54
79
75
72
50
89
34
56
69
56
31
47
62
64
74
45
65
71
79
38
69
46
57
69
61
70
67
45
85
61
69
62
77
77
51
69
34
39
87
71
79
39
66
36
50
73
g. Construya una tabla de frecuencia para los datos. Tenga mucho cuidado en
la seleccin de sus intervalos de clase. Muestre las frecuencias acumulativas
y relativas para cada clase. Qu conclusin puede sacar de la tabla?
h. Presente y explique una distribucin de frecuencia acumulada ms que y
una distribucin menor de.
4. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones
de la nacin reportadas en la edicin de la revista Forbes de la edicin del 24 de
Mayo de 1997 aparecen en la siguiente tabla de frecuencias.
EDADES
Frecuencias
50
54
55
59
13
60
64
15
65
69
10
70
74
75
79
5. La misma edicin de la revista Forbes tambin proporcion datos sobre los salarios
en miles de dlares. Resulto la siguiente tabla de frecuencias:
Salario (en miles de dlares)
Frecuencias
90
439
440
789
11
790
1139
10
1140
1489
1490
1839
1840
2189
2190
2540
Frecuencia
(nmero de minutos)
(nmero de empleados)
10
10
11
12
15
13
14
17
15
16
14
17
18
19
20
21
23
72
Calificacin:
Completa los espacios en blanco:
1.
La ________________
________________
La Estadstica acta como disciplina puente entre los _______________ _______________ y los
_________________ __________________. Un ______________ _________________ es una abstraccin
simplificada de una realidad ms compleja y siempre existir una cierta discrepancia entre lo que se
observa y lo previsto por el modelo.
3.
4.
5.
6.
El ______________________ es el elemento que describe una _______________ y sirve como una estimacin
del parmetro de la poblacin correspondiente.
Grupo sanguneo (A, B, AB, O+)
Variable
Es una ________________________
de la poblacin que se est
analizando
en
un
estudio
estadstico
Pueden tomar
valores no
cuantificables
numricamente
73
8.
Una medida en escala _________________ se crea cuando se utilizan ________________ para establecer
categoras dentro de las cuales las _________________ pueden registrarse exclusivamente. Es importante
recordar que sta no indica ningn orden de preferencia, sino que simplemente establece una
disposicin ______________________ en la cual se puede ubicar cada observacin.
9.
Una medida en escala ________________, son las que ______________ las observaciones en categoras
con un orden significativo. Hay quien clasifica sus productos como buenos, mejores y los mejores.
10. En una escala de _______________ las variables se miden de manera ______________, y al igual que los
datos ordinales, llevan inherente un rango u ordenamiento. El valor de ______________ es arbitrario pero
la diferencia entre valores es importante.
11. En una escala de ________________, las medidas son numricas, el cero es un valor _____________ en
cualquier escala y la diferencia entre valores es importante. Con datos medidos en una escala de
_________________, se puede determinar cuntas veces es mayor una medida que otra.
M
E
D
I
D
A
A
S
D
F
G
J
K
L
I
U
Y
T
I
W
D
X
A
G
V
O
U
O
C
I
E
A
F
Q
V
D
N
W
S
A
D
F
I
V
G
N
U
M
E
R
I
C
A
X
A
E
D
O
O
C
O
R
D
O
M
F
C
J
J
S
Y
R
L
O
R
R
A
Q
E
T
R
O
B
T
Y
K
O
E
U
A
S
C
R
D
E
D
C
V
S
D
R
S
P
S
R
D
S
C
V
R
D
R
F
V
C
D
R
I
B
R
F
Y
O
Y
O
A
Q
U
I
I
P
R
E
W
E
A
M
N
R
E
Y
A
O
T
R
G
N
I
N
U
O
P
C
E
R
O
T
R
U
N
N
E
M
J
A
R
S
A
A
X
C
V
A
M
M
P
O
O
C
G
K
N
L
T
T
A
L
C
V
B
Z
I
N
C
L
A
L
O
J
L
L
O
S
T
A
Y
K
I
N
J
R
T
M
A
74
R
Y
U
E
P
L
D
G
O
S
P
N
A
H
T
Y
I
S
I
N
I
S
J
I
F
M
N
B
H
D
L
H
Y
S
N
C
C
U
N
D
H
N
O
M
B
R
E
S
P
G
U
H
A
L
A
M
T
F
G
T
A
X
G
A
M
C
A
B
D
K
L
A
I
E
E
K
F
E
N
R
O
Z
O
H
L
N
I
M
E
S
V
R
R
G
D
R
O
A
N
O
N
A
A
M
O
N
R
I
B
I
V
H
A
V
M
Z
S
N
O
N
B
Y
S
H
T
F
J
D
J
J
S
A
I
B
I
N
O
K
R
U
H
J
Y
I
O
F
K
K
R
L
K
E
D
C
V
T
G
I
E
S
F
C
T
G
L
O
T
O
A
B
F
C
D
E
A
O
F
G
H
A
I
K
O
P
Y
J
K
L
T
M
N
O
F
Q
A
E
I
N
P
O
L
L
M
T
G
V
A
R
I
A
B
L
E
S
P
P
Calificacin:
Las edades de 50 integrantes de un programa de servicio social del gobierno son:
38
42
44
47
51
51
51
54
55
55
56
56
60
60
61
62
64
65
65
65
66
66
66
67
68
68
68
69
70
71
73
74
74
75
76
77
78
79
80
82
82
83
83
84
87
88
91
92
98
99
Use estos datos para construir la tabla de frecuencias con 7 y 13 intervalos iguales.
Suponga que el director de servicios sociales desea saber la proporcin de participantes en el
programa que tienen entre 45 y 50 aos de edad. a partir de cul distribucin de frecuencias
relativas, de 7 o de 13 intervalos, puede estimar mejor la respuesta?
Valor menor =
Valor mayor =
Rango =
Caso 1: Ni = 7
Tamao del intervalo =
Clase
fi
fs
M.C.
Fi
Fs
1
2
3
4
5
6
7
75
fr (%)
fa < q
fa > q
far < q
far > q
Caso 2: Ni = 13
Clase
fi
fs
M.C.
Fi
Fs
1
2
3
4
5
6
7
8
9
10
11
12
13
76
fr (%)
fa < q
fa > q
far < q
far > q
50
40
30
20
10
0
0
10
20
30
40
50
60
LMITES REALES
77
70
80
90
100
110
1. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la nacin reportadas en la edicin de la revista Forbes de
la edicin del 24 de Mayo de 1997 aparecen en la siguiente tabla de frecuencias.
clase
fi
fs
50
54
55
59
10
60
64
15
65
69
70
74
75
79
M.C.
Fi
Fs
fr
fa <
fa>
far<
far>
f*MC
f*MC2
fi MCi
i 1
faA
~ F 2
Ti
x
i
f
78
n
fa
2
1
Ti
x Fi
1 2
s2
Ni
f MC
i
i
Ni
i 1
2
fi MCi
n
i 1
n 1
s var ianza
S k1
v mnimo x 1s
v mximo x 1s
v mnimo x 2s
v mximo x 2s
v mnimo x 3s
C.V .
v mximo x 3s
3x ~
x
Sk2
s
x
x
s
s
100%
x
Medidas de posicin:
fa
n
4
faA
Ti
Q1 Fi 4
f
2n
4
2n
faA
4
Ti
f
fa
Q 2 Fi
79
3n
4
3n
faA
4
Ti
f
fa
Q 3 Fi
Fi
Fs
%fr
NUMERO DE DIRECTIVOS
clase
1
2
3
4
5
6
16
35%
14
30%
12
25%
10
20%
8
15%
6
10%
5%
2
0
0%
44.5
49.5
54.5
59.5
64.5
74.5
69.5
EDAD (AOS)
79.5
fa <
fa >
far <
far >
NUMERO DE EJECUTIVOS
FR
50
100%
45
90%
40
80%
35
70%
30
60%
25
50%
20
40%
15
30%
10
20%
10%
49.5 80
0%
54.5
59.5
64.5
EDAD (AOS)
69.5
74.5
79.5
% DE EJECUTIVOS
OJIVAS
% DE DIRECTIVOS
Calificacin:
The Wall Street Journal describi una disputa entre la gerencia y el sindicato de trabajo local
respecto a la eficiencia y productividad de los trabajadores. La gerencia argumentaba que a
los empleados les tomaba ms de 20 minutos terminar cierto trabajo. Si se mide el tiempo de 85
empleados, arrojando los resultados tabulados, con base en esta muestra, la gerencia est en
lo correcto?
Clase
Frecuencia
(nmero de minutos)
(nmero de empleados)
10
10
11
12
15
13
14
17
15
16
14
17
18
19
20
21
22
81
Calificacin:
Los siguientes datos representan las declaraciones trimestrales de impuestos por ventas (en miles
de dlares), correspondientes al perodo que finaliz en marzo de 2004, enviados al contralor
del poblado Fair Lake por los 50 negocios establecidos en dicha localidad:
10.3
13.0
13.0
8.0
11.1
11.6
10.0
12.5
9.3
10.5
11.1
6.7
11.2
11.8
10.2
15.1
12.9
9.3
11.5
7.6
9.6
11.0
7.3
8.7
11.1
12.5
9.2
10.4
10.7
10.1
9.0
8.4
5.3
10.6
9.9
6.5
10.0
12.7
11.6
8.9
14.5
10.3
12.5
9.5
9.8
7.5
12.8
10.5
7.8
8.6
82
Calificacin:
147.8
119.9
142.0
125.0
151.1
137.4
133.3
130.8
128.9
125.7
125.2
142.3
129.8
142.0
126.3
141.1
138.7
141.2
118.6
140.9
Conclusiones:
83
145.7
125.7
134.9
133.0
138.2