Вы находитесь на странице: 1из 84

CENTRO DE BACHILLERATO TECNOLGICO

INDUSTRIAL Y DE SERVICIOS No. 50

PROBABILIDAD Y
ESTADSTICA

Se sugiere al aspirante que trabaje arduamente en el desarrollo de las


actividades de aprendizaje, busque en otras fuentes de informacin, adems
del presente material, busque la retroalimentacin del profesor y recuerda
que para llegar a la meta necesitaras constancia y dedicacin al 100% a tus
estudios de bachillerato.

abril 1

2015

CUADERNILLO
DE TRABAJO

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

PROBABILIDAD
Competencia: Conocer y aplicar los axiomas y teoremas de probabilidad en la
solucin de problemas.
INTRODUCCIN
Sin tener en cuenta la profesin que se haya elegido, algo s es seguro, en algn
momento se han de tomar decisiones. Con mucha frecuencia esto tendr que
hacerse sin conocer todas las consecuencias de tales decisiones. Por ejemplo,
los inversionistas deben decidir sobre la conveniencia de invertir en una accin
en particular, con base en sus expectativas sobre rendimientos futuros. Los
empresarios al decidir comercializar un producto enfrentan la incertidumbre
sobre la posibilidad de xito. En cada caso, como sucede con la mayora de los
asuntos comerciales, se han de tomar decisiones sin toda la informacin
pertinente.
Todo esfuerzo por reducir el nivel de incertidumbre en el proceso de toma de
decisiones incrementa enormemente la probabilidad de que se tomen
decisiones ms inteligentes y bien informadas. El propsito de esta unidad es
ilustrar las formas en las cuales puede medirse la posibilidad o probabilidad de
ocurrencia de eventos futuros.
2.1

TCNICAS DE CONTEO

En este tema se presentarn cuatro mtodos, combinaciones, permutaciones,


escogencia mltiple y multiplicacin, para determinar sin enumeracin directa
el nmero de resultados posibles de un experimento particular o el nmero de
elementos de un conjunto particular.
2.1.1 Principio fundamental del conteo
Si un evento puede realizarse de n1 maneras diferentes, y si, continuando el
procedimiento, un segundo evento puede realizarse de n2 maneras diferentes,
y si, despus de efectuados, un tercer evento puede realizarse de n3 maneras
diferentes, y as sucesivamente, entonces el nmero de maneras en que los
eventos pueden realizarse en el orden indicado es el producto:

n1 n2 n3

(II.1)

Ejemplo 2.1 Supongamos que una placa de automvil consta de dos letras
distintas seguidas de tres dgitos de los cuales el primero no es cero.
Cuntas placas diferentes pueden grabarse?

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Solucin: La primer letra puede colocarse de 26 maneras diferentes


(supuesto el alfabeto de 26 letras), la segunda letra de 25 maneras
diferentes (puesto que la letra grabada en la primer posicin no puede
escogerse como segunda letra), para el primer dgito, para el primer
dgito hay nueve nmeros, es decir nueve maneras, y para cada uno de
los otros dos dgitos 10 maneras. Por lo tanto pueden grabarse
26 25 9 10 10 585,000 ; por tanto se podran formar 585,000 placas
diferentes.
2.1.2 Permutaciones
Si un orden es suficiente para constituir otro subconjunto de r objetos tomados
de un conjunto de n objetos entonces se trata de permutaciones. Una
permutacin de los n objetos tomados r a la vez se define como
n

Pr

n!
n r !

(II.2)

Donde n! se lee n factorial y significa el producto de todos los nmeros de 1 a


n. Por tanto 5! 5 4 3 2 1 120 . Por definicin 0! 1.
Ejemplo 2.1 Hallar el nmero de palabras de tres letras diferentes que pueden
formarse con las letras: a, b, c, d, e, f.
Solucin: Representemos las palabras de tres letras por tres cajas:

Ahora la primera letra puede escogerse de seis formas diferentes; en


seguida, la segunda letra se puede escoger de cinco formas diferentes; y
despus de esto, la ltima letra se puede escoger de cuatro formas
diferentes. Escribamos cada nmero en su correspondiente caja como
sigue:

Aplicando la expresin II.2 se tiene:


6

P3

6!
720

120
6 3! 6

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Por tanto se pueden formar 120 posibles palabras de tres letras sin
repeticin.
2.1.3 Escogencia Mltiple
Muchos problemas del anlisis combinatorio y, en particular, de probabilidad se
relacionan con la escogencia de una bola tomada de una urna que contiene
n bolas (o una carta de una baraja o una persona de una poblacin). Cuando
escogemos una bola tras otra de una urna, r veces, definimos esta escogencia
como una prueba ordenada de tamao r. Se consideran dos casos:
1. Pruebas con sustitucin. En este caso cada bola escogida se regresa a la
urna antes de tomar la siguiente. Ahora puesto que hay n maneras
diferentes para escoger cada bola, segn el principio fundamental del
conteo hay
(II.3)
n
n

n nr

r veces

pruebas ordenadas diferentes de tamao r con sustitucin.


2. Pruebas sin sustitucin. Aqu la bola no se devuelve a la urna antes de
escoger la siguiente. As no hay repeticiones en la prueba ordenada. O
sea que, una prueba ordenada de tamao r sin sustitucin es
simplemente una permutacin r de objetos de la urna. Por consiguiente
hay
n

Pr

n!
n r !

(II.4)

pruebas ordenadas diferentes de tamao r sin sustitucin tomadas de un


grupo de n objetos.
Ejemplo 2.2 De cuantas maneras se pueden escoger tres cartas sucesivas de
una baraja de 52 cartas, (1) con sustitucin, (2) sin sustitucin?
Solucin: (1) si cada carta se regresa al naipe antes de escoger la
siguiente, entonces cada carta puede escogerse de 52 maneras
diferentes. Entonces hay 52 52 52 523 140,608 pruebas ordenadas
diferentes de tamao tres con sustitucin. (2) Por otra parte si no hay
sustitucin, entonces la primera carta puede escogerse de 52 maneras
diferentes, la segunda carta tiene 51 maneras diferentes y la ltima carta
tiene 50 maneras diferentes, por tanto hay 52 P3 132,600 pruebas
ordenadas diferentes de tamao tres sin sustitucin.

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

2.1.4 Combinaciones
Supongamos que tenemos una coleccin de n objetos. Una combinacin de
estos n objetos tomados r a la vez, o una combinacin r, es un subconjunto de r
elementos. En otras palabras, una combinacin r es una seleccin de r o de n
objetos donde el orden no se tiene en cuenta.
n!
(II.5)
n Cr
r ! n r !
Ejemplo 2.3 Considere que dados 10 productos, cuntos subconjuntos de tres
productos podran empacarse juntos y ofrecerse a los clientes? Si se considera
que el orden en el cual se ofrecen los tres productos no influir en los clientes.
Solucin: El nmero de combinaciones de 10 elementos tomados 3 a la vez es
10 C3 120 . Por tanto hay 120 paquetes de tres artculos que se pueden ofrece a
los clientes.
2.2

ENFOQUES DE PROBABILIDAD

La probabilidad es la posibilidad numrica de que ocurra un evento. La


probabilidad de un evento es medida por valores comprendidos entre 0 y 1.
Entre mayor sea la probabilidad de que ocurra un evento, su probabilidad
asignada estar ms prxima a 1, mientras que la probabilidad de una
imposibilidad es 0, sta se expresa como:

0 PE 1

(II.6)

El proceso que produce un evento es denominado experimento. Un


experimento es toda accin bien definida que conlleva a un resultado nico
bien definido.
El conjunto de todos los posibles resultados para un experimento es el espacio
muestral representado por:

S x1 , x 2 , , xn

(II.7)

La teora de la probabilidad ocupa un lugar importante en muchos asuntos de


negocios. Las plizas de seguros de vida dependen de las tablas de mortalidad,
las cuales a su vez se basan en probabilidades de muerte en edades
especficas. Otras tasas de seguros tales como seguro de bienes races y de
automviles se determinan de manera similar. La probabilidad tambin juega
un papel importante en la estimacin del nmero de unidades defectuosas en

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

un proceso de fabricacin, la probabilidad de recibir pagos sobre cuentas por


cobrar y las ventas potenciales de un nuevo producto.
Existen slo tres formas generalmente aceptadas para enfocar: (1) modelo de
frecuencia relativa (o a posteriori), (2) modelo subjetivo y (3) modelo clsico (o a
priori).
El modelo de frecuencia relativa utiliza datos que se han observado
empricamente, registra la frecuencia con que ha ocurrido algn evento en el
pasado y estima la probabilidad de que el evento ocurra nuevamente con
base en estos datos histricos. La probabilidad de un evento con base al
modelo de frecuencia relativa se determina mediante:

PE

Nmero de veces que ha ocurrido el evento en el pasado


Nmero total de observaciones

(II.8)

El modelo subjetivo requiere establecer la probabilidad de algn evento con


base en la mejor evidencia disponible. En muchos casos esto puede ser apenas
una conjetura hecha sobre cierta base. El modelo subjetivo se utiliza cuando se
desea asignar probabilidad a un evento que nunca ha ocurrido. Por ejemplo la
probabilidad de que una mujer sea elegida como presidente de Mxico,
debido a que no hay datos sobre los cuales confiar, deben analizar las
opiniones y creencias para obtener una estimacin subjetiva.
De los tres mtodos para medir la probabilidad, el modelo clsico es el que se
relaciona con mayor frecuencia con las apuestas y juegos de azar. La
probabilidad clsica de un evento E se determina mediante:
PE

2.3

Nmero de formas en las que puede ocurrir un evento


Nmero total de posibles resultados

(II.9)

Axiomas de Probabilidad

2.3.1 Uniones, intersecciones y relaciones entre eventos


Un conjunto es una coleccin de objetos bien definida. Se asume que se han
identificado dos conjuntos A y B. Cada uno contiene numerosos elementos. Un
diagrama de Venn es una herramienta til para mostrar la relacin entre
conjuntos.
Interseccin entre A y B A B : es el conjunto de todos los elementos que estn
tanto en A como en B. Los eventos A y B se les denomina eventos no disyuntos.
La figura 2.1(a) muestra el correspondiente diagrama de Venn.

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Unin de A y B A B : es el conjunto de todos los elementos que estn en A o


en B. La figura 2.1(b) muestra el diagrama de Venn de la unin de dos eventos.

Figura II.1 Diagrama de Venn: (a) A interseccin B y (b) A unin B

Se dice que dos eventos son mutuamente excluyentes si la ocurrencia de uno


prohbe la ocurrencia del otro.
Los eventos son independientes, si la ocurrencia de uno no tiene nada que ver
con la ocurrencia del otro.
Cuando se saca de un conjunto finito, dos eventos son independientes si y slo
si se realiza el reemplazo. Sin embargo, si el primer elemento no se reemplaza
antes de sacar el segundo elemento, los dos eventos son dependientes.
2.3.2 Tablas de contingencia y tablas de probabilidad
Una tabla de contingencia permite examinar o comparar dos variables. De los
500 empleados de King Dynamics, Inc. 170 estn clasificados como miembros
de personal administrativo, 290 como trabajadores de lnea y 40 son auxiliares.
La tabla compara el gnero de los trabajadores y la clasificacin que tienen
stos.
Tabla II.1 Tabla de contingencia para King Dynamics
Clasificacin de los empleados
Gnero

Administrativo

Lnea

Auxiliar

Total

Hombres

120

150

30

300

Mujeres

50

140

10

200

Total

170

290

40

500

Una tabla de probabilidad puede crearse dividiendo cada una de las entradas
de la tabla anterior entre el total, 500 trabajadores. Los resultados se ven en la
tabla.

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Tabla II.2 Tabla de probabilidad para King Dynamics


Clasificacin de los empleados
Gnero

H
Mujeres M

Hombres

Total

Administrativo

Lnea

0.24

150
500

50
500

0.10

170
500

0.34

120
500

Auxiliar

Total

0.06

300
500

0.60

10
500

0.02

200
500

0.40

40
500

0.08

500
500

1.00

0.30

30
500

140
500

0.28

290
500

0.58

Los valores en las mrgenes de la tabla se llaman probabilidades marginales.


Por ejemplo, la probabilidad de seleccionar un trabajador de lnea de manera
aleatoria es

PL 0.58
y la probabilidad de seleccionar un hombre es

PM 0.60
Las probabilidades conjuntas en las celdas de la estructura principal de la tabla
muestran la probabilidad de la interseccin entre dos eventos. Por ejemplo, la
probabilidad de seleccionar un trabajador que sea parte del personal
administrativo y que sea hombre, es

PH S 0.24
Una probabilidad marginal se encuentra como la suma de las probabilidades
conjuntas correspondientes. Por tanto

PH PH S PH L PH A 0.24 0.30 0.06 0.60


2.3.3 Probabilidad condicional
Es la probabilidad de que el evento A ocurra, dado que el evento B ya ocurri.
Se denota como PA|B y se lee la probabilidad de A dado B. La formula
general para calcular la probabilidad condicional, es la siguiente:

PA|B

P A B
PB

(II.10)

Para ilustrar la aplicacin de la expresin III.10, retomemos la tabla de


probabilidades de King Dynamics, se puede observar que la probabilidad de
que un trabajador tomado aleatoriamente sea hombre es

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

PH 0.60
sin embargo, si se desea calcular la probabilidad de que el trabajador sea
hombre dado que es un miembro del personal administrativo PH| S se puede
hallar as
PH S 0.24
PH| S

0.71
PS
0.34
2.3.4 Las dos reglas de la probabilidad
Para calcular la probabilidad de eventos ms complejos utilizaremos la regla de
la multiplicacin y la regla de la adicin. Cada una se utiliza para propsitos
especficos.
2.3.4.1

Regla de la multiplicacin

El propsito de la regla de la multiplicacin es determinar la probabilidad del


evento conjunto PA B . Es decir, que para encontrar la probabilidad de A y B,
simplemente se multiplican sus respectivas probabilidades. El procedimiento
exacto depende de si A y B son dependientes o independientes.
Los eventos A y B son independientes si PA PA|B . Es decir, la probabilidad
de A es la misma bien se considere o no el evento B. De igual forma, si A y B son
independientes, si PB PB| A
Para eventos independientes la probabilidad de dos eventos se vuelve:

PA B PA PB

(II.11)

Si los eventos son dependientes, entonces, por definicin, se debe considerar el


primer evento al determinar la probabilidad del segundo. Es decir, la
probabilidad del evento B depende de la condicin que A ya haya ocurrido. Se
necesita del principio de probabilidad condicional. La probabilidad de los
eventos conjuntos A y B:

PA B PA PB| A

(II.12)

Retornando a la tabla de probabilidad para King Dynamics, tabla II.2, se


observa que la probabilidad marginal de la segunda fila muestra claramente
que

PM 0.4
sin considerar si el trabajador es miembro administrativo, lnea o auxiliar. Sin
embargo, la probabilidad conjunta de que sea mujer y miembro de lnea

PM L 0.28

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Tambin se puede calcular esta probabilidad utilizando la expresin II.12

PM L PM PL|M
el ltimo trmino es
anteriormente como

probabilidad

PL| M

condicional,

la

cual

se

determin

PL M 0.28

0.7
PM
0.4

entonces

PM L PM PL|M 0.4 0.7 0.28


Aunque el uso de una tabla II.2 puede simplificar el clculo de probabilidad,
existen ejemplos en los cuales es muy difcil la creacin de una tabla, por lo
tanto se requiere el uso de las frmulas.
2.3.4.2

Regla de la adicin

La regla de la adicin se utiliza para determinar la probabilidad del evento A o


B, PA B .
La probabilidad de que ocurra el evento A o B para eventos que no son
mutuamente excluyentes, si ambos pueden ocurrir al mismo tiempo, se
determina por medio de la siguiente expresin:

PA B PA PB PA B

(II.13)

En el ejemplo de King Dynamics, la probabilidad de que un empleado sea


trabajador hombre o un trabajador de lnea es:

PM L PM PL PM L 0.4 0.58 0.28 0.7


La probabilidad del evento A o del evento B cuando los eventos son
mutuamente excluyentes se determina por:

PA B PA PB

(II.14)

De la tabla II.2 de King Dynamics, los eventos de que un empleado sea


trabajador hombre o un trabajador mujer son mutuamente excluyentes.

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

ACTIVIDAD DE APRENDIZAJE 1. CUESTIONARIO

Calificacin:

1. Utiliza la palabra, algunas se repiten, o enunciado que complete el espacio en


blanco:

accin
cero
conjunto
enfoque clsico
evento
experimento
frecuencia
relativa
probabilidad
resultado
resultados
subjetivo
uno

datos
empricamente
enfoque
frecuencia
muestral
nmero de formas en las
que puede ocurrir un
evento
nmero de veces que ha
ocurrido el evento en el
pasado
nmero
total
de
observaciones
nmero total de posibles
resultados
pasado

afecta
condiconal
dependientes
excluyentes
independientes
nada
no
ocurran
ocurrencia
otro

Histricamente se han desarrollado tres enfoques conceptuales para definir la probabilidad y


determinar valores de probabilidad:

__________________________________________

__________________________________________

__________________________________________

La _________________ es la posibilidad numrica de que ocurra un evento. La ______________ de


un evento es medida por valores comprendidos entre ____ y _____.
El proceso que produce un ____________ es denominado ____________. Un experimento es toda
_________ bien definida que conlleva a un ____________ nico bien definido.

10

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

El _____________ de todos los posibles ______________ para un _____________ es el espacio


___________ representado por: s x1 , x2 ,

, xn

El ____________ de ____________ relativa utiliza datos que se han observado ______________,


registra la frecuencia con que ha ocurrido algn _____________ en el _____________ y estima la
probabilidad de que el ________________ ocurra nuevamente con base en estos ____________
histricos. La probabilidad de un evento con base al modelo de _________________ relativa se
determina mediante:

P( E )

De los tres mtodos para medir la probabilidad, el modelo clsico es el que se relaciona con
mayor frecuencia con las apuestas y juegos de azar. La probabilidad clsica de un evento E se
determina mediante:

P( E )

Se dice que dos o ms eventos son mutuamente _________________ si la _________________ de


uno prohbe la ocurrencia del _________________. Esto es, si no pueden ocurrir al mismo tiempo.

Dos o ms eventos son ___________ excluyentes cuando es posible que _________________ al


mismo tiempo.

Los eventos son _________________, si la ocurrencia de uno _____ tiene _________________ que ver
con la _________________ del otro. Dos eventos son _________________ cuando la ocurrencia o no
ocurrencia de un evento _________________ a la probabilidad de _________________ del otro
evento.

11

Cbtis No. 50

Cuando

Probabilidad y estadstica (Matemticas aplicadas)

dos

eventos

_________________

son

dependientes,

se

emplea

el

concepto

de

probabilidad

para designar la probabilidad de ocurrencia del evento relacionado. La

expresin P B | A indica la probabilidad de que ocurra el evento B dado que ya ha ocurrido


el evento A. La formula general para calcular la probabilidad condicional, es la siguiente:

Probabilidad de eventos

2. Para cada una de las siguientes situaciones, indique cul de los enfoques de la
probabilidad (el clsico, el de frecuencias relativas o el subjetivo) sera ms til para
determinar el valor de probabilidad requerido.

a. La probabilidad de que haya un golpe de estado el prximo ao.


______________________________
b. La probabilidad de obtener ya sea un 1 o un 6 en un solo lanzamiento de un
dado de seis caras. _________________________________
c. La probabilidad de que una persona aleatoriamente elegida entre las que
visitan una gran tienda departamental realice una compra en esa tienda.
_________________________________________

3. Una bolsa contiene 4 canicas rojas y 3 azules. Si se saca una canica de la bolsa al
azar, cul es la probabilidad de sacar una canica azul?

4. Se escoge aleatoriamente una persona vestida de rojo de un grupo de 5 personas


que visten de rojo y 4 personas que visten de azul.

12

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

5. Se escoge una pelota de tenis verde de una bolsa que contiene 4 pelotas verdes, 7
amarillas y 5 blancas.
6. Determine el valor de probabilidad aplicable a cada una de las siguientes
situaciones.
a. La probabilidad de accidentes industriales en una industria en particular en un
plazo anual. Una muestra aleatoria de 10 empresas, las cuales emplean a un
total de 8000 personas, report la ocurrencia de 400 accidentes industriales
durante un periodo reciente de 12 meses.
b. La probabilidad de acertar a un nmero ganador en un juego de ruleta. Los
nmeros de la rueda incluyen un 0, 00 y del 1 al 36.
c. La probabilidad de que un establecimiento de franquicia de comida rpida sea
financieramente exitoso. El probable inversionista obtiene datos de otras
unidades del sistema de franquicias, estudia el desarrollo de la zona residencial
en la que estar ubicado el establecimiento y considera el volumen de ventas
requerido para garantizar el xito financiero con base en la inversin de capital
requerida y los costos operativos. En general, el inversionista juzga que hay un
80% de posibilidades de que el establecimiento sea financieramente exitoso y
20% de que no lo sea.
7. La siguiente tabla muestra el nmero de computadoras vendidas diariamente por
una tienda minorista
Nmero de
computadoras
vendidas

Nmero de das

12

43

18

20

25

Probabilidad

13

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Determine la probabilidad de que el nmero de computadoras que se vendan el da de hoy


sea:
a. 2
b. Menos de 3
c. Ms de 1

d. Por lo menos 1

8. Un importador de cristal irlands de Nueva York recibe envos de cajas de tres


artculos. La siguiente tabla muestra los datos para las ltimas 100 cajas indicaron el
nmero de artculos daados que haba en cada caja.
Nmero de defectos

Nmero de cajas

Probabilidad

40

27

21

12

Determine la probabilidad de que el nmero de artculos defectuosos sea:


a. 2
b. Menos de 3

c. Ms de 1

d. Ninguno

14

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Probabilidad con tcnicas de conteo

Si un orden es suficiente para constituir otro subconjunto de r objetos tomados de un conjunto


de n objetos entonces se trata de permutaciones. Una permutacin de los n objetos tomados r
a la vez se define como

Pr

n!
n r !

9. Calcula las permutaciones para los siguientes valores de n y r:

n6 r 3
n4 r2
n 10 r 4

Supongamos que tenemos una coleccin de n objetos. Una combinacin de estos n objetos
tomados r a la vez, o una combinacin r, es un subconjunto de r elementos. En otras palabras,
una combinacin r es una seleccin de r o de n objetos donde el orden no se tiene en cuenta.

Cr

n!
r ! n r !

10. Calcula las combinaciones para los siguientes valores de n y r:

n6 r 3
n4 r2
n 10 r 4

15

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

11. Un caso reciente en la corte del condado de Madison, Kentucky, sobre las
prcticas de contratacin de una compaa de telfonos local. La compaa
plane contratar 3 nuevos empleados. Haba 8 candidatos para los cargos, 6 de los
cuales eran hombres. Los 3 que fueron contratados eran hombres. Un cargo por
discriminacin de sexo se impuso contra la compaa. Cmo decidira usted?

12. Diez unidades de produccin se seleccionan de una lnea de produccin. Tres de


estas 10 son defectuosas. Si deben sacar 5 de las 10, cul es la probabilidad de
que 2 sean defectuosas?

13. Un representante de ventas debe visitar seis ciudades durante un viaje.


a. Si en la zona geogrfica por visitar hay 10 ciudades, cuntas diferentes
agrupaciones de seis ciudades susceptibles de ser visitadas por el representante
de ventas hay?
b. Supongamos que en la zona geogrfica que visitar el representante de ventas
hay 10 ciudades y, adems, que la secuencia en la que sern programadas las
visitas a la seis ciudades elegidas tambin es de importancia. Cuntas
secuencias son posibles para las seis ciudades asignadas?

14. De las ciudades mencionadas en el problema anterior, supongamos que seis de


ellas son en realidad mercados primarios del producto en cuestin mientras que las
otras cuatro son mercados secundarios. Si el vendedor elige aleatoriamente las seis
ciudades por visitar, cul es la probabilidad de que:
a. Cuatro de ellas sean mercados primarios y dos mercados secundarios

b. Las seis resulten ser mercados primarios

16

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

15. Los cinco individuos que componen la direccin de una pequea empresa
manufacturera sern sentados juntos en un banquete. Determine la probabilidad
de que el grupo de tres directivos elegido a partir de los cinco incluya a:
a. Un directivo en particular

b. Dos directivos en particular

c. Tres directivos en particular

Tablas de probabilidades conjuntas

16. La revista Forbes (febrero de 1997) clasific las 120 ciudades de estados unidos de
acuerdo con la calidad de vida, con base en parte del porcentaje de empleados
que tenan ttulo universitario. Los resultados se ven en la siguiente tabla de
contingencia parcial, en donde A es menos del 15% con ttulo universitario, B es del
15 al 20% con ttulo universitario y C es ms del 20% con ttulo universitario. Realice
una tabla de probabilidad y responda las preguntas que se presentan en la
siguiente tabla.

Porcentaje
con ttulo
universitario
A
B
C
Total

Tabla 1. Clasificacin de la revista Forbes para las 120 ciudades de EU


Calidad de vida
Pobre (P)
Bueno (G)
Excelente (E)
Total

10

20

40
20

20

10
60

17

20

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Tabla 2. Tabla de probabilidad para las 120 ciudades de EU


Porcentaje
con ttulo
universitario

Pobre (P)

Bueno (G)

Excelente (E)

Total

Total

Los valores en las mrgenes de la tabla se llaman _______________________. La probabilidad de


seleccionar una ciudad con menos del 15% de empleados con ttulo universitario es:

P( A) ________
y la probabilidad de seleccionar un empleado con nivel de vida excelente es:

P( E) ________
Las probabilidades conjuntas en las celdas de la estructura principal de la tabla muestran la
probabilidad de la ________________ entre dos eventos. Por ejemplo, la probabilidad de
seleccionar una ciudad con calidad de vida pobre y del 15 al 20% de sus empleados con titulo
universitario, es:

P( P B) __________
Mientras que la notacin

P( E C )

se lee como _______________________________

_____________________________________________________________________________
y da:

P( E C) : _______________

Una probabilidad marginal se encuentra como la suma de las probabilidades conjuntas


correspondientes.

18

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Probabilidad condicional

Es la probabilidad de que el evento A ocurra, dado que el evento B ya ocurri. Para ilustrar la
aplicacin de la probabilidad condicional, retomemos la tabla 2 de probabilidades, se puede
observar que la probabilidad de que una ciudad tomada aleatoriamente tenga ms del 20%
de sus empleados con titulo universitario es:

P C

Sin embargo, si se desea calcular la probabilidad de que la ciudad cuente con ms del 20% de
sus empleados con titulo universitario dado que su nivel de vida es excelente se puede hallar
as:

P C | E

Regla de la multiplicacin

El propsito de la regla de la multiplicacin es determinar la probabilidad del evento conjunto

P A

B . Es decir, que para encontrar la probabilidad de A y B, simplemente se multiplican

sus respectivas probabilidades. El procedimiento exacto depende de si A y B son dependientes


o independientes.

Los eventos A y B son independientes si

P A P A B . Es decir, la probabilidad de A es la

misma bien se considere o no el evento B. De igual forma, si A y B son independientes, si

P B P B A

Para eventos independientes la probabilidad de dos eventos se vuelve:

19

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

B P A P B

P A

Si los eventos son dependientes, entonces, por definicin, se debe considerar el primer evento al
determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la
condicin que A ya haya ocurrido. Se necesita del principio de probabilidad condicional. La
probabilidad de los eventos conjuntos A y B:

P A

B P A P B | A

Regla de la adicin
La regla de la adicin se utiliza para determinar la probabilidad del evento A o B,

P A

B .

La probabilidad de que ocurra el evento A o B para eventos que no son mutuamente


excluyentes, si ambos pueden ocurrir al mismo tiempo, se determina por medio de la siguiente
expresin:

P A

P P A

B P

En el ejemplo de Forbes, la probabilidad de que una ciudad tenga un nivel de vida bueno o
que ms del 20% de sus empleados tengan titulo universitarios es:

La probabilidad del evento A o del evento B cuando los eventos son mutuamente excluyentes
se determina por:

P A

B P

De la tabla 2 de Forbes, los eventos de que una ciudad tenga una calidad de vida pobre o una
calidad de vida excelente son mutuamente excluyentes.

20

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

DISTRIBUCIONES DE PROBABILIDAD

Competencia: Conocer e identificar las diferentes funciones de distribucin de


probabilidad, para su aplicacin en la solucin de problemas.

INTRODUCCIN

Una variable aleatoria es una variable cuyo valor es el resultado de un evento


aleatorio. Se supone que se lanza una moneda tres veces y se anota el nmero de
caras que se obtienen. Los posibles resultados son 0 caras, 1 cara, 2 caras, o 3 caras. La
variable aleatoria es el nmero de caras que se obtienen, y los posibles resultados son
los valores de la variable aleatoria. Como segundo ejemplo, los pesos de envo del
agua mineral en contenedores oscilaban aleatoriamente entre 10 a 25 libras. Los pesos
reales de los contenedores, en libras, son los valores de la variable aleatoria "peso".

Tal y como lo sugieren estos dos ejemplos, las variables aleatorias pueden ser discretas
o continuas. Una variable aleatoria discreta puede asumir slo ciertos valores, con
frecuencia nmeros enteros, y resulta principalmente del conteo. El nmero de caras
en el experimento del lanzamiento de la moneda es un ejemplo de una variable
aleatoria discreta. Los valores de la variable aleatoria se restringen slo a ciertos
nmeros: 0, 1, 2, y 3. El resultado del lanzamiento de un dado, el nmero de camiones
que llegan por hora al puerto de carga, y el nmero de clientes que estn en fila para
sacar sus libros favoritos, son otros ejemplos de variables aleatorias discretas.

Una variable aleatoria continua resulta principalmente de la medicin y puede tomar


cualquier valor, al menos dentro de un rango dado. Los pesos del agua mineral es un
ejemplo, debido a que los contenedores pueden tomar cualquier valor entre 10 y 25
libras. Otros ejemplos de variables aleatorias continuas incluyen la estatura de los
clientes en una tienda de ropa, los ingresos de los empleados en un centro comercial
local y el tiempo transcurrido entre la llegada de cada cliente a la biblioteca. En cada
caso, la variable aleatoria puede medirse con cualquier valor, incluyendo fracciones
de la unidad. Aunque las unidades monetarias no pueden dividirse en un nmero
continuo o infinito de subdivisiones (el dlar puede subdividirse slo 100 veces),
comnmente se tratan como distribuciones continuas de probabilidad.

21

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Una distribucin de probabilidad es un despliegue de todos los posibles resultados de


un experimento junto con las probabilidades de cada resultado. La probabilidad de
que la variable aleatoria tome algn valor especfico, ., se escribe ( = ). El valor
esperado de una variable aleatoria discreta es la media ponderada de todos los
posibles resultados en los cuales los pesos son las probabilidades respectivas de tales
resultados.
3.1 Distribuciones de probabilidad binomial

En estadstica, la distribucin binomial es una distribucin de probabilidad discreta que


mide el nmero de xitos en una secuencia de n ensayos independientes de Bernoulli
con una probabilidad fija p de ocurrencia del xito entre los ensayos.

En las empresas se tienen situaciones donde se espera que ocurra o no un evento


especfico. ste puede ser de xito o fracaso.

La distribucin binomial se utiliza en situaciones cuya solucin tiene dos posibles


resultados. Ejemplos:

Al nacer un beb puede ser varn o mujer.


En el deporte un equipo puede ganar o perder.
En pruebas de cierto o falso slo hay dos alternativas.
Un tratamiento mdico puede ser efectivo o inefectivo.
La meta de produccin o ventas del mes se pueden o no lograr.
En pruebas de seleccin mltiple, aunque hay cuatro o cinco alternativas, se
pueden clasificar como correcta o incorrecta.

Propiedades de un experimento de Bernoulli

En cada prueba del experimento slo hay dos posibles resultados: xitos o
fracasos.
El resultado obtenido en cada prueba es independiente de los resultados
obtenidos en pruebas anteriores.
La probabilidad de un suceso es constante, la representamos por p, y no
vara de una prueba a otra. La probabilidad del complemento es 1- p y la
representamos por q .

22

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Funcin de probabilidad binomial se expresa como:

P X ;n, p n C X p X 1 p

n X

donde :
P X ;n, p probabilidad de X-xitos, dadas n y p
n nmero de observaciones
p probabilidad de xitos
1 p probabilidad de fracasos
X nmero de xitos en la muestra X 1,2,

,n

La media y desviacin estndar de la distribucin se definen como:

E X n p
n p 1 p

1. Grafique la distribucin binomial para los siguientes valores:

n3

p 0.25 x 0,1, 2,3

x
0
1
2
3

P(X=x)

23

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Distribucin binomial
0.5

0.4

P(X)

0.3
0.2
0.1
0
0

Nmero de xitos (X)

2. La probabilidad de que cierta clase de componente pase con xito una


determinada prueba de impacto es 0.75. Encuentre la probabilidad de que
exactamente 2 de los siguientes 4 componentes que se prueban pasen la prueba.
3. La probabilidad de que un paciente se recupere de una rara enfermedad de la
sangre es 0.4. Si se sabe que 15 personas han contrado esta enfermedad, cul es
la probabilidad de que: a) sobrevivan entre 3 y 8 personas, b) sobrevivan
exactamente 5 personas y c) al menos 10 sobrevivan.

4. En pruebas realizadas a un amortiguador para automvil se encontr que el 20%


presentaban fuga de aceite. Si se instalan 20 de estos amortiguadores, hallar la
probabilidad de que: a) 4 salgan defectuosos, b) ms de 5 tengan fuga de aceite,
c) de 3 a 6 amortiguadores salgan defectuosos y d) determine el promedio y la
desviacin estndar de amortiguadores con defectos.
x

P(X=x)

0
1
2
3
4
5
6
7
8
9
10

24

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

11
12
13
14
15

P(X=x)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

25

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Distribucin binomial
0.3
0.25

P(X)

0.2
0.15
0.1
0.05
0
0

10

11

12

13

14

15

Nmero de xitos (X)

Distribucin binomial
0.25

0.2

P(X)

0.15

0.1

0.05

0
1

9 10 11 12 13 14 15 16 17 18 19 20 21
Nmero de xitos (X)

26

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

3.2 Distribucin de Poisson

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de


probabilidad discreta. Expresa la probabilidad de un nmero k de eventos ocurriendo
en un tiempo fijo, si estos eventos ocurren con una frecuencia media conocida y son
independientes del tiempo discurrido desde el ltimo evento. Se dice que existe un
proceso de Poisson si podemos observar eventos discretos en un rea de oportunidad
un intervalo continuo (de tiempo, longitud, superficie, etc.) de tal manera que si se
reduce lo suficiente el rea de oportunidad o el intervalo,

La probabilidad de observar exactamente un xito en el intervalo es constante.


La probabilidad de obtener ms de un xito en el intervalo es 0.
La probabilidad de observar un xito en cualquier intervalo es estadsticamente
independiente de la de cualquier otro intervalo.

Utilidad:

La distribucin de Poisson se utiliza en situaciones donde los sucesos son


impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de
posibles resultados.
Permite determinar la probabilidad de ocurrencia de un suceso con resultado
discreto.
Es muy til cuando la muestra o segmento, n, es grande y la probabilidad de
xitos p es pequea.
Se utiliza cuando la probabilidad del evento que nos interesa se distribuye
dentro de un segmento dado como por ejemplo distancia, rea, volumen o
tiempo definido.

Esta distribucin se aplica en situaciones como:

La llegada de un cliente al negocio durante una hora.


Las llamadas telefnicas que se reciben en un da.
Los defectos en manufactura de papel por cada metro producido.
Los envases llenados fuera de los lmites por cada 100 galones de producto
terminado.
El nmero de pacientes que llegan al servicio de emergencia de un hospital en
un intervalo de tiempo.
El nmero de glbulos blancos que se cuentan en una muestra dada.
El nmero de partos triples por ao

27

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

La expresin matemtica para la distribucin de Poisson para obtener xitos, dado que se espera 1
xito es:

e X
P X ;
X!
P X ; la probabilidad de X eventos en un rea de oportunidad

nmero de eventos esperado (media)


X nmero de eventos
5. Grafique la distribucin de Poisson para los siguientes valores:

1, 4,10 x 0,1, 2,3,..., 20


X

P(X=x)

P(X=x)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

28

P(X=x)

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

19
20

Distribucin de Poisson
0.4
0.35
0.3

P(X)

0.25
0.2
0.15
0.1
0.05
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

6. Un comerciante de verduras tiene conocimiento de que el 3% de la caja est


descompuesta. Si un comprador elige 100 verduras al azar, encuentre la
probabilidad de que: (a) las 4 estn descompuestas y (b) de 1 a 3 estn
descompuestas.
7. En pruebas realizadas a un amortiguador para automvil se encontr que el 0.04
presentaban fuga de aceite. Si se instalan 150 de estos amortiguadores, hallar la
probabilidad de que: (a) 4 salgan defectuosos, (b) ms de 5 tengan fuga de
aceite, y (c) de 3 a 6 amortiguadores salgan defectuosos.
8. Si 8 de 100 viviendas violan el cdigo de construccin. cul es la probabilidad de
que un inspector de viviendas, que selecciona aleatoriamente a 50 de ellas,
descubra que: (a) ninguna de las casas viola el cdigo de construccin, (b) una
viola el cdigo de construccin y (c) dos violan el cdigo de construccin.
9. El nmero de pacientes que llega a un hospital sigue una distribucin de Poisson. Si
el nmero promedio es de 120 por hora, cul es la probabilidad de que en un
minuto lleguen por lo menos 3 pacientes?
10. Se sabe que 10 es el nmero promedio de camiones tanque de aceite que llegan
por da a una cierta ciudad portuaria. Las instalaciones del puerto pueden atender
cuando mucho a 15 camiones tanque en un da. Cul es la probabilidad de que
en un determinado da se tengan que regresar los camiones tanque?

29

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

11. En un estudio de un inventario se determin que, en promedio, la demanda por un


artculo en particular en una bodega era 5 veces al da. Cul es la probabilidad
de que en un determinado da este artculo sea requerido: (a) ms de 5 veces y (b)
ni una sola vez?
12. El profesor Bradley anima a sus estudiantes de estadstica a "actuar de forma
prudente" consultando al tutor si tienen alguna pregunta mientras se preparan para
el examen final. Parece que la llegada de los estudiantes a la oficina del tutor se
ajusta a una distribucin de Poisson, con un promedio de 5.2 estudiantes cada 20
minutos. El profesor Bradley est preocupado porque si muchos estudiantes
necesitan los servicios del tutor, puede resultar un problema de congestin.
a) El tutor debe determinar la probabilidad de que cuatro estudiantes lleguen
durante cualquier intervalo de 20 minutos, lo cual podra causar el problema de
congestin que teme el profesor Bradley. Si la probabilidad excede el 20%, se
contratar un segundo tutor.
b) El tutor debe calcular la probabilidad de que ms de cuatro estudiantes
lleguen durante algn perodo de 20 minutos. Si es mayor que el 50%, las horas
de oficina del tutor se aumentarn, permitiendo a los estudiantes extender el
horario en las que vienen a ver al tutor.
c) Si la probabilidad de que ms de siete estudiantes lleguen durante un perodo
cualquiera de 30 minutos excede 50%, el mismo profesor Bradley ofrecer tutora
adicional.

13. A un conmutador de la oficina principal de la compaa llegan llamadas a un


promedio de dos por minuto y se sabe que tienen distribucin de Poisson. Si el
operador est distrado por un minuto, cul es la probabilidad de que el nmero de
llamadas no respondidas sea:
a.

Cero?

b.

Por lo menos una?

c.

Entre 3 y 5, inclusive?

14. Un proceso de fabricacin utilizado para hacer artefactos plsticos Incas presenta
una tasa de defectos de 5 por cada 100 unidades. Las unidades se envan a los
distribuidores en lotes de 200. Si la probabilidad de que ms de 3 salgan
defectuosos supera el 30%, usted planea vender en su lugar, camisetas Grateful
Dead. Cul artculo agregar usted al inventario?

30

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

15. Usted compra partes para bicicleta de un proveedor en Toledo que tiene 3
defectos por cada 100 partes. Usted est en el mercado para comprar 150 partes
pero no aceptar una probabilidad de ms del 50% de que ms de dos partes sean
defectuosas. Usted le comprara a dicho proveedor?
3.3 Distribucin normal

Una de las herramientas de mayor uso en las empresas es la utilizacin de la curva


normal para describir situaciones donde podemos recopilar datos. Esto nos permite
tomar decisiones que vayan a la par con las metas y objetivos de la organizacin.
Utilidad:

Se utiliza muy a menudo porque hay muchas variables asociadas a fenmenos


naturales que siguen el modelo de la normal.
Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una
especie, por ejemplo: tallas, pesos, dimetros, distancias, permetros,...
Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco,
o de una misma cantidad de abono
Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un
mismo grupo de individuos, puntuaciones de examen
Caracteres psicolgicos, por ejemplo: cociente intelectual, grado de
adaptacin a un medio,...

La funcin de distribucin:

Puede tomar cualquier valor (- , + )


Hay ms probabilidad para los valores cercanos a la media m
Conforme nos separamos de , la probabilidad va decreciendo de igual forma
a derecha e izquierda (es simtrica).
Conforme nos separamos de , la probabilidad va decreciendo dependiendo la
desviacin tpica

31

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

La expresin matemtica para la distribucin normal:

1 X


1
2
f X ; ,
e
2
donde :
es la media
es la desviacin
estndar
3.14159
X es cualquier valor
de la variable
continua

F(X)=P X k
16. Grafique la distribucin normal para los siguientes valores: 50 5,10, 20

P(X)

Distribucin normal
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0

20

40

60
X

32

80

100

120

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

17. Dada una distribucin normal, encuentre el rea bajo la curva que cae
a. a la izquierda de z 1.43
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

b. a la derecha de z 0.89
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

c.

entre z 2.16 y z 0.65


0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

d. a la izquierda de z 1.39
0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

e.

a la derecha de z 1.96

33

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

f.

entre z 0.48 y z 1.74


0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

18. Dada una distribucin normal con media igual a 50 y desviacin estndar igual a
10, encuentre la probabilidad de que X asuma un valor entre 45 y 62.

0.5
0.4
0.3
0.2
0.1
-3.4
-3
-2.6
-2.2
-1.8
-1.4
-1
-0.6
-0.2
0.2
0.6
1
1.4
1.8
2.2
2.6
3
3.4

19. Los siguientes datos representan la duracin de vida en segundos de 50 moscas,


sometidas a un nuevo atomizador en un experimento de laboratorio controlado:
17
12
16
13
7

20
14
18
7
10

10
6
8
18
5

19
9
13
7
14

23
13
3
10
15

13
6
32
4
10

12
7
9
27
9

19
10
7
19
6

18
13
10
16
7

a) determine el porcentaje de vida de las moscas entre 10 y 20 segundos,


b) ms de 23 segundos,

34

24
7
11
8
15

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

c) menos de 10 segundos.
20. TelCom Satellite presta servicios de comunicacin a los negocios del rea
metropolitana de Chicago. Los funcionarios de la compaa han aprendido que la
transmisin satlite promedio es de 150 segundos, con una desviacin estndar de
15 segundos. Los tiempos parecen estar distribuidos normalmente.
Para estimar de manera apropiada la demanda del cliente por sus servicios y
establecer una estructura de tarifas que maximice las utilidades corporativas,
TelCom debe determinar qu tan probable es que algunas llamadas se presenten.
El director de servicios desea que usted proporcione estimados de la probabilidad
de que una llamada dure:
a.
b.
c.
d.

Entre 125 y 150 segundos.


Menos de 125 segundos.
Entre 145 y 155 segundos.
Entre 160 y 165 segundos.

21. Como ingeniero constructor usted compra bolsas de cemento de un promedio de


50 libras, con una desviacin estndar de 5.2 libras. Debe que usted tuvo el
accidente escalando una montaa, el mdico le dijo que no levantara nada que
pesara ms de 60 libras debera usted cargar una bolsa?

CONTENIDO DE LA ESTADSTICA

Competencia: El estudiante determinar el contenido de la estadstica dentro del rea


de conocimiento de su profesin.

INTRODUCCIN

A medida que aumenta la complejidad de nuestro mundo, se hace cada vez ms


difcil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales
decisiones deben tomarse con mucho menos que un conocimiento adecuado y
experimentando una gran incertidumbre. Sin embargo, las soluciones a estos
problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia
final. Continuamente estamos recibiendo presiones debido a problemas econmicos

35

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

como una inflacin galopante, el sistema tributario engorroso, etc. Todo nuestro tejido
econmico y social est amenazado por la contaminacin ambiental, la deuda
pblica onerosa, la tasa de criminalidad que siempre va en aumento y las
impredecibles tasas de inters. Esta unidad aportara una visin general sobre lo que es
la estadstica y como puede utilizarse.

1.1 OBJETO DE LA ESTADSTICA

La Estadstica se ocupa de la recoleccin, agrupacin, presentacin, anlisis e


interpretacin de datos, por tanto, la estadstica es un mtodo cientfico que pretende
sacar conclusiones a partir de unas observaciones hechas.

El objetivo bsico de la estadstica es hacer inferencia acerca de una poblacin


basada en la informacin contenida en una muestra. Inferir significa predecir, suponer,
asegurar. Es decir se pretende establecer inferencia acerca de una poblacin.
Entendiendo a la poblacin como un conjunto de individuos, organismos o entes
inanimados de los cuales queremos conocer alguna o algunas caractersticas para
que nos ayuden a tomar una decisin u obtener alguna conclusin de suma
importancia.

La Estadstica actual es el resultado de la unin de dos disciplinas que evolucionaron


de forma independiente hasta confluir en el siglo XIX:

el Clculo de Probabilidades, que naci en el siglo XVII como la teora matemtica


de los juegos de azar,
la Estadstica, o ciencia del Estado, que estudia la descripcin de datos, y que tiene
unas races ms antiguas, de hecho, tan antiguas como la humanidad (censos de
poblacin). La interaccin de ambas lneas de pensamiento da lugar a la ciencia que
estudia cmo obtener conclusiones de la investigacin emprica mediante el uso de
modelos matemticos.
Resumiendo la Estadstica acta como disciplina puente entre los modelos
matemticos y los fenmenos reales. Un modelo matemtico es una abstraccin
simplificada de una realidad ms compleja y siempre existir una cierta discrepancia

36

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

entre lo que se observa y lo previsto por el modelo. La Estadstica proporciona una


metodologa para evaluar y juzgar estas discrepancias entre la realidad y la teora.

1.2 RAMAS DE LA ESTADSTICA

La estadstica es la ciencia que tiene que ver con la (1) recoleccin, (2) organizacin,
(3) presentacin, (4) anlisis, e (5) interpretacin de datos. Las dos principales ramas
del anlisis estadstico son:

Estadstica descriptiva, es el proceso de recolectar, agrupar y presentar datos


de una manera tal que describa fcil y rpidamente dichos datos.

Estadstica inferencial involucra la utilizacin de una muestra para sacar alguna


inferencia o conclusin sobre la poblacin de la cual hace parte la muestra.

1.3 ESTADSTICA EN LA INVESTIGACIN

Virtualmente cada rea de la investigacin cientfica seria puede beneficiarse del


anlisis estadstico. Para quien formula las polticas econmicas y para quien asesora al
presidente y otros funcionarios pblicos sobre procedimientos econmicos apropiados,
la estadstica ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas
tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden
hacerse de manera inteligente tan slo con la ayuda del anlisis estadstico. Los
hombres y mujeres de negocios en su eterna bsqueda de la rentabilidad, consideran
que la estadstica es esencial en el proceso de toma de decisiones. Los esfuerzos en
control de calidad, minimizacin de costos, combinacin de productos e inventarios, y
una gran cantidad de otros asuntos empresariales, pueden manejarse efectivamente a
travs del uso de procedimientos estadsticos comprobados.

Para quienes estn en el rea de la investigacin de mercados, la estadstica es de


gran ayuda en el momento de determinar qu tan probable es que un producto
nuevo sea exitoso. La estadstica tambin es muy til para evaluar las oportunidades de
inversin por parte de asesores financieros. Los contadores, los jefes de personal y los
fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del anlisis

37

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

estadstico. Incluso un investigador en el campo de la medicina, interesado en la


efectividad de un nuevo medicamento, considera la estadstica una aliada
imprescindible.

Recuerde su Jefe espera que usted haga dos cosas: (a) tomar decisiones y (b)
solucionar problemas; estos dos cometidos pueden lograrse a travs de la aplicacin
de procedimientos estadsticos.

1.3.1 La aplicacin universal de la estadstica

Los problemas complejos que enfrenta el mundo actual requieren soluciones


cuantitativas. Si usted no est en capacidad de aplicar la estadstica y otros mtodos
cuantitativos a muchos de los problemas comunes que sin duda se le presentarn,
estar en gran desventaja en el mercado laboral.

Casi todas las reas del saber requieren del pensamiento estadstico. Las disciplinas de
estudios que dependen ampliamente del anlisis estadstico, incluyen pero no se
limitan a, marketing, finanzas, economa e investigacin de operaciones. Los principios
aprendidos en contabilidad y gerencia administrativa tambin se basan en la
preparacin estadstica.

Los analistas financieros y econmicos con frecuencia se basan en sus habilidades


cuantitativas para proporcionar soluciones a problemas difciles. La compresin de los
principios financieros y econmicos permitir aplicar las tcnicas estadsticas para
hallar soluciones viables y tomar decisiones.

Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el
servicio pblico, el gobierno, a hacia otra fuente de retribucin remunerada, la
experiencia acadmica ser ms completa si se adquiere una slida formacin en
fundamentos de anlisis estadstico.

1.3.2 Gerencia de calidad total

38

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

A medida que la competencia mundial se intensifica, surge, de parte de los negocios,


un esfuerzo por promover la calidad de sus productos. Este esfuerzo, conocido
ampliamente como Gerencia de Calidad Total (Total Quality Management, TQM), tiene
como propsito central la promocin de las cualidades del producto que el
consumidor considera importantes. Tales atributos van desde la ausencia de defectos
hasta el servicio eficiente y la respuesta rpida a las posibles quejas del consumidor.
Hoy da, la mayora de los grandes negocios, as como tambin muchos negocios
pequeos, tienen departamentos de Control de Calidad (Quality Control, QC) cuya
funcin es recolectar datos sobre el desempeo y solucionar problemas de calidad.
As, la TQM representa un rea creciente de oportunidades para quienes tienen
conocimientos en estadstica.

La TQM involucra el uso de equipos integrados conformados por ingenieros, expertos


en marketing, especialistas en diseo, estadsticos, y otros profesionales que pueden
contribuir a la satisfaccin del cliente. La formacin de estos equipos, denominada
Despliegue de la Funcin de la Calidad (Quality Function Deployment, QFD), est
diseada para reconocer y agenciar las inquietudes de los consumidores. Los
especialistas actan conjuntamente para promover la calidad del producto y para
que supla de manera efectiva las necesidades y preferencias del consumidor.

Los crculos de control de calidad constan de un grupo pequeo de empleados


(generalmente entre 5 y 12) que se renen regularmente para solucionar problemas
relacionados con el trabajo. Con frecuencia se conforman tanto con trabajadores en
lnea como con representantes de la gerencia; los miembros de estos crculos de
calidad son todos de la misma rea de trabajo y reciben capacitacin formal en
control estadstico de calidad y en planeacin de grupos. A travs de discusiones
abiertas y del anlisis estadstico, los crculos pueden lograr mejoras significativas en
diversas reas que van desde el mejoramiento de la calidad, el diseo del producto, la
productividad y los mtodos de produccin, hasta la reduccin de costos y seguridad.

Uno de los elementos ms importantes del TQM es un conjunto de herramientas y


mtodos estadsticos utilizados para promover el Control Estadstico de Calidad
(Statistical Quality Control, SQC). Tales herramientas ayudan a organizar y analizar
datos para efectos de solucionar problemas.

39

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Hablando en trminos generales, el SQC est diseado para asegurar que los
productos cumplan con unas normas y especificaciones mnimas de produccin. Este
objetivo con frecuencia se promueve a travs del uso del muestreo de aceptacin, el
cual es parte integral del SQC. El muestreo de aceptacin implica probar una muestra
aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo
el envo, o el lote. Esta decisin se basa en parte de un nivel de calidad aceptable
(Aceptable Quality Level, AQL), o nmero mximo de defectos que una empresa est
dispuesta a tolerar.

1.4 CONCEPTOS BSICOS

Toda rama de la investigacin cientfica tiene su vocabulario propio y la estadstica no


es la excepcin, las definiciones y expresiones que siguen son esenciales para la
compresin de cmo se realizan las pruebas estadsticas.

1.4.1 Poblacin y parmetros

Poblacin: Es la recoleccin completa de todas las observaciones de inters para el


investigador. Una poblacin puede ser finita o infinita.

Poblacin finita: Es aquella que posee o incluye un nmero limitado de medidas y


observaciones. Se pueden listar los elementos en algn orden y en consecuencia
contarlos uno a uno hasta alcanzar el ltimo.

Poblacin infinita: Es infinita si se incluye un gran conjunto de medidas y observaciones


que no pueden alcanzarse en el conteo. Hipotticamente no existe lmite en cuanto al
nmero de observaciones que cada uno de ellos puede generar. Es conveniente
referirse a una poblacin infinita cuando se habla de una poblacin que no puede ser
numerada en un periodo razonable.

Parmetro: Es una medida descriptiva de la poblacin total de todas las observaciones


de inters para el investigador.

40

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

1.4.2 Muestras y estadsticos

Muestra: Es una parte representativa de la poblacin que se selecciona para ser


estudiada ya que la poblacin es demasiado grande como para analizarla en su
totalidad.

Estadstico: Elemento que describe una muestra y sirve como una estimacin del
parmetro de la poblacin correspondiente.

1.4.3 Variables

Variable: Es una caracterstica de la poblacin que se est analizando en un estudio


estadstico.

Tipos de variables:

Cualitativas, categricas (o alfanumricas): Pueden tomar valores no


cuantificables numricamente. Se denomina categora a cada uno de los
valores que toma la variable.

Nominales: si no existe ningn orden entre las categoras de la variable.


Ejemplos, el grupo sanguneo (A ,B ,AB, O); el color de los ojos (azules,
verdes, marrones, negros).
Binarias: aqullas que slo toman dos valores posibles (s/no,
presencia/ausencia de cierto carcter), dentro de las nominales. Ejemplo:
el sexo, ser fumador, tener carn de conducir, ser daltnico.
Ordinales: cuando existe un cierto orden entre las categoras de la
variable. Ejemplo: el nivel de estudios (sin estudios, bsicos, medios,
superiores), el grado de miopa (ausencia, bajo, medio, alto).

41

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Cuantitativas
(o
numricamente.

numricas):

Pueden

tomar

valores

cuantificables

Discretas: si solamente toman valores aislados (generalmente enteros).


Suelen corresponder a conteos. Ejemplos, el nmero de hermanos, el nmero
de cafs/da, el nmero de multas/ao.
Continuas: potencialmente puede tomar cualquier valor numrico dentro de
un intervalo o de una unin de intervalos. Ejemplos, el tiempo de reaccin a
un cierto medicamento, el peso de un individuo, la longitud del caparazn
de una tortuga.

1.4.4 Mtodos de muestreo

Gran parte del trabajo de un estadstico se realiza con muestras. En la prctica no va a


ser posible estudiar todos los elementos de la poblacin, por varias razones:

El estudio puede implicar la destruccin del elemento (estudio de la vida media


de una partida de bombillas, estudio de la tensin de rotura de unos cables).
Los elementos pueden existir conceptualmente, pero no en realidad (poblacin
de piezas defectuosas que producir una mquina en su vida til).
Puede ser inviable econmicamente (muy costoso) estudiar a toda la
poblacin.
El estudio llevara tanto tiempo que sera impracticable e incluso las propiedades
de la poblacin podran variar con el tiempo.

Por tanto debe seleccionarse una muestra de la poblacin, calcular el estadstico de la


muestra, y utilizarlo para estimar el parmetro correspondiente de la poblacin.

1.4.4.1 Muestreo aleatorio simple

Una muestra es aleatoria simple cuando:

1. cada elemento de la poblacin tiene la misma probabilidad de ser escogido en


forma individual,
2. las observaciones se realizan con reposicin, de manera que la poblacin es
idntica en todas las extracciones.

42

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Comentarios:

La condicin (1) asegura la representatividad.


La condicin (2) se impone por simplicidad: si el tamao de la poblacin N es
grande con respecto al tamao muestral n, es prcticamente indiferente realizar
el muestreo con o sin reposicin.

Cmo se realiza? Se utilizan las tablas de nmeros aleatorios: se enumeran los


elementos de la poblacin del 1 al N y se toman nmeros aleatorios de tantas cifras
como tenga N. El valor del nmero aleatorio indicar el elemento a seleccionar.

1.4.4.2 Muestreo Estratificado

Los elementos de la poblacin se dividen en grupos homogneos o estratos segn la


caracterstica ms importante (por ejemplo, segn el sexo, la edad, la profesin, etc.).
Para esto:

se asigna un nmero de elementos a cada estrato,


dentro de cada estrato se seleccionan los elementos por muestreo aleatorio
simple.

Si hay k estratos de tamaos N1 , ,Nk , de manera que N N1 Nk , la


composicin de la muestra ser n n1 nk , donde el nmero de elementos se
pueden determinar de dos formas distintas:

1. proporcionalmente al tamao de cada estrato:

ni n

Ni
N

2. proporcionalmente a la variabilidad de cada estrato:

43

(I.1)

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

ni n

i Ni

(I.2)

N
i 1

donde i es una medida de la variabilidad del estrato i-simo.

1.4.4.3 Muestreo por conglomerados

Hay situaciones en que ni el muestreo aleatorio simple ni el estratificado son aplicables.


En estos casos es habitual que los elementos de la poblacin se encuentren agrupados
en conglomerados, de los cuales s que se sabe cuntos hay. (Por ejemplo, la
poblacin se distribuye en provincias, los habitantes de una ciudad se distribuyen en
barrios, etc.).

Si puede suponerse que cada conglomerado es una muestra representativa de la


poblacin total respecto de la variable de estudio, podemos:

seleccionar al azar algunos de estos conglomerados,


dentro de cada conglomerado, analizar:
a) todos sus elementos,
b) una muestra aleatoria simple de sus elementos.

Inconveniente, si los conglomerados son heterogneos entre ellos, puesto que slo se
analizan algunos de ellos, la muestra final puede ser no representativa de la poblacin.

Las ideas de estratificacin y conglomerado son opuestas:

La estratificacin funciona mejor cunto mayor sean las diferencias entre


estratos, pero es necesario que los estratos sean homogneos internamente.
Los conglomerados funcionan mejor cunto menores sean las diferencias entre
ellos, pero deben ser muy heterogneos internamente, es decir, dentro de cada
conglomerado debe estar incluida toda la variabilidad de la poblacin.

44

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

La regla general que se aplica a todos los procedimientos de muestreo es que


cualquier informacin previa tiene que utilizarse para subdividir la poblacin y asegurar
una mayor representatividad de la muestra. Una vez que los grupos homogneos han
sido definidos, la seleccin dentro de ellos debe realizarse por muestreo aleatorio
simple.

La exactitud de toda estimacin es de enorme importancia. Esta exactitud depende


en gran parte de la forma como se tom la muestra, y del cuidado que se tenga para
garantizar que la muestra proporcione una imagen confiable de la poblacin. Sin
embargo, con mucha frecuencia se comprueba que la muestra no es del todo
representativa de la poblacin y resultara un error de muestreo.

Existen dos causas posibles del error de muestreo. La primera fuente del error de
muestreo es el azar en el proceso del muestreo. Debido al factor azar en la seleccin
de elementos de la muestra, es posible seleccionar sin darse cuenta, elementos que
sean anormalmente grandes o inusualmente pequeos, produciendo una
subestimacin del parmetro. En cualquiera de los dos casos, ha ocurrido un error de
muestreo.

Una forma ms seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre
cuando hay alguna tendencia a seleccionar determinados elementos de muestra en
lugar de otros. Si el proceso de muestreo se disea de manera incorrecta y tiende a
promover la seleccin de demasiadas unidades con una caracterstica en especial, a
expensas de las unidades que no tienen dicha caracterstica, se dice que la muestra
est sesgada.

El sesgo, es el grado de asimetra que presenta un histograma o polgono de


frecuencias. Si el histograma est cargado a la izquierda, el sesgo tiene un valor
negativo. En cambio cuando esta ms cargado a la derecha, el sesgo toma un valor
positivo. Si el sesgo adquiere un valor nulo, significa que el histograma es simtrico.

1.4.5 Escalas de medida

45

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Las variables pueden clasificarse con base en su escala de medida. La manera en que
se clasifican las variables afecta en gran parte la forma como se utilizan en el anlisis.
Las variables pueden ser (1) nominales, (2) ordinales, (3) de intervalo, o (4) de razn.

1.4.5.1 Mediciones en escala nominal

Una medida nominal se crea cuando se utilizan nombres para establecer categoras
dentro de las cuales las variables pueden registrarse exclusivamente.

Por ejemplo, el sexo puede clasificarse como hombre o mujer. Se podra codificar
tambin con un 1 o 2, pero los nmeros serviran tan slo para indicar las categoras
y no tendra significado numrico. Es importante recordar que una medida en escala
nominal no indica ningn orden de preferencia, sino que simplemente establece una
disposicin categrica en la cual se puede ubicar cada observacin.

Existen escalas nominales tanto para datos cuantitativos como cualitativos. Una escala
nominal para datos numricos asigna nmeros a las categoras para distinguirlas.

1.4.5.2 Medidas en escalas ordinales

Son las que clasifican las observaciones en categoras con un orden significativo.

A diferencia de una medida en escala nominal, una medida en escala ordinal si


muestra un ordenamiento o secuencia de los datos. Es decir, que las observaciones se
clasifican con base en algunos criterios. Hay quien clasifica sus productos como
buenos, mejores y los mejores. Las encuestas de opinin con frecuencia utilizan
una medida en escala ordinal como totalmente de acuerdo, de acuerdo, sin
opinin, en desacuerdo, y en total desacuerdo.

Al igual que con los datos nominales, los nmeros pueden utilizarse para ordenar los
rangos. Y al igual que con los datos nominales, la magnitud de los nmeros no es

46

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

importante; el rango depende slo del orden de los valores. Por ejemplo se pueden
utilizar los rangos de 1, 2 y 3, o 1, 3 y 12 para este asunto. Las diferencias
aritmticas entre valores carecen de sentido. Un producto con rango 2 no es dos
veces mejor que uno de rango 1.

1.4.5.3 Medidas en escala de intervalo

Medidas en una escala numrica en la cual el valor de cero es arbitrario pero la


diferencia entre valores es importante. Los datos de intervalo son cuantitativos por
necesidad; una escala de intervalo no siempre tiene un punto cero.

En una escala de intervalo las variables se miden de manera numrica, y al igual que
los datos ordinales, llevan inherente un rango u ordenamiento. Sin embargo, a
diferencia de los rangos ordinales, la diferencia entre los valores es importante. Por eso,
las operaciones aritmticas de suma y resta, son significativas.

1.4.5.4 Medidas en escala de razn

Medidas numricas en las cuales cero es un valor fijo en cualquier escala y la


diferencia entre valores es importante. Con datos medidos en una escala de razn, se
puede determinar cuantas veces es mayor una medida que otra.

La escala de razn se basa en un sistema numrico en el cual el cero es significativo.


Por tanto las operaciones de multiplicacin y divisin tambin toman una
interpretacin racional. Una escala de razn se utiliza para medir muchos tipos de
datos que se encuentran en el anlisis empresarial. Variables tales como costos,
rentabilidad y niveles de inventario se expresan como medidas de razn. Por ejemplo,
una firma con una participacin en el mercado del 40% tiene dos veces ms
participacin que una firma con una participacin en el mercado del 20%. Las
medidas tales como peso, tiempo y distancia tambin se miden en una escala de
razn, ya que cero es significativo y un artculo que pesa 100 libras tiene la mitad del
peso de un artculo que pesa 200 libras.

47

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

Batera 1 de ejercicios:

1. Describa en sus propios trminos la diferencia entre una poblacin y una muestra;
entre un parmetro y un estadstico.
2. Cul es la diferencia entre una variable cuantitativa y una variable cualitativa. D
ejemplos.
3. Diferencie entre una variable continua y una variable discreta. D ejemplos de
cada una.
4. Seleccione una poblacin cualquiera que sea de su inters. Identifique variables
cuantitativas y cualitativas de esa poblacin que puedan seleccionarse para ser
estudiadas.
5. Analice si las siguientes variables son discretas o continuas:
a. Nmero de cursos que los estudiantes de su colegio estn cursando este
semestre.
b. Nmero de pases atrapados por el beisbolista Tim brown, receptor de los LA
Raiders.
c. Peso de los compaeros de equipo de Tim Brown.
d. Peso del contenido de las cajas de cereal.
e. Nmero de libros que usted ley el ao pasado.
6. En cul escala de medida puede expresarse cada una de estas variables?
Explique sus respuestas.
a. Los estudiantes clasifican a su profesor de estadstica sobre una escala de
terrible, no tan malo, bueno, maravilloso y dios griego.
b. Los estudiantes en una universidad estn clasificados por profesin, tales como
marketing, administracin y contadura.
c. Los estudiantes estn clasificados por cursos utilizando los valores 1, 2 , 3, 4 y 5.
d. Agrupar mediciones de lquidos en octavo, cuarto y galn.
e. Edades de los clientes.

48

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

ESTADSTICA DESCRIPTIVA

COMPETENCIA: El estudiante aplicar las tcnicas de estadstica descriptiva a un


conjunto de datos mediante el uso de modelos tabulares y grficos, con el fin de
describir dicho conjunto y utilizar dicha informacin en el proceso de toma de
decisiones.

Organizacin y representacin de datos


Distribucin de frecuencias tabulares y grficas
Medidas de tendencia central
Medidas de dispersin, asimetra y kurtosis
Medidas de posicin

49

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

INTRODUCCIN

Casi todos los trabajos que se hacen en estadstica comienzan con el proceso de
recoleccin de datos necesarios para formar con ellos un conjunto que se utilizar en
el estudio. Para propsitos generales, se adoptar la suposicin conveniente de que
esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos estn
disponibles.

Esta recoleccin de datos originales revela muy poco por s sola. Es extremadamente
difcil determinar el verdadero significado de un grupo de nmeros que simplemente se
han registrado en un papel. Nuestra labor es organizar y describir tales datos de
manera concisa y significativa. Para determinar su significancia, los datos se organizan
de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden
decirnos.

1.5 ORGANIZACIN Y REPRESENTACIN DE DATOS

Pueden utilizarse varias herramientas bsicas para describir y resumir un conjunto


grande de datos. La manera ms simple, pero quizs la ms significativa, es la serie
ordenada. Una serie ordenada simplemente enumera tales observaciones en orden
ascendente o descendente. Est proporciona alguna agrupacin al conjunto de
datos; por ejemplo, se puede ver de inmediato los valores extremos. Sin embargo la
utilidad de una serie ordenada es limitada. Las herramientas que resultan de particular
utilidad para organizar los datos incluyen tablas de frecuencia que colocan los datos
en clases especficas y diversos grficos que pueden proporcionar una representacin
visual de los datos.

Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas de
Estados Unidos. Los datos estn expresados en miles de dlares. Supngase que se
desea analizar, Cul es el ingreso promedio de los ejecutivos de marketing?, Cul

50

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

sera el ingreso mnimo y mximo?, etc. Los resultados obtenidos se muestran en el


siguiente cuadro de datos:

58
64
79
74
69
71
65
55
73
40

76
76
74
38
62
54
79
75
72
50

89
34
56
69
56
31
47
62
64
74

45
65
71
79
38
69
46
57
69
61

67
45
85
61
69
62
77
77
51
69

34
39
87
71
79
39
66
36
50
73

La forma en la que se presentaron los datos dificulta la obtencin de la respuesta a


tales interrogantes. Conviene, pues, organizar los datos de tal modo que proporcionen
informacin resumida y ms clara sobre el proceso.

Los mtodos estadsticos de organizacin de datos ofrecen para ello las tcnicas de
agrupacin de los mismos en intervalos o categoras de clases, formando distribuciones
de frecuencias. Cabe aclarar que a los intervalos se les llama indistintamente intervalos
de clase, clases, categoras de clase o categoras.
1.6 DISTRIBUCIN DE FRECUENCIAS TABULARES Y GRFICAS

Cuando se tiene un problema en donde la muestra contenga ms de 30 datos se


emplea el mtodo de datos agrupados para obtener el histograma y las ojivas
correspondientes. El procedimiento para organizar los datos en distribuciones de
frecuencias se describe a continuacin:

1. La tabla de datos se ordena de menor a mayor.


2. Se determina la tabla de frecuencias, distribucin de frecuencias simples, en la cul
se determinan los siguientes valores:
a. Se obtiene el nmero de datos n ,

51

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

b. Se obtiene el rango R valor mayor - valor menor ,


c. Se obtiene el numero de intervalos, ste en la tabla de frecuencias
determina el numero de renglones y en el histograma determina el numero
de rectngulos o barras, el cul est definido por la siguiente ecuacin:

Ni 3.32 log n

(I.3)

el resultado debe ser un numero entero por lo que si hay una fraccin se
redondea el resultado.

d. Se determina el tamao del intervalo por medio de:

Ti

R
Ni

(I.4)

en el histograma representa el ancho del rectngulo. El resultado se trabaja


con un solo decimal. Si el resultado del rango tiene decimales, entonces se
recorre el punto hasta hacerlo un nmero entero antes de sacar el tamao
del intervalo.
Criterio para determinar el tamao del intervalo:

d.1 No se aceptan resultados enteros

d.2 No se aceptan decimales entre 0.1 0.4

d.3 Solo se aceptan decimales entre 0.5 0.9

d.4 Si el resultado obtenido de aplicar la expresin I.4 cae en el caso d.1 o


d.2 entonces el nmero de intervalos se disminuye una unidad, Ni 1 y se
calcula el Ti , si ste es rechazado, entonces ahora se aumenta en una
unidad el nmero de intervalos, Ni 1 y se calcula el Ti . Si no se acepta el

52

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

resultado, entonces al nmero de intervalos original se le restan o se le suman


dos unidades y as sucesivamente hasta que sea aceptado el resultado.

Cuando el resultado sea aceptado entonces queda definido el nmero de


intervalos; para sacar el tamao de intervalos finalmente se redondea el
resultado aun nmero entero y se coloca el punto en su posicin original.

e. Intervalo de clase: este intervalo est formado por dos valores, los cuales son
la frontera inferior fi y la frontera superior fs . La frontera inferior empieza
con el valor ms pequeo y se le va sumando, suma a suma, el valor del
tamao del intervalo. El total de valores en la frontera inferior es igual al
nmero de intervalos. La frontera superior toma como primer valor el
segundo valor de la frontera inferior restndole una dcima, centsima,
milsima o entero segn la unidad a trabajar. Tambin se irn sumando a los
resultados el valor del tamao del intervalo.

f.

Marca de Clase: es el punto medio del intervalo de clase dado por

M.C.

fi f s
2

(I.5)

g. Intervalos reales: estos se obtienen del intervalo de clase de la siguiente


forma

g.1

Si se trabajan enteros se resta a fi cinco dcimas (0.5) y se suma a f s


cinco dcimas (0.5),

g.2

Si se trabajan dcimas (ej. 20.3) se resta a fi cinco centsimas (0.05)


y se suma a f s cinco centsimas (0.05), y

g.3

Si se trabajan centsimas (ej. 5.67) se resta a fi cinco milsimas


(0.005) y se suma a f s cinco milsimas (0.005).

53

Cbtis No. 50

Probabilidad y estadstica (Matemticas aplicadas)

h. Frecuencia absoluta f : es el nmero de datos contenidos en determinado


intervalo, se obtiene de la tabla de datos ordenados.
i.

Frecuencia absoluta relativa fr :

fr

j.

f
n

(I.6)

Frecuencia acumulada fa : suma acumulada de las frecuencias absolutas


de cada uno de los intervalos, la frecuencia acumulada menor que suma
primero del primer intervalo al ltimo y la frecuencia acumulada mayor
que suma del ltimo intervalo al primero .

k. Frecuencia acumulada relativa far :

far

fa
n

(I.7)

La tabla I.1 muestra un resumen de las columnas que forman la tabla de frecuencias
derivada de los pasos antes mencionados. Cabe mencionar que fi1 se lee de la
siguiente manera: frontera inferior de la clase 1(o lmite inferior de la clase 1), es decir el
nmero indica la clase a la que pertenece el valor que ser colocado en esa casilla.

54

Tabla I.1. Bosquejo general de la tabla de frecuencias.


Clase

Marca de Clase

Lmites de clase
fs

fi

Lmites reales de clase

M.C.

Fi

Fs

f f
M.C.1 i1 s1
2

34
0.5

Fi1 fi1 0.05 ej . 56.7


0.005 78.34

34
0.5

Fs1 f s1 0.05 ej . 56.7


0.005 78.34

fi1 Vm

34
1

56.7
0.1
f s1 fi 2
ej .
0.01 78.34
0.001 1.235

fi 2 fi1 Ti

fs2 fs1 Ti

f f
M.C.2 i 2 s2
2

0.5

Fi 2 fi 2 0.05
0.005

0.5

Fs2 f s2 0.05
0.005

fi 3 fi 2 Ti

fs3 fs2 Ti

f f
M.C.3 i 3 s3
2

0.5

Fi 3 fi 3 0.05
0.005

0.5

Fs3 f s3 0.05
0.005

Ni

Frecuencia

f
f1
f2
f3

Frecuencia
Relativa

fr

f
fr1 1 100%
n
f2
fr 2
100%
n
f
fr 3 3 100%
n

Frecuencia Acumulada
Menor que
Menos de

fa

Frecuencia Acumulada
Mayor que
o ms

fa

fa1 f1

fa1 f1 f2 f3

fa2 f1 f2

fa2 f2 f3

fa3 f1 f2 f3

fa3 f3

55

Frecuencia Acumulada
Relativa
Menor que

Frecuencia Acumulada
Relativa
Mayor que

f
far1 a1 100%
n
fa2
far 2
100%
n
f
far 3 a3 100%
n

f
far1 a1 100%
n
fa2
far 2
100%
n
f
far 3 a3 100%
n

far %

far %

Los grficos tambin son mtodos tiles para describir conjunto de datos. Un
histograma coloca las clases de una distribucin de frecuencia en el eje horizontal y las
frecuencias en el eje vertical. Su objetivo es revelar detalles y patrones que no se
pueden discernir fcilmente de los datos originales.

Aplicando la metodologa antes mencionada (paso 1 y 2: de a hasta d.4) a los datos


no agrupados de ingresos de ejecutivos de marketing se obtienen los siguientes valores
para determinar el nmero de clases:

60

valor menor

31

valor mayor

89

58

Ni

5.90

Ti

9.67

De acuerdo a los resultados obtenidos, como el valor del tamao de intervalo resulto
un decimal entre 0.5 y 0.9 el nmero de intervalos calculado se acepta y se redondean
las cantidades correspondientes, por tanto la tabla de frecuencias constara de seis
clases con un tamao de intervalo de 10, como se muestra en la tabla I.2.

En la tabla I.2 se ilustran los datos agrupados de la muestra de los ingresos de 60


ejecutivos de marketing en seis intervalos de clase donde: fi y fs es la frontera inferior y
superior, respectivamente, MC es la marca de clase, Fi y Fs es la frontera real inferior y
superior, respectivamente, f es la frecuencia y fr es la frecuencia relativa, fa < y fa > es
la frecuencia acumulada menor que y mayor que, respectivamente y finalmente
far es la frecuencia acumulada relativa.

La tabla I.3 muestra la forma general de la tabla para construir el grafico de histograma
y polgono de frecuencias en la hoja de clculo Excel, mientras que la figura I.1
muestra el grafico obtenido de los datos de los ingresos de 60 ejecutivos de marketing
mostrados en la tabla I.2.

56

Tabla I.2. Datos agrupados de los ingresos de 60 ejecutivos de marketing.

Clase

fi

fs

M.C.

Fi

Fs

fr (%)

fa <

fa >

far <

far >

31

40

35.5

30.5

40.5

15%

60

15%

100%

41

50

45.5

40.5

50.5

10%

15

51

25%

85%

51

60

55.5

50.5

60.5

12%

22

45

37%

75%

61

70

65.5

60.5

70.5

17

28%

39

38

65%

63%

71

80

75.5

70.5

80.5

18

30%

57

21

95%

35%

81

90

85.5

80.5

90.5

5%

60

100%

5%

60

100%

Tabla I.3 Datos utilizados para la construccin del Histograma y Polgono de Frecuencias

Fi

Fs

Vi

Fi1

Fs1

f
0
f1

Fi 2

Fs2

f2

fr 2

Fi 3

Fs3

f3

fr 3

T
Vi Fi1 i
2

Vf

ltimo valor del


limite real superior

fr

Clase

f r1

T
Vf ltimo valor del lmite real superior i
2

57

35%

18

20%
15%
10%

5%

25%

12%

30%

28%

30%

5%

Frecuencia Relativa

17

10%

20
18
16
14
12
10
8
6
4
2
0

15%

Frecuencia (ejecutivos)

Ingresos de ejecutivos de marketing para empresas en E.U.

0%

25.5

40.5

50.5

60.5

70.5

80.5

90.5

95.5

30.5

40.5

50.5

60.5

70.5

80.5

90.5

Lm ites Reales (m iles de dlares)


Histograma

Polgono

Figura I.1 Representacin de los ingresos de ejecutivos de marketing en E.U. por medio
de un Histograma y Polgono de frecuencias.

Con frecuencia se desea determinar el nmero de observaciones que son mayor


que o menor que alguna cantidad. Esto puede lograrse con una distribucin de
frecuencia acumulada ms de o mayor que o una distribucin de frecuencia
acumulada menos de o menor que.

La tabla I.4 ilustra los datos extrados de la tabla de frecuencias para la construccin
del grafico de ojivas: mayor que y menor que utilizando la hoja de clculo Excel, la
figura I.2 muestra el grafico obtenido de los valores de la tabla I.4. Por ejemplo, se
puede leer que de la clase uno 9 ejecutivos gana menos de $31,000 dlares y por otra
parte 60 ejecutivos gana $31,000 dlares o ms.

Una distribucin de frecuencia relativa expresa las frecuencias dentro de una clase
como un porcentaje del nmero total de observaciones.

58

Tabla I.4 Datos utilizados para la construccin de las Ojivas: mayor que y menor que.

Limites
Frontera
de clase
reales

Frecuencia
Acumulada
Menor que
Menos de

fa

Frecuencia
Acumulada
Mayor que
o ms

fa

Frecuencia
Acumulada
Relativa
Menor que

far %

Fi1

fa1

Fs1

fa1

fa2

far1

Fs2

fa2

fa3

far 2

Fs3

fa3

far 3

Frecuencia acumulada

70
60

95%
57

60
51

50

45
40

38

30

65%
39

80%

21

40%

60%

37%
25%

20
10

120%
100%
60 100%

15%

15

20%

0%

22

0
30.5

40.5

50.5

60.5

70.5

80.5

(%) Frecuencia
acumulada relativa

Grafica de Frecuencias Acumuladas "OJIVAS"

0%

90.5

Lm ites Reales (m iles de dolares $)


fa "menor que"

fa "mayor que"

far "menor que"

Figura I.2 Representacin de los ingresos de ejecutivos de marketing en E.U. por


medio de Ojivas: mayor que y menor que.

La tabla I.5 ilustra los datos extrados de la tabla de frecuencias para la construccin
del polgono de frecuencias suavizado por medio de la hoja de clculo Excel, cabe
mencionar que en este grafico se puede observar como se distribuyen los datos de la
muestra y adems en este se localizan las medidas de tendencia central y medidas de
dispersin, la figura I.3 muestra el grafico obtenido de los datos de la tabla I.2.

59

Tabla I.5 Datos utilizados para la construccin del polgono de frecuencias suavizado.

Fi1

Fs1

f
0
f1

Fi 2

Fs2

f2

Fi 3

Fs3

f3

Clase

Fi

Fs

Vi

ltimo valor del


limite real superior

Vf

Polgono de Frecuencias Suavizado


20

Frecuencia (Ejecutivos)

18

18

17

16
14
12
10

8
6
4

2
0

0
25.5

0
40.5

50.5

60.5

70.5

80.5

90.5

95.5

Lm ites Reales (Miles de Dolares $)

Figura I.3 Representacin de los ingresos de ejecutivos de marketing en E.U. por


medio de un polgono de frecuencias suavizada.

1.7 Medidas de tendencia central

Los datos, al igual que los estudiantes, se congregan alrededor de sus puntos de
encuentro favoritos. Parece que los estudiantes acuden en masa a sitios tales como
partidos de ftbol, fraternidades, bares populares y otros sitios de reunin y en raras
ocasiones hasta la biblioteca. De igual forma, los nmeros parecen disfrutar de la
compaa de otros nmeros y estn propensos a reunirse alrededor de un punto
central denominado medida de tendencia central o ms comnmente, media. Una
medida de tendencia ubica e identifica el punto alrededor del cual se centran los
datos.

60

Un conjunto de datos puede ser rpidamente descrito de manera sucinta con un solo
nmero.

1.7.1 La media

La media toma en cuenta la frecuencia y los puntos medios de cada clase, la siguiente
expresin calcula la media de un conjunto de datos agrupados

Ni

fi MCi
i 1

(I.8)

donde

x es la media muestral,
fi es la frecuencia de la i-sima clase,
MCi es la marca de clase de la i-sima clase,
N i es el nmero de intervalos, y

n es el nmero de datos.

1.7.2 La mediana

Primero debe hallarse la clase que contiene a la mediana, para esto se debe cumplir el
siguiente criterio

fa

61

n
2

(I.9)

Este criterio se debe verificar en cada clase empezando desde el primer intervalo de
clase hasta el ltimo intervalo de clase. La clase que cumpla con la condicin se le
llamar clase mediana. La expresin que calcula la posicin del valor que se
encuentra a la mitad del conjunto de datos es la siguiente

faA
~ F 2
Ti
x
i
f

(I.10)

donde

Fi es la frontera inferior real de la clase que contiene a la mediana,

faA es la frecuencia acumulada anterior a la clase que contiene a la mediana,


f es la frecuencia de la clase que contiene a la mediana, y

Ti es el tamao del intervalo.

1.7.3 La moda
Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia, se
hallar en la clase que tenga la frecuencia ms alta, llamada la clase modal. Para
estimar la moda en el caso de datos agrupados, se utiliza la siguiente ecuacin:

1
Ti
x Fi

1 2
donde:

Fi es la frontera inferior real de la clase modal,

1 es la diferencia de la frecuencia de la clase modal menos anterior,


2 es la diferencia de la frecuencia de la clase modal menos la siguiente, y
Ti es el tamao del intervalo.
62

(I.11)

La media es la medida ms comn de tendencia central. Se presta para mayor


manipulacin e interpretacin algebraica. Desafortunadamente se ve afectada por
valores extremos o atpicos, y a diferencia de la mediana, puede ser sesgada por las
observaciones que estn muy por encima o muy por debajo de sta. Debido a que la
mediana no se ve afectada por valores extremos, representa mejor el conjunto de
observaciones. La moda tambin es menos afectada por valores atpicos, sin
embargo, si no hay moda, o si el conjunto de datos es bimodal, su uso puede ser
confuso.

Esto no implica que una medida sea necesariamente mejor que las otras. La medida
que se seleccione depende de la naturaleza de los datos o de la forma como se
utilicen los datos.

1.8 Medidas de dispersin, asimetra y kurtosis

Para describir un conjunto de datos se ha observado que es de utilidad ubicar el


centro del conjunto de datos. Pero identificar una medida de tendencia central rara
vez es suficiente. Una descripcin ms completa del conjunto de datos puede
obtenerse si se mide que tan dispersos estn los datos alrededor de dicho punto
central. Esto es precisamente lo que hacen las medidas de dispersin, indican cunto
se desvan las observaciones alrededor de su media.

1.8.1 El rango
La medida de dispersin ms simple y menos til es el rango o recorrido. El rango es
simplemente la diferencia entre la observacin ms alta y la ms baja. Su ventaja es
que es fcil de calcular. Su desventaja es que considera slo dos de los cientos de
observaciones que hay en un conjunto de datos.

1.8.2 Varianza y desviacin estndar


La varianza y la desviacin estndar son medidas de dispersin mucho ms tiles,
proporcionan una medida ms significativa sobre el punto hasta el cual se dispersan las
observaciones alrededor de su media.

63

Si los datos estn agrupados en una tabla de frecuencia, la varianza y la desviacin


estndar muestral pueden calcularse respectivamente como

s2

Ni

f MC
i
i
Ni

i 1

2
fi MCi
n
i 1

n 1

s var ianza

(I.12)

(I.13)

donde

s 2 es la varianza de la muestra,

s es la desviacin estndar de la muestra, y


MCi2 es la marca de clase de la i-sima clase elevada al cuadrado

1.8.3 Asimetra

1.8.3.1 La distribucin normal y la regla emprica

La desviacin estndar puede utilizarse para sacar ciertas conclusiones si el conjunto


de datos en cuestin est distribuido normalmente. Una distribucin normal es una
distribucin de datos continuos (no discreto) que produce una curva simtrica en
forma de campana, como la que se muestra en la figura I.4.

64

Se asume que se tiene un nmero grande de observaciones, si los datos estn


distribuidos normalmente, una grfica de la frecuencia con la cual ocurre cada
observacin tomar la forma de la figura I.4. Las observaciones en cada extremo
ocurrirn relativamente de forma poco frecuente, pero las observaciones que estn
ms cerca de la mitad ocurrirn con una frecuencia alta, por tanto se produce la
curva simtrica en forma de campana. La observacin modal es la que ocurre con
mayor frecuencia y por tanto est en el pico de la distribucin. En una distribucin
normal la media, mediana y la moda son todas iguales.

Figura I.4 Distribucin normal.

La regla emprica se ilustra grficamente en la figura I.5, sta especfica que:

68.3% de las observaciones estn dentro de ms o menos una desviacin


estndar de la media ( v mnimo x 1s y v mximo x 1s ),
95.5% de las observaciones estn dentro de ms o menos dos desviaciones
estndar de la media ( v mnimo x 2s y v mximo x 2s ), y
99.7% de las observaciones estn dentro de ms o menos tres desviaciones
estndar de la media ( v mnimo x 3s y v mximo x 3s ).
Es importante recordar que la regla emprica describe el rea total bajo la curva
normal que se encuentra dentro de un rango dado.
65

Si las observaciones estn altamente dispersas, la curva en forma de campana se


aplanar y se esparcir. La kurtosis mide el grado de agudeza de una distribucin, est
se clasifica como curva leptokurtica (delgada), curva mesokurtica (intermedia) y curva
platikurtica (aplanada).

Figura I.5 La distribucin normal y la regla emprica.

1.8.3.2 Sesgo (medidas de asimetra)


No todas las distribuciones son normales, algunas estn sesgadas a la izquierda o a la
derecha como se muestra en la figura I.6, en ambos casos, la moda por es por
definicin la observacin que ocurre con mayor frecuencia. Por tanto, est en el pico
de la distribucin. Sin embargo, como se dijo anteriormente, por su naturaleza la media
se ve ms afectada por las observaciones extremas. Por tanto, es jalada en la
direccin del sesgo, ms de lo que est la mediana, la cual est en algn sitio entre la
media y la moda.
El sesgo es el grado de asimetra y puede medirse con el coeficiente de sesgo de
Pearson

S k1

Sk2

x
x
s

~
3x x
s

66

(I.14)

(I.15)

Si Sk1 y Sk 2 0 , los datos estn sesgados a la izquierda (-), si Sk1 y Sk 2 0 , los datos
estn sesgados a la derecha (+); si Sk1 y Sk 2 0 estn distribuidos normalmente.

Figura I.6. Distribuciones sesgadas.

1.8.3.3 Coeficiente de variacin (dispersin relativa)

Cuando se consideran dos o ms distribuciones que tienen medias significativamente


diferentes, o que estn medidas en unidades diferentes, es peligroso sacar
conclusiones respecto a la dispersin slo con base a la desviacin estndar, recuerde
no se puede mezclar perros con gatos.

Por tanto, con frecuencia debemos considerar el coeficiente de variacin (C.V.), el


cual sirve como medida relativa de dispersin. El coeficiente de variacin determina el
grado de dispersin de un conjunto de datos relativo a su media por medio de la
siguiente expresin

C.V .

s
100%
x

(I.16)

1.9 Medidas de posicin


Aunque la varianza y la desviacin estndar son las medidas de dispersin ms tiles en
anlisis estadstico, existen otras tcnicas con las cuales puede medirse la dispersin de
un conjunto de datos. Estas medidas adicionales de dispersin son los cuartiles, los
deciles y los percentiles.

67

Cada conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales. El
primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones, y sobre
el cual puede encontrarse el 75% restante. El segundo cuartel es justo la mitad. La
mitad de las observaciones estn por debajo y la mitad por encima. El tercer cuartel es
el valor debajo del cual est el 75% de las observaciones y encima del cual puede
encontrarse el 25% restante.

Primero debe hallarse las clases que contienen al primer, segundo y tercer cuartel, para
esto se debe cumplir el siguiente criterio, respectivamente

localizacin del primer cuartIl

fa

n
4

(I.17)

fa

2n
4

(I.18)

localizacin del segundo cuartil

localizacin del tercer cuartIl

fa

3n
4

(I.19)

Estas condiciones se deben verificar en cada clase empezando desde el primer


intervalo de clase hasta el ltimo intervalo de clase. Las expresiones que calculan la
posicin de cada cuartil son las siguientes

faA
Ti
Q1 Fi 4
f

(I.20)

2n

faA

Ti
Q 2 Fi 4
f

(I.21)

68

3n

faA

Ti
Q 3 Fi 4
f

(I.22)

donde

Fi es la frontera inferior real de la clase que contiene al cuartil,

faA es la frecuencia acumulada anterior a la clase que contiene al cuartil,


f es la frecuencia de la clase que contiene al cuartil, y

Ti es el tamao del intervalo.

Una medida nica de dispersin es el rango intercuartlico (R.I.). La mitad de las


observaciones se clasifican dentro de este rango. Consta del 50% de la mitad de las
observaciones y corta el 25% inferior y el 25% superior de los puntos de datos. Como
resultado, le R.I. proporciona una medida de dispersin que no est muy influenciada
por unas cuantas observaciones extremas.

R.I. Q3 Q1

(I.23)

Los deciles separan un conjunto de datos en 10 subconjuntos iguales, y los percentiles


en 100 partes. El primer decil es la observacin debajo de la cual se encuentra el 10%
de las observaciones, mientras que el 90% restante se encuentra encima de ste. El
primer percentil es el valor debajo del cual se encuentra el 1% de las observaciones, y
el resto estn encima de ste. Todo conjunto de datos tiene 9 deciles y 99 percentiles.

69

Batera 2 de ejercicios:

1. Determinacin del nmero de intervalos N i y tamao del intervalo Ti . Considere


los siguientes datos:
a.
b.
c.
d.
e.

n 50
n 35
n 35
n 30
n 30

y
y
y
y
y

R 52
R 820
R 82.01
R 90.1
R 194

1. Un conjunto de datos contiene 100 observaciones; la ms grande es 315 y la ms


pequea es 56.
a. Cuntas clases debera tener la tabla de frecuencias?
b. Cul es el intervalo de clase?
c. Cules son los lmites y puntos medios de cada clase?
2. En un estudio reciente sobre 500 graduados en administracin de negocios, el
salario inicial ms alto que se report fue de $27,500 dlares y el ms bajo fue de
$19,900 dlares. Usted desea crear la tabla de frecuencias para analizar y
comparar estos datos con las ofertas de trabajo que usted ha recibido.
d. Cuntas clases pondrn en su tabla de frecuencia?
e. Cul es el intervalo de clase?
f. Cules son los lmites y puntos medios de cada clase?
3. Los siguientes datos son los ingresos de 60 ejecutivos de marketing para empresas
de Estados Unidos. Los datos estn expresados en miles de dlares.
58
64
79
74
69
71
65
55
73
40

76
76
74
38
62
54
79
75
72
50

89
34
56
69
56
31
47
62
64
74

45
65
71
79
38
69
46
57
69
61

70

67
45
85
61
69
62
77
77
51
69

34
39
87
71
79
39
66
36
50
73

g. Construya una tabla de frecuencia para los datos. Tenga mucho cuidado en
la seleccin de sus intervalos de clase. Muestre las frecuencias acumulativas
y relativas para cada clase. Qu conclusin puede sacar de la tabla?
h. Presente y explique una distribucin de frecuencia acumulada ms que y
una distribucin menor de.
4. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones
de la nacin reportadas en la edicin de la revista Forbes de la edicin del 24 de
Mayo de 1997 aparecen en la siguiente tabla de frecuencias.
EDADES

Frecuencias

50

54

55

59

13

60

64

15

65

69

10

70

74

75

79

5. La misma edicin de la revista Forbes tambin proporcion datos sobre los salarios
en miles de dlares. Resulto la siguiente tabla de frecuencias:
Salario (en miles de dlares)

Frecuencias

90

439

440

789

11

790

1139

10

1140

1489

1490

1839

1840

2189

2190

2540

a. Calcule e interprete la media, mediana y la moda.


b. Calcule e interprete la varianza y la desviacin estndar.
71

c. Construya el histograma y polgono de frecuencias.


d. Construya las ojivas.
e. Construya el polgono de frecuencias suavizado e indique sus resultados
(media, mediana, moda, sesgo, C.V. y C.A.) en ste.
f. Los salarios estn tan dispersos como las edades del problema anterior.
6. The Wall Street Journal describi una disputa entre la gerencia y el sindicato de
trabajo local respecto a la eficiencia y productividad de los trabajadores. La
gerencia argumentaba que a los empleados les tomaba ms de 20 minutos
terminar cierto trabajo. Si se mide el tiempo de 85 empleados, arrojando los
resultados tabulados, con base en esta muestra, la gerencia est en lo correcto?
Clase

Frecuencia

(nmero de minutos)

(nmero de empleados)

10

10

11

12

15

13

14

17

15

16

14

17

18

19

20

21

23

a. Calcule la media, mediana y la moda.


b. Calcule la varianza y la desviacin estndar.
c. Construya el histograma y polgono de frecuencias.
d. Construya las ojivas.
e. Construya el polgono de frecuencias suavizado e indique sus resultados
(media, mediana, moda, sesgo, C.V. y C.A.) en ste.

72

ACTIVIDAD DE APRENDIZAJE 1. CONCEPTOS BSICOS

Calificacin:
Completa los espacios en blanco:
1.

La ________________

________________

se ocupa de la __________________, __________________,

_________________, ________________ e ________________ de datos, por tanto, la estadstica es un mtodo


cientfico que pretende sacar conclusiones a partir de unas observaciones hechas.
2.

La Estadstica acta como disciplina puente entre los _______________ _______________ y los
_________________ __________________. Un ______________ _________________ es una abstraccin
simplificada de una realidad ms compleja y siempre existir una cierta discrepancia entre lo que se
observa y lo previsto por el modelo.

3.

La __________________________ es la recoleccin completa de todas las observaciones de inters para


el investigador. sta puede ser ____________________ o _________________.

4.

El ____________________ es una medida ___________________ de la poblacin total de todas las


____________________ de inters para el investigador.

5.

La _____________________ es una parte representativa de la __________________ que se selecciona para


ser _______________________ ya que la poblacin es demasiado ________________ como para analizarla
en su totalidad.

6.

El ______________________ es el elemento que describe una _______________ y sirve como una estimacin
del parmetro de la poblacin correspondiente.
Grupo sanguneo (A, B, AB, O+)

Completa el siguiente cuadro sinptico:

Color de ojos (azul, negros, etc.)


Slo toma dos valores posibles

Variable

Es una ________________________
de la poblacin que se est
analizando
en
un
estudio
estadstico

Cuando existe un cierto orden


entre las categoras, por ejemplo:
(bajo, medio, alto)

Pueden tomar
valores no
cuantificables
numricamente

Enteros: numero de hermanos,


nmero de multas/ao.

Reales: peso de un individuo,


tiempo de reaccin a un
medicamento.

Pueden tomar valores


cuantificables
numricamente.

73

Busca la palabra que complete la oracin en la sopa de letras:


7.

Las variables pueden clasificarse con base en su escala de ________________.

8.

Una medida en escala _________________ se crea cuando se utilizan ________________ para establecer
categoras dentro de las cuales las _________________ pueden registrarse exclusivamente. Es importante
recordar que sta no indica ningn orden de preferencia, sino que simplemente establece una
disposicin ______________________ en la cual se puede ubicar cada observacin.

9.

Una medida en escala ________________, son las que ______________ las observaciones en categoras
con un orden significativo. Hay quien clasifica sus productos como buenos, mejores y los mejores.

10. En una escala de _______________ las variables se miden de manera ______________, y al igual que los
datos ordinales, llevan inherente un rango u ordenamiento. El valor de ______________ es arbitrario pero
la diferencia entre valores es importante.
11. En una escala de ________________, las medidas son numricas, el cero es un valor _____________ en
cualquier escala y la diferencia entre valores es importante. Con datos medidos en una escala de
_________________, se puede determinar cuntas veces es mayor una medida que otra.

M
E
D
I
D
A
A
S
D
F
G
J
K
L
I
U
Y
T

I
W
D
X
A
G
V
O
U
O
C
I
E
A
F
Q
V
D

N
W
S
A
D
F
I
V
G
N
U
M
E
R
I
C
A
X

A
E
D
O
O
C
O
R
D
O
M
F
C
J
J
S
Y
R

L
O
R
R
A
Q
E
T
R
O
B
T
Y
K
O
E
U
A

S
C
R
D
E
D
C
V
S
D
R
S
P

S
R
D
S

C
V
R
D
R
F
V
C
D
R
I
B
R
F
Y
O
Y
O

A
Q
U
I
I
P
R
E
W
E
A
M
N
R
E
Y
A
O

T
R
G
N
I
N
U
O
P
C
E
R
O
T
R
U
N
N

E
M
J
A
R
S
A
A
X
C
V
A
M
M
P
O
O
C

G
K
N
L
T
T
A
L
C
V
B
Z
I
N
C
L
A
L

O
J
L
L
O

S
T
A
Y
K
I
N
J
R
T
M
A

74

R
Y
U
E
P
L
D
G
O
S
P
N
A
H
T
Y
I
S

I
N
I
S
J
I
F
M
N
B
H
D
L
H
Y
S
N
C

C
U
N
D
H
N
O
M
B
R
E
S
P
G
U
H
A
L

A
M
T
F
G
T
A
X
G
A
M
C
A
B
D
K
L
A

I
E
E
K
F
E
N
R
O
Z
O
H
L
N
I
M
E
S

V
R
R
G
D
R
O
A
N
O
N
A
A
M
O
N
R
I

B
I
V
H
A
V
M
Z
S
N
O
N
B
Y
S
H
T
F

J
D
J
J
S
A
I
B
I
N
O
K
R
U
H
J
Y
I

O
F
K
K
R
L
K
E
D
C
V
T
G
I
E
S
F
C

T
G
L
O
T
O
A
B
F
C
D
E
A
O
F
G
H
A

I
K
O
P
Y
J
K
L
T
M
N
O
F
Q
A
E
I
N

P
O
L
L
M
T
G
V
A
R
I
A
B
L
E
S
P
P

ACTIVIDAD DE APRENDIZAJE 2. Nmero de intervalos ptimo

Calificacin:
Las edades de 50 integrantes de un programa de servicio social del gobierno son:

38
42
44
47
51

51
51
54
55
55

56
56
60
60
61

62
64
65
65
65

66
66
66
67
68

68
68
69
70
71

73
74
74
75
76

77
78
79
80
82

82
83
83
84
87

88
91
92
98
99

Use estos datos para construir la tabla de frecuencias con 7 y 13 intervalos iguales.
Suponga que el director de servicios sociales desea saber la proporcin de participantes en el
programa que tienen entre 45 y 50 aos de edad. a partir de cul distribucin de frecuencias
relativas, de 7 o de 13 intervalos, puede estimar mejor la respuesta?
Valor menor =
Valor mayor =
Rango =

Caso 1: Ni = 7
Tamao del intervalo =

Clase

fi

fs

M.C.

Fi

Fs

1
2
3
4
5
6
7

75

fr (%)

fa < q

fa > q

far < q

far > q

Caso 2: Ni = 13

Tamao del intervalo =

Clase

fi

fs

M.C.

Fi

Fs

1
2
3
4
5
6
7
8
9
10
11
12
13

76

fr (%)

fa < q

fa > q

far < q

far > q

Ojivas (Frecuencias acumuladas relativas)


100
90
80
70
60
%

50
40
30
20
10
0
0

10

20

30

40

50

60

LMITES REALES

77

70

80

90

100

110

ACTIVIDAD DE APRENDIZAJE 3. Medidas de tendencia central y de dispersin en datos agrupados


Calificacin:

1. Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la nacin reportadas en la edicin de la revista Forbes de
la edicin del 24 de Mayo de 1997 aparecen en la siguiente tabla de frecuencias.
clase

fi

fs

50

54

55

59

10

60

64

15

65

69

70

74

75

79

M.C.

Fi

Fs

fr

fa <

fa>

far<

far>

f*MC

f*MC2

Medidas de tendencia central:


Ni

fi MCi
i 1

faA
~ F 2
Ti
x
i
f

78

n
fa
2

1
Ti
x Fi

1 2

Medidas de dispersin, asimetra y kurtosis:

s2

Ni

f MC
i
i
Ni

i 1

2
fi MCi
n
i 1

n 1
s var ianza

S k1

v mnimo x 1s
v mximo x 1s

v mnimo x 2s
v mximo x 2s

v mnimo x 3s

C.V .

v mximo x 3s
3x ~
x
Sk2
s

x
x
s

s
100%
x

Medidas de posicin:

fa

n
4

faA
Ti
Q1 Fi 4
f

2n
4
2n

faA
4
Ti
f

fa

Q 2 Fi

79

3n
4
3n

faA
4
Ti
f

fa

Q 3 Fi

Fi

Fs

%fr

NUMERO DE DIRECTIVOS

clase

1
2
3
4
5
6

16

35%

14

30%

12

25%

10
20%
8
15%
6
10%

5%

2
0

0%

44.5

49.5

54.5

59.5

64.5

74.5

69.5

EDAD (AOS)

79.5

fa <

fa >

far <

far >

NUMERO DE EJECUTIVOS

FR

50

100%

45

90%

40

80%

35

70%

30

60%

25

50%

20

40%

15

30%

10

20%

10%

49.5 80

0%
54.5

59.5

64.5

EDAD (AOS)

69.5

74.5

79.5

% DE EJECUTIVOS

OJIVAS

% DE DIRECTIVOS

EDADES DE LOS DIRECTIVOS DE LAS MEJORES CORPORACIONES EN E.U.

ACTIVIDAD DE APRENDIZAJE 4. Caso de estudio I

Calificacin:

The Wall Street Journal describi una disputa entre la gerencia y el sindicato de trabajo local
respecto a la eficiencia y productividad de los trabajadores. La gerencia argumentaba que a
los empleados les tomaba ms de 20 minutos terminar cierto trabajo. Si se mide el tiempo de 85
empleados, arrojando los resultados tabulados, con base en esta muestra, la gerencia est en
lo correcto?
Clase

Frecuencia

(nmero de minutos)

(nmero de empleados)

10

10

11

12

15

13

14

17

15

16

14

17

18

19

20

21

22

a. Calcule la media, mediana y la moda.


b. Calcule la varianza y la desviacin estndar.
c. Construya el histograma y polgono de frecuencias.
d. Construya las ojivas.
Conclusiones

81

ACTIVIDAD DE APRENDIZAJE 5. Caso de estudio II

Calificacin:
Los siguientes datos representan las declaraciones trimestrales de impuestos por ventas (en miles
de dlares), correspondientes al perodo que finaliz en marzo de 2004, enviados al contralor
del poblado Fair Lake por los 50 negocios establecidos en dicha localidad:

10.3
13.0
13.0
8.0
11.1
11.6
10.0
12.5
9.3
10.5

11.1
6.7
11.2
11.8
10.2
15.1
12.9
9.3
11.5
7.6

9.6
11.0
7.3
8.7
11.1
12.5
9.2
10.4
10.7
10.1

9.0
8.4
5.3
10.6
9.9
6.5
10.0
12.7
11.6
8.9

14.5
10.3
12.5
9.5
9.8
7.5
12.8
10.5
7.8
8.6

a. Calcule la media, la varianza y la desviacin estndar de esta poblacin.


b. Qu proporcin de estos negocios tienen declaraciones trimestrales de
impuestos sobre ventas dentro de 1, 2 o 3 desviaciones estndar de la
media?
c. Compare y encuentre las diferencias entre sus hallazgos con lo que cabra
esperar de acuerdo con la regla emprica. le sorprenden los resultados
obtenidos en b)?
Conclusiones:

82

ACTIVIDAD DE APRENDIZAJE 6. Caso de estudio III

Calificacin:

Virginia Suboleski es una supervisora de mantenimiento de aeronaves. Una entrega reciente de


pernos por parte de un nuevo proveedor llam la atencin de uno de los empleados. Suboleski
envi 25 de esos pernos a un laboratorio de pruebas para determinar la fuerza necesaria para
romperlos. A continuacin presentamos los resultados en miles de libras de fuerza:

147.8
119.9
142.0
125.0
151.1

137.4
133.3
130.8
128.9
125.7

125.2
142.3
129.8
142.0
126.3

141.1
138.7
141.2
118.6
140.9

a. Calcule la media, mediana y la moda.


b. Calcule la varianza y la desviacin estndar.
c. Construya el histograma y polgono de frecuencias.
d. Construya las ojivas.

Conclusiones:

83

145.7
125.7
134.9
133.0
138.2

Вам также может понравиться