Вы находитесь на странице: 1из 113

Estadstica I

Notas de clase (Borrador)

Martn Daz Rodrguez


Departamento de Matematicas
Universidad del Norte
Estadstica I
Notas de clase (Borrador)

M. Daz Rodrguez
Barranquilla-Colombia
2015
Martn Daz Rodriguez
Estadstica I, (Borrador) Notas de clase.
Barranquilla:Ediciones Uninorte, 2015
112p
ISBN:

Ediciones
c Uninorte,2015
Martn
c Daz Rodrguez, 2015

Cordinacion editorial

Editor
Martn Daz Rodrguez.

Correccion de textos

Diseno de portada

Impreso y hecho en Colombia


Indice de cuadros

1.1 Grado de satisfaccion en ciencias polticas . . . . . . . . . . . . . . . . . . . . . . . . 44


1.2 Grado de satisfaccion en ciencias polticas . . . . . . . . . . . . . . . . . . . . . . . . 45
1.3 Grado de satisfaccion en ciencias economicas . . . . . . . . . . . . . . . . . . . . . . 46

4.1 Grado de satisfaccion en ciencias economicas . . . . . . . . . . . . . . . . . . . . . . 102


4.2 Grado de satisfaccion en por profesion . . . . . . . . . . . . . . . . . . . . . . . . . . 103

v
vi Martn Daz Rodrguez

INDICE DE CUADROS
Indice general

1 Estadstica Descriptiva. 1
1.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Resena Historica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Estadstica Descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Componentes de una investigacion estadstica . . . . . . . . . . . . . . . . . . 3
1.2.2 Tipos de datos y escalas de medicion . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Distribuciones de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.4 Tablas de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.5 Medidas de centralizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.6 Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Propiedades de la varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Datos agrupados por intervalos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5 Demostraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5.1 Demostracion 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5.2 Demostracion 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2 Probabilidad. 47
2.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.2 Repaso sobre conjuntos y algunas propiedades: . . . . . . . . . . . . . . . . . . . . . 48
2.2.1 Propiedades de conjuntos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3 Espacio Muestral. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.4 Definicion Axiomatica de Probabilidad: . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4.1 Tecnicas de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.2 Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.4.3 Probabilidad Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4.4 Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3 Variables Aleatorias Unidimensionales. 67


3.1 Variables Aleatorias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.2 Variable Aleatoria Continua. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2.1 Funcion de probabilidad acumulada . . . . . . . . . . . . . . . . . . . . . . . 68
3.3 Distribuciones especiales de variables aleatorias . . . . . . . . . . . . . . . . . . . . . 69
3.3.1 Variables aleatorias discretas (casos especiales) . . . . . . . . . . . . . . . . . 69

vii
viii Martn Daz Rodrguez

3.4 Variable aleatoria continua (casos especiales) . . . . . . . . . . . . . . . . . . . . . . 73


3.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4 Distribuciones conjuntas. 91
4.1 Variables Aleatorias Discretas Bidimensionales . . . . . . . . . . . . . . . . . . . . . 91
4.2 Variables Aleatorias Continuas Bidimensionales . . . . . . . . . . . . . . . . . . . . . 91
4.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

INDICE GENERAL
Captulo 1

Estadstica Descriptiva.

1.1. Introduccion
Haciendo un esfuerzo de reduccion y en formato de diccionario, es posible reconocer la estadstica
como la:

1
Ciencia que se ocupa del estudio de fenomenos de tipo generico, normalmente complejos y
enmarcados en un universo variable, mediante el empleo de modelos de reduccion de la
informacion y de analisis de validacion de los resultados en terminos de representatividad .
En otras palabras y aunque no es lo suficientemente exacto por no encerrar la inmensidad de
aplicaciones, puede afirmarse que la estadstica es la ciencia que se ocupa de reunir, organizar
y analizar datos con el objeto de obtener afirmaciones fiables (informacion valida, sin errores,
y representativa) que permitan resolver problemas como el diseno de experimentos y la toma
de decisiones a traves de las fases de recogida de informacion, (donde la informacion puede ser
numerica, alfabetica o simbolica) de analisis y de presentacion e interpretacion de los resultados y
elaboracion de metodos.

En estadstica existe siempre una relacion entre la informacion necesaria y la fiabilidad del
conocimiento que esta proporciona, puesto que la certeza completa es inalcanzable. El arte de la
estadstica practica reside en la investigacion de la probabilidad de un hecho y en el conocimiento
de la cantidad de informacion que se requiere para calcular su probabilidad.

La estadstica es la ciencia que trata de obtener afirmaciones fiables sobre hechos o fenomenos
variables. Esta desempenando un importante papel ascendente en casi todas las facetas del progreso
humano. Anteriormente solo era aplicada a los asuntos del estado, de donde viene su nombre;
pero ahora la influencia de la estadstica se extiende a la agricultura, biologa, negocios, qumica,
comunicaciones, economa, ensenanza, electronica, medicina, fsica, ciencias polticas, psicologa,
sociologa y otros muchos campos de la ciencia e ingeniera.
El proposito de este trabajo en su primera parte, es presentar una introduccion a los principios
generales de la estadstica descriptiva que sea de utilidad para todos, con independencia de sus
campos de especializacion; como la organizacion y analisis de datos, probabilidades de eventos, las
1 SANCHEZ-CRESPO, G; MANZANO, V.: Sobre la definicion de Estadstica.Boletn de la International

Association of Statistical Education para America Latina, Oct. (2002), (5 pp) (dpp)

1
2 Martn Daz Rodrguez

diferentes formas en que se pueden distribuir las probabilidades y variar los datos de cualquier
muestra o poblacion. Ademas espero que en su segunda parte tambien sirva de consulta para todos
aquellos que esten ligados de una u otra forma con aplicaciones estadsticas en sus propios problemas
de investigacion.
En este documento recopilaremos de forma organizada conceptos importantes que permitan obtener
una vision y claridad amplia de la definicion antes expuesta y de la gran influencia de la ciencia
estadstica dentro de casi todos lo fenomenos que nos rodean especialmente a aquellos interesados
en el desarrollo cientfico.

1.1.1. Resena Historica


Desde los comienzos de la civilizacion han existido formas sencillas de estadstica, pues ya se
utilizaban representaciones graficas y otros smbolos en pieles, rocas, palos de madera y paredes de
cuevas para contar el numero de personas, animales o cosas. Hacia el ano 3000 a.C. los babilonios
usaban pequenas tablillas de arcilla para recopilar datos sobre la produccion agrcola y sobre los
generos vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir
las piramides, los egipcios analizaban los datos de la poblacion y la renta del pas. Los libros bblicos
de Numeros y Cronicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos
censos de la poblacion de Israel y el segundo describe el bienestar material de las diversas tribus
judas. En China existan registros numericos similares con anterioridad al ano 2000 a.C. Los grie-
gos clasicos realizaban censos cuya informacion se utilizaba hacia el 594 a.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopilo una gran cantidad de datos sobre la
poblacion, superficie y renta de todos los territorios bajo su control. Durante la edad media
solo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y
Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los anos 758 y
762 respectivamente. Despues de la conquista normanda de Inglaterra en 1066, el rey Guillermo I
de Inglaterra encargo la realizacion de un censo. La informacion obtenida con este censo, llevado a
cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzo en
Inglaterra a principios del siglo XVI, y en 1662 aparecio el primer estudio estadstico notable de
poblacion, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas
de defuncion en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau,
en Alemania, realizado en 1691, fue utilizado por el astronomo ingles Edmund Halley como base
para la primera tabla de mortalidad. En el siglo XIX, con la generalizacion del metodo cientfico
para estudiar todos los fenomenos de las ciencias naturales y sociales, los investigadores aceptaron
la necesidad de reducir la informacion a valores numericos para evitar la ambiguedad de las
descripciones verbales.

En nuestros das, la estadstica se ha convertido en un metodo efectivo para describir con


exactitud los valores de datos economicos, polticos, sociales, psicologicos, biologicos o fsicos, y
sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico
no consiste ya solo en reunir y tabular los datos, sino sobre todo en el proceso de nterpretacionde
esa informacion. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilsticas; los resultados de estas se pueden utilizar
para analizar datos estadsticos. La probabilidad es util para comprobar la fiabilidad de las

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 3

inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado


estudio estadstico.

1.2. Estadstica Descriptiva


Debido a lo extenso y variado del campo cubierto por la estadstica es difcil proponer una definicion
precisa del concepto, sin embargo, en terminos generales, podra decirse que la estadstica es el
estudio de los fenomenos aleatorios y de la recopilacion, presentacion, analisis y uso de datos para
tomar decisiones y resolver problemas en caso de incertidumbre. No obstante los estudiosos de la
estadsticas estan de acuerdo en clasificacion de la misma para su estudio en dos estructuras que
si se quiere se pueden considerar como complementarias; por un lado la estadstica descriptiva, y,
por el otro la estadstica inferencial, las que desempenan com lo dije antes funciones distintas pero
complementarias.
La estadstica descriptiva trata del resumen y descripcion de datos. Dicho resumen puede ser
tabular, grafico o numerico. El analisis se limita en si mismo a los datos seleccionados y no se re-
aliza inferencia alguna o generalizacion acerca de la totalidad de donde provienen esas observaciones.

La estadstica descriptiva es el trabajo preliminar para la interferencia, entendiendo por in-


terferencia estadstica el proceso de hacer predicciones a cerca de un todo o tomar decisiones al
basarnos en la informacion contenida en una muestra. La estadstica es la ciencia, pura y aplicada,
que crea, desarrolla y aplica tecnicas, de modo que pueda evaluarse la incertidumbre derivada de
interferencias inductivas.

1.2.1. Componentes de una investigacion estadstica


Definicion 1.2.1. Experimentos aleatorios : Son el objeto de estudio de la estadstica y tienen que
ver con el azar.
Definicion 1.2.2. Poblacion : Es el conjunto de todos los posibles resultados que se pueden obtener
de un experimento aleatorio.
Definicion 1.2.3. Muestra : Cualquier subconjunto extrado de una poblacion.
Una muestra es representativa de una poblacion cuando cumple las siguientes condiciones:

1. De tamano adecuado.
2. Tomada al azar.
3. Las conclusiones tomadas de la muestra puedan extenderse a la poblacion.
Definicion 1.2.4. Muestra Aleatoria : Es cualquier muestra escogida al azar.
Definicion 1.2.5. Parametro : Cualquier caracterizacion objeto de estudio en una poblacion.
Ejemplo: La media poblacional, la mediana poblacional.
Un parametro se considera como el valor verdadero de la caracterstica a estudiar.
Definicion 1.2.6. Estadsticos : Cualquier caracterizacion de la poblacion realizada sobre una
muestra.

1.2. ESTADISTICA DESCRIPTIVA


4 Martn Daz Rodrguez

1.2.2. Tipos de datos y escalas de medicion


Un conjunto de observaciones (datos) puede hacerse mas comprensible y adquirir significado
mediante un arreglo ordenado. Estos datos pueden ser cuantitativos o cualitativos.
Definicion 1.2.7. Datos cuantitativos : Son aquellos cuya determinacion esta asociada a una
unidad de medida. Como son, por ejemplo, los datos correspondientes a los pesos de las personas,
la edad de un grupo de personas, el numero de estudiantes en las diferentes carreras en una
universidad, etc.
Definicion 1.2.8. Datos cualitativos : Son aquellos que se refieren a caractersticas o atributos
tales como, color del cabello, sexo, estrato social, etc.
La asignacion de numeros a los objetos se puede hacer de acuerdo con reglas diferentes, lo cual
origina distintas escalas de medicion, las cuales seran descritas a continuacion:

Definicion 1.2.9. Escala nominal : Es aquella en la que los numeros solo se emplean para
diferenciar los objetos, distintas categoras o nombres.
Por ejemplo, los numeros en las camisetas de los jugadores de futbol, los numeros de la cedula de
ciudadana, etc.

Definicion 1.2.10. Escala ordinal : Es aquella en que los numeros se utilizan para diferenciar
en orden de supremaca de acuerdo con cierto criterio jerarquico; como son los numeros que se
utilizan para clasificar los distintos estratos socioeconomicos o para designar preferencias. Cuando
los objetos son medidos en esta escala, los que tengan la misma asignacion se consideran iguales, y
los que tengan asignaciones distintas se consideran diferentes.
La diferencia entre dos numeros ordinales no tiene significado cuantitativo, solo expresa que una
situacion es mejor que otra, pero no cuanto.
Definicion 1.2.11. Escala de intervalos : Es una escala mas especializada que las dos anteriores,
en el sentido de que es posible ordenar las mediciones y decir en cuanto difiere una situacion de la
otra.
Por ejemplo en las mediciones de la temperatura no solo podemos decir que hoy hace mas calor
que ayer, sino que podemos decir hoy la temperatura es dos grados mas alta que ayer. Esta
escala es una escala verdaderamente cuantitativa.
Definicion 1.2.12. Escala de razon : Es aquella que tiene una unidad de medida, un punto de
origen no arbitrario (un cero verdadero, sinonimo de ausencia del atributo).
Por ejemplo el peso de una persona, su estatura, etc, en esta escala la razon entre dos numeros es
significativa, por ejemplo, si Paulo saco 5.0 y Graciela saco 2.5 en un curso de Estadstica I, cuya
calificaciones oscila de 0.0 a 5.0, entonces Paulo saco el doble de nota que Graciela.
Una vez que se han precisado las distintas escalas a las que estaran referidos los datos, se pasa a
resenar los elementos basicos que forman parte de las distintas maneras como se pueden resumir
los datos con el proposito de tener una vision aproximada de las caractersticas mas sobresalientes
de estos.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 5

Datos discretos y continuos


Representaremos los datos con las ultimas letras del abecedario, tales como x, y, z, las cuales pueden
tomar cualquier valor de un conjunto prefijado de valores. Si los datos solo pueden tomar el mismo
valor en todos los casos, a estos datos los llamaremos constante.
Definicion 1.2.13. Datos continuos : Si un dato x puede tomar cualquier valor en un intervalo
dado, entonces x se le llama dato continuo.
Definicion 1.2.14. Datos discretos : Si un dato x puede tomar solo un numero finito o infinito
pero contable de valores en un intervalo dado, entonces se dice que x es un dato discreto.
En general las medidas dan origen a datos continuos, mientras que las enumeraciones o conteos
originan datos discretos.
Ejemplo 1.2.1. Identificar de los siguientes datos cuales representan datos discretos y cuales
datos continuos?:
1. Numero de acciones vendidas cada da en un mercado de valores.
R/: Discreta, por ser el numero de acciones, algo contable.

2. Temperaturas registradas cada media hora en un observatorio.


R: Continua, porque la temperatura puede tomar cualquier valor en un rango dado.

1.2.3. Distribuciones de frecuencias


Definicion 1.2.15. Frecuencia de un dato : Sean {x1 , x2 , x3 , ..., xn } un conjunto de datos distintos.
Se define la frecuencia de un dato i, denotada fi como el numero de veces que aparece el dato en la
poblacion; i=1,2,...n.
Ejemplo 1.2.2. Para los siguientes 6 datos {1,1,2,2,2,3} se tiene que la frecuencia del numero 1
es 2; la del numero 2 es 3 y la del numero 3 es 1.
Definicion 1.2.16. Frecuencia acumulada hasta un dato dado: Sean {x1 , x2 , ..., xn }, un conjunto
de datos con frecuencias f1 , f2 , . . . , fn respectivamente, se define la frecuencia acumulada hasta el
dato xi , i = 1, ..., n denotada Fi as:
Fi = ik=1 fk = f1 + f2 + ... + fi ; i = 1, 2, ...n.
Definicion 1.2.17. Frecuencia relativa de un dato : Sean {x1 , x2 , ..., xn }, un conjunto de datos con
frecuencias f1 , f2 , . . . , fn respectivamente, se define la frecuencia relativa de un dato xi , i = 1, ..., n,
denotada fri as:
fi
fri = n i = 1, 2..., n.
k=1 fk
Definicion 1.2.18. Frecuencia relativa acumulada hasta un dato dado: Sean {x1 , x2 , ..., xn }, un
conjunto de datos con frecuencias f1 , f2 , . . . , fn respectivamente, se define la frecuencia relativa
acumulada del dato xi , i = 1, ..., n denotada Fri as:
Fi
Fri = , i = 1, 2..., n
nk=1 fk

1.2. ESTADISTICA DESCRIPTIVA


6 Martn Daz Rodrguez

1.2.4. Tablas de frecuencias


Las tablas de frecuencia constan de dos o mas columnas (o filas). En el caso de una tabla de
frecuencia con dos columnas; en la primera escribiremos los valores de los datos (variable), los
cuales denotaremos con xi y en la segunda las correspondientes frecuencias,fi . Estas sencillas
tablas se utilizan, cuando la variable de estudio es discreta y generalmente el numero de datos no
es demasiado grande. Cuando el numero de datos es demasiado grande se acostumbra a clasificar
los datos por grupos o categoras, este tema lo abordaremos mas adelante.

Las tablas de frecuencias puede ser ampliada agregando nuevas columnas con las frecuencias
relativas y las frecuencias acumuladas, y aun mas.
Ejemplo 1.2.3. Distribucion de frecuencias.
Los datos siguientes representan las edades en anos de 31 estudiantes de un curso de estadstica I
en administracion:

17 19 20 19 18 19
18 18 18 18 18 18
20 18 18 20 20 18
20 20 19 18 19 18
21 19 19 19 18 18
19
Organice los datos, calcule sus frecuencias, frecuencias acumuladas y relativas, y representelas por
medio de una tabla de frecuencias.

Solucion:
De acuerdo con los datos, se observa que estos jovenes tienen edades comprendidas entre 17 y 21
anos. Si denotamos con x1 los que tienen 17 anos, con x2 los que tienen 18 anos, x3 los de 19
anos, x4 los de 20 anos y con x5 los de 21 anos; la tabla de frecuencias, se puede expresar de la
siguiente manera:

xi fi Fi fri Fri
x1 = 17 f1 = 1 F1 = 1 fr1 = 1/31 Fr1 = 1/31
x2 = 18 f2 = 14 F2 = 15 fr2 = 14/31 Fr2 = 15/31
x3 = 19 f3 = 9 F3 = 24 fr3 = 9/31 Fr3 = 24/31
x4 = 20 f4 = 6 F4 = 30 fr4 = 6/31 Fr4 = 30/31
x5 = 21 f5 = 1 F5 = 31 fr5 = 1/31 Fr5 = 31/31
En la misma se observa que la frecuencia de las edades 17, 18, 19, 20 y 21 anos definidas
en la segunda columna de la tabla son: 1, 14, 9, 6 y 1 respectivamente, es decir, f1 = 1, f1 = 14,
f1 = 9, f1 = 6 y f1 = 1.
En la tercera columna de la tabla encontramos las frecuncias acumuladas de los estudiantes, en la
cuarta columna se encuentran las frecuencias relativas correspondientes a cada una de las edades
distintas. Se observa, por ejemplo, que la frecuencia relativa para los estudiantes que tienen 18
14
anos es fr2 = 31 = 45,16 %, es decir, que los jovenes de 18 anos, representan mas del 45 % de los

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 7

estudiantes de este grupo.


En la ultima columna se encuentran las frecuencias relativas acumuladas de las edades, se observa
en ella, que la frecuencia relativa acumulada hasta 18 anos que corresponde al segundo dato distinto
15
en la tabla es de Fr2 = 31 = 48,38 %; o sea que la contribucion del estudiante que tienen 17 anos
en el acumulado del grupo es mnima.
Ejemplo 1.2.4. Se lanzan cinco monedas 1000 veces . El numero de lanzamientos en los que han
salido 0,1,2,3,4,5 caras se indican en la siguiente tabla:

No de caras ni fi Ni Fi
0 38
1 144
2 342
3 287
4 164
5 25

1. Completar la tabla
2. Determinar para que clase Fi es mayor que el 60 % :F =

1.2.5. Medidas de centralizacion


Definicion 1.2.19. Moda
Sean {x1 , x2 , ..., xn }, un conjunto de datos con frecuencias f1 , f2 , . . . , fn respectivamente, se define
el dato moda, denotado x, como aquel que tiene como frecuencia a fk , siendo fk fi para
i {1, 2, ..., n}, k = 1,2,...,n.
La moda de una serie de datos es aquel dato que se presenta con mayor frecuencia, es decir, es el
dato mas comun.
La moda puede no existir, incluso si existe puede no ser unica. Una distribucion que tiene una sola
moda se llama unimodal.
En caso de los datos (numericos) agrupados donde se ha construido una curva de frecuencias para
ajustar los datos, la moda sera el valor (o valores ) de x correspondientes al maximo de la curva.
Definicion 1.2.20. Mediana
Sean {x1 , x2 , ..., xn }, un conjunto ordenado de todos los datos de una poblacion, se define la mediana
poblacional, denotada x as:
( Xn + Xn
+1
2 2
si n es par
x = 2
X n+1 si n es impar
2

La mediana de una coleccion de datos ordenados en orden de magnitud, es el valor que divide al
conjunto de datos en dos partes iguales, es decir, el 50 % de los datos son menores o iguales a el
y el otro 50 %, son mayores o iguales a el. A esta medida tambien se le conoce con el nombre de
percentil 50. Si la poblacion se divide en vez de en dos partes, en cuatro partes, entonces cada una
de la partes se le conoce con el nombre de cuartil; si ordenamos los datos de manera ascendente,

1.2. ESTADISTICA DESCRIPTIVA


8 Martn Daz Rodrguez

el primer cuartil, sera el dato que deja por debajo de el, el 25 % de los datos, el segundo cuartil,
sera la mediana y el tercer cuartil, correspondera al dato que deja por debajo del el, el 75 % de
los datos. Denotaremos el primero, segundo y tercer cuartil por Q1 , Q2 y Q3 , respectivamente.
Definicion 1.2.21. Media poblacional: Sean {x1 , x2 , ..., xn }, el conjunto de todos los datos
distintos en una poblacion y sean f1 , f2 , . . . , fn las frecuencias respectivas, se define la media
poblacional, denotada , as:

Pn
fi xi
= Pi=1
n .
i=1 fi

Nota: Si fi = 1, i = 1,2,...n, entonces:

Pn
i=1 xi
= .
n
Definicion 1.2.22. Media muestral
Sean x1 , x2 , ......, xn , una muestra de datos distintos extrada de una poblacion y sean f1 , f2 , ....,
fn , las frecuencias respectivas. Se define la media muestral, denotada X, as:
Pn
i=1 fi Xi
X= P n .
i=1 fi

Nota: Si fi =1, para todo i = 1, 2, ..., n, entonces


Pn
Xi
X = i=1 .
n

1.2.6. Medidas de dispersion


Al grado en que los datos cuantitativos tienden a extenderse alrededor de un valor medio se le llama
variacion o dispersion de los datos. Se utilizan varias medidas de dispersion, como lo son:
Definicion 1.2.23. Rango
El rango de un conjunto de datos cuantitativos es la diferencia entre el mayor y el menor de estos,
denotaremos el rango con la letra r.
Definicion 1.2.24. Desviacion Media
Sean {x1 , x2 , ..., xn }, el conjunto de todos los datos distintos de una poblacion y sean f1 , f2 , . . . , fn
las frecuencias respectivas, se define la desviacion media poblacional, denotada D.M., as:

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 9

Pn
f |x |
D.M. = Pni i
i=1
.
i=1 fi

Nota: Si fi = 1, i = 1,2,...n, entonces:

Pn
i=1 |xi |
D.M. = .
n
Definicion 1.2.25. Varianza Poblacional
Sean x1 , x2 , ..., xN , el conjunto de todos los datos distintos de una poblacion y sean f1 , f2 , ..., fN ,
las frecuencias respectivas. Se define la varianza poblacional, denotada , 2 as:

PN
fi (xi )2
2 = i=1
PN .
i=1 fi

Y en el caso particular de fi = 1, i = 1,2,...N, entonces:

PN
2 i=1 (xi )2
= .
N

Definicion 1.2.26. Varianza muestral


Sean x1 , x2 , ......, xN , una muestra de datos distintos extrada de una poblacion y sean f1 , f2 , ....,
fN , las frecuencias respectivas. Se define la varianza muestral, denotada S 2 , as:
Pn
f (X X)2
2
S = i=1 Pni i ,
i=1 fi 1

donde X es la media muestra.

Nota: Si fi =1, para todo i = 1, 2, ..., n, entonces


Pn
(Xi X)2
S 2 = i=1
n1

Definicion 1.2.27. Desviacion Estandar Poblacional


Sea 2 la varianza poblacional, se define la desviacion estandar poblacional, denotada, , as:

1.2. ESTADISTICA DESCRIPTIVA


10 Martn Daz Rodrguez


= 2 .

Osea que la desviacion estandar poblacional, es la raz cuadrada positiva de la varianza poblacional.

Definicion 1.2.28. Desviacion estandar muestral


Sea S 2 la varianza en una muestra de tamano n, extraida de una poblacion, se define la desviacion
estandar muestral, denotada S as:
S = S2.
Osea que la desviacion estandar muestral S, es la raz cuadrada positiva de la varianza muestral
S2.
sP
n
i=1P fi (Xi X)2
S= ,
fi 1

donde X es la media muestral.

1.3. Propiedades de la varianza


1. Si Y=aX+b, entonces 2 Y = a2 2 X

2. Si Y=aX, entonces 2 Y = a2 2 X

3. Si X=c, entonces 2 X = 0.

Demostracion:
1) Se demostrara para el caso poblacional.
Por definicion sabemos que

fi (Yi Y )2
P
Y2 = P , y por hipotesis que (1.1)
fi
Yi = aXi + b, para todo i = 1, 2, ..., N, entonces, (1.2)
X X X X
fi Yi = fi (aXi + b) = fi aXi + fi b, (1.3)

lo cual implica que


P P P P P
fi Yi fi aX i fi b a fi Xi b fi
Y = P = P + P = P + P = aX + b (1.4)
fi fi fi fi fi

reemplazando 1.2 y 1.4 en 1.1 se tiene:

fi (aXi + b aX b)2 a2 fi (Xi )2


P P
Y2 = P = P = a2 X
2
(1.5)
fi fi

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 11

Definicion 1.3.1. Coeficiente de Variacion


Denotado C.V., se define como:

C.V. = . (1.6)

El coeficiente de variacion mide el porcentaje de variabilidad de un conjunto de datos con respecto


a su media. Este coeficiente nos permite comparar variabilidades de dos o mas conjuntos de datos
sin importar el numero de elementos o las unidades en que esten dados los mismos.

Definicion 1.3.2. Coeficiente de Sesgo


Sean {x1 , x2 , ..., xn }, un conjunto de datos distintos con frecuencias f1 , f2 , . . . , fn respectivamente,
se define el coeficiente de sesgo, denotado C.S., as:

Pn Pn
i=1 fi (xi )3 / i=1 fi
C.S. = (1.7)
3

En el caso particular de fi = 1, i = 1,2,...n, entonces:


Pn
i=1 (xi )3 /n
C.S. =
3

Si C.S. es mayor que cero decimos que la curva plana de distribucion de los datos versus las
frecuencias respectivas es sesgada a derecha, es decir, la grafica de distribucion de los datos debe
ser de la siguiente forma:

Si C.S. es igual a cero decimos que la curva plana de distribucion de los datos versus las frecuencias
respectivas es insesgada, es decir, la grafica de distribucion de los datos debe ser de la siguiente
forma:

1.3. PROPIEDADES DE LA VARIANZA


12 Martn Daz Rodrguez

Si C.S. es menor que cero decimos que la curva plana de distribucion de los datos versus las
frecuencias respectivas es sesgada a izquierda, es decir, la grafica de distribucion de los datos debe
ser de la siguiente forma:

En general, el coeficiente de sesgo, nos da informacion de la distribucion simetrica o no, de un


conjunto de datos alrededor de la media.

Definicion 1.3.3. Coeficiente de Kurtosis:Denotado C.C.


Sean {x1 , x2 , ..., xn }, un conjunto de datos distintos con frecuencias f1 , f2 , . . . , fn respectivamente,

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 13

se define el coeficiente de Kurtosis, denotado C.C., as:

Pn Pn
i=1 fi (xi )4 / i=1 fi
C.C. = (1.8)
4

En el caso particular de fi = 1, i = 1,2,...n, entonces:

Pn
i=1 (xi )4 /n
C.C. =
4

Si C.C. es mayor que tres decimos que la curva de distribucion de los datos versus las frecuencias re-
spectivas es empinada, es decir, la grafica de distribucion de los datos debe ser de la siguiente forma:

Si C.C. es igual a tres decimos que la curva de distribucion de los datos versus las frecuencias
respectivas es normal (forma de campana), es decir, la grafica de distribucion de los datos debe ser
de la siguiente forma:

1.3. PROPIEDADES DE LA VARIANZA


14 Martn Daz Rodrguez

Si C.C. es menor que tres decimos que la curva de distribucion de los datos versus las frecuencias
respectivas es achatada, es decir, la grafica de distribucion de los datos debe ser de la siguiente forma:

En general, el coeficiente de curtosis, es una medida de apuntamiento de la distribucion de los datos,


el cual mide el comportamiento de datos en las colas en relacion con los datos que se encuentran
alrededor de la media.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 15

UNIVERSIDAD DEL NORTE


PRIMER PARCIAL DE ESTADISTICA I

Ejemplo 1.3.1. Los datos en la tabla siguiente, representan las edades en anos de un grupo de
estudiantes universitarios
17 19 20 19 18 19
18 18 18 18 18 18
20 18 18 20 20 18
20 20 19 18 19 18
21 19 19 19 18 18
19
Tomando como base los datos de la tabla, haga lo siguiente:

1. Calcule la media
2. Calcule la varianza
3. Calcule el coeficiente de variacion

4. Calcule el coeficiente de sesgo.


5. Con base en los resultados obtenidos en los items anteriores, describa las caractersticas que
presentan estos jovenes en relacion con la edad.

1.3. PROPIEDADES DE LA VARIANZA


16 Martn Daz Rodrguez

Pn
fi xi
= Pi=1
n .
i=1 fi

Pn
i=1Pfi (xi )2
2 = n .
i=1 fi

Pn Pn
i=1 fi (xi )4 / i=1 fi
C.C. = (1.9)
4

Pn Pn
i=1 fi (xi )3 / i=1 fi
C.S. = (1.10)
3


C.V. = . (1.11)

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 17

Solucion:

xi fi Fi fi xi (xi )2 (xi )3 (xi )4 fi (xi )2 fi (xi )3 fi (xi )4


17 1 1 17 2.89 -4.91 8.35 2.89 -4.91 8.35
18 14 15 252 0.49 -0.34 0.24 6.86 -4.76 3.36
19 9 24 171 0.09 0.027 8.1*103 0.81 0.243 0.07
20 6 30 120 1.69 2.19 2.85 10.14 13.14 1701
21 1 31 21 5.29 12.16 27.98 5.29 12.16 27.98
Suma 581 9.13 39.42 25.99
Pn Pn
= i=1 fi xi / i=1 fi , entonces:

= 581/31 = 18.7

Pn Pn
2 = i=1 fi (xi )2 / i=1 fi , entonces:

2 = 25.99 / 31 =0.83


C.V.= , entonces:

C.V.= 0,83/ 18.7 = 0.04

Pn
fi (xi )3 /
Pn
fi
C.S.= i=1
3
i=1
, entonces:
15,87/31
C.S.=
( 0,83)3
= 0,67

Problema de aplicacion 1. A la asociacion colombiana de ciencias economicas le preocupa la


escasez de profesionales en este campo que parece se dara en un futuro no lejano en la ciudad de
Barranquilla. Para investigar el grado actual de satisfaccion con la profesion, se ha patrocinado
un estudio en toda la ciudad. Como parte de este estudio se pidio a 50 profesionales de este campo
que indicaran su grado de satisfaccion con respecto al trabajo, el salario y las oportunidades de
ascenso. Se reunieron los datos en la tabla que se presenta a continuacion:

1.3. PROPIEDADES DE LA VARIANZA


18 Martn Daz Rodrguez

Trabajo Sueldos Ascensos Trabajo Sueldo Ascensos


71 49 58 72 76 37
84 53 63 71 25 74
84 74 37 69 47 16
87 66 49 90 56 23
72 59 79 84 28 62
72 37 86 86 37 59
72 57 40 70 38 54
63 48 78 86 72 72
84 60 29 87 51 57
90 62 66 77 90 51
73 56 55 71 36 55
94 60 52 75 53 92
84 42 66 76 59 82
85 56 64 95 66 52
88 55 52 89 66 62
74 70 51 85 57 67
71 45 68 65 42 68
88 49 42 82 37 54
90 27 67 82 60 56
85 89 46 89 80 64
79 59 41 74 47 63
72 60 45 82 49 91
88 36 47 90 76 70
77 60 75 78 52 72
64 43 61 74 59 82

Ademas los datos anteriores fueron clasificados segun la profesion en el campo economico: admin-
istrador, contador y economista.
A continuacion se presentan los datos anteriores ya clasificados por profesion:

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 19

Administrador Contador Economista


Trabajo Sueldo Ascenso Trabajo Sueldo Ascenso Trabajo Sueldo Ascenso
72 57 40 71 49 58 84 53 63
90 62 66 84 74 37 87 66 49
84 42 66 72 37 86 72 59 79
85 56 64 63 48 78 88 55 52
71 45 68 84 60 29 74 70 51
88 49 42 73 56 55 85 89 46
72 60 45 94 60 52 79 59 41
88 36 47 90 27 67 69 47 16
77 60 75 72 76 37 90 56 23
64 43 61 86 37 59 77 90 51
71 75 74 86 72 72 71 36 55
84 28 62 95 66 52 75 53 92
70 38 54 65 42 68 76 51 54
87 51 57 82 37 54 89 80 64
74 59 82 82 60 56
89 66 62 90 76 70
85 57 67 78 52 72
74 47 63
82 49 91

Aplique los estadsticos estudiados para describir las caractersticas generales del grupo de pro-
fesionales en general y en particular en cada profesion. Presente los resumenes de interes que
permitan valorar las variables en estudio.
Describa los resultados encontrados en donde especifique comentarios sobre los asuntos siguientes:

1. Con base en estas variables que aspecto del trabajo satisface mas a los Profesionales de
esta ciencia?, cual parece ser el que menos lo satisface?, en cual de las tres variables cree
usted deben introducirse mejoras para estimular a mas personas a vincularse a la formacion
como profesionales en las distintas ramas de las ciencias economicas?

2. Segun las medidas descriptiva de dispersion, establezca cual de las tres variables parece
generar mayor diferencia de opinion entre estos profesionales? cual de las variables parece
tener mayor cohesion entre ellos?, justifique su respuesta.

3. Que se puede decir acerca de la satisfaccion de estos profesionales segun su tipo de


profesion?, Cual de las ramas de las ciencias economicas parecen tener los mejores niveles
de satisfaccion. ?

4. Organice los datos de cada uno de los tres tipos de profesiones estudiados en una distribucion
de frecuencias, haga su analisis respectivo incluyendo el uso de las graficas que usted considere
necesarias para explicar su argumento.

1.3. PROPIEDADES DE LA VARIANZA


20 Martn Daz Rodrguez

1.4. Datos agrupados por intervalos.


Cuando se dispone de un conjunto de datos muy numerosos, es util distribuirlos en clases o
categoras y determinar el numero de individuos pertenecientes a cada clase o categora, este
numero de elementos que caen en cada clase lo llamaremos frecuencia de la clase.

Una ordenacion tabular de las clases versus las frecuencias correspondientes a cada una, se
le conoce como tabla de frecuencia por clases. Los datos ordenados y resumidos en una distribucion
de frecuencia, se suelen llamar datos agrupados. Aunque con el proceso de agrupacion generalmente
se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos
en un sencillo cuadro que facilita el hallazgo de las relaciones que pueden haber entre ellos.

Las definiciones presentadas para los datos no agrupados por clase, son validas tambien para
datos agrupados por clases, solo que para los ultimos se habla de la frecuencia del intervalo de clase.

Comencemos definiendo inicialmente el rango de un conjunto de datos

Definicion 1.4.1. Rango de un conjunto de datos


Sean x1 , x2 , ..., xn , el conjunto de todos los datos distintos en una poblacion y sean f1 , f2 , ..., fn ,
las frecuencias respectivas. Se define el rango, denotado por r, as:
r = xM xm
donde xM y xm son el mayor y el menor de los datos respectivamente.
Intervalo de Clase: Es cada uno de los intervalos en que se han decidido agrupar parcialmente
los datos con el proposito de hacer un resumen de ellos.

Numero de intervalos: Para determinar el numero de intervalos K, en un conjunto de n


datos, existen varios criterios de seleccion, uno de ellos es el de la formula de Sturges, la cual viene
dada as: K 1 + 3,3log10 n. Se debe tener en cuenta que cuando el resultado 1 + 3,3log10 n no
es numero entero el valor de K se toma por exceso, como el entero mas cercano a este resultado, si
5 < 1 + 3,3log10 n < 20. Si 1 + 3,3log10 n > 20, entonces se toma K= 20, si 1 + 3,3log10 n < 5,
entonces se toma K=5.

Definicion 1.4.2. Amplitud:


Sea r el rango de un conjunto de datos y K el numeros de intervalos de clase de igual longitud, se
define la amplitud de un intervalo, denotada a, as:

r
a= .
K
Nota: Si a no es un numero decimal finito, es necesario ampliar el rango en una cantidad c, tal que,
a= r+c
k , sea el menor numero decimal finito, con tantas cifras decimales como cifras decimales
tengan los datos, y de tal forma que cada intervalo tenga la misma amplitud.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 21

Definicion 1.4.3. Marca de clase: sean Linf y Lsup el lmite inferior y el superior respectivamente
de un intervalo de clase. Se define la marca de clase para el intervalo [Li ,-Ls ), como la semisuma
de Li y Ls .

Nota: Denotaremos la marca de clase del j-esimo intervalo por Xj , con j = 1, ..., K.

Tabla de frecuencias:
Es un arreglo rectangular de los intervalos de clases versus las frecuencias respectivas.

Representacion grafica de los datos agrupados por intervalos


Histograma de frecuencia: Es una representacion grafica de las distribuciones de frecuencia de
un conjunto de datos, constituida por una serie de rectangulos cuya base es la longitud de cada
intervalo y la altura, la dada por la frecuencia del intervalo correspondiente.
En esta representacion visual de los datos es posible observar fundamentalmente tres caractersticas:

1. Forma

2. Acumulacion o tendencia posicional

3. Dispersion o variabilidad

Polgono de Frecuencia:
Es una representacion en el plano de la distribucion de frecuencia de los datos agrupados por
intervalos; que consiste en un grafico compuesto por segmentos de rectas (lneas) trazadas desde
los puntos de coordenadas, marcas de clase versus la frecuencia de la clase; hasta los puntos de
coordenadas marca de clase contigua versus frecuencia de la clase contigua, y as sucesivamente,
comenzando en la primera marca de clase y terminando en la ultima marca de clase.
Las representaciones graficas de distribuciones de frecuencia relativa pueden obtenerse del histogra-
ma o del polgono de frecuencias, sin mas que cambiar la escala de frecuencia a frecuencia relativa.
El graficos resultante recibe el nombre de histograma de frecuencias relativas o histogramas
porcentuales y polgonos de frecuencias relativas o polgonos porcentuales, respectivamente.

Ojivas:
Es el nombre que se le da, en especial a los polgonos de frecuencia acumulada.

Ojivas porcentuales:
Estos graficos pueden obtenerse con solo cambiar la escala de frecuencias acumuladas a frecuencias
relativas acumuladas en los polgonos de frecuencia.

Ecuaciones adicionales para datos agrupados por intervalos.

Para datos agrupados por intervalos se tiene para las medidas de centralizacion estudiadas, las
siguientes ecuaciones:

1.4. DATOS AGRUPADOS POR INTERVALOS.


22 Martn Daz Rodrguez

1. La Moda

1
x = Linf intervalo modal +( )a
1 + 2

2. La Mediana
k
(N/2) (Fi1 ) X
X = Linf + [ ] a, siendo N = fi
fi i=1

3. La Media
Pk
i=1 fi di
=A+ a
N
siendo
Xi A
di = .
a
4. Varianza:

Pk Pk
2 fi (xi )2 ( fi xi )2
= i=1
i=1
= x2 (x )2
N N2
Demostracion 1): Le queda de ejercicio, recuerde que:

1 = f(modal) f(modal1) , y 2 = f(modal) f(modal+1) .

Demostracion 2):

Geometricamente, la mediana es el valor x que corresponde a la vertical que divide a un histograma


en dos partes de igual area.

De la grafica sabemos que


X
e = Linf + d (1)

Por semejanza de triangulo sabemos que:


n
2 Fi1 d
= (1),
fi a
entonces
n
2 Fi1
d = a, (2)
fi
reemplazando (2) en (1), se obtiene
n
2 Fi1
X
e = Linf + a;
fi

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 23

en general se puede demostrar que el elemento que ocupa el puesto tal que por debajo de el se
encuentre el k % de los datos se puede calcular mediante la siguiente ecuacion:

fk = Linf + k %n Fi1 a,
X
fi
siendo Linf ,n, Fi1 , y fi el lmite inferior del intervalo de clase que contiene al dato xk , el tamano
de la muestra, la frecuencia acumulada anterior a la clase que contiene al dato y la frecuencia del
intervalo de clase que contiene al dato xk , respectivamente.

Demostracion de 3):

siendo
Xi A
di = .
a

Tambien se puede demostrar que si


Xi A
di = ,
a
entonces Pn
2 fi (di d )2
= a2 d2 , siendo d2 = i=1P
n .
i=1 fi

Ejemplo 1.4.1. De un grupo de 30 trabajadores de una empresa de servicios, se suministro la


siguiente informacion con respecto a sus edades:

[Linf Lsup ) xi fi Fi fri Fri di fi di fi di 2


[-) 12 0
[-) 0.267
[-) 28
[-)
[-] 0
[-] P
fi di = 32

Si se sabe que el menor de los trabajadores tiene una edad de 22 anos y el mayor tiene 46 anos.

1. Completar la tabla

2. Con base en la tabla halle el dato moda

3. Halle la media

1.4. DATOS AGRUPADOS POR INTERVALOS.


24 Martn Daz Rodrguez

Solucion:
1.
k 1 + 3,3 lg(n) = 5,8 k = 6.
r = xn x1 = 46 22 = 24
r 24
a= =4
k 6
f2 f2
f r2 = = = 0,267 f2 = 8,
n 30
recuerde que la frecuencia debe ser un numero natural.
Como por hipotesis f1 = 12, y, f1 d1 = 0, entonces d1 = 0.
Sabemos que la suma de todas las frecuencias debe ser igual a 30, o sea que

f6 + f4 + 28 = 30, f6 + f4 = 2, f6 = 2 f4 (1)

24 + 3f4 + 56 = 32, 3f4 + 5f5 = 8 (2)


reemplazando (1) en (2), se tiene
3f4 + 5(2 f4 ) = 8
3f4 + 10 5f4 = 8
2 = 2f4 f4 = 1, y, f6 = 1.
Ahora podemos completar la tabla Tabla

[Linf Lsup ) xi fi Fi fri Fri di fi di fi xi


[22-26) 24 12 12 0.4 0.4 0 0 288
[26-30) 28 8 20 0.267 0.667 1 8 224
[30-34) 32 8 28 0.267 0.93 2 16 256
[34-38) 36 1 29 0.03 0.96 3 3 36
[38-42) 40 0 29 0 0.96 4 0 0
[42-46] 44 1 30 0.03 1 5 5 44
848

2.
1
X
b = Linf
modal + a
1 + 2
1 = 12 0 = 12,
2 = 12 8 = 4,
12 8
x
b = 22 + 4 = 22 + = 24,6
18 3
3. P
fi xi 848
x= P = = 28,28
fi 30

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 25

Ejemplo 1.4.2. Con el fin de analizar el comportamiento de la estatura en centmetros de un


grupo de 108 estudiantes del Colegio Santa Teresita, se suministra la siguiente informacion:

[Linf Lsup ) xi fi Fi di fi di fi (di )2 fi (di d )3 fi (di d )4


[) -4
[-) 5
[-)
[-) 24
[-) 29
[-) 89
[-) 14
[-] P
fi di = 7

Ademas,se sabe que la estatura promedio fue de 146.32 cms y que el 87 por ciento de los estudiantes
miden 138.5 cms o mas.
Nota: Tome la amplitud con cero cifras decimales.

1. Completar la tabla

2. Hallar la desviacion estandar

3. Hallar el coeficiente de variacion

4. Hallar lel coeficiente de sesgo

5. Hallar lel coeficiente de curtosis

6. Con base en los resultados obtenidos en la tabla y en los estadsticos calculados que puede
decirse de las estatura de estos estudiantes. Justifique su respuesta.

Desarrollo:
Solucion parte 1.
Como F2 = 5, entonces los posibles resultados para f1 y f2 son:

f1 0 1 2 3 4 5
f2 5 4 3 2 1 0

1.4. DATOS AGRUPADOS POR INTERVALOS.


26 Martn Daz Rodrguez

Si f1 = 0, entonces f1 d1 = 0d1 = 0 y eso es absurdo ya que por hipotesis f1 d1 = 4.


Si f1 = 5 o 3, entonces d1 sera una fraccion los cual es tambien absurdo,
ya que d1 debe ser un numero entero.
Si f1 = 4, o 2, la suma de los fi di dara un numero mayor que 7 ( verifquelo !),
as que no queda otra opcion para f1 , que ser igual a 1, por lo que f2 = 4.

Como f1 d1 = 1d1 = d1 = 4, entonces d2 = 3, y as sucesivamente hasta llegar a d8 = 3,


entonces f2 d2 = 12, f4 d4 = 24, (ver la tabla anterior), f5 d5 = 0, esto implica que la marca de
clase fija A, esta en el quinto intervalo, es decir que
a
A = Li5 + .
2
Observando la tabla es facil ver que f7 d7 = 56, que F6 = 89, y f7 = 14, entonces

F7 = F6 + 14 = 89 + 14 = 103.

Como F8 = 108, ya que es la frecuencia acumulada hasta el ultimo intervalo, entonces

f8 = F8 F7 = 108 103 = 5, y, f8 d8 = 5 3 = 15.

Para calcular f3 y f6 , recuerde que:

1 + 4 + f3 + 24 + 29 + f6 + 14 + 5 = 108,

simplificando
f3 + f6 = 31, (1)
y de la tabla (ver sexta columna), tambien se sabe que:

4 + (12) + (2)(f3 ) + (24) + (0) + (1)(f6 ) + 28 + 15 = 7

2f3 + f6 = 4,
o en forma equivalente
f6 = 4 + 2f3 , (2).
Reemplazo (2) en (1), se tiene:

f3 + (4 + 2f3 ) = 31
f3 + 2f3 ) = 27, f3 = 9, y, f6 = 22.

Como la marca de clase fija A = Linf 5 + a2 , y Linf 5 = Linf 4 + a = 138,5 + a, entonces

a 3a
A = 138,5 + a + = 138,5 + .
2 2
Por otro lado se tiene que: Pn
fi d i 7 7
d = Pi=1
n = = ,
f
i=1 i n 108

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 27

y sabemos que x , se puede escribir en la forma

x = A + ad , entonces
3a 7a 169a
x = 138,5 + + = 138,5 + = 146,32 ( esto ultimo por hipotesis ).
2 108 108
Tomando la amplitud con cero cifras decimales, se tiene a = 5.

[Linf Lsup ) xi fi Fi di fi di fi (di )2 fi (di d)2


[123.5-128.5) 126 1 1 -4 -4 16 16.48
[128.5-133.5) 131 4 5 -3 -12 36 37.45
[133.5-138.5) 136 9 14 -2 -18 36 38.19
[138.5-143.5) 141 24 38 -1 -24 24 26.96
[143.5-148.5) 146 29 67 0 0 0 0.10
[148.5-153.5) 151 22 89 1 22 22 19.43
[153.5-158.5) 156 14 103 2 28 56 52.64
[158.5-163.5] 161 5 108 3 P 15 45 43.21
fi di =7 234.57
Solucion parte 2.

a2 (f (di d)2 )
P
25 234,51
Pi
p
Sx 2 = = = 54,79, Sx = 54,79 = 7,402.
(fi 1) 107
Solucion parte 3.


S 54,79
c.v = = = 0,052.
x 141,32
Solucion parte 4. Esta le queda de tarea 

1.4. DATOS AGRUPADOS POR INTERVALOS.


28 Martn Daz Rodrguez

Ejemplo 1.4.3. Los pagos semanales de 200 estudiantes que trabajan parte de su tiempo se
distribuyen como lo muestra la siguiente tabla:

[Linf Lsup ) fi Fi di fi di fi d2i fi Xi fi (Xi )2


[-) 125
[- ) 17
[-) -39
[-) 22 88
[-)
[-) 35
[-) 32
[-)
[-)
[-)
[-] P
fi di = 1
El 85 por ciento de los jovenes ganan 92.5 dolares o mas, el promedio de los pagos, es de 105.025;
en la decima casilla acumulamos 5 por ciento de los pagos. El sueldo mas frecuente es de 105,625
dolares y hasta la decima casilla acumulamos el 97 por ciento de los pagos de los jovenes.

a) Completar tabla.
b) Calcular la mediana.
c) Hallar varianza.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 29

Solucion:
Solucion parte a.)
Por hipotesis
n = 200, = 105,025, x = 105,625
5n 97 n
f10 = = 10; F10 = = 194,
100 100
f4 = 22 y f4 d4 = 88, entonces d4 2 = 4, o sea que d4 = 2.
Si d4 = 2 entonces d3 = 1 y como por hipotesis
f3 d 3 = 39, entonces f3 = 39 absurdo, por lo tanto d4 = 2.
Como d4 = 2, entonces d1 = 5 y por hipotesis
f1 d 1 = f1 (5) = 125, entonces f1 = 5.
d3 = 3, por ser d4 = 2 y por hipotesis
f3 d 3 = f3 (3) = 39, entonces f3 = 13.
Se sabe que el 85 por ciento ganan 92.5 dolares o mas, entonces el 15 por ciento gana menos de
92.5 dolares, por tanto:
(15)(200)
= 30
100
y esto coincide con F3 lo que nos dice que el limite superior del tercer intervalo es 92.5.
Pn
fi di
= A + Pi=1 n a = 105,025,
i=1 fi

donde
(5)(a) (5)(a)
A = Linf,4 + = 92,5 + ,
2 2
luego
(5)(a) a
= 105,025 = 92,5 + + .
2 200
De lo anterior a = 5.
1
X
b = L6 + ( )a = 105,625, con 1 = 35 f5 = 10, y, 2 = 35 32 = 3,
1 + 2
35 f5
de donde se obtiene 105,625 = 102,5 + , simplificando se tiene,
35 f5 + 3
3,125 35 f5
=
5 38 f5
0,625(38 f5 ) = 35 f5

23,75 0,625f5 = 35 f5

0,375f5 = 11,25

f5 = 30

1.4. DATOS AGRUPADOS POR INTERVALOS.


30 Martn Daz Rodrguez

Con los datos restantes es posible construir un sistema de ecuaciones de la forma:

149 + f8 + f9 =184

-84 +2f8 +3f9 =1

f8 + f9 = 35 (1)

2f8 +3f9 =85 (2)

resolviendo el sistema de ecuaciones generados por las ecuaciones 1.) y 2.) tienen los val-
ores de f8 = 20 y f9 = 15.

Tabla completa

[Linf Lsup ) fi Fi di fi d i fi d2i Xi (Xi )2


[77,5 82,5) 5 5 -5 -25 125 80 626.25
[82,5 87,5) 12 17 -4 -48 192 85 401
[87,5 92,5) 13 30 -3 -39 117 90 225.75
[92,5 97,5) 22 52 -2 -44 88 95 100.5
[97,5 102,5) 30 82 -1 -30 30 100 25.25
[102,5 107,5) 35 117 0 0 0 105 0.00625
[107,5 112,5) 32 149 1 32 32 110 24.75
[112,5 117,5) 20 169 2 40 80 115 99.5
[117,5 122,5) 15 184 3 45 135 120 224.25
[122,5 127,5) 10 194 4 40 160 125 399
[127,5 132,5] 6 200 5 30 150 130 623.75
Solucion parte b.)
P
(n/2) fi
X
e = Linf + ( )a
fmediana
(100 82)
X
e = 102,5 + (5) = 105,071
35
Solucion parte c.)
PN
fi (Xi X)2 2750
2 = i=1
PN = = 13,819
i=1 fi
199
2 = 3,71
******************************** ************************
Ejemplo 1.4.4. De un grupo de 33 estudiantes de la Universidad del Norte que realizaron un
examen de calculo, se conoce la siguiente informacion; cinco estudiantes sacaron una nota menor

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 31

de 4.0, el 33.45 por ciento sacaron notas entre 4.2 y 4.4 y resto de la informacion reposa en la
siguiente tabla.

[Linf Lsup ) xi fi Fi f ri F ri di fi di
5 -25
0
5
0
[3.8-4.1) 0.3
30 0.45
2

1. Complete la tabla y con base en ella calcule:

2. el coeficiente de curtosis

3. el coeficiente de sesgo.

4. Que caractersticas especiales tiene este grupo.? Justifique su respuesta.

K = 1 + 3,3(lg(n))
k=6

r = xn x i
r=2

a = kr
a = 0,3

Como f1 = 5, y f1 d1 = 25

25
entonces d1 = f1

25
d1 = 5 = 5,

de ah le podemos dar los valores al resto de los di , i = 2, ..., 5

Para hallar los intervalos solo tenemos que restar 3.8-0.3 y sumar 4.1+0.3 y as sucesiva-
mente hasta llenar la tabla.

Para hallar todos los xi tenemos que sumar los dos intervalos de cada celda y luego dividir-
lo entre dos.

1.4. DATOS AGRUPADOS POR INTERVALOS.


32 Martn Daz Rodrguez

como sabemos que el 33.45 por ciento de los estudiantes sacaron una nota entre 4.2 y 4.4
podemos deducir que esos puntajes pertenecen a la fila 6, es decir que f6 = 15

como sabemos que cinco de los estudiantes tuvieron una nota menor de 4.0 entonces f3 y
f4 tienen un valor de 0

[Linf Lsup ) xi fi Fi f ri F ri di fi di
[2.6-2.9) 2.75 5 5 0.15 0.15 -5 -25
[2.9-3.2) 3.05 0 5 0 0.15 -4 0
[3.2-3.5) 3.35 0 5 0 0.15 -3 0
[3.5-3.8) 3.65 0 5 0 0.15 -2 0
[3.8-4.1) 3.95 10 15 0.3 0.45 -1 -10
[4.1-4.4) 4.25 15 30 0.45 0.91 0 0
[4.4-4.7) 4.55 2 32 0.06 0.97 1 2
[4.7-5.0] 4.85 1 33 0.03 1 2 2
P
(fi di ) 31
x=A+ n (a) x = 4,25 + 33 (0,3) x = 3,96

[Linf Lsup ) xi fi Fi f ri F ri di fi di fi (xi x)2 fi (xi x)3 fi (xi x)4


[2.6-2.9) 2.75 5 5 0.15 0.15 -5 -25 6.84 -8 9.36
[2.9-3.2) 3.05 0 5 0 0.15 -4 0 0 0 0
[3.2-3.5) 3.35 0 5 0 0.15 -3 0 0 0 0
[3.5-3.8) 3.65 0 5 0 0.15 -2 0 0 0 0
[3.8-4.1) 3.95 10 15 0.3 0.45 -1 -10 0.009 2,7 104 8,1 106
[4.1-4.4) 4.25 15 30 0.45 0.91 0 0 1.63 0.53 0.17
[4.4-4.7) 4.55 2 32 0.06 0.97 1 2 0.79 0.5 0.31
[4.7-5.0] 4.85 1 33 0.03 1 2 2 0.86 0.8 0.74
33 -31 10.129 -6.409 10.58
Varianza muestral

fi (xi x)2
P
S2 = P
(fi )1

10,129
S2 = 32

S 2 = 0,316

Coeficiente de Sesgo

fi (xi x)3
P

C.S = n
s3

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 33

6,409
C.S = 32
0,177

C.S = 1,131

Coeficiente de Curtosis

fi (xi x)3
P

C.C = n
s4

10,58
C.C = 32
0,099

C.C = 3,339

Ejemplo 1.4.5. A continuacion se muestran los datos de 50 personas correspondientes al numero


de hectareas que cada uno posee. Se sabe que el 20 por ciento de las personas tienen entre 65 y 75
hectareas.
[Linf Lsup ) xi fi Fi di fi di
[-) 18
[) 8
[41-??) 51
[-) 30
[-] 8

1. Completar la tabla

2. Halle la moda

3. Halle la desviacion estandar

Linf,i +Lsup,i
Por definicion la marca de clase del i-esimo intervalo viene dada por: xi = 2

L +Lsup,3
x3 = inf,3 2 , pero por hipotesis x3 = 51, que al reemplazarlo en la ecuacion anterior,
se tiene:
41+Lsup,3
51 = 2 , entonces

41
Lsup,3 = (51 2 )2

Como todos los intervalos son de igual amplitud y el tercer intervalo [41, 61] tiene una am-
plitud de 20, entonces a=20.

Como el 20 por ciento de las 50 personas tienen entre 61 y menos de 81 hectares entonces,

1.4. DATOS AGRUPADOS POR INTERVALOS.


34 Martn Daz Rodrguez

5020
100 = 10, que es el numero de personas con numero de hectareas entre 61 y menos de
81.

Lo que quiere decir que f4 = 10


Teniendo f4 y (f4 d4 ), podemos hallar d4

Como por hipotesis f4 d4 = 30 y f4 = 10, entonces f4 d4 = 10d4 = 30, de donde se tiene


que
30
d4 = 10 = 3,
con esto podemos hallar los demas di .

Como n=50 y f5 = 8, entonces la frecuencia acumulada hasta el cuarto intervalo

F4 = F5 f5

F4 = 50 8

F4 = 42

Para hallar f3 se tiene que:

f1 + f2 + f3 + f4 + f5 = 50, entonces

f3 = 50 (f1 + f2 + f4 + f5 )

f3 = 50 (18 + 8 + 10 + 8)

f3 = 6,

[Linf Lsup ) xi fi Fi di fi d i
[1-21) 11 18 18 0 0
[21-41) 31 8 26 1 8
[41-61) 51 6 32 2 12
[61-81) 71 10 42 3 30
[81-101] 91 8 50 4 P 32
fi di = 82

A=11 / 4 . a=20
P
x=A+ Pfi di (a)
fi

82
x = 11 + 50 (20)

x = 43,8

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 35

[Linf Lsup ) xi fi Fi di fi di fi (xi x)2


[1-21) 11 18 18 0 0 19365.12
[21-41) 31 8 26 1 8 1310.72
[41-61) 51 6 32 2 12 311.04
[61-81) 71 10 42 3 30 7398.4
[81-101] 91 8 50 4 P 32 17822.72
fi di =82 46.208

fi (xi x)2
P
s2 = P
(fi 1)

46,208
s2 = 49

s2 = 0,943

s2 = 0,971

1.5. Demostraciones
1.5.1. Demostracion 1
Demostrar que:
( n2 Fi 1) a
x
e = li + .
fi
Sea x
e = li + d, debemos demostrar que

( n2 Fi 1) a
d= ,
fi

de la grafica ( falta la grafica)se observa que por semejanza de triangulo que


n
d 2 Fi1
=
a fi
entonces
( n2 Fi1 ) a
d=
fi
luego
( n2 Fi1 ) a
x
e = li + .
fi

1.5.2. Demostracion 2
Demostrar que: P
fi di
x=A+ P a.
fi

1.5. DEMOSTRACIONES
36 Martn Daz Rodrguez

Por definicion sabemos que P


fi xi
x= P ,
fi
sea
xj A
dj := , j = 1, ..., n,
a
donde A es una marca de clase cualquiera, pero fija. Es facil ver que di Z.
Como
xj A
dj = entonces xj = adj + A
a
multiplicando por fj en ambos miembro de la ecuacion anterior obtenemos:

fj xj = afj dj + Afj ,

sumando sobre todos los j obtenemos


X X X
fj xj = a fj d j + A fj ,
P
ahora dividiendo por fj , se obtiene
P P P
f x a f d A f
Pj j = P j j + P j
fj fj fj
P
fi di
x= P a + A.
fi

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 37

UNIVERSIDAD DEL NORTE


PRIMER PARCIAL DE ESTADISTICA I

1. Las notas del primer parcial de calculo I de 29 estudiantes de un grupo de ingeniera de la


Universidad del Norte se distribuyen de la siguiente manera:

[Li Ls ] Xi fi Fi di fi di
9
8
7

P5
i=1 fi di = 38

Ademas se sabe que las notas de la cuarta y quinta casilla son:


4.2, 4.3, 4.4, 4.5 y 4.7.
a) Determine cuantos estudiantes ganaron el primer parcial.

b) Determine el coeficiente de curtosis

c) Determine el coeficiente de sesgo

d ) Construya un histograma de frecuencia y un polgono de frecuencia y con base en es-


tos graficos y los resultados obtenidos de los items anteriores que puede decir de los datos.

e) Que posicion relativa ocupo un estudiante que saco una nota de 3.9?

1.5. DEMOSTRACIONES
38 Martn Daz Rodrguez

Despues de hacer una evaluacion previa, vemos que la marca de clase fija es x1 , ya que es en la
unica forma que la sumatoria de los fi di de 38.
De otro lado tenemos que f4 + f5 = 5 y que 3f4 + 4f5 = 16
Al igualar estas dos ecuaciones obtenemos que
f5 = 1 y f4 = 4
por otro lado tenemos que la amplitud debe ser mayor que 0.3 para que los datos 4.2, 4.3, 4.4 y
4.5, esten en el cuarto intervalo y menor que 0.5 para que en el ultimo intervalo solo este la nota
5.0, ya que si la amplitud fuera 0.5, la nota 4.5 estara en el quinto intervalo y esto es falso, ya que
este quinto intervalo solo tiene un elemento. Por lo tanto la amplitud debe ser a=0.4, ya que debe
tener tanta cifras decimales, como cifras decimales tengan los datos.

[li ls ) xi fi Fi di fi di
[3.0-3.4) 3.2 9 9 0 0
[3.4-3.8) 3.6 8 17 1 8
[3.8-4.2) 4.0 7 24 2 14
[4.2-4.6) 4.4 4 28 3 12
[4.6-5.0] 4.8 1 29 4 4

P
(fi di )
x=A+ P
(fi ) a
3,8
x = 3,2 + 29 (0,4)
x = 3,72
P 2
i x) )
2 = (fiN(x1
2 = 6,08
28 = 0,21
3 = 0,1
4 = 0,047

[li ls ) xi fi Fi di fi di fi (xi x)2 fi (xi x)3 fi (xi x)4


[3.0-3.4) 3.2 9 9 0 0 2.43 -1.26 0.65
[3.4-3.8) 3.6 8 17 1 8 0.11 -0.01 1,6 103
[3.8-4.2) 4.0 7 24 2 14 0.54 0.15 0.04
[4.2-4.6) 4.4 4 28 3 12 1.84 1.25 0.85
[4.6-5.0]
P 4.8 1 29 4 4 1.16 1.25 1.36
= 38 6.08 1.38 2.9

Coeficiente de curtosis
(fi (xi x)4 )
P
P
(fi )
c.c = 4
2,9
c.c = ,0047
29

c.c = 2,12
Coeficiente de sesgo
(xi x)3
P
P
(fi )
c.s = 3

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 39

1,38
c.s = 0,1
29

c.s = 0,4.

1.5. DEMOSTRACIONES
40 Martn Daz Rodrguez

Ejercicio 1 (Examen para los estudiantes AD). A continuacion se muestran los datos de 50
personas correspondientes al numero de hectareas que cada uno posee. Se sabe que el 20 por ciento
de las personas tienen entre 65 y 75 hectareas.
[Linf Lsup ) xi fi Fi di fi di
[-) 18
[ 21-?? ) 8
[- ) 51 1
[-)
[-] 8

1. Completar la tabla

2. Halle la moda

3. Halle la desviacion estandar

4. Halle el coeficiente de variancion y el coeficiente de sesgo


5. Con base en los resultados obtenidos en los items anteriores. Describa las caractersticas que
posee este grupo de personas en relacion con el numero de hectareas. Justifique su respuesta.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 41

Ejercicio 2 (Examen para los estudiantes PECO). A continuacion se muestran los datos de 50
personas correspondientes a el numero de hectareas que cada uno posee. Se sabe que el 25 por ciento
de las personas tienen entre 65 y 75 hectareas.
[Linf Lsup ) xi fi Fi di fi di
[-) 18
[ 21-?? ) 8
[- ) 1
[-)
[-] 91 8

1. Completar la tabla

2. Halle la moda

3. Halle la desviacion estandar

4. Halle el coeficiente de variancion y el coeficiente de sesgo


5. Con base en los resultados obtenidos en los items anteriores, describa las caractersticas que
posee este grupo de personas en relacion con el numero de hectareas. Justifique su respuesta.

1.5. DEMOSTRACIONES
42 Martn Daz Rodrguez

Ejercicio 3 (Examen para los estudiantes AD). A continuacion se muestran los datos de 50
personas correspondientes a el numero de hectareas que cada uno posee. Se sabe que el 25 por
ciento de las personas tienen entre 65 y 75 hectareas.
[Linf Lsup ) xi fi Fi di fi di
[-) 11 18
[-) 8
[- ) 1
[-)
[-] 91 8

1. Completar la tabla

2. Halle la moda

3. Halle la desviacion estandar

4. Halle el coeficiente de variancion y el coeficiente de sesgo


5. Con base en los resultados obtenidos en los items anteriores, describa las caractersticas que
posee este grupo de personas en relacion con el numero de hectareas. Justifique su respuesta.

Ejercicio 4 (Examen para los estudiantes PCPG). De un grupo de 30 trabajadores de una empresa
de servicios, se suministro la siguiente informacion con respecto a sus edades:

[Linf Lsup ) xi fi Fi fri Fri di fi di fi di 2


[-) 12 0
[-) 0.267
[-) 28
[-)
[-] 0
[-] P
fi di = 32
Si se sabe que el menor de los trabajadores tiene una edad de 22 anos y el mayor tiene 46 anos.

1. Completar la tabla

2. Con base en la tabla halle el dato moda

3. Halle la media y la varianza

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 43

4. Con base en los resultados obtenidos en los items anteriores, describa las caractersticas del
grupo en relacion con sus edades.
Justifique cada una de sus respuestas

1.5. DEMOSTRACIONES
44 Martn Daz Rodrguez

Ejercicio 5. A la asociacion colombiana de ciencias polticas le preocupa la escasez de profesionales


en este campo que parece se dara en un futuro no lejano en la ciudad de Barranquilla; ellos creen
que ese problema esta relacionado con los factores: grado de satisfaccion con la profesion, el grado
de satisfaccion con el trabajo y el grado de satisfaccion salarial. Para determinar la influencia de
estos factores en esa posible escases futura, se ha contratado un estudio conuna firma especializada
en pronosticos para investigar sobre estos factores en profesionales de ciencias polticas en la
ciudad. Como parte de este estudio se pidio a 50 profesionales de este campo que indicaran su
grado de satisfaccion con respecto al trabajo, el salario y las oportunidades de ascenso. Se reunieron
los datos en la tabla que se presenta a continuacion, en la que solo aparece el grado de satisfaccion
en el trabajo:

Cuadro 1.1: Grado de satisfaccion en ciencias polticas


Trabajo Trabajo Trabajo
67 74 75
68 76 77
68 77 78
69 79 82
70 82 82
71 84 84
71 84 84
71 84 85
71 85 85
72 86 86
72 87 87
72 88 88
72 88 89
72 89 90
73 90 90
74 90 94
74 95

Resto del grupo: Utilizando datos agrupados por intervalos y los estadsticos estudiados, describa
las caractersticas de los profesionales de ciencias polticas en relacion con el grado de satisfacion
con el trabajo. Justifique su respuesta estadsticamente.

Para los estudiantes de PCPG, haga lo mismo para datos no agrupados, tome solo la
primera columna.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Estadstica I. Notas de clase (Borrador) 45

Ejercicio 6. A la asociacion colombiana de ciencias polticas le preocupa la escasez de profesionales


en este campo que parece se dara en un futuro no lejano en la ciudad de Barranquilla; ellos creen
que ese problema esta relacionado con los factores: grado de satisfaccion con la profesion, el grado
de satisfaccion con el trabajo y el grado de satisfaccion salarial. Para determinar la influencia de
estos factores en esa posible escases futura, se ha contratado un estudio conuna firma especializada
en pronosticos para investigar sobre estos factores en profesionales de ciencias polticas en la
ciudad. Como parte de este estudio se pidio a 50 profesionales de este campo que indicaran su
grado de satisfaccion con respecto al trabajo, el salario y las oportunidades de ascenso. Se reunieron
los datos en la tabla que se presenta a continuacion, en la que solo aparece el grado de satisfaccion
en el trabajo:

Cuadro 1.2: Grado de satisfaccion en ciencias polticas


Trabajo Trabajo Trabajo
67 74 75
68 76 77
68 77 78
69 79 82
70 82 82
71 84 84
71 84 84
71 84 85
71 85 85
72 86 86
72 87 87
72 88 88
72 88 89
72 89 90
73 90 90
74 90 94
74 95

Utilizando datos no agrupados y los estadsticos estudiados, describa las caractersticas de los
profesionales de ciencias polticas en relacion con el grado de satisfacion con el trabajo, (tome
solo los 10 primeros datos de la ultima columna). Justifique su respuesta estadsticamente.

1.5. DEMOSTRACIONES
46 Martn Daz Rodrguez

Ejercicio 7. A la asociacion colombiana de ciencias polticas le preocupa la escasez de profesionales


en este campo que parece se dara en un futuro no lejano en la ciudad de Barranquilla; ellos creen
que ese problema esta relacionado con los factores: grado de satisfaccion con la profesion, el grado
de satisfaccion con el trabajo y el grado de satisfaccion salarial. Para determinar la influencia de
estos factores en esa posible escases futura, se ha contratado un estudio conuna firma especializada
en pronosticos para investigar sobre estos factores en profesionales de ciencias polticas en la
ciudad. Como parte de este estudio se pidio a 50 profesionales de este campo que indicaran su
grado de satisfaccion con respecto al trabajo, el salario y las oportunidades de ascenso. Se reunieron
los datos en la tabla que se presenta a continuacion, en la que solo aparece el grado de satisfaccion
en el trabajo:

Cuadro 1.3: Grado de satisfaccion en ciencias economicas


Trabajo Salario Ascensos Trabajo Salario Ascensos
71 49 58 72 76 37
84 53 63 71 25 74
84 74 37 69 47 16
87 66 49 90 56 23
72 59 79 84 28 62
72 37 86 86 37 59
72 57 40 70 38 54
63 48 78 86 72 72
84 60 29 87 51 57
90 62 66 77 90 51
73 56 55 71 36 55
94 60 52 75 53 92
84 42 66 76 59 82
85 56 64 95 66 52
88 55 52 89 66 62
74 70 51 85 57 67
71 45 68 65 42 68
88 49 42 82 37 54
90 27 67 82 60 56
85 89 46 89 80 64
79 59 41 74 47 63
72 60 45 82 49 91
88 36 47 90 76 70
77 60 75 78 52 72
64 43 61 74 59 82

Utilizando datos agrupados por intervalos y los estadsticos estudiados, describa las caractersticas
de los profesionales de ciencias polticas en relacion con el grado de satisfacion con el salario.
Justifique su respuesta estadsticamente.

CAPITULO 1. ESTADISTICA DESCRIPTIVA.


Captulo 2

Probabilidad.

2.1. Introduccion
La historia del calculo de probabilidades es, entre todas las ramas de las matematicas, algo singular,
ya que nace como una teora para juegos de azar y muy pronto se utiliza para el estudio de fenomenos
colectivos tales como problemas actuariales, riesgos economicos y sociales, predicciones estadsticas
y otros muchos problemas filosoficos de diversos tipos. As durante casi tres siglos (XVII, XVIII
y XIX el llamado periodo clasico de la probabilidad), la motivacion y el motor para su desarrollo
proviene sobre todo, de temas externos a la matematica. El problema principal a que se enfrenta
esta teora, es el de como pasar del contenido intuitivo del concepto de azar a conceptos rigurosos
dentro de la matematica.
En los problemas de tipo discreto o finito esta dificultad no se presenta. En un juego de baraja
(poker) la pregunta cual es la probabilidad de sacar un poker de ases? tiene una respuesta bien
definida.
En otro tipo de problemas las cosas pueden complicarse; por ejemplo, consideremos el problema
de calcular la probabilidad de que un dardo al ser lanzado contra un disco caiga en cierta parte
prefijada del disco. Este problema puede ser complicado o sencillo y esto depende de cual sea el
subconjunto del disco que se fijo.
A principios de este siglo quedaba claro que la teora de la probabilidad requera de un marco
teorico mas adecuado para su desarrollo y este se encuentra gracias a los avances logrados en otras
areas de la matematica. Al construir este marco se logran varias cosas: no solo se libera a la teora
de su mero papel de instrumento, sino que se la convierte en una rama plenamente reconocida de
las matematicas, sin que por ello olvide su motivacion externa e intuitiva.
La rama toma su forma actual a partir de los anos 30s cuando Kolmogorov establece con sus
axiomas para el calculo de probabilidades las bases matematicas para asentar la teora, con lo cual,
ademas se aclaran las aparentes paradojas existentes. Todo esto aparece en su famosa monografa
Grundbegriffe der Wahrscheinlichkeitsrechnung, (1933). Los antecedentes del esquema Kolmogorov
son:
1. Los notables avances que en el area del analisis matematico se dan durante la primera decada
de este siglo con la creacion de la teora de la medida (E. Borel) y de la integral de Lebesgue. Esto
surge independientemente de la probabilidad, a pesar de lo cual, resulta ser la herramienta ideal
para su desarrollo y solido sustento matematico.
2. Por el lado de la probabilidad, se cuenta con la demostracion de E. Borel de la ley fuerte de los
grandes numeros en donde este ya maneja la nocion de probabilidad con las propiedades aditivas

47
48 Martn Daz Rodrguez

que tiene una medida. Por otra parte, los trabajos de Norbert Wiener y los de Paley y Zigmund,
contienen desarrollos importantes de la teora y en ellos ya manejan la idea de probabilidad como
medida. Tambien Lominicki y Steinhaus (1923) escriben sobre la relacion de la probabilidad con
la teora de la medida. No menos relevante es el trabajo relativo a las cadenas de Markov y sus
aplicaciones.
Por su parte N. Wiener, en sus trabajos de los anos veinte, logra resolver un importante problema
consistente en dar un modelo matematico preciso y riguroso de un fenomeno aleatorio por excelencia:
el movimiento browniano. Tiene este nombre porque fue observado por primera vez por el botanico
Robert Brown en 1828, al analizar con el microscopio partculas de polen suspendidas en agua.
Es plausible pensar que una partcula de polen no tiene una direccion fija, sino que, debido a los
constantes impactos que recibe de las moleculas de agua cambia constantemente de direccion. Por
ello su posicion al cabo de cierto tiempo resulta impredecible. La matematica clasica sirve para
estudiar fenomenos deterministas, como por ejemplo la cada libre o el tiro parabolico; no as para
fenomenos de tipo aleatorio como el del movimiento browniano. Por ello el modelo que N. Wiener
dado para el movimiento browniano, es un gran paso adelante y uno de los mas espectaculares
logros de la entonces novedosa teora de las probabilidades.
Se puede as considerar que el trabajo de estos grandes matematicos de nuestro siglo impulsa de
manera determinante la creacion de esta nueva rama de las matematicas y con ello abren un nuevo
cauce de investigacion que ha sido en las siguientes seis decadas excepcional por sus logros y su
extraordinario dinamismo.

2.2. Repaso sobre conjuntos y algunas propiedades:


Para el buen desarrollo de este captulo son importantes los siguientes conceptos sobre conjuntos:
Si U es el conjunto universal, y, A y B, son subconjuntos de U, se definen:

1. La union de dos conjuntos A y B, denotada A B, as:

A B = {x/x A x B}

2. La interseccion de dos conjuntos A y B, denotada A B, as:

A B = {x/x A x B}

3. La diferencia entre dos conjuntosA y B, denotada A B, as:

A B = A B c = {x/x A x no pertenece a B}

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 49

4. El complemento de un conjunto

Ac = {x/x U x no pertenece a A}

2.2.1. Propiedades de conjuntos:


Si U es el conjunto universal, y, A, B y C son subconjuntos de U, se cumplen las siguientes
condiciones:

1. A =

2. A U = A

3. A Ac =

4. A = A

5. A U = U

6. A Ac = U

7. A B = B A

8. A B = B A

9. A (B C) = (A B) (A C)

10. A (B C) = (A B) (A C)

11. (A B)c = Ac B c

12. (A B)c = Ac B c

13. A = (A B) (A B c )

14. Si A y B no tienen elementos en comun es decir son disyuntos, entonces:

AB =

2.2. REPASO SOBRE CONJUNTOS Y ALGUNAS PROPIEDADES:


50 Martn Daz Rodrguez

2.3. Espacio Muestral.


Definicion 2.3.1. Espacio Muestral.
Es el conjunto de todos los posibles resultados que se pueden obtener al realizar un experimento
aleatorio, denotaremos el espacio muestral con la letra S.
Ejemplo 2.3.1. Al lanzar un dado normal una vez, el espacio muestral es:

S = {1,2,3,4,5,6}

que son los posibles resultados que se pueden obtener.


Definicion 2.3.2. Punto Muestral:
Es cualquier elementos del espacio muestral.
Observe que la definicion anterior el espacio muestral, no es mas que el conjunto universal y que
al hablar de puntos muestrales, estamos hablando de los elementos del conjunto universal.
El espacio muestral puede ser discreto, continuo o mixto.

Definicion 2.3.3. Espacio Muestral Discreto:


Cuando dado los dos valores numericos mas extremos, los resultados del experimento solo toman un
numero finito o infinito pero contable de valores entre estos valores extremos, se dice que el espacio
muestral es discreto.
Ejemplo 2.3.2. El espacio muestral obtenido al lanzar un dado normal una vez, es un ejemplo de
espacio muestral discreto.
Definicion 2.3.4. Espacio Muestral continuo:
Cuando dado dos valores numericos extremos, los resultados del experimento pueden tomar cualquier
valor entre estos valores extremos, se dice que el espacio muestral es continuo.
Ejemplo 2.3.3. Temperatura, el tiempo que tarda una impresora en imprimir un archivo.
Definicion 2.3.5. Evento:
Es cualquier subconjunto del espacio muestral.
Ejemplo 2.3.4. Que al lanzar un dado una vez, estemos interesados en un numero par. En este
caso el evento es:

A = {2, 4, 6} S = {1, 2, 3, 4, 5, 6}
Definicion 2.3.6. Evento Imposible:
Es aquel que no tienen puntos muestrales ( o tienen elementos que no pertenecen al espacio muestral)
Ejemplo 2.3.5. Al lanzar un dado normal una vez, A = {}, si el resultado que se desea es 7.
Definicion 2.3.7. Evento Seguro:
Es aquel que al realizar el experimento siempre ocurrira.
Por ejemplo al lanzar un dado normal el resultado siempre sera, 1, 2, 3, 4, 5 o 6, as que el evento
S={1,2,3,4,5,6}, es un evento seguro.

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 51

Definicion 2.3.8. Evento Simple: Se dice que un evento es simple si contiene un solo punto
muestral.
Definicion 2.3.9. Evento Compuestos: Se dice que un evento es compuesto, si contiene mas de
un punto muestral.
Definicion 2.3.10. Evento Disyuntos: dos eventos son disyuntos si su interseccion es vaca, es
decir si la ocurrencia de uno de ellos, anula la ocurrencia del otro y viceversa.
El concepto de Probabilidad se puede abordar desde dos puntos de vista, desde el punto de vista
emprico donde la probabilidad es tratada como una frecuencia relativa y desde el punto de vista
axiomatico. El principal problema de la primera es que supone que todos los puntos muestrales
tienen la misma probabilidad de ocurrencia, cosa en general no es cierta.
Definicion 2.3.11. Definicion Emprica: Sea S el espacio muestral en un experimento aleatorio y
sea A un evento de S. se define la probabilidad de A, denotada P (A), as:
Numero de casos favorables a la ocurrencia del evento A
P (A) =
numero total de casos posibles de S

2.4. Definicion Axiomatica de Probabilidad:


Definicion 2.4.1. Probabilidad
Sea S el espacio muestral en un experimento aleatorio y sea z el conjunto de todoslos subcon-
juntos de S, (es decir son eventos) y sea P una funcion:

P : z R
se dice que P es una funcion de probabilidad o tambien simplemente una probabilidad si y solo si
se cumplen las siguientes condiciones:

a. P (A) 0

b. P (S) = 1

c. Si A1 , A2 , A3 , ..., A es una sucesion infinita de eventos disyuntos dos a dos, entonces:


P
P (Ui=1 Ai ) = i=1 P (Ai ) = P (A1 , A2 , ..., A )

Nota: P esta definida solo en el intervalo [0,1]


Teorema 2.4.1. Sean A y B eventos de S, S es el espacio muestral, entonces:

a. P () = 0

2.4. DEFINICION AXIOMATICA DE PROBABILIDAD:


52 Martn Daz Rodrguez

b. P (S) = 1

c. P (Ac ) = 1 P (A)

d. P (A B) = P (A) + P (B) P (A B)

e. P (A) = P (A B) + P (A B c )

f. P (A B) = P (A) + P (B) ; Si A B =
Ejemplo 2.4.1. 1. Supongamos que P (A) = 0,5; P (B) = 0,3; P (A B) = 0,6

Calcular:
a. P (Ac ) =?

b. P (A B) =?

c. P (A B c ) =?

d. P (Ac B c ) =?

e. P (Ac B) =?

f. P (Ac B c ) =?

Solucion

a. P (Ac ) = 1 0,5 = 0,5

b. P (A B) = P (A) + P (B) P (A B)
Entonces: P (A B) = 0,5 + 0,3 0,6 = 0,2

c. P (A B c ) = P (A) P (A B)
Entonces: P (A B c ) = 0,5 0,2 = 0,3

d. P (Ac B c ) = P [(A B)c ] = 1 P (A B) = 1 0,6 = 0,4.


A Ac
c
B P (A B) = 0,2 P (A B) = 0,1 P (B) = 0,3
Bc P (A B c ) = 0,3 P (Ac B c ) = 0,4 P (B c ) = 0,7
P (A) = 0,5 P (Ac ) = 0,5

Luego la probabilidad buscada es P (Ac B c ) = 0,4

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 53

e. P (Ac B) = P [(A B c )c ] = 1 P (A B c ) = 1 0,3 = 0,7

f. P (Ac B c ) = P [(A B)c ] = 1 P (A B) = 1 0,2 = 0,8


Ejemplo 2.4.2. Suponga que una familia sale de vacaciones de verano en su casa rodante y que
M es el evento de que sufriran problemas mecanicas, T es el evento de que recibiran una infraccion
por cometer una falta de transito y V es el evento de que llegaran a un lugar para acampar que
esta lleno. De acuerdo con siguiente diagrama:

Ponga en palabras los eventos representados por las siguientes regiones:

a. Region 5

b. Region 3

c. Region 1 y 2 juntas.

d. Region 4 y 7 juntas.

e. Region 3, 6, 7 y 8 juntas.

Solucion

a. Sufriran problemas mecanicos pero no recibiran ninguna infraccion ni llegaran a un lu-


gar lleno para acampar.

b. Recibiran una infraccion por falta de transito y llegaran a un lugar para acampar que
esta lleno pero no sufriran problemas mecanicos.

c. Sufriran problemas mecanicos y llegaran a una zona para acampar que esta llena.

2.4. DEFINICION AXIOMATICA DE PROBABILIDAD:


54 Martn Daz Rodrguez

d. Recibiran una infraccion de transito y no llegaran a un sitio para acampar que no tenga
sitios vacos.

e. No sufriran problemas mecanicos.

2.4.1. Tecnicas de Conteo


Definicion 2.4.2. Principio de Adicion Si un evento A puede realizarse de m maneras diferentes y
un evento B puede realizarse de n maneras distintas, y los eventos no pueden darse conjuntamente,
entonces el numero formas distintas en que pueden darse los eventos A o B es ( m + n).
Ejemplo 2.4.3. Evento A : viajar de Barranquilla a bogota va terrestre.
Evento B : viajar de Barranquilla a bogota va aerea.

Para el evento A supongamos que existen 4 rutas distintas y para el evento B, 3 rutas diferentes,
luego numero de formas distintas en que se puede viajar de Barranquilla a Bogota es 3 + 4 = 7
Definicion 2.4.3. Principio de Multiplicacion Si un evento A puede realizarse de m maneras
diferentes y un evento B puede realizarse de n maneras distintas y los eventos pueden darse
conjuntamente, entonces el numero de formas distintas en que pueden darse los eventos A y B
conjuntamente es m * n
Ejemplo 2.4.4. Evento A : lanzar un dado una vez.
Evento B : lanzar una moneda una vez.

Para el evento A hay 6 posibilidades (numeros enteros entre 1 y 6) y para el evento B exis-
ten dos posibles resultados (cualquiera de los dos lados de la moneda). Luego, los puntos muestrales
para cuando A y B ocurren conjuntamente es 6 * 2= 12.
Definicion 2.4.4. Permutacion Una permutacion es una n-upla de elemento en donde el orden en
que se escriben estos, es importante.
Piense en una permutacion como si fuera un vector, ya que por ejemplo el vector (1,2,3) es diferente
del vector (2,1,3), a pesar de tener los mismos elementos, en forma analoga la permutacion 123 es
diferente de la permutacion 213.
Definicion 2.4.5. Combinacion Es una n-tupla de elementos en donde el orden en que se escriban
los elementos no es importante, es decir, si se escriben los mismos elementos en un orden distinto,
se estara hablando de la misma combinacion.
Piense en una combinacion como si fuera un conjunto, ya que por ejemplo el conjunto {1,2,3} y el
conjunto {2,1,3}, son iguales a pesar de que sus elementos estan escritos en un orden distinto; en
forma analoga 123 visto como una combinacion y 213 son representaciones de la misma combinacion.
Teorema 2.4.2. El numero de permutaciones de n elementos distintos, tomados de k en k , sin
repeticion, denotado nPk , viene dado as:

n!
nPk = (nk)!

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 55

con k n. Ademas, si k = n se tiene:

n!
nPn = (nn)! = n!

Teorema 2.4.3. El numero de permutaciones de n elementos distintos, tomados de k en k, con


repeticion es nk .
Teorema 2.4.4. El numero de permutaciones de n elementos de los cuales n1 son iguales entre
s, n2 iguales entre s pero distintos de los anteriores, y as sucesivamente hasta llegar al grupo
k-esimo que tiene nk elementos iguales entre s, pero distintos de todos los anteriores, denotado
nP n1 , n2 , ..., nk viene dado as:

n!
nP n1 , n2 , ..., nk = (n1 !n2 !...nk !)

Pk
donde n = i=1 ni
Teorema 2.4.5. El numero de combinaciones de n elementos distintos tomados de k en k,
denotado nCk , viene dado as:

n!
nCk = k!(nk)! =

con k n. Ademas, si k = n se tiene:

n!
nCn = n!(o)! =1

Ejemplo 2.4.5. Calcule nPk para la palabra INFINITO

Solucion

n1 =3 para I
n2 =2 para N
n3 =1 para F
n4 =1 para T
n5 =1 para O

8!
Luego nP3,2,1,1,1 = 3! 2! 1! 1! 1! = 3360

2.4. DEFINICION AXIOMATICA DE PROBABILIDAD:


56 Martn Daz Rodrguez

Ejemplo 2.4.6. De cuantas formas distintas pueden 6 personas ordenarse para subirse a un bus?

Solucion

n=6
6P6 = 6! = 720

b. De cuantas formas es posible si dos personas especficas no pueden estar juntas?

Solucion

Se sabe que si se tienen 6 puestos disponibles para las 6 personas, las formas totales en que
estas se pueden sentar juntas en una lnea es 6!=720.
Se necesita calcular las nuevas posibles formas de instalarse sin que las personas en conflicto
queden juntas y para ello una forma posible de solucion es la siguiente, se calcula las formas en
las que las personas especficas pueden sentarse juntas y luego restar este valor del numero total
de posibilidades. Ahora, el numero total de formas en las que las dos personas especficas pueden
sentarse juntas es 2! 5! y segun lo descrito anteriormente, el numero de formas en las que las 6
personas pueden instalarse bajo la condicion establecida es:

6! - (2! 5!) = (5!)(6) - (2!) (5!) = (5!) (6 - 2) = (5!) (4) = 480

Ejemplo 2.4.7. Una cadena de tiendas de aparatos electronicos ofrecen un precio especial por
un conjunto completo de equipos de sonido: amplificador, componente compactos, parlantes y
tocadisco. Un comprador puede elegir un componente de cualquiera de las siguientes marcas:
1. Amplificador: Kendwood, Onkyo, Pioneer, Sony y Sherwood
2. Componente Compacto: Onkyo, Pioneer, Sony y Technics
3. Parlantes: Boston, Infinity y Polk
4. Tocadisco: Onkyo, Sony, Teac y Technics
Un tablero en la tienda permite que un cliente conecte entre s cualquier seleccion de componentes,
uno de cada tipo.

Aplique la regla del producto para contemplar lo siguiente:


a. De cuantas maneras se puede seleccionar un componente de cada tipo?
b. De cuantas maneras se pueden seleccionar los componentes si el amplificador y el tocadiscos
deben ser Sony?
c. De cuantas maneras se pueden seleccionar los componentes si ninguno de ellos debe ser Sony?
d. De cuantas maneras se puede hacer una seleccion si por lo menos un componente debe ser
Sony?
e. Si alguien maneja los interruptores del tablero en forma aleatoria, Cual es la probabilidad
de que el sistema seleccionado contenga cuando menos un componente Sony, y, exactamente un
Componente Sony?

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 57

Solucion

a. 5 * 4 * 3 * 4 = 240

b. 1 * 1 * 3 * 4 = 12

c. 4 * 3 * 3 * 3 = 108

d.
240 - 108 =132

e.
a. Formas de hacer la seleccion empleando cuando menos un componente Sony

132
P(Punto a - Punto c)= 240
b. Formas de hacer la seleccion utilizando exactamente un componente Sony k = 27 + 36 + 36 = 99
99 33
Por lo que la probabilidad es igual a 240 = 80

2.4.2. Probabilidad Condicional


Definicion 2.4.6. Probabilidad Condicional Sean A y B eventos de un espacio muestral S, se
define la probabilidad condicional de A dado B, denotada P(AB), as:

P (AB)
P (A|B) = P (B)

Si P (B) 6= 0
Ejemplo 2.4.8. La probabilidad de que un doctor diagnostique de manera correcta una enfermedad
particular es de 0.7. Dado que el doctor hace un diagnostico incorrecto, la probabilidad de que el
paciente presente una demanda es de 0.9
Cual es la probabilidad de el medico presente un diagnostico incorrecto y el paciente lo demande?

Solucion

A = Diagnostico correcto
B = Demanda
P(A) = 0.7
P (B|Ac ) = 0,9
P (Ac B) =?

Entonces:
P (Ac B) = P (Ac )P (B|Ac )
luego, P (Ac ) = 0,3
P (Ac B) = (0,3)(0,9) = 0,27

2.4. DEFINICION AXIOMATICA DE PROBABILIDAD:


58 Martn Daz Rodrguez

Definicion 2.4.7. Eventos Independientes Sean A y B dos eventos de un espacio muestral S, se


dice que los eventos A y B son independientes si y solo si:

P (A|B) = P (A) y P (B|A) = P (B)


Teorema 2.4.6. Sean A y B dos eventos de un espacio muestral S, A y B son independientes si y
solo si:

P (A B) = P (A)P (B)

2.4.3. Probabilidad Total


Teorema 2.4.7. Sean A1 , A2 , ..., An una sucesion disjunta de eventos de S, tales que ni=1 (Ai ) = S
y sea B otro evento de S, entonces:

Pn Pn
P (B) = i=1 P (Ai B) = i=1 P (Ai )P (B|Ai ).

2.4.4. Regla de Bayes


Teorema 2.4.8. Regla de Bayes
P (Ai B) PnP (Ai )P (B|Ai )
P (Ai |B) = P (B) =
k=1 P (Ak )P (B|Ak )

Ejemplo 2.4.9. Una caja contiene 6 bolas rojas y 4 verdes y una segunda contiene 7 rojas y
3 verdes. Se escoge al azar una bola de la primera caja y se coloca en la segunda. Despues se
selecciona una bola de la segunda y se pone en la primera.

1. Cual es la probabilidad de que se seleccione una bola roja de la primera caja y una bola roja
de la segunda caja.
Solucion Ai = bola roja de la caja i; con i = 1,2

a. P (A1 A2 ) = P (A1 )P (A2 |A1 )

luego, P (A1 ) = 6/10


P (A2 |A1 ) = 8/11

24
Entonces: P (A1 A2 ) = (6/10)(8/11) = 55

Ejemplo 2.4.10. Una empresa que fabrica camaras de video, un modelo basico y otro de lujo. El
ano pasado el 0.4 de las camaras vendidas fueron basicas. De los compradores del modelo basico,
el 0.3 compran con garanta ampliada mientras que el 0.5 de los compradores del modelo de lujo

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 59

tambien lo hacen as. Si se sabe que un comprador seleccionado al azar tiene garanta ampliada,
Que tan probable es que tenga un modelo basico?

Solucion

B
= camara comprada es modelo basico.
A
= camara comprada tiene garanta ampliada.

P (B|A) =?
P (B|A) = P P(AB)
(A)

DIAGRAMA P (A) = P (B)P (A|B) + P (B c )P (A|B c )


P (A) = (0,4)(0,3) + (0,6)(0,5) = 0,42

P (A B) = P (B)P (A|B) = 0,12


0,12
P (B|A) = 0,42 = 0,285

Ejemplo 2.4.11. Un amigo que trabaja en una gran ciudad tiene 2 autos, uno pequeno y otro
grande. 3/4 del tiempo utiliza el automovil pequeno para ir a trabajar y el 1/4 restante utiliza el
auto grande.
Si utiliza el automovil pequeno por lo general no tiene problema para estacionarse y llega a su
trabajo a tiempo con una probabilidad de 0.9.
Si utiliza el automovil grande la probabilidad es de 0.6 de llegar a tiempo.
Si llego a tiempo una manana en particular, Cual es la probabilidad de que haya utilizado el auto
pequeno?

Solucion

B
= utilizar el auto pequeno.
A
= llegar a tiempo al trabajo.

P(B/A)=?
P (B) = 3/4 = 0,75
P (B c ) = 1/4 = 0,25
P (A|B) = 0,9 y P (Ac |B) = 0,1
P (A|B c ) = 0,6

DIAGRAMA Luego, P (B|A) = P (A B)P (A)


P (A) = P (B)P (A|B) + P (B c )P (A|B c )
P (A) = (0,75)(0,9) + (0,25)(0,6) = 0,825
P (B)P (A|B) (0,75)(0,9)
Entonces: P (B|A) = P (A) = (0825) = 0,818

2.4. DEFINICION AXIOMATICA DE PROBABILIDAD:


60 Martn Daz Rodrguez

2.5. Ejercicios

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 61

UNIVERSIDAD DEL NORTE


I
ICA
TA DIST
ES
C I A L DE
PAR

Problema de aplicacion 2. Un inversionista esta pensado en comprar un numero muy grande


de acciones, la cotizacion de las acciones en la bolsa durante los dos meses anteriores es de gran
interes para el inversionista. Con base en esta informacion se observa que la cotizacion se relaciona,
con el producto nacional bruto (PNB). Si el (PNB) aumenta, la probabilidad de que aumenten las
acciones es de 0.8. si el (PNB) es el mismo, la probabilidad de que aumenten las acciones es de
0.2 y si el (PNB) disminuye la probabilidad de que aumenten las acciones es de 0.1. Si para los
siguientes 6 meses se asignan las probabilidades de 0.4, 0.3 y 0.3 para los eventos PNB aumenta,
PNB permanece igual y PNB disminuye, respectivamente.
1. Determine la probabilidad de que las acciones no aumenten su en los ultimos 6 meses.
2. Si las acciones aumentan su valor, cual es la probabilidad de que el PNB haya aumentado su
valor?
Problema de aplicacion 3. La probabilidad de que cierto componente funcione es de 0.9.
un aparato tiene dos de estos componentes. El aparato funciona mientras lo haga uno de estos
componentes. Cual es la probabilidad de que el aparato funcione?

Problema de aplicacion 4. Se lanza una moneda con una probabilidad de 2/3 de que el resultado
sea cara, si sale cara se extrae una bola aleatoriamente de una urna que contiene 2 bolas rojas y
3 verdes. Si sale sello se extrae una bola de otra urna que contiene 2 rojas y 2 verdes. Cual es la
probabilidad de extraer una bola roja?
Problema de aplicacion 5. Dos fabricas A y B producen relojes de la misma clase. A con un
reloj defectuoso entre 100 y B con un reloj defectuoso entre 200. un comerciante compra una caja
de tales relojes, sin saber de cual fabrica viene. Saca un reloj y funciona, al sacar el segundo reloj,
Cual es la probabilidad de que el reloj funcione?
Justifique cada una de sus respuestas.

2.5. EJERCICIOS
62 Martn Daz Rodrguez

Problema de aplicacion 6. Suponga que se han distribuido bolas de colores en 3 cajas


indiferenciables de la siguiente manera:
Caja 1 Caja 2 Caja 3
Roja 2 4 3
Blanca 3 1 4
Negra 5 3 3
1. Cual es la probabilidad de extraer una bola roja?

2. Cual es la probabilidad si se sabe que la bola es roja, se haya extrado de la caja 3?


3. Si las probabilidades de seleccionar la caja 1, 2 y 3 son 2/3, 1/6 y 1/6, respectivamente Cual
es la probabilidad, si se sabe que la bola es roja, se haya extrado de la caja 3?
4. Si se junta todas las bolas en una caja y se extraen cinco de ellas, sin reemplazo cual es la
probabilidad de seleccionar una roja y una negra ?
Problema de aplicacion 7. Una persona posee dos autos, un modelo compacto y uno estandar.
Aproximadamente utiliza el vehculo compacto para trasladarse a su trabajo las tres cuartas partes
del tiempo y el restante usa el carro mas grande. Cuando emplea el carro compacto llega a su casa
a las 5:30 el 75 % de las veces; si utiliza el carro de tamano estandar llega a la misma hora el 60 %
de las veces (pero disfruta del aire acondicionado del carro mas grande). Si llega a su casa despues
de las 5:30. Cual es la probabilidad de que haya usado el carro compacto?

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 63

UNIVERSIDAD DEL NORTE


PARCIAL DE ESTADISTICA I

NOMBRE

Problema de aplicacion 8. Un agente de bienes races muestra casas a un comprador potencial.


Hay 10 casas del precio deseado en una lista de la zona. El comprador tiene tiempo para visitar
solo tres de ellas.
1. En cuantas formas podra escoger las tres casas, si se considera el orden de visita?

2. En cuantas formas podra escoger las tres casas, si se considera que el orden de visita no es
importante?

3. Si cuatro de las casas son nuevas y seis han sido ocupadas previamente, y las tres casas por
visitar se escogen al azar, cual es la probabilidad de que sean nuevas?
Problema de aplicacion 9. Un profesor que el ultimo periodo dio dos secciones de estadstica
en ingeniera, el primero con 20 alumnos y el segundo con 30 decidio asignar un proyecto para los
cursos. Despues de recibidos todos los proyectos, los apilo en orden aleatorio antes de calificarlos.
Considere los 15 primeros proyectos que se califican.
Cual es la probabilidad de que al menos 10 de ellos provengan de la segunda seccion?
Problema de aplicacion 10. Tres parejas de casados han comprado boletas para el teatro y
se sientan en una fila formada por seis asientos. Si toman sus asientos de un modo totalmente
aleatorio, cual es la probabilidad de que Jim y Paula (marido y mujer) se sienten en los dos
asientos de la extrema izquierda? cual es la probabilidad de que Jim y Paula se sienten juntos?,
dado que Jhon y Mary Lou (marido y mujer) se sientan juntos en el medio, cual es la probabilidad
de que los otros dos esposos se sienten junto a sus esposas?
Problema de aplicacion 11. El individuo A tiene un crculo de amigos cercanos (B, C, D, E y
F). A ha odo un rumor fuera del crculo y ha invitado a los cinco amigos a una reunion para hacer
circular el rumor. Para comenzar, A selecciona a uno de los cinco al azar y le comenta el rumor,
entonces ese individuo selecciona al azar a uno de los cuatro individuos restantes y repite el rumor.
As, un nuevo individuo de los que no han odo el rumor es seleccionado por el individuo que acaba
de escucharlo, y as, hasta que todos lo han odo.
1. Cual es la probabilidad de que el rumor sea repetido en el orden B, C, D, E y F?
2. Cual es la probabilidad de que F sea la tercera persona de la reunion a quien se le cuente el
rumor?
Problema de aplicacion 12. Una empresa que fabrica camaras de video produce un modelo
basico y uno de lujo. El ano pasado, 40 % de las camaras vendidas han sido del modelo basico,
30 % compran una garanta ampliada, mientras que el 50 % de los compradores del modelo de lujo
tambien lo hacen as. Si sabemos que un comprador seleccionado al azar tiene garanta ampliada
que tan probable es que tenga un modelo basico?

2.5. EJERCICIOS
64 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


AL
RCI
PA
D O
N
E GU
S DE ESTADISTICA I

NOMBRE

Problema de aplicacion 13. Un experimento consiste en lanzar primeramente un dado y despues


lanzar una moneda siempre y cuando el numero en el dado sea par. Si el resultado del dado es impar,
la moneda se lanza dos veces. Dibuje un diagrama de arbol para mostrar los elementos del espacio
muestral.
Problema de aplicacion 14. Un determinado zapato se fabrica en 5 estilos diferentes y en 4
colores distintos para cada uno. Si la zapatera desea mostrar a su clientela pares de zapatos en
todos los estilos y colores, cuantos pares diferentes deberan colocar en el aparador?
Problema de aplicacion 15. Una clase de estadstica avanzada se compone de 10 alumnos de
primer ano, 30 de ultimo ano y 10 graduados. Las calificaciones finales mostraron que 3 de los de
primer ano, 10 de los del ultimo ano y 5 de los graduados, recibieron una A de calificacion por el
curso. Si se selecciona un estudiante aleatoriamente y se encuentra que es uno de los que obtuvo
una A, cual es la probabilidad de que el o ella sea alumno del ultimo ano?
Problema de aplicacion 16. En el ultimo ano de la escuela en un grupo de 100 alumnos se
encontro que 42 cursaron matematicas, 68 psicologa, 54 historia, 22 matematicas e historia, 25
matematicas y psicologa, 7 historia pero no matematicas ni psicologa, 10 las tres materias y
8 ninguna de las tres. Si se selecciona un estudiante aleatoriamente, encuentre la probabilidad de que

1. una persona en sicologa haya estudiado las tres


2. Una persona que no se inscribio en psicologa haya tomado historia y matematicas.
Problema de aplicacion 17. La probabilidad de que un hombre casado vea un cierto programa
de TV es de 0.4 y la de que una mujer del mismo estado civil lo haga, de 0.5. La probabilidad de
que un hombre vea el programa, dado que su esposa lo hace, es 0.7. Encuentre la probabilidad de que

1. una pareja de casados vea el programa;

2. una esposa vea el programa dado que su esposo lo hace;

3. al menos una persona de un matrimonio vea el programa.

CAPITULO 2. PROBABILIDAD.
Estadstica I. Notas de clase (Borrador) 65

Ejercicio 8. El evento A es que el siguiente libro que salga de una biblioteca publica sera de no
ficcion y B de ficcion. Supongamos que P(A)=0.35 y P(B)=0.5.

1. Por que no es posible que P(A)+P(B)=1 ?


T
2. Calcule P(A B).
S
3. Calcule P(A B).
T
4. Calcule P(A B).

ECAES DE ESTADISTICA I

Ejercicio 9. Una urna contiene 7 bolas numeradas del 1 al 7, la probabilidad de que al sacar tres
de ellas, las tres sean pares, si el experimento se hace con reposicion es:
a) 17 b) 37 c) 47 d) ( 37 )3

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: d) probabilidad

Ejercicio 10. Una urna contiene 7 bolas numeradas del 1 al 7, la probabilidad de que al sacar tres
de ellas, las tres sean impares, si el experimento se hace con reposicion es:
a ) ( 74 )3
b) 37
c) 47
d) 17

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: a) probabilidad

Ejercicio 11. Una urna contiene 7 bolas numeradas del 1 al 7, la probabilidad de que al sacar tres
de ellas de una en una, las tres sean pares, si el experimento se hace sin reposicion es:
1
a) 35
3
b) 7
c) 47
d) ( 37 )3

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: a) probabilidad

Ejercicio 12. Una urna contiene 7 bolas numeradas del 1 al 7, la probabilidad de que al sacar tres
de ellas de una en una, las tres sean impares, si el experimento se hace sin reposicion es:
a ) ( 74 )3
b) 37
4
c) 35
1
d) 7

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: c) probabilidad

2.5. EJERCICIOS
66 Martn Daz Rodrguez

Ejercicio 13. Una urna contiene 7 bolas, tres rojas y cuatro negras, la probabilidad de que al
sacar tres de ellas, las tres sean negras, si el experimento se hace sin reposicion es:

1
a) 35
3
b) 7
1
c) 21
d) ( 37 )3

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: c) probabilidad
Ejercicio 14. Una urna contiene 7 bolas, tres rojas y cuatro negras, la probabilidad de que al
sacar tres de ellas, las tres sean rojas, si el experimento se hace sin reposicion es:
1
a) 35
3
b) 7
1
c) 21
1
d) 84

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: d) probabilidad
Ejercicio 15. Una urna contiene 7 bolas, tres rojas y cuatro negras, si al sacar tres de ellas, sin
reposicion, se sabe que la primera es roja, la probabilidad de que las otras dos tambien lo sean es:
1
a) 35
3
b) 7
1
c) 21
1
d) 31

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: d) probabilidad condicional
Ejercicio 16. Una urna contiene 7 bolas, tres rojas y cuatro negras, si al sacar tres de ellas,
con reposicion, se sabe que la primera es roja, la probabilidad de que las otras dos tambien lo sean es:

1
a) 35
9
b) 37
1
c) 21
1
d) 31

Componente: Resolver problemas Competencia: Operativa Contenido referencial:


Respuesta: b) probabilidad condicional

CAPITULO 2. PROBABILIDAD.
Captulo 3

Variables Aleatorias
Unidimensionales.

3.1. Variables Aleatorias Discretas


Definicion 3.1.1. Sea S el espacio muestral de experimento aleatorio. Sea X una funcion:

X : z R

y sea f otra funcion:

f : X R

se dice que X es una variable aleatoria discreta y f su funcion de probabilidad si y solo si se cumplen
las siguientes condiciones:

1. f (x) 0; x R

2. P (X = x) = f (x)

P
3. xR f (x) = 1

Algo que caracteriza a una variable discreta, es que dado un par de valores numericos de la variable,
esta no puede tomar todos los valores que hay entre estos dos valores dados.
El grafico siguiente podra ser la curva de distribucion de una funcion de probabilidad para una
variable aleatoria discreta. Piense en los segmentos de rectas del graficos como puntos.

67
68 Martn Daz Rodrguez

3.2. Variable Aleatoria Continua.


Definicion 3.2.1. Sea S el espacio muestral en un experimento aleatorio, sea X una funcion:

X : z R

y sea f otra funcion:

f : X R,

se dice que X es una variable aleatoria continua y f una funcion de densidad para X, si y solo si se
cumplen las siguientes condiciones:

1. f (x) 0; x R

Rb
2. P (a X b) = a
f (x)dx

R
3.
f (x)dx = 1

Algo que es caracterstico en una variable aleatoria continua, es lo siguiente: dado dos valores de
una variable aleatoria continua, ella puede tomar cualquier valor entre los dos valores dados. Como
ejemplos de variables aleatorias se tiene estatura de una persona, la temperatura de un lugar, el
peso de una una persona, etc.
El grafico siguiente muestra la curva de distribucion de la funcion de densidad para una variable
aleatoria continua.

3.2.1. Funcion de probabilidad acumulada


Definicion 3.2.2. Sea X una variable aleatoria discreta, f su funcion de probabilidad, se defina la
funcion de probabilidad acumulada para X, denotada F, as:

P
F (x) = tx f (t) = P (X x)

Definicion 3.2.3. Funcion de densidad Sea X una variable aleatoria continua, f su funcion de
densidad, se define la funcion de densidad acumulada para X, denotada F, as:

R
F (x) = P (X x) =
f (t)dt

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 69

Ejemplo 3.2.1. Una organizacion de consumidores que evalua automoviles nuevos, reporta
regularmente el numero de defectos importantes en cada examen. Sea X el numero de defectos
importantes en un automovil seleccionado al azar. Si su funcion de probabilidad acumulada es como
sigue:
1. Calcule la probabilidad de que X sea igual a 2.

2. Calcule la probabilidad de que X sea mayor que 3.

3. Calcule la probabilidad de que X este entre 2 y 5.

4. Calcule la probabilidad de que X este entre 2 y 5 sin incluirlos.


Solucion
P2 P1
1. P (X = 2) = x=0 f (x) x=0 f (x) = 0,34 0,19 = 0,2

P P3
2. P (X > 3) = x=4 f (x) = 1 P (x 3) = 1 x=0 f (x) = 1 0,67 = 0,33

P5 P1
3. P (2 X 5) = x=0 f (x) x=0 f (x) = 0,97 0,19 = 0,78

P4 P2
4. P (2 < X < 5) = x=0 f (x) x=0 f (x) = 0,92 0,39 = 0,53.
Justifique cada uno de los pasos en la solucion del ejemplo anterior.
Ejemplo 3.2.2. De una caja que contiene 4 monedas de $1000 y 2 de $500. se seleccionan tres
de ellas al azar sin reemplazo. Determine la distribucion de probabilidad, para el total T, de las 3
monedas. Halle la distribucion de probabilidad.

3.3. Distribuciones especiales de variables aleatorias


3.3.1. Variables aleatorias discretas (casos especiales)
Definicion 3.3.1. Distribucion Uniforme Discreta Sea X una variable aleatoria discreta que puede
tomar los valores x1 , x2 , x3 , ..., xn . Se dice que X es una variable aleatoria discreta con distribucion
uniforme y f su funcion de probabilidad si y solo si:

1

n; si x {x1 , x2 , ..., xn }
f (x) =
0, en cualquier otro caso
Ademas:

3.3. DISTRIBUCIONES ESPECIALES DE VARIABLES ALEATORIAS


70 Martn Daz Rodrguez

Pn Pn 2
xi i=1 (Xi E(X))
E(X) = i=1
n y V (X) = n

Definicion 3.3.2. Distribucion de Bernoulli


Sea X una variable aleatoria discreta que toma los valores de exito (1) con probabilidad P y fracaso
(0) con probabilidad (1 - P), se dice que X es una variable aleatoria discreta de Bernoulli si y solo
si su funcion de probabilidad f puede expresarse as:


P, si x=1
f (x) = 1 P, si x=0
0, en cualquier otro caso

Ademas:

E(X) = P y V (X) = P (1 P ).
Definicion 3.3.3. Distribucion Binomial Sea X una variable aleatoria discreta, se dice que
X,numero de exitos en n ensayos de Bernoulli, es una variable con distribucion binomial, si y solo
si la probabilidad de exito P en cada uno de los n ensayos de Bernoulli es la misma y su funcion
de probabilidad f puede expresarse as:


(n{x )P x (1 P )nx ; si x = 0, 1, 2, .., n
f (x) =
0; en cualquier otro caso

Ademas:

E(X) = nP y V (X) = nP (1 P ).
Definicion 3.3.4. Distribucion Hipergeometrica Sea X una variable aleatoria discreta, se dice
que la variable X,numero de exitos en n ensayos de Bernoulli, es una variable con distribucion
hipergeometrica, si y solo si la probabilidad de exito en cada uno de los n ensayos de Bernoulli es
variable y su funcion de probabilidad f puede expresarse as:

(
(k{x )(N k){(nx)
; si x = 0, 1, 2, .., n
f (x) = N {n
0; en cualquier otro caso

Ademas:

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 71

k k k N n
E(X) = n N y V (X) = n( N )(1 N )( N 1 ).

Definicion 3.3.5. Distribucion Binomial Negativa


Sea X una variable aleatoria discreta, se dice que X, numero de fracasos antes de obtener el r exito
en ensayos de Bernoulli, es una variable con distribucion binomial negativa, si y solo si su funcion
de probabilidad viene dada as:


(r + x 1){x P r (1 P )x ; si x = 0, 1, 2, .., n
f (x) =
0; en cualquier otro caso

Donde P es la probabilidad de exito en cada ensayo de Bernoulli y ademas:

r(1P )
E(X) = P y V (X) = [ r(1P
P2 ]
)

Esta distribucion es tambien conocida como distribucion de tiempo de espera.

Definicion 3.3.6. Distribucion de Poisson Sea X una variable aleatoria discreta, se dice X,
numero de exitos por unidad de longitud, de area, de volumen, de tiempo, etc, es una variable
aleatoria con distribucion de Poisson si y solo si su funcion de probabilidad viene dada as:

x e

f (x) = x! ; si x = 0, 1, 2, ..
0; en cualquier otro caso

Ademas:

E(X) = V (X) =

Ejemplo 3.3.1. Se sabe que el 0.4 de los ratones inoculados con un suero quedan protegidos de
cierta enfermedad. Si se inoculan 5 ratones, encuentre la probabilidad de que:
a. Ninguno contraiga la enfermedad.
b. Menos de 2 contraigan la enfermedad.
c. Mas de tres contraigan la enfermedad.

Solucion

Sea X
=numero de ratones que se inoculan y quedan protegidos de cierta enfermedad.

X tiene una distribucion binomial con p= 0.4 y n=5

3.3. DISTRIBUCIONES ESPECIALES DE VARIABLES ALEATORIAS


72 Martn Daz Rodrguez

a. P (X = 5) = (5{5 )(0,4)5 (1 0,4)0 = 0,01024

b. P (X 4) = P (X = 4) + P (X = 5) = (5{4 )(0,4)4 (1 0,4)1 + 0,01024 = 0,0768 + 0,01024

c. P (X 1) = P (X = 1) + P (X = 0) = (5{1 )(0,4)1 (1 0,4)4 + (5{0 )(0,4)0 (1 0,4)5 =


0,2592 + 0,07776 = 0,33696

Ejemplo 3.3.2. Cual es la probabilidad de que una mesera se rehuse a servir bebidas alcoholicas
a solo 2 menores si verifica al azar las identificaciones de 5 estudiantes de entre 9 estudiantes de
los cuales 4 no tienen la edad legal?

Solucion

Sea X = numero de menores a los que la mesera se rehusa a servir bebidas alcoholicas
dentro del grupo de los 5 estudiantes elegidos al azar.

La variable X tiene distribucion hipergeometrica.

N=9
k=4
n=5
(4{2 )(5{3 )
Luego, P (X = 2) = (9{5 )
= 0,4761.

Ejemplo 3.3.3. En promedio en cierta interseccion ocurren 3 accidentes de transito por mes.
Cual es la probabilidad de que para cualquier mes dado ocurran:

a. Exactamente 5 accidentes?

b. Ocurran menos de tres accidentes?

c. Ocurran al menos dos accidentes?

Solucion

X
= numero de accidentes en un mes.

X es una variable con distribucion de Poisson y = 3


(35 )(e3 )
a. P (X = 5) = f (5) = 5!

b. P (X < 3) = f (0) + f (1) + f (2)

c. P (X 2) = 1 P (X < 2) = 1 [f (0) + f (1)]

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 73

3.4. Variable aleatoria continua (casos especiales)


Definicion 3.4.1. Distribucion Uniforme Continua Sea X una variable aleatoria continua,
definida en un intervalo [a,b] se dice que X tiene una distribucion uniforme continua, si y solo si:

1

ba ; si x [a, b]
f (x) =
0; en cualquier otro caso

Ademas:
a+b (ab)2
E(X) = 2 y V (X) = 12

Definicion 3.4.2. Distribucion Normal Sea X una variable aleatoria continua, se dice que X tiene
una funcion de densidad con distribucion normal, si y solo si:

x 2
(
e1/2(
)

f (x) =

2 2
; si x R; > 0; , R
0; en cualquier otro caso

con parametros y .
Teorema 3.4.1. Sea X una variable con distribucion normal con paramtros y , entonces

E(X) = y V (X) = 2

Nota 1. Si = 0 y 2 = 1; Se dice que X tiene distribucion normal estandar con funcion de


densidad:

( 2
e1/2x
; si x R;
f (x) = 2
0; en cualquier otro caso

Teorema 3.4.2. Sea X una variable con distribucion normal con media y varianza 2 , entonces
la variable
X
Z=

tiene distribucion normal estandar.
El teorema anterior dice que toda variable con distribucion normal, se puede transformar en una
variable con distribucion normal estandar, restandole su media y luego dividiendo esta diferencia
entre la raz cuadrada de la varianza, es decir, entre su desviacion estandar.

3.4. VARIABLE ALEATORIA CONTINUA (CASOS ESPECIALES)


74 Martn Daz Rodrguez

Graficas Explicativas

%begincenter

Ejemplo 3.4.1. El diametro interior de un anillo determinado. Se distribuye normalmente con


una media de 10 cm y una desviacion estandar de 0.03 cm

a. Que proporcion de los anillos tendra diametros interiores que excedan de 10.075cm?

b. Cual es la probabilidad de que el anillo de un piston tenga un diametro interior entre


9.97 y 10.03?

c. Por debajo de que valor el diametro interior sera el 0.15 de los anillos del piston?

d. Cual es la probabilidad de que dos de los siguientes 6 pistones tengan un diametro inte-
rior entre 9.97 y 10.03?

e. Cual es la probabilidad de que se necesite 6 pistones para tener un diametro interior en-
tre 9.97 y 10.03?
Solucion

= 10

= 0,03

La variable tiene distribucion normal con X diametro interior de un anillo de un piston.

a. P (X > 10,075)
X 10,07510
Z= = 0,03

P (X > 10,075) = P (Z > 2,5)

Observando la tabla encontramos que el area a la derecha es 0.9938, por tanto el area a la
derecha y nuestra respuesta buscada sera (1 - 0.9938) = 0.0062

b. P (9,97 X 10,03) = P ( 9,9710


0,03 Z 10,0310
0,03 )

P (1 X 1) = P (Z 1) P (Z 1) = 0,8413 0,1587 = 0,6826

c. P (X x0 ) = 0,15
X0
P ( x
) = 0,15

P (z Z0 ) = 0,15

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 75

Ahora, buscando en la tabla el valor de 0.15, se encuentra que Z = -1.04 por tanto:
X0
Z0 = luego X0 = 9,9688

d. P (Y = 2) = 6{2 P 2 (1 P )4

e. Z numero de fracasos

r=1

P (Z = 5) = (1 + 5 1){5 P 1 (1 P )5
Ejemplo 3.4.2. Las notas definitivas obtenidas por los estudiantes de Estadstica I del profesor A,
estan normalmente distribuidas con una media de 3.6 y una desviacion estandar de 1.1.
Las notas obtenidas por los estudiantes de Estadstica I del profesor B, estan tambien, normalmente
distribuidas con una media de 3.1 y una desviacion estandar de 0.93.
Luis estudiante del profesor A saco una nota definitiva de 4.5, Karen amiga de Luis y alumna del
profesor B, le dice a Luis que ella saco una nota equivalente a esa en su grupo (ocupo el mismo
puesto que Luis en su grupo).
1. Cuanto saco Karen (de el resultado de la nota con una sola cifra decimal)?
2. Que posicion ocupo en su grupo?
En cada caso, justifique estadsticamente su respuesta.

Solucion al item 1):


Sea X la nota obtenida por un estudiante del grupo del profesor B.

En la primera columna de la siguiente tabla se muestra la informacion correspondiente a las cali-


ficaciones del profesor A y en la segunda, la informacion correspondiente a las notas del profesor B:

Profesor A Profesor B
Las notas estan normalmente distribuidas Las notas estan normalmente distribuidas
= 3,6 = 3,1
= 1,1 = 0,93
Nota del estudiante Luis 4.5 Sea x0 , la nota de la estudiante Karen.
Estandarizando la nota de Luis en su grupo y luego la nota de Karen en su grupo y tenien-
do en cuenta que esta nota estandarizada, debe ser igual a la nota estandarizada de Luis, la cual
es conocida, de ah, se despeja el valor de x0 que corresponde a la nota de Karen, como se muestra
a continuacion:

Nota de estandarizada de Luis:


4,5 3,6
= ,82.
1,1

3.4. VARIABLE ALEATORIA CONTINUA (CASOS ESPECIALES)


76 Martn Daz Rodrguez

Ahora como por hipotesis, se sabe que la nota de Karen es igual a la de Luis, eso implica que la
nota estandarizada de Karen, debe ser tambien 0.8181, es decir,que
x0 x0 3,1
= = 0,82,
0,93
despejando a x0 en esta ecuacion, se tiene que x0 = (0,82)(0,93) + 3,1 = 3,86, o sea, que x0 = 3,9.
Respuesta: La nota obtenida por Karen en su grupo es 3.9.

Respuesta al item 2):


Ya teniendo la nota de Karen, se calcula la probabilidad de obtener una nota menor o igual a
esta, para saber que posicion ocupa en su grupo, sabiendo ya que las notas estan normalmente
distribuidas, lo que se hace a continuacion:

X
P (X 3,9) = P ( ) = P (Z 0,82),

que al buscar en la tabla de la distribucion normal estandar, corresponde a 0.79 o en forma
porcentual al 79 %, entonces P X 3,9) = P (Z 0,82) = 0,79 = 79 %.
De acuerdo con este resultado, una respuesta a la parte b) es:
Si ordenamos las notas de mayor a menor Karen ocupa un puesto por encima del 79 % de los
estudiantes de su grupo.
Definicion 3.4.3. Distribucion Gamma Sea X una variable aleatoria continua, se dice que X
tiene una distribucion Gamma, si y solo si su funcion de densidad, viene dada as:

(
x(1) ex
; si x, , > 0; , R
f (x) = ()
0; en cualquier otro caso

Ademas:


E(X) = y V (X) = 2

NOTA : a. si = 1 se dice que X tiene distribucion exponencial

()ex ;

si x>0
f (x) =
0; en cualquier otro caso

Ademas:

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 77

1 1
E(X) = y V (X) = 2

n 1
b. Si = 2 y= 2 se dice que X tiene distribucion Chi-Cuadrado

( n n x
(1/2) 2 x( 2 1) e 2
f (x) = (n/2) ; si x>0
0; en cualquier otro caso

Ademas:

E(X) = n y V (X) = 2n

3.5. Ejercicios

3.5. EJERCICIOS
78 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


Estadstica I. Tercer Parcial

NOMBRE

Norma: Los celulares deben estar apagados y guardados ya sea en su bolso o su bolsillo
El incumplimiento de la norma sera causal de anulacion de su examen Tiempo maximo:
55 minutos.
1. En la Ciudad de Mexico hay en promedio 3.5 perros callejeros por cuadras en las zonas
proletarias de la ciudad. Si se supone que los perros estan igualmente distribudos en dichas
zonas, determine la probabilidad de que en una zona proletaria de la ciudad se encuentre
usted cuatro o mas perros callejeros por cuadras:
a) en una cuadra cualquiera.
b) en al menos tres de las siguientes cinco cuadras que recorra,
c) por primera vez en la tercera cuadra que recorra,
d ) por segunda vez en la cuarta cuadra que recorra.
e) Si en una cuadra en particular hay nueve perros, de los cuales tres son negros, cual es
la probabilidad de que al escoger cuatro de ellos, exactamente uno sea negro?
2. Un senor tiene una hija universitaria a quien le da una cantidad variable de dinero para llevar
cada da a la esccuela. El papa desea que dicha cantidad la decida la suerte. Para eso mete
en una caja ocho pequenos papeles doblados, de las cuales cinco dicen 20 pesos y tres dicen
10 pesos. Cada manana y en presencia de su padre la nina saca tres papeletas al azar. Lo que
sumen las tres papeletas sera lo que su papa le dara ese da para sus gastos en la universidad.
a) Encuentre la funcion de probabilidad para la suma de dinero recibida por la nina
diariamente.
b) Cual es la probabilidad de que un da la nina reciba 60 pesos?
c) calcule la media y la desviacion estandar.
Valoracion: Primer punto 3.0
Segundo punto 2.0
Definicion 3.5.1. Distribucion Binomial y binomial negativa
f (x) = (n{x )P x (1 P )nx ; si x = 0, 1, 2, .., n
f (x) = (r + x 1{x )P r (1 P )x ; si x = 0, 1, 2, ..,

E(X) = nP y V (X) = nP (1 P ).
Definicion 3.5.2. Distribucion Hipergeometrica

(k{x )(N k){(nx)


f (x) = N {n
; si x = 0, 1, 2, .., n

k k k N n
E(X) = n N y V (X) = n( N )(1 N )( N 1 ).

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 79

Definicion 3.5.3. Distribucion de Poisson

f (x) = x e
x! ; si x = 0, 1, 2, ..

E(X) = V (X) =

3.5. EJERCICIOS
80 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


Estadstica I. Tercer Parcial

NOMBRE

Norma: Los celulares deben estar apagados y guardados ya sea en su bolso o su bolsillo
El incumplimiento de la norma sera causal de anulacion de su examen Tiempo
maximo: 55 minutos.
3. De acuerdo con un estudio publicado por un grupo de sociologos de la universidad de
Massachussets, aproximadamente 30 % de los adictos al Valium en el estado de Massachussets,
lo tomaron por primera vez debido a problemas sicologicos. Encuentre la probabilidad de que
de los siguientes 7 adictos entrevistados:
a) exactamente 4 hayan comenzado a usarlo debido a problemas sicologicos.

b) entre 2 y 5 de ellos comenzaron a tomarlo por problemas que no fueron sicologicos.


4. Para evitar que lo descubran en la aduana, un viajero ha colocado 8 tabletas de narcotico en
una botella, que contiene 7 pldoras de vitamina que son similares en apariencia. Si el oficial
de la aduana selecciona 4 tabletas aleatoriamente para analizarlas, Cual es la probabilidad
de que el viajero sea arrestado por posesion ilegal de narcoticos?

5. El gerente de una empresa desea contratar una nueva secretaria para llenar el cargo vacante
que dejara su actual secretaria que cumplio la edad para pensionarse, para ello recibe la hoja
de vida de varias aspirantes y las entrevista, una a la vez. Si la probabilidad de escoger una
secretaria de las que llevaron su hoja de vida es de 1/5, Cual es la probabilidad de que
se requiera entrevistar una sexta aspirante para encontrar la primera que cumple con los
requisitos?

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 81

6. Un cientfico inocula varios ratones, uno a la vez, con un germen de una enfermedad hasta que
obtiene 4 que la han contrado. Si la probabilidad de contraer la enfermedad es 1/5, Cual es
la probabilidad de que se requieran 6 ratones?

3.5. EJERCICIOS
82 Martn Daz Rodrguez

7. El numero promedio de ratas de campo por acre en un campo de trigo de 8 acres se estima
es de 10, encuentre la probabilidad de que menos de 5 ratas de campo se encuentren:
a) en dos acre de terreno determinado

b) en 3 de los siguientes 5 acres inspeccionados.

8. La dureza Rockwell de un metal se determina al golpear con un punto acerado la superficie


del metal y despues medir la profundidad de penetracion del punto. Suponga que la dureza
Rockwell de cierta aleacion esta normalmente distribuida con media de 70 y desviacion
estandar de 3.

a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75. Cual es la probabilidad


de que un especimen seleccionado al azar tenga una dureza aceptable?

b) Si la escala aceptable es (70-c,70+c), para que valores de c tendra una dureza aceptable
el 95 % de todos los paquetes?
Cual es la probabilidad de que a lo sumo 8 de 10 especmenes seleccionados
independientemente tenga una dureza menor de 73.84?

9. La distribucion del peso de paquetes enviados de cierto modo, es normal con valor medio
de 10 libras. El servicio de paquetera desea establecer un valor de peso c, mas alla del cual
habra cargo extra. Cual valor de c es tal que 99 % de todos los paquetes pesen por lo menos
una libra abajo del peso con cargo extra?

10. Se sabe que el dinero que gastan al ano los estudiantes de determinanda universidad en libros
de textos sigue una distribucion normal con media $ 38.000 pesos y una desviacion estandar
de $ 5000 pesos. Halle los valores extremos en pesos del rango mnimo, que contenga el 95 %
de los gastos en compra de textos de los estudiantes de esa universidad.
11. Suponga que el 8 % todos los ejes de acero producidos por cierto proceso estan fuera de las
especificaciones, pero pueden volver a trabajar. Considere una muestra aleatoria de 20 ejes
y exprese con X el numero de los que esten fuera de las especificaciones y puedan volver a
trabajar. Cual es la probabilidad de que X sea:

a) a lo sumo 13?

b) menos de 13?
c) entre 15 y 25 inclusive?

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 83

UNIVERSIDAD DEL NORTE


PROGRAMA DE ADMINISTRACION DE EMPRESA
Estadstica I. Tercer Parcial

NOMBRE

PECO El tiempo de llegada a clase de los estudiantes de estadstica uno del curso 2439
esta normalmente distribuido con un a media de 4 minutos y una desviacion estandar de
2 minutos.

a) Si el profesor cree que el 3.5 % de los estudiantes llegaran tarde a su clase, cual es el
tiempo mnimo de retraso en la llegada a clase de estos estudiantes?
b) Cual es la probabilidad de que de 5 estudiantes que lleguen al curso, exactamente 2,
lleguen en el tiempo de retraso?
c) Cual es la probabilidad de que se requiera de la llega a clase de un quinto estudiante
para encontrar un tercero que llegue en el tiempo de retraso?
d ) Si se sabe que de 10 estudiantes que hay en el curso, seis llegaron en menos del tiempo
mnimo de retraso y el profesor quiere darles bonificacion en la nota del tercer parcial a
esos seis estudiantes, pero el no sabe cuales de los 10 estudiantes llegaron en menos del
tiempo mnimo de retraso, Cual es la probabilidad de que el profesor se equivoque?
e) Si en promedio llegan 5 estudiantes por minutos, Cual es la probabilidad de que en dos
minutos lleguen exactamente 4 estudiantes al curso?

3.5. EJERCICIOS
84 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


PROGRAMA DE ADMINISTRACION DE EMPRESA
Estadstica I. Tercer Parcial

NOMBRE

PCPG La probabilidad de que un estudiante de Fundamentos de Estadstica llegue a clase en menos


de 2.5 minutos de iniciada la misma es de 0.227.

a) Cual es la probabilidad de que de 5 estudiantes que lleguen al curso, exactamente 2,


lleguen en menos de 2.5 minutos?
b) Si se sabe que de 10 estudiantes que hay en el curso, seis llegaron en menos de 2.5 minutos
y el profesor quiere darles bonificacion en la nota del tercer parcial a esos seis estudiantes,
pero el no sabe cuales de los 10 estudiantes llegaron en menos de 2.5 minutos, Cual es
la probabilidad de que el profesor se equivoque?
c) Si en promedio llegan 5 estudiantes por minutos, Cual es la probabilidad de que en dos
minutos lleguen exactamente 6 estudiantes al curso?

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 85

UNIVERSIDAD DEL NORTE


PROGRAMA DE ADMINISTRACION DE EMPRESA
Estadstica I. Tercer Parcial

NOMBRE

Definicion 3.5.4. Distribucion Binomial

f (x) = (n{x )P x (1 P )nx ; si x = 0, 1, 2, .., n

E(X) = nP y V (X) = nP (1 P ).
Definicion 3.5.5. Distribucion Hipergeometrica

(k{x )(N k){(nx)


f (x) = N {n
; si x = 0, 1, 2, .., n

k k k N n
E(X) = n N y V (X) = n( N )(1 N )( N 1 ).

Definicion 3.5.6. Distribucion de Poisson

f (x) = x e
x! ; si x = 0, 1, 2, ..

E(X) = V (X) =

3.5. EJERCICIOS
86 Martn Daz Rodrguez

12. Se enva un aviso a todos los propietarios de cierto tipo de automoviles, solicitandoles
llevarlos al distribuidor para comprobar la presencia de un defecto particular de fabricacion.
Supongamos que solo el 5 % tiene el defecto. Considere una muestra aleatoria de 10
automoviles.

a) Cuales son el valor esperado y la desviacion estandar del numero de automoviles de la


muestra que no tienen defecto?

b) Cual es la probabilidad de que por lo menos 1 automovil de los muestreados tengan el


defecto?
c) Cual es la probabilidad de que entre 2 y 5 automoviles en la muestra tenga el defecto?
d ) Cual es la probabilidad de que se requiera revisar 10 automoviles para encontrar el cuarto
automovil defectuoso.
e) Si se tienen 10 automoviles de los cuales se sabe 4 son defectuosos, cual es la probabilidad
de que al seleccionar 5 de ellos, tres sean defectuosos.
f ) Si al concesionario llegan en promedio tres vehculos defectuosos por hora Cual es la
probabilidad de que en dos horas llegen exactamente 4 vehculos?

13. El numero de solicitudes de asistencia recibido por un servicio de remolque de vehculos con
fallas es en promedio de 4 en una hora.

a) Calcule la probabilidad de que exactamente 10 solicitudes lleguen en un periodo


particular de dos horas.

b) Cual es la probabilidad de que por lo menos cinco soliciten el servicio en un periodo


particular de una hora?

Valoracion: El primer punto vale 3.5/5 y el segundo 1.5/5.

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 87

14. La presion de aire de un neumatico seleccionado al azar, instalado


en un automovil nuevo esta normalmente distribuido con un valor
medio de 31 lb/pulg2 y desviacion estandar de 0.2 lb/pulg2 .

a) Cual es la probabilidad de que la presion de un neumatico,


seleccionado al azar, exceda de 30.5 lb/pulg2 ?

b) Suponga que un neumatico se considera con presion baja si


esta debajo de 30.4 lb/pulg2 . Cual es la probabilidad de que
al menos uno de los cuatro neumatico de un automovil se
encuentre bajo?
15. Suponga que aviones pequenos llegan a cierto aeropuerto segun
un proceso de Poisson, con una tasa de 8 aviones por hora.

a) Cual es la probabilidad de que exactamente 5 aviones


pequenos lleguen en un periodo de una hora? por lo menos 5
en una hora?.

b) Cuales son el valor esperado y la desviacion estandar del


numero de aviones pequenos que lleguen durante un periodo
de 90 minutos.?
16. (REVISAR EL ENUNCIADO) Un director de personal que
entrevista a 11 ingenieros para cuatro vacantes a programado
seis entrevistas para el primer da y cinco para el segundo da.
Suponga que los candidatos son entrevistados al azar.

a) Cual es la probabilidad de que x de los mejores cuatro


candidatos sean entrevistados el primer da?
3.5. EJERCICIOS
88 Martn Daz Rodrguez

b) Cuantos de los mejores cuatros candidatos pueden esperar ser


entrevistados el primer da ?

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Estadstica I. Notas de clase (Borrador) 89

17. Un profesor de estadstica I, esta interesado en saber cual es la


nota definita mnima que debe sacar un estudiante en su grupo de
trabajo. El profesor cree que a lo mas el 91.92 % de su estudiantes
aprobaran la materia en su grupo de trabajo, y cree tambien que
las notas estaran normalmente distribudas con una media de 4.3,
y una varianza de 1. Determine esa nota

18. El dispositivo de carga de un paracadas militar de carga ha sido


disenado para que se abra cuando este se encuentre a 200 m
de altura sobre el suelo. Supongamos que la altitud de apertura
en realidad tiene una distribucion normal con media 200 m y
desviacion estandar 30 m. habra dano a el equipo si el paracadas
se abre a una altitud de menos de 100 m. Cual es la probabilidad
de que haya dano a la carga en al menos uno de cinco paracadas
lanzados independientemente?

19. Suponga que las velocidades tpicas en la carrera 51b entre la


circunvalar y la Universidad del Norte se distribuyen normalmente
con una media de 59 kms por hora y una desviacion estandar de
4 kms por hora. Si la polica distrital tiene ordenes de multar al
10 % mas veloz de los conductores, cual es la mayor velocidad a la
que usted puede conducir ah sin ser multado?

3.5. EJERCICIOS
90 Martn Daz Rodrguez

20. El diametro de una unidad de almacenamiento optico, tiene


una distribucion normal, con media de 0.2508 pulgadas y
una desviacion estandar de 0.0005 pul. Las especificaciones del
diametro del eje son 0.2500 +o- 0.0015. que proporcion de ejes,
cumple con este requisito?
21. El diametro promedio de un eje es de 1.018 pul y la desviacion
estandar de 0.0013 pul. El diametro interior promedio de un
cojinete correspondiente es de 1.059 pulgadas y una desviacion
estandar de 0.0017 pul. Suponiendo que tanto el diametro
interior y exterior del cojinete son variables aleatorias distribuidas
normalmente. Cual es el juego mnimo que se espera ocurra al
combinar aleatoriamente ejes y cojinetes en un ensamble? Juego
mnimo valor de L=? Tal que p(juegoL)=0.00135 Calcular el valor
esperado del juego, varianza y la probabilidad de interferencia.

CAPITULO 3. VARIABLES ALEATORIAS UNIDIMENSIONALES.


Captulo 4

Distribuciones conjuntas.

4.1. Variables Aleatorias Discretas Bidimensionales


Definicion 4.1.1. Sea (X,Y) un vector bidimensional, se dice que el par (X,Y) es un vector
aleatorio discreto bidimensional y f su funcion de probabilidad conjunta si y solo si se cumplen
las siguientes condiciones:

1. f (x, y) 0

2. P (X = x, Y = y) = f (x, y)
P P
3. xR yR f (x, y) = 1

4.2. Variables Aleatorias Continuas Bidimensionales


Definicion 4.2.1. Sea (X,Y) un vector bidimensional, se dice que el par (X,Y) es un vector
aleatorio continuo bidimensional y f una funcion de densidad conjunta para (X,Y) si y solo si
se cumplen las siguientes condiciones:

1. f (x, y) 0

RbRd
2. P(a X b, c Y d ) = a c
f (x, y)dydx
R R
3. f (x, y)dydx = 1

Definicion Sea (X,Y) una variable aleatoria bidimensional discreta y f su funcion de probabilidad
conjunta, se define la funcion de probabilidad conjunta acumulada, denotada F, as:

P P
F (x, y) = P (X x, Y y) = t1 x t2 y f (t1 , t2 )

91
92 Martn Daz Rodrguez

Definicion Sea (X,Y) una variable aleatoria bidimensional discreta y f su funcion de prob-
abilidad conjunta, se definen:

a. La funcion de probabilidad marginal para x, denotada f1 , as:

P
f1 (x) = yR f (x, y)

b. La funcion de probabilidad marginal para y, denotada f2 , as:

P
f2 (y) = xR f (x, y)

c. Las funciones de probabilidad condicional para x dado y, denotada f(x,y) y para y dado
x, denotada f(y/x), as:

f (x,y) f (x,y)
f (x/y) = f2 y y f (y/x) = f1 x

con f1 (x) y f2 (y) distintos de cero.

Caso Continuo Bivariado (X,Y) es un vector aleatorio continuo bidimensional y f su


funcion de densidad conjunta, si y solo si:

1.f (x, y) 0; (x, y) R2


RbRd
2.P (a X b, c Y d) = a c
f (x, y)dydx
R R
3.
f (x, y)dydx = 1

Definicion Sea (X,Y) una variable aleatoria bidimensional continua y f su funcion de den-
sidad conjunta, se define la funcion de densidad conjunta acumulada, denotada F, as:

R R
F (x, y) = P (X x, Y y) =
f (t1 , t2 )dt2 dt1

Definicion Sea (X,Y) una variable aleatoria bidimensional continua y f su funcion de den-
sidad, se definen:

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 93

a. La funcion de densidad marginal para X, denotada f1 , as:

R
f1 (x) =
f (x, y)dy

b. La funcion de densidad marginal para y, denotada f2 , as:

R
f2 (y) =
f (x, y)dx

c. Las funciones de densidad condicional para x dado y, denotada f(x,y) y para y dado x,
denotada f(y/x), as:

f (x,y) f (x,y)
f (x/y) = f2 y y f (y/x) = f1 x

con f1 (x) y f2 (y) distintos de cero.

Definicion Sea (X,Y) un vector aleatorio bidimensional, se definen:

a. La funcion de probabilidad o densidad marginal acumulada para x, denotada F1 , as:

P
tx f1 (t); si (x, y) es un vector aleatorio discreto
F1 (x) = P (X x, Y R) =
Rx

f1 (t)dt; si (X, Y ) es un vector aleatorio continuo

b. Se define la funcion de probabilidad o densidad marginal acumulada para y, as:

P
ty f2 (t); si (X, Y ) es un vector aleatorio discreto
F2 (y) = P (X R, Y y) =
Ry

f2 (t)dt; si (X, Y ) es un vector aleatorio continuo

4.2. VARIABLES ALEATORIAS CONTINUAS BIDIMENSIONALES


94 Martn Daz Rodrguez

Esperanza y Varianzas

Sea (X,Y) un vector aleatorio bidimensional, se definen:

a. La esperanza marginal para X y Y, denotadas E(x) y E(y), as:

P
xR xf1 (x); si (X, Y ) es un vector aleatorio discreto
E(X) =
R

xf1 (x)dx; si (X, Y ) es un vector aleatorio continuo

P
yR yf2 (y); si (X, Y ) es un vector aleatorio discreto
E(Y ) =
R

yf2 (y)dx; si (X, Y ) es un vector aleatorio continuo

b. Se definen las varianzas marginales V(X) y V(Y), as:

2
P
xR [X E(X)] f1 (x); si (X, Y ) es un vector aleatorio discreto
V (X) =
R

[X E(X)]2 f1 (x)dx; si (X, Y ) es un vector aleatorio continuo

2
P
yR [Y E(Y )] f2 (y); si (X, Y ) es un vector aleatorio discreto
V (Y ) =
R

[Y E(Y )]2 f2 (y)dx; si (X, Y ) es un vector aleatorio continuo

Tambien se definen las esperanzas y varianzas condicionales as:

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 95

P
xR xf (x/y); si (X, Y ) es un vector aleatorio discreto
E(X/y) =
R

xf (x/y)dx; si (X, Y ) es un vector aleatorio continuo

P
yR yf (y/x); si (X, Y ) es un vector aleatorio discreto
E(Y /x) =
R

yf (y/x)dy; si (X, Y ) es un vector aleatorio continuo

2
P
xR [X E(X/y)] f (x/y); si (X, Y ) es un vector aleatorio discreto
V (X/y) =
R

[X E(X)]2 f (x/y)dx; si (X, Y ) es un vector aleatorio continuo

2
P
yR [Y E(Y /x)] f (y/x); si (X, Y ) es un vector aleatorio discreto
V (Y /x) =
R

[Y E(Y )]2 f (y/x)dy; si (X, Y ) es un vector aleatorio continuo

Covarianza

COV(X,Y)= E(XY) - E(X)E(Y)

Correlacion

(X, Y ) = COV (X,Y


)
V (X) V (Y )

4.2. VARIABLES ALEATORIAS CONTINUAS BIDIMENSIONALES


96 Martn Daz Rodrguez

Ejemplo 4.2.1. La Universidad del Norte desea seleccionar estudiantes de alto rendimiento para el
servicio de monitoras en los cursos de estadstica I. Inicialmente la Universidad preselecciono los
dos mejores estudiantes de estadstica I de los profesores A, B y C, respectivamente. Solo tres
de los preseleccionados seran escogidos como monitores de estadstica I. Si X denota el numero
de estudiantes seleccionados pertenecientes al grupo del profesor A y Y el numero de estudiantes
seleccionados pertenecientes al grupo del profesor B.
1. Cual es la probabilidad de que de los tres estudiantes seleccionados, al menos uno sea del
grupo del profesor A?

2. Determine si el numero de estudiantes seleccionados del grupo del profesor A es independiente


del numero de estudiantes seleccionados pertenecientes al grupo del profesor B.

3. Cuantos estudiantes seleccionados, se esperan pertenezcan al grupo del profesor A (esperanza


marginal)?

Solucion para la parte 1)


Sea X el numero de estudiantes seleccionados pertenecientes al profesor A.
Sea Y el numero de estudiantes seleccionados pertenecientes al profesor B.
Sea n el numero de estudiantes monitores requeridos, en este caso, n=3.
En la tabla siguiente se muestra por filas, en la primera, el numero de estudiantes seleccionados
por cada profesor, que en este caso es dos y en la segunda, el numero de monitores seleccionados
de cada profesor:

Profesor A Profesor B Profesor C


Los dos mejores estudiantes de cada profesor 2 2 2
Numero de estudiantes escogidos por cada profesor x y n-x-y
Ahora el numero total de estudiantes seleccionados es de seis y el numero de monitores requeridos
es de tres, as que el numero de formas de escoger tres de los seis seleccionados es: 6C3 .

El numero total de estudiantes seleccionados del profesor A es de dos (igual para los profe-
sores B y C), as que si x es el numero de estudiantes escogidos como monitores del profesor A, el
numero de formas de escoger x estudiantes cuando se tienen dos es: 2Cx .

El numero total de estudiantes seleccionados del profesor B es de dos, as que si y es el


numero de estudiantes escogidos como monitores del profesor B, el numero de formas de escoger y
estudiantes cuando se tienen dos es: 2Cy .

Por ultimo, si ya se escogieron x monitores del profesor A, y, y monitores del profesor B,


entoces para completar el grupo de los tres monitores requeridos, solo falta escoger de los dos
candidatos del profesor C, 3-x-y; los cuales se pueden escoger de 2C(3xy) . Por lo que la funcion
de probabilidad conjunta es:
(
(2Cx )(2Cx )(2C3xy )
(6C3 ) , si x = 0, 1, 2 y , y = 0, 1, 2, con x + y 3
f (x, y) = (4.1)
0, en cualquier otro caso

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 97

Al evaluar la funcion de probabilidad conjunta en cada par de valores posibles (x,y), se tiene como
resultado, lo que se observa en la siguiente tabla:

f(x,y) 0 1 2
2 2
0 f(0,0) =0 f(0,1) = 20 f(0,2) = 20
2 8 2
1 f(1,0) = 20 f(1,1) = 20 f(1,2) = 20
2 2
2 f(2,0) = 20 f(2,1) = 20 f(2,2) =0
Para dar respuesta al item 1) basta calcular la P (X 1), pero

P (X 1) = P (X = 1) + P (X = 2)
= f (1, 0) + f (1, 1) + f (1, 2) + f (2, 0) + f (2, 1) + f (2, 2) (4.2)

Respuesta para el item 1): P (X 1) = 0,8

Solucion para el item 2): Recuerde que dos variables son independientes si

f (x, y) = f1 (x)f2 (y), para todo x, y para todo y.

Las funciones de probabilidad marginal para X, se muestran en la ultima fila de la siguiente


tabla, al igual que la funcion de probabilidad marginal para Y; la cual se muestra en la ultima
2 1 4
columna de la misma tabla: Si tomamos x=0, y, y=1, entonces f (0, 1) = 20 = 10 , f1 (0) = 20
12 4 12 6 1 5
y f2 (1) = 20 , por lo que f1 (0)f2 (1) = 20 20 = 50 6= f (0, 1) = 10 = 50 , lo cual implica que las
variables no son independiente, ya que para el caso particulkar de x=0 y, y=1, no se cumple que
f (0, 1) = f1 (0)f2 (1).
Respuesta para el item 2): Las variables X y Y, no son independientes.

Para hallar una solucion al item 3), recuerde que la esperanza marginal de X (que es lo que
se pide en este item), viene dada as:
2 12 4
E(X) = x=0,1,2 xf1 (x) = 0f1 (0) + 1f1 (1) + 2f1 (2) = 0(
) + 1( ) + 2( ) = 1
20 20 20
Respuesta para el item 3): El numero de estudiantes seleccionados que se esperan pertenezcan al
grupo del profesor A es igual a 1.

4.3. Ejercicios

4.3. EJERCICIOS
98 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


EXAMEN FINAL DE ESTADISTICA I
Solo esta permitido el uso de la tabla de la distribucion normal
Los celulares deben estar apagados y guardados ya sea en su bolso o su bolsillo.
Tiempo maximo: 90 minutos.

NOMBRE

1. La Universidad del Norte desea seleccionar estudiantes de alto rendimiento para el servicio
de monitoras en los cursos de estadstica I. Inicialmente la Universidad preselecciono los dos
mejores estudiantes de estadstica I de los profesores A, B y C, respectivamente. Solo tres de
los preseleccionados seran escogidos como monitores de estadstica I. Si X denota el numero de
estudiantes seleccionados pertenecientes al grupo del profesor B y Y el numero de estudiantes
seleccionados pertenecientes al grupo del profesor C.

a) Cual es la probabilidad de que de los tres estudiantes seleccionados, al menos uno sea
del grupo del profesor A?

b) Determine si el numero de estudiantes seleccionados del grupo del profesor A es inde-


pendiente del numero de estudiantes seleccionados pertenecientes al grupo del profesor B.

c) Cuantos estudiantes seleccionados, se esperan pertenezcan al grupo del profesor A


(esperanza marginal)?

2. Las notas del tercer parcial de 124 estudiantes de estadstica I, estan normalmente dis-
tribuidas con una media de 3.6 y una varianza de 0.9. Si la nota mnima aprobatoria es 2.95,
determine cuantos de los 124 estudiantes ganaron el parcial? Justifique estadsticamente su
respuesta.

3. De los 124 estudiantes de estadstica I que realizaron los tres primeros parciales, exactamente
nueve estudiantes distintos sacaron 4.7. Tres lo sacaron en el primer parcial, dos en el segundo
y cuatro en el tercero. Si se escogen tres de estos nueve estudiantes para un comite:
a) Cual es la probabilidad de escoger dos de los que sacaron 4.7 en el primer parcial y uno
de los que sacaron 4.7 en el segundo parcial ? Justifique estadsticamente su respuesta.
b) Halle el coeficiente de correlacion entre el numero de estudiantes que sacaron 4.7 en
primer parcial y 4.7 en el segundo parcial. Justifique estadsticamente su respuesta.

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 99

UNIVERSIDAD DEL NORTE


EXAMEN FINAL DE ESTADISTICA I

NOMBRE

1. La Universidad del Norte va a financiar internamente cinco proyectos de investigacion


relacionados con conciencia salubrista. Si la Dvision de Ingenieras presenta 3 proyectos, la de
Ciencias Basicas 2 y la Division de Humanidades cuatro.
a) Cual es la probabilidad de escoger tres de la Division de Ingeneras?
b) Si debe ser escogido uno de la Division de Ciencias Basicas, cual es la probabilidad de
escoger tres de la Division de Ingenieras?
2. Cada neumatico delantero de un tipo particular de automovil se llenara a una presion de
26lb/pulgs2. suponga que la presion de aire de cada neumatico es una variable aleatoria, X
para el neumatico derecho y Y para el izquierdo, con pdf conjunta

k(x2 + y 2 ), si 20 x 30, 20 y 30,
f (x, y) = (4.3)
0 en cualquier otro caso

a. Cual es el valor de K?
b. Cual es la probabilidad de que ambos neumaticos tengan menor presion que la requerida?
3. Dos componentes de una microcomputadora tienen la siguiente pdf conjunta para sus
duraciones X y Y:

xex(1+y) ,

si x > 0, y > 0,
f (x, y) = (4.4)
0 en cualquier otro caso

Cual es la probabilidad que la duracion X del primer componente sea mayor que 3?

4. Dada la funcion de densidad conjunta:

2
+ y)ex ,

f (x, y) = 3 (x si x > 0, 0 < y < 1,
(4.5)
0, en cualquier otro caso

a) Calcular P (X > Y /Y = 1)

4.3. EJERCICIOS
100 Martn Daz Rodrguez

UNIVERSIDAD DEL NORTE


EXAMEN FINAL DE ESTADISTICA I
Solo esta permitido el uso de la tabla de la distribucion normal
Los celulares deben estar apagados y guardados ya sea en su bolso o su bolsillo.
Tiempo maximo: 120 minutos.

NOMBRE

1. Dado el vector aleatorio discreto (X,Y), X=-1, 0, 1 y Y=1, 2, 4, con funcion de probabilidad
conjunta dada por:

f (x, y) 1 2 4
1 1/16 1/16 1/8
0 1/8 1/4 1/8
1 1/8 1/16 1/16

Calcular

a. Calcular el coeficiente de correlacion XY , son independientes las variables X y Y?


Justifique estadsticamente su respuesta.

2. Un profesor de estadstica I, esta interesado en saber cual es la nota definita mnima que
debe sacar un estudiante en su grupo de trabajo para aprobar la asignatura. El profesor
cree que a lo mas el 97.5 % de su estudiantes aprobara la materia en su grupo de trabajo,
y cree tambien que las notas estaran normalmente distribudas con una media de 4.2, y
una varianza de 0.6.
a. Determine esa nota mnima aprobatoria. Justifique estadsticamente su respuesta.

b. Si la nota mnima para ser un estudiante distinguido en estadstica I, es de 4.0.


Que porcentaje de los estudiantes de este grupo, son estudiantes con esa categora?
Justifique estadsticamente su respuesta.

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 101

a) Las variables aleatorias X y Y que representan los pesos de chocolates de crema y de


chiclosos respectivamente, en cajas de un kg., que contienen una mezcla de chocolates
de crema, chiclosos y envinados, tiene como funcion de densidad conjunta:

24xy, 0 x 1, 0 y 1, x + y 1,
f (x, y) = (4.6)
0, en cualquier otro caso

Halle el coeficiente de correlacion entre X y Y.


b) De un costal de frutas que contiene 2 naranjas, 3 manzanas y tres peras, se selecciona
una muestra de cuatro frutas, si X denota el numero de naranjas seleccionadas y Y
denota el numero de manzanas seleccionadas que aparecen conjuntamente en la muestra,
calcular:

1) P(X + Y 2)

2) E(X/Y = 1)

5. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcotico en


una botella, que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial
de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, Cual es la probabilidad
de que el viajero sea arrestado por posesion ilegal de narcoticos?

2) La funcion de densidad conjunta para la demanda mensual de dos productos viene dada por :

y25 y25 2
1 { 23 [( x5 2 x5
10 ) ( 10 )( 10 )+( 10 ) ]} ,
f (x, y) = 100 2 3
e si x, y R.

a) Cual es el coeficiente de correlacion entre X y Y?


b) Cual es la covarianza entre X y Y?
c)Obtener la funcion de probabilidad condicional de f(x/ y).
d) Suponga que la demanda de y es 30 , Cual es la probabilidad condicional de que X sea menor
que 65?

Problema de aplicacion 18. A la asociacion colombiana de ciencias economicas le preocupa la


escasez de profesionales en este campo que parece se dara en un futuro no lejano en la ciudad de
Barranquilla; ellos creen que ese problema esta relacionado con los factores: grado de satisfaccion
con la profesion, el grado de satisfaccion con el trabajo y el grado de satisfaccion salarial. Para
determinar la influencia de estos factores en esa posible escases futura, se ha contratado un estudio
conuna firma especializada en pronosticos para investigar sobre estos factores en profesionales de
ciencias economicas en la ciudad. Como parte de este estudio se pidio a 50 profesionales de este
campo que indicaran su grado de satisfaccion con respecto al trabajo, el salario y las oportunidades
de ascenso. Se reunieron los datos en la tabla que se presenta a continuacion:

4.3. EJERCICIOS
102 Martn Daz Rodrguez

Cuadro 4.1: Grado de satisfaccion en ciencias economicas


Trabajo Sueldos Ascensos Trabajo Sueldo Ascensos
71 49 58 72 76 37
84 53 63 71 25 74
84 74 37 69 47 16
87 66 49 90 56 23
72 59 79 84 28 62
72 37 86 86 37 59
72 57 40 70 38 54
63 48 78 86 72 72
84 60 29 87 51 57
90 62 66 77 90 51
73 56 55 71 36 55
94 60 52 75 53 92
84 42 66 76 59 82
85 56 64 95 66 52
88 55 52 89 66 62
74 70 51 85 57 67
71 45 68 65 42 68
88 49 42 82 37 54
90 27 67 82 60 56
85 89 46 89 80 64
79 59 41 74 47 63
72 60 45 82 49 91
88 36 47 90 76 70
77 60 75 78 52 72
64 43 61 74 59 82

Ademas los datos anteriores fueron clasificados segun la profesion en: administrador, contador y
economista.
A continuacion se presentan los datos anteriores ya clasificados por profesion:

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Estadstica I. Notas de clase (Borrador) 103

Cuadro 4.2: Grado de satisfaccion en por profesion


Administrador Contador Economista
Trabajo Sueldo Ascenso Trabajo Sueldo Ascenso Trabajo Sueldo Ascenso
72 57 40 71 49 58 84 53 63
90 62 66 84 74 37 87 66 49
84 42 66 72 37 86 72 59 79
85 56 64 63 48 78 88 55 52
71 45 68 84 60 29 74 70 51
88 49 42 73 56 55 85 89 46
72 60 45 94 60 52 79 59 41
88 36 47 90 27 67 69 47 16
77 60 75 72 76 37 90 56 23
64 43 61 86 37 59 77 90 51
71 75 74 86 72 72 71 36 55
84 28 62 95 66 52 75 53 92
70 38 54 65 42 68 76 51 54
87 51 57 82 37 54 89 80 64
74 59 82 82 60 56
89 66 62 90 76 70
85 57 67 78 52 72
74 47 63
82 49 91

Se quiere identificar las caractersticas generales del grupo de profesionales en general y en partic-
ular en cada profesion, y presentar los resumenes de interes que permitan valorar las variables en
estudio, como lo son: grado de satisfaccion con el trabajo (Trabajo), grado de satisfaccion con el
sueldo (Sueldo) y grado de satisfaccion con el ascenso (Ascenso).

Si lo que se quiere hacer es un analisis desde el punto de vista estadstico, se debera tener
en cuenta los siguientes interrogantes:
1. Con base en estas variables que aspecto del trabajo satisface mas a los Profesionales de
esta ciencia?, cual parece ser el que menos lo satisface?, en cual de las tres variables se
deben introducir mejoras para estimular a mas personas a vincularse a la formacion como
profesionales en las distintas ramas de las ciencias economicas?

2. Cual de las tres variables parece generar mayor diferencia de opinion entre estos profesion-
ales? Cual de las variables parece tener mayor cohesion entre ellos?

3. Que se puede decir acerca de la satisfaccion de estos profesionales segun su tipo de


profesion?, Cual de las ramas de las ciencias economicas parecen tener los mejores niveles
de satisfaccion?

4. Considere los valores diferentes del grado de satisfaccion del ascenso como diferentes cate-
goras, es decir, considere la variable Ascenso como una variable categorica (cualitativa), haga

4.3. EJERCICIOS
104 Martn Daz Rodrguez

lo mismo con los valores diferentes del grado de satisfaccion del salario, o sea con la variable
Salario, es el grado de satisfaccion del ascenso independiente del grado de satisfaccion en
salario?
5. Considere los valores diferentes del grado de satisfaccion del trabajo como diferentes cate-
goras, es decir, considere la variable Trabajo como una variable categorica (cualitativa), haga
lo mismo con los valores diferentes del grado de satisfaccion del salario, es el grado de sat-
isfaccion del trabajo independiente del grado de satisfaccion del salario?
6. Considere los valores diferentes del grado de satisfaccion del ascenso como diferentes cate-
goras, es decir, considere la variable Ascenso como una variable categorica (cualitativa), haga
lo mismo con los valores diferentes del grado de satisfaccion del trabajo, o sea con la variable
Trabajo, es el grado de satisfaccion del ascenso independiente del grado de satisfaccion en
trabajo?
7. Considere el grado de satisfaccion en salario como una variable cuantitativa, se ajustan los
valores de la variable grado de satisfaccion en el salario a los valores de una variable con
distribucion normal?

8. Considere el grado de satisfaccion en el ascenso como una variable cuantitativa, se ajustan


los valores de la variable grado de satisfaccion en el ascenso a los valores de una variable con
distribucion normal?
9. Considere el grado de satisfaccion en el trabajo como una variable cuantitativa, se ajustan
los valores de la variable grado de satisfaccion en el trabajo a los valores de una variable con
distribucion normal?
10. Considere el grado de satisfaccion en salario y grado de satisfaccion en ascenso como variables
cuantitativas. En cada una de las profesiones analizadas, Determine si el grado de satisfaccion
en sueldo es funcion del grado de satisfaccion en el ascenso.

11. Considere el grado de satisfaccion en salario y grado de satisfaccion en el trabajo como vari-
ables cuantitativas. En cada una de las profesiones analizadas, Determine si el grado de
satisfaccion en el salario es funcion del grado de satisfaccion en el trabajo.
12. Considere el grado de satisfaccion en salario y grado de satisfaccion en ascenso como vari-
ables cuantitativa, determine si el grado de satisfaccion en sueldo es funcion del grado de
satisfaccion en ascenso en las ciencias economicas.
13. Con base en los resultados anteriores, cree usted, hay razones para que la asociacion colom-
biana de ciencias economica este preocupada?

CAPITULO 4. DISTRIBUCIONES CONJUNTAS.


Bibliografa

1. Walpole. Estadsticas para ingenieros .

2. Mendenhall. Estadsticas para adminitracion y economa.

3. Lincoln L. Chao. Estadsticas para adminitracion y economa.

4. Ya Lun Chou. Analisis estadstico.

5. Murray R. Spiegel. Estadstica.

6. George C. Canavos.Probabilidad y Estadstica.


7. George C. Canavos.Probabilidad y Estadstica.

8. http://www.matem.unam.mx/rollos/probabilidad.html
9.
10.

11.
12.
13.

105

Вам также может понравиться