Вы находитесь на странице: 1из 29

PROBABILIDAD Y ESTADISTICA

ESTADISTICA DESCRIPTIVA
ORIGEN HISTRICO
La estadstica, tuvo sus inicios en los grandes imperios de la antigedad, los primeros antecedentes
que se conocen para llevar un registro de sus pertenencias son las tablillas de arcilla utilizadas por los
babilonios 5000 a.c. Ms tarde las culturas posteriores a los babilonios realizaban registros de bienes,
soldados, esclavos, etc. Y ms tarde la implementacin de censos de poblacin.
A mediados del siglo XVII la estadstica tuvo un gran desarrollo cuantitativo, ya que en esa poca, los
imperios del viejo continente tenan la necesidad de llevar un buen control administrativo de sus actividades
comerciales y blicas, entre otras, donde sus registros y operaciones consistan en nmeros.
Posteriormente se inicia el estudio de la probabilidad, que junto con la estadstica permite estudiar
problemas donde intervienen fenmenos aleatorios que no se pueden predecir.
En la actualidad la estadstica junto con el clculo de probabilidades tienen una gran aplicacin en
todas las actividades que realiza el hombre, tales como: predicciones, censos, control de calidad, etc.
No es posible ubicar exactamente en la historia la aparicin de la estadstica, sin embargo, se supone
que su desarrollo estuvo ligado con el surgimiento de los diferentes sistemas de numeracin y escritura
creados por las civilizaciones antiguas en diferentes pocas y lugares, todo esto permita el registro y
comunicacin de los datos relacionados con diferentes actividades y se hicieron ms complejos en el
transcurso del tiempo.
Actividad 1
Desarrolla la siguiente actividad y reprtala a tu profesora, en hojas tamao carta, engrapada, con
nombre completo y grupo.

Qu ms puedes contar de la historia de la estadstica? (investiga).

Ahora vamos a conocer ms sobre estadstica y como se emplea en el mbito acadmico, social y global.

CONCEPTO DE ESTADSTICA
Estadstica es un conjunto de tcnicas para la coleccin, manejo, descripcin y anlisis de informacin,
de manera que las conclusiones obtenidas de ella tengan un grado de confiabilidad especificado.

CLASIFICACIN DE LA ESTADSTICA
La estadstica para su estudio se divide en dos grandes ramas:
Estadstica descriptiva: Es la parte encargada de la recoleccin, clasificacin, ordenamiento, presentacin y
descripcin de un conjunto de datos (como la edad de una poblacin, altura de los
estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de
describir apropiadamente las diversas caractersticas de ese conjunto.

Estadstica inferencial: Tambin se le conoce como Estadstica Inductiva, y es la parte que se encarga de
estudiar y analizar las medidas descriptivas y en base a esto, sacar conclusiones y
tomar de decisiones con el mayor grado de confiabilidad.

Los resultados que se obtienen de la estadstica descriptiva, se presentan por lo general en


cualquiera de las tres formas siguientes:
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

PROBABILIDAD Y ESTADISTICA

TABULAR. Mediante una tabla, en la cual se encuentran los datos organizados y clasificados del objeto que
se estudia.
MEDIDAS ESTADSTICAS. Mediante nmeros, de los cuales se obtienen al aplicar un mtodo o
procedimiento a un conjunto de datos.
GRAFICAS. Mediante un diagrama, en el cual se presentan de una manera objetiva los datos organizados en
una figura ilustrativa.

LOS FENMENOS QUE ESTUDIA LA ESTADSTICA


Se pueden clasificar en dos grandes grupos:
1.- Fenmenos deterministas: Tambin se les llama fenmenos determinsticos y son aquellos que
obedecen leyes o principios plenamente demostrados, por lo que en este tipo de fenmenos resulta
sencillo elaborar predicciones sobre su concurrencia, desarrollo y efecto final, por ejemplo: los eclipses,
una reaccin qumica, la cada libre de los cuerpos, un tiro parablico, la germinacin de una semilla,
etc. Mediante las observaciones repetidas y las medidas descriptivas de los datos que se obtienen, la
estadstica permite obtener y comunicar de una manera ms exacta los resultados y conclusiones sobre
los fenmenos deterministas.

2.- Fenmenos aleatorios: Son aquellos que no obedecen a ninguna ley y generalmente pueden tener 2
ms resultados diferentes, mediante su observacin repetida y el estudio de sus datos se pueden llegar a
obtener predicciones y tomar decisiones con el ms alto grado de confiabilidad, por ejemplo, los juegos de
azar, los terremotos, huracanes, la economa, etc.

POBLACIN Y MUESTRA
Para la recoleccin de datos se ha ideado y desarrollado diferentes mtodos que tienen como
principal objetivo hacer que la muestra sea representativa de la poblacin, ya que de esta manera, las
conclusiones que se obtengan del estudio de la muestra se podrn hacer extensivas a toda la poblacin.

Poblacin: Se define como un grupo, coleccin u ordenamiento de objetos, individuos o medidas


perfectamente definidos. Para la estadstica es importante que una poblacin se encuentre bien
definida ya que de esta manera se puede decidir si un objeto pertenece o no a ella. Una
poblacin puede ser finita o infinita.
La poblacin finita: est formada por un nmero determinado de elementos.
La poblacin infinita: no se tiene determinado el nmero de elementos en estudio.

Muestra: Es una parte de una poblacin, es fundamental que una muestra sea representativa de la
poblacin de la cual procede, ya que de esta manera los resultados y las conclusiones que se
obtengan al estudiar la muestra se podrn hacer extensivas a toda la poblacin.

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

PROBABILIDAD Y ESTADISTICA

CLASIFICACIN DE LAS VARIABLES


Para el estudio de un proceso estadstico, las variables se clasifican en:
Cualitativas
Variables
Discretas
Cuantitativas
Continuas

Las variables cuantitativas. Son aquellas que se representan a travs de un valor numrico, que en
una recopilacin de datos se obtiene mediante conteo o medicin de las caractersticas en estudio. Se
clasifican en discretas y continuas.
Las variables discretas. Son las que estn asociadas a un proceso de conteo, es decir que solo
pueden tomar algn valor de una escala de medicin, por ejemplo en un saln de clases puede haber 32
33 alumnos, pero nunca 32.4 alumnos.
Las variables continuas. Estn asociadas a un proceso de medicin y pueden adquirir cualquier valor
en una escala de medicin, estos es, que si tienen dos valores dados, siempre puede existir otro valor
intermedio, por ejemplo un hombre puede medir 1.71m, otro 1.72m y un tercero un valor comprendido entre
estos, tal como 1.714m.

MTODOS DE MUESTREO O SELECCIN DE UNA MUESTRA


Los mtodos empleados debern poseer caractersticas que nos faciliten alcanzar resultados ptimos.
Entre las propiedades que podemos anotar:
a) Que proporcionen la mxima informacin contenida en los datos en forma rpida y fcil de visualizar.
b) Que posean sencillez operativa.
c) Que permitan presentar los datos de una manera esttica.
Los mtodos tabulares y grficos nos permiten organizar y presentar datos de tal forma que los
aspectos sobresalientes de los mismos son rpida y fcilmente aprehensibles. En ocasiones estos mtodos
nos ayudan a establecer hiptesis tentativas sobre la naturaleza del fenmeno que se estudia.
Con la finalidad de que una muestra sea representativa de la poblacin de la cual procede, se han
desarrollado numerosos mtodos de muestreo, entre los ms relevantes se tienen:
Muestreo tipo Lotera: Consiste en identificar a cada objeto de la poblacin mediante una etiqueta,
posteriormente las etiquetas se colocan en una urna para mezclarlas y de ah extraer las etiquetas
correspondientes a los objetos que forman la muestra al azar.
Muestreo tipo sistemtico: Consiste en ordenar a todos los objetos de la poblacin en forma creciente o
decreciente de acuerdo con algunas de sus caractersticas y finalmente, del ordenamiento resultante se
extrae a cada ensimo objeto para formar la muestra.
Muestreo Estratificado: En algunos casos los objetos de una poblacin pueden estar divididos en
estratos naturales o artificiales, generalmente los estratos tienen diferentes nmeros de objetos, por lo
tanto la muestra representativa requerir que cada estrato contribuya a la muestra con una cantidad de
objetos proporcional a su tamao, por ejemplo: Si se trata de muestrear seres humanos.
a) Estratos naturales: Podran ser las zonas geogrficas o los grupos tnicos.
b) Estratos artificiales: Podran ser el nivel cultural o socioeconmico.
Las ventajas de trabajar con muestras son evidentes, en cualquier caso resultar ms sencillo y menos
laborioso el estudiar una muestra en lugar de toda una poblacin.
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz
3

PROBABILIDAD Y ESTADISTICA

FUENTES DE INFORMACIN.
La estadstica puede obtener informacin a travs de los siguientes medios:
1.- La entrevista: Consiste en un encuentro concertado entre dos o ms personas para obtener o
intercambiar datos sobre temas concretos.
2.- La encuesta: Consiste en un cuestionario elaborado previamente para la obtencin de datos sobre temas
especficos.
3.- El censo: Consiste en un padrn de personas, bienes y actividades que la mayora de los gobiernos
realizan en forma peridica.
4.- Publicaciones especializadas: Es posible obtener informacin a travs de las memorias o almanaques
que se publican peridicamente por parte de algunas empresas sobre las actividades que se realizaron.
5.- Datos experimentales: Proceden de los laboratorios de investigacin de empresas o instituciones
educativas, generalmente se tratan de reas especificas de tiempo.
6.- Medios de comunicacin masiva: Es poco frecuente pero se podra en algunos casos obtener
informacin de inters de la tv, radio, peridicos y revistas.
7.- Observacin. Consiste en recopilar informacin mediante la simple observacin.
8.- Investigacin. Consiste en recopilar informacin que ya se tiene concentrada o escrita, la cual se puede
obtener en bibliotecas, hemerotecas, mapotecas, videotecas, internet, etc.
Actividad 2
Desarrolla la siguiente actividad y reprtala a tu profesora, en hojas tamao carta, engrapada, con
nombre completo y grupo.

Recorta de peridico o revista, tres situaciones


de algunos artculos de tu
mayor inters que describan cualquiera de los siguientes medios de informacin:
Entrevista, censo, test, padrn y encuesta. Despus responde el cuestionario que
estar en el sitio de google (dibujandolineas), este para cada situacin.

La estadstica descriptiva tiene como objetivo resumir o describir las caractersticas importantes de
un conjunto de datos.
Para ello es necesario conocer que la estadstica tiene dos ramas de datos; datos no agrupados y datos
agrupados. Y empezaremos con los ms sencillos de trabajar, los datos no agrupados.

DATOS NO AGRUPADOS
No existen reglas de carcter general para decidir cundo se debe agrupar a un conjunto de datos o
cundo es preferible mantenerlos en su forma individual, la mayora de los autores y de los investigadores
sugieren que hasta aproximadamente 25 30 se deben obtener en forma individual, de esta manera se
conservar el mayor detalle de un grupo poco numeroso de datos.
Actividad 3
Desarrolla la siguiente actividad y reprtala a tu profesor(a), en hojas tamao carta, engrapada, con
nombre completo y grupo.

Qu es un dato y su clasificacin? (investiga)

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

PROBABILIDAD Y ESTADISTICA

Ejemplo1:
Los siguientes datos representan el conteo del nmero de cromosomas encontrados en el ncleo celular de
18 tomas de tejido de la herbcea Claytonica Virgnica sometida a radioactividad para un estudio de
ingeniera gentica, de los cuales necesitamos describir caractersticas importantes por medio de la
estadstica descriptiva.
24,29,28,29,28,31,38,32,28,28,30,28,30,32,30,30,32,31.

Ordenamiento: Es la primera manipulacin a la que deber ser sometido un conjunto de datos, como su
nombre lo indica, consiste en ordenarlos preferentemente de manera creciente.

Ordenndolos: __________________________________________________________________________
Para poder describir estos datos necesitamos medirlos, para ello hacemos uso de ciertas medidas que a
continuacin veremos.

MEDIDAS ESTADSTICAS
Existen tres mediciones que se estudian en la estadstica descriptiva:

Medidas de tendencia central


Medidas de posicin
Medidas de dispersin

Estas medidas se utilizaran tanto para datos no agrupados como datos agrupados

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central, tambin llamadas medidas de posicin o medidas de centralizacin,
indican mediante un valor o atributo la localizacin central de la distribucin de frecuencia.
Debido a que se pueden dar varias interpretaciones a lo que significa valor central de una distribucin,
se estudian cinco medidas de tendencia central que son la media, la mediana, la moda, media geomtrica, la
media armnica. Cabe aclarar que estas medidas de posicin, no son las nicas que existen.
Se denomina de esta manera porque tienden a localizarse en la parte central del ordenamiento, las ms
utilizadas son:
1.- Media ( x ): Tambin se le conoce como media aritmtica o promedio. Es la ms usada de las medidas
descriptivas. Tiene la ventaja de ser muy fcil de calcular, adems de poseer propiedades tericas
excelentes desde el punto de vista de la estadstica inductiva. Su principal desventaja es que, por
ser el punto de equilibrio de los datos, es muy sensible a la presencia de observaciones extremas.
La mediana resuelve, en gran parte, esa desventaja.
n

x
i 1

Poblacin

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

Muestra

PROBABILIDAD Y ESTADISTICA

Del ejemplo 1: Calcular la media aritmtica

REGLA DE REDONDEO
Una regla sencilla para redondear respuestas es la siguiente:
Aumente una posicin decimal ms a las que estn presentes en el conjunto original de datos.
De tal manera que el resultado por la regla de redondeo ser:

2.- Mediana ( X ) Md: Se define como el valor del dato que divide a la informacin en dos partes iguales,
para los datos no agrupados se tienen dos criterios:
a) Si se tiene un nmero impar de datos, entonces existir un dato que quede en la parte central de
todo el ordenamiento y el valor de la mediana ser igual con el valor del dato central.

b) Cuando se tiene un nmero par de datos, en la parte central del ordenamiento quedar una pareja
de datos y en ese caso el valor de la mediana ser igual al promedio de valores de los datos
centrales:

24,28,28,28,28,28,29,29,30,30,30,30,31,31,32,32,32,38

3.- Moda ( X ) Mo: Se define como el valor del dato que se repite el mayor nmero de veces, en algunos
casos puede no existir, entonces se dice que la muestra o poblacin no hay moda, en otros casos
puede haber varias modas, entonces se dice que la distribucin de datos es bimodal, trimodal,
multimodal.

Nota: Algunos autores dicen que cuando existen 4 ms modas esta medida se declara inexistente.

4.- Media geomtrica (G): En algunos casos esta medida tiene ventajas sobre la media aritmtica ya que no
es tan sensible con datos con variables extremos, sin embargo, esto slo ocurre cuando se obtiene un
gran nmero de datos, se utiliza bsicamente para promediar razones, tasas de cambio y valores que
muestran una progresin geomtrica., se obtiene:
Poblacin

Gn

i 1

xi

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

Muestra

G n 1

i 1

xi

PROBABILIDAD Y ESTADISTICA

Del ejemplo 1:

5.- Media armnica (H): Esta medida se utiliza preferentemente cuando se trabaja con cantidades que
varan en el tiempo, por ejemplo: velocidades, frecuencias, aceleraciones, etc. Se calcula usando todos
los elementos en un conjunto de valores, se utiliza bsicamente para ciertas tasas que pueden ser
expresadas recprocamente. Sin embargo, es til en casos especiales para promediar razones. Se
obtiene mediante:
Poblacin

n
n

i 1

Muestra

1
xi

n 1
1
x
i 1
i
n

Del ejemplo 1:

MEDIDAS DE POSICIN (CUANTILES)


As como la mediana marca la mitad de valores mayores que ella y la mitad de valores menores que
ella, los cuantiles permiten identificar valores ubicados en diferentes posiciones de un grupo de datos.
1.- Los cuartiles (1, 2 y 3): Sealan el valor que est al 25, 50 y 75 % de la totalidad de datos, el segundo
cuartil equivale a la mediana.
2.- Los deciles (del 1 al 9): Marcan el valor ubicado al 10, 20, , 80 y 90 % de los datos, el quinto decil
equivale a la mediana.
3.- Los percentiles (del 1 al 99): Indican el valor que est al 1, 2, , 98 y 99 % de los datos, el valor del
cincuenta percentil deber coincidir con el de la mediana. Los deciles 1, 2, etc., equivalen a los
percentiles 10, 20, etc., y los cuartiles equivalen a los percentiles 25, 50 y 75.
En las frmulas para obtener los cuantiles se seala entre parntesis la posicin del elemento deseado,
siendo n el nmero de datos.
CUARTILES

Q1

n
4

DECILES

D1

n
10

PERCENTILES

P1

n
100

Q2 mediana
D2

2n
10

P34

34n
100

Q3

3n
4

D5 mediana
P50 mediana

D9 etc.
P93 etc.

La cantidad que se obtenga se manejar con los siguientes criterios:


a) Cuando resulten fracciones de mitad por ejemplo 3.5, significa que la medida de ubicacin se
encuentra entre la tercera y cuarta, por lo tanto el valor ser igual al promedio de la tercera y cuarta.
b) Si resultan fracciones diferentes a mitades, el nmero se redondea al entero ms cercano.
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

PROBABILIDAD Y ESTADISTICA

Ejercicio. Obtener los cuartiles para los datos del ejemplo 1. n = 18,

Q1

Para Q1:

Para Q2:

Para Q3 : Q3

n
18

4.5 por lo que la posicin 4 y 5 es 28, por tanto el primer cuartil es 28


4
4

Q2 mediana 30 por lo que la posicin 9 es 30, por tanto el segundo cuartil es 30


3n
(3)(18)

13.5 por lo que la posicin 13 y 14 es 31, por tanto el tercer cuartil es


4
4

31

MEDIDAS DE DISPERSIN
Las medidas de dispersin, as como las de tendencia central, pueden calcularse tanto para un
conjunto de datos individuales como para una tabla de distribucin de frecuencias. Las medidas de
dispersin permiten cuantificar con diferentes criterios el grado de disgregacin que tienen los datos de una
poblacin o muestra.
Las ms utilizadas son el rango, la desviacin cuartil, la desviacin media, la varianza y la desviacin
estndar.

1.- El rango (R): Es la diferencia entre los valores extremos, el mayor y el menor, en l estn distribuidos
todos los dems valores, por eso tambin se le llama recorrido o longitud. Se usa poco debido a que es
muy influenciable por la presencia de valores extremos de poca frecuencia; se piensa que cuanto mayor
es el rango mayor es la dispersin de los datos, lo cual conduce a apreciaciones falsas.

R X n X1
R = __________________
2.- Rango intercuartil (RI): Tambin se le conoce como desviacin cuartlica, es el resultado de la diferencia
entre el tercer cuartil Q3 y el primero Q1, geomtricamente tambin representa la longitud de un intervalo
de nmeros reales en donde en la mayora de los casos estn distribuidos los datos ms significativos o
de mayor peso. Cuando se quiere eliminar los datos ms extremos se utiliza el rango intercuartil, es aqu
donde se deben encontrar los datos ms significativos por la poda que se hace.
Rango Intercuartil = RI = Q3 - Q1
RI = __________________
3.-El rango semintercuartil (QD) o desviacin cuartil, es la mitad del rango intercuartil y mide la dispersin
con mayor precisin que el rango, sin embargo, presenta las limitaciones siguientes:
a) No toma en consideracin todos los valores de la distribucin de frecuencias y puede suceder que los
valores menores a Q1 o superiores a Q3 estn muy compactos o muy dispersos, y el valor de Q sera
el mismo.
b) No es posible, conociendo nicamente Q, hacer la ubicacin precisa de una observacin dentro de la
distribucin de frecuencias.
c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones matemticas que
usa la estadstica.
Q Q1
QD 3
2
2

4.- Varianza (s ): Es la media aritmtica de los cuadrados de desviaciones respecto a la media aritmtica. La
varianza sirve de base para calcular la desviacin estndar, desviacin tpica o desviacin cuadrtica
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

PROBABILIDAD Y ESTADISTICA

media que es la ms importante de todas las medidas de dispersin, en muchos casos las unidades de
la varianza carecen por completo de sentido fsico.
n

Poblacin

S2

( xi x ) 2
i 1

S2

X
i 1

2
i

X2

Muestra

S2

( xi x ) 2
i 1

n 1

5.- Desviacin estndar (s): Se calcula como la raz cuadrada de la varianza, e indica qu tan diferentes
son entre s los datos que se analizan.

S S2

Con esta ltima medicin termnanos de medir nuestros datos no agrupados, recordando que la primera
medicin y la ltima son las ms importantes de en procesos estadstico.

GRAFICAS
Ahora el ltimo paso graficar, para este tipo de datos solo ser necesario realizar la clsica grafica de
pastel.
Para esto necesitamos una pequea tabla donde estarn nuestros datos, sus frecuencias y su
porcentaje de acuerdo al total de datos.
La pregunta clave Qu es la frecuencia? Bueno, La frecuencia es la cantidad de presencias que tienen
el dato; o sea, el datos 28 se presenta cinco veces.

Dato
24
28
29
30
31
32
38
total

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

f
1
5
2
4
2
3
1
18

%
5.6%
27.8%
11.1%
22.2%
11.1%
16.7%
5.6%
100%

PROBABILIDAD Y ESTADISTICA

Dibuja la grfica de pastel del ejemplo 1

Ahora conoceremos la otra rama DATOS AGRUPADOS, para ello necesitamos agruparlos antes de
medirlos, por lo cual usaremos algunos mtodos tabulares.

MTODOS TABULARES Y GRFICOS PARA LA ORGANIZACIN Y PRESENTACIN


DE DATOS AGRUPADOS
Los mtodos tabulares y grficos nos permiten organizar y presentar datos de tal forma que los
aspectos sobresalientes de los mismos son rpidos y fcilmente aprensibles. En ocasiones estos mtodos
nos ayudan a establecer hiptesis tentativas sobre la naturaleza del fenmeno que se estudia.

Consideramos grande un grupo que contiene ms de 30 datos. Las definiciones bsicas de grupos
grandes son exactamente iguales a las de grupos pequeos; no obstante, debido al mayor nmero de datos,
ser preciso modificar nuestros mtodos, si queremos conservar cierta comodidad en el trabajo.
EJEMPLO
Se utilizar una muestra de tamao 73, tomada del siguiente estudio de rendimientos obtenidos en
laboratorio relativo a las plantas de maz atacadas por el barrenado europeo.

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

10

PROBABILIDAD Y ESTADISTICA

Rendimiento (en kilogramos) de plantas de maz atacadas por el barrenado europeo


3.81
5.26
7.44
8.26
7.64
10.34
6.65
7.98

6.81
6.90
8.82
7.90
7.17
6.91
6.86
8.14

7.49
8.64
5.88
10.27
8.06
7.82
7.74
7.78

4.56
5.47
7.62
6.65
6.66
6.76
6.67

7.16
6.07
5.67
7.25
8.26
7.75
7.12

8.61
6.48
9.00
6.26
6.67
7.36
4.00

3.86
8.72
5.60
6.43
6.25
8.52
7.10

6.78
9.16
7.64
7.71
7.63
7.23
6.72

9.02
5.85
8.82
7.52
6.73
7.63
8.96

8.65
8.51
10.08
6.68
7.60
6.95
5.64

DATOS: Cortesa del doctor Jorge Vera Graziano

Lo primero que se debe hacer es poner los datos en orden, del menor al mayor, por lo que se tiene:
3.81
3.86
4.00
4.56
5.26
5.47
5.60
5.64
5.67

5.85
5.88
6.07
6.25
6.26
6.43
6.48
6.65
6.65

6.66
6.67
6.67
6.68
6.72
6.73
6.76
6.78
6.81

6.86
6.90
6.91
6.95
7.10
7.12
7.16
7.17
7.23

7.25
7.36
7.44
7.49
7.52
7.60
7.62
7.63
7.63

7.64
7.64
7.71
7.74
7.75
7.78
7.82
7.90
7.98

8.06
8.14
8.26
8.26
8.51
8.52
8.61
8.64
8.65

8.72
8.82
8.82
8.96
9.00
9.02
9.16
10.08
10.27

10.34

Clasificacin de los datos: Cuando se trata de grandes cantidades de datos, hay que clasificar la
informacin en categoras o clases que nos permitan representar grficamente la situacin, as como
ayudarnos a calcular los dems datos estadsticos descriptivos.
Formacin de una tabla de frecuencias. Una forma de presentacin que ser muy til para nuestros
propsitos es el que resulta de organizar los datos en Tablas de Frecuencias o Tablas de Distribucin de
Frecuencias. En este tipo de tablas se divide la amplitud de los valores numricos de los datos en un cierto
nmero de intervalos o clases, y se cuenta cuantas observaciones pertenecen a cada una de ellas.
El nmero de observaciones que pertenecen a una clase o intervalo se denomina frecuencia o
frecuencia absoluta (f).
El agrupamiento se hace por clases o intervalos de clase que son intervalos de valores reales dentro
de los cuales se encuentran comprendidos los valores de algunos de los datos.
A la anchura o tamao de clase se le denomina Intervalo de Clase.

Este ltimo requerimiento no es inflexible y algunas veces se emplean diferentes anchuras o


intervalos de clase. Los tres criterios bsicos a seguir para la subdivisin en clases son:
1. Lo mejor es tener de 5 a 12 clases.
2. Cada clase debe tener la misma anchura.
3. Las clases deben establecerse de modo que cada pieza de datos pertenezca exactamente a una
clase.
Hay dos criterios ms, tiles pero no necesarios:
4. A menudo ofrece ventajas el empleo de una anchura impar de clase.
5. Conviene usar un sistema que aproveche una pauta numrica, a fin de asegurar la exactitud.

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

11

PROBABILIDAD Y ESTADISTICA

PROCEDIMIENTO PARA EL CLCULO DE LA ANCHURA DEL INTERVALO DE CLASE:

T .I c

valor mas alto valor mas bajo


No. int ervalo

Redondear el resultado para obtener un nmero ms adecuado. Generalmente se redondea hacia


arriba.

LMITES DE CLASE (L.I. - L.S.)


Los puntos que limitan a cada una de las clases reciben el nombre de lmites de clase.
Lmite inferior: es el dato menor de un intervalo
Lmite superior: es el dato mayor de un intervalo

Lmites de clase
LI
- LS

1
2
3
4
5
6
7
total

Nota:
1. De un solo vistazo, se puede verificar, gracias a las pautas numricas, que las clases son correctas.
2. La anchura de clase es la distancia del lmite inferior de una clase al lmite inferior de la clase
siguiente (no del inferior al superior de la misma clase)

LMITES REALES DE CLASE (L.R.C.)


Son valores que evitan huecos entre un intervalo y el siguiente. Sus valores se obtienen como el
punto medio del lmite superior y el lmite inferior del siguiente intervalo, resultando que el lmite real superior
de un intervalo es igual al lmite real inferior del intervalo siguiente.

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

12

PROBABILIDAD Y ESTADISTICA

1
2
3
4
5
6
7

Lmites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total

L.R.C.
L.R.I. L.R.S.

0.94
0.94
0.94
0.94
0.94
0.94
0.94

4
5
7
25
17
12
3
73

MARCA DE CLASE (X)


El nmero que representa a cada una de las clases, y que se obtiene dividiendo la suma de los
lmites de cada clase entre dos, se denomina marca de clase o punto medio de clase.

X
X

1
2
3
4
5
6
7

Lmites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total

L.I . L.S .
2

3.81 4.74
4.275
2
c

0.94
0.94
0.94
0.94
0.94
0.94
0.94

4
5
7
25
17
12
3
73

L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385

FRECUENCIA RELATIVA ( fr )
El nmero que resulta de dividir la frecuencia absoluta de cada clase entre el nmero total de las
observaciones se denomina frecuencia relativa de clase. Esta indica que proporcin de observaciones del
total pertenecen a cada clase.
Se obtiene dividiendo la frecuencia absoluta del intervalo entre el nmero total de datos. La suma de
todas las frecuencias relativas de un conjunto de datos es igual a uno.

fr

f
No.totaldedatos

fr1

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

4
0.0548
73

13

PROBABILIDAD Y ESTADISTICA

1
2
3
4
5
6
7

Limites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total

0.94
0.94
0.94
0.94
0.94
0.94
0.94

4
5
7
25
17
12
3
73

L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385

fr

4.275
5.215
6.155
7.095
8.035
8.975
9.915

FRECUENCIA ACUMULADA (fa)


La frecuencia acumulada de un intervalo, se obtiene sumando la frecuencia de ese intervalo con la
frecuencia de los intervalos anteriores. La frecuencia acumulada del ltimo intervalo, corresponde al nmero
total de datos. Esta indica la cantidad de datos que se llevan cuantificados, segn la clase utilizada.

fa f1 f 2 ... f n
fa 0 4 4 fa1
fa 4 5 9 fa 2
FRECUENCIA ACUMULADA RELATIVA (far)
La frecuencia acumulada relativa se obtiene sumando sucesivamente las frecuencias relativas.

1
2
3
4
5
6
7

Limites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total

0.94
0.94
0.94
0.94
0.94
0.94
0.94

4
5
7
25
17
12
3
73

L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385

fr

4.275
5.215
6.155
7.095
8.035
8.975
9.915

0.0548
0.0685
0.0959
0.3425
0.2329
0.1644
0.0411
1.0001

fa

far

MEDIDAS DESCRIPTIVAS PARA DATOS AGRUPADOS


n

1.- La media:

x i fi
i 1

donde: xi = la marca de clase


f =frecuencia
n = nmero de datos

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

14

PROBABILIDAD Y ESTADISTICA

4.275 * 4 5.215 * 5 6.155 * 7 ... 9.915 * 3 7.3654 7.37


73

G xi

fr

2.- La media geomtrica:

G 4.2750.0548 * 5.2150.0685 * ... * 9.9150.0411 7.2317 7.23

3.- La media armnica:

4.- La mediana:

n
fi

73
4
5
3

...
4.275 5.215
9.915

n
fa a
Md L.R.I . 2
f

7.08

*c

El intervalo que contiene la mediana ser aquel que contenga la mitad de los datos (fa).
L.R.I.= limite real inferior que contienen a la mediana
faa = frecuencia acumulada anterior a la que contiene a la mediana
fi = frecuencia del intervalo que contiene a la mediana
c = tamao del intervalo

73 / 2 36.5 , para este caso el intervalo que contiene a la media es el nmero 4.


73

16
* 0.94 7.3958 7.40
Md 6.625 2
25

5.- Moda:

1
c
Mo LRI
1 2

Dnde: LRI es de la clase modal (es la de mayor frecuencia)


1 = la diferencia entre la frecuencia del intervalo que contiene a la moda y la frecuencia del intervalo
anterior
2 = la diferencia entre la frecuencia del intervalo que contiene a la moda y la frecuencia del intervalo
siguiente
c = tamao del intervalo
El intervalo que contienen a la moda es el que tiene la mayor frecuencia. Para este caso es el mismo
intervalo que contena a la mediana (4)
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz
15

PROBABILIDAD Y ESTADISTICA

25 7
* 0.94 7.2757 7.28
X 6.625
25 7 25 17

MEDIDAS DE UBICACIN
a
Qk LRI c
f
Donde LRI: Es el lmite real inferior de la clase en donde se localiza la medida de ubicacin.
a: la diferencia del cuartil calculado y la frecuencia acumulada del intervalo anterior de la clase
calculada
f: Es la frecuencia de los datos donde se localiza la medida de ubicacin.
c: Es el ancho de clase.
Para Q1:

Q1

nm 73(1)

18.25
4
4

2.25
Q1 6.625
0.94 6.7096 6.71
25
Para Q2 = 7.40
Para Q3:

Q3

nm 733

54.75
4
4

Para D3:

)(

nm 733

21.90
10
10
5.9
D3 6.625
0.94 6.8468 6.85
25

D3

MEDIDAS DE DISPERSIN
1.- Rango:
R = marca de clase superior marca de clase inferior
R = xs xi
R = 9.915 4.275 = 5.64
2.- Rango intercuartilar: Se obtiene de la misma forma que para los datos no agrupados.
RI = Q3 - Q1
RI = 8.42 6.71 = 1.71

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

16

PROBABILIDAD Y ESTADISTICA

s2

3.- Varianza:

4.- Desviacin Estndar:

x2

x2

S S2

Al igual que los datos no agrupados, esta es la ltima medicin que se realiza en este proceso de medicin.

Despus de realizar las medidas correspondientes a nuestros datos, la forma ms fcil de visualizar estas
mediciones es por medio de grficos. Se sugiere solo representar a los datos agrupados.

REPRESENTACIN GRFICA DE LOS DATOS AGRUPADOS


En el estudio de la Estadstica Descriptiva es fundamental el uso de representaciones grficas de datos
para una mejor visualizacin y comprensin de la informacin.
Existen varios tipos de representaciones grficas de las cuales son:
1.- Grfica circular
2.- Diagrama de barras
3.- Histograma
4.- Polgono de frecuencias
5.- Ojiva
6.- Grficos de lneas
7.- Pictogramas
Slo estudiaremos el histograma, polgono de frecuencias y la ojiva

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

17

PROBABILIDAD Y ESTADISTICA

1.- HISTOGRAMA: Es la representacin grfica ms usada para fines estadsticos. Para su construccin se
parte del diagrama de barras verticales donde la base de cada barra representa los limites reales de
clase y la altura, la frecuencia absoluta o relativa.
Para que haya continuidad en el histograma se usan los lmites reales de los intervalos con objeto
que cuando se estn trazando las barras entre un intervalo y otro no exista separacin alguna.

f
12

10
8

6
4

L.R.C.

2.- POLGONO DE FRECUENCIAS: Se toma la altura de cada intervalo (ordenada de cada marca de clase)
y luego se une con segmentos de recta cada punto medio para obtener el polgono de frecuencias.

f
12

10
8

6
4

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

18

PROBABILIDAD Y ESTADISTICA

3.- LA OJIVA.- Para dibujar el polgono de frecuencias acumuladas u ojiva, se toma la columna de fra o fa
para indicar la altura de cada intervalo y marcar un punto sobre el eje vertical para al final unir los
puntos, en el horizontal se identifica con los lmites reales superiores de cada intervalo. Toda ojiva inicia
con una frecuencia relativa igual a cero asociada al lmite real inferior del primer intervalo; y siempre es
abierta.

fa
50
45
40
35
30
25
20
15
10
5

L.R.C.

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

19

PROBABILIDAD Y ESTADISTICA

RELACIN EMPRICA ENTRE MEDIA, MEDIANA Y MODA


Las grficas 1 y 2 muestran las posiciones relativas de la media, la mediana y la moda para curvas
de frecuencias asimtricas a derecha e izquierda, respectivamente. Para curvas simtricas, los tres valores
coinciden.

Moda
Mediana
Media

Media
Mediana
Moda
Grfica 1

Grfica 2
TIPOS DE CURVAS DE FRECUENCIAS

Las curvas que aparecen, en la prctica adoptan ciertas formas caractersticas, como ilustran las
siguientes grficas.

Simtrica o en forma de
la Campana

Asimtrica (sesgada) a la
derecha (sesgo positivo)

En forma de J

En forma de J inversa

Bimodal

Asimtrica (sesgada) a
izquierda (sesgo negativo)

En forma de U

Multimodal

1. Las curvas de frecuencias simtricas o en forma de campana, se caracterizan porque las


observaciones equidistantes del mximo central tienen la misma frecuencia. Ejemplo importante es la
curva normal.
2. En las curvas de frecuencia poco asimtricas o sesgadas, la cola de la curva a un lado del mximo
central es ms larga que al otro lado. Si la cola mayor est a la derecha, la curva se dice asimtrica a
la derecha o de asimetra positiva. En caso contrario, se dice asimtrica a la izquierda o de asimetra
negativa
3. En una curva en forma de J o J invertida, hay un mximo en un extremo.
4. Una curva de frecuencia en forma de U tiene mximos en ambos extremos.
5. Una curva de frecuencia bimodal tiene dos mximos.
6. Una curva de frecuencia multimodal tiene ms de dos mximos.
La asimetra puede ser positiva o derecha (la media es mayor que la mediana); negativa o izquierda (la
media es menor que la mediana), o nula (la media es igual a la mediana, es decir la figura es simtrica).
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

20

PROBABILIDAD Y ESTADISTICA

La asimetra puede cuantificarse mediante el coeficiente de Pearson (Karl Pearson, matemtico ingls,
1857-1936).
Pearson 1 cuando no hay moda

Pearson 2 cuando hay moda

Dnde: C.P. Coeficiente de Pearson


es la media
es la mediana
es la moda
S es la desviacin estndar

Cuando el resultado es negativo indica que la media es menor que la mediana, es decir, est a la
izquierda de la mediana.
MOMENTOS Y CURTOSIS
La deformacin respecto al eje horizontal de una distribucin de frecuencias se conoce como curtosis o
aplastamiento. Una medida cualitativa de la forma de las distribuciones de frecuencias las clasifica en:
Leptocrticas: Sus datos se concentran en un reducido intervalo de valores.
Mesocrticas: Estas presentan una concentracin de valores alrededor de la media, y una reduccin de
stos hacia los extremos. A stas se le conoce tambin como distribuciones normales o
campanas de Gauss.
Platicrticas: En ellas los datos se distribuyen de manera relativamente uniforme en todo el rango de
valores.

Leptocrtica

Mesocrtica

Platicrtica

El coeficiente de curtosis puede calcularse por medio de los momentos de la distribucin de frecuencias.
El primer momento es igual a cero (siempre), y que el segundo momento es siempre igual a la varianza de la
distribucin.
Los momentos se calculan utilizando la siguiente frmula:
n

xi x

i 1

Dnde:

es el momento
n es el nmero de momento
N es el nmero total de valores
Xi es cada valor

El coeficiente de crtosis se obtiene:

2 2

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

Donde: k es el coeficiente de curtosis


4 es el momento 4
2 es el momento 2

21

PROBABILIDAD Y ESTADISTICA

INTERPRETACIN Y COMPRENSIN DE LA MEDIA Y DESVIACIN ESTNDAR


La desviacin estndar mide la variacin entre los valores. Los valores cercanos producirn una
desviacin estndar pequea, mientras que los valores muy dispersados producirn una desviacin estndar
ms grande. Se considerarn tres formas diferentes para lograr una apreciacin de los valores de las
desviaciones estndar.
1.- REGLA PRCTICA DEL INTERVALO: Se basa en el principio de que para muchos conjuntos de
datos, la vasta mayora (tanto como el 95 %) de los valores muestrales se ubican dentro de dos desviaciones
estndar de la media.
Para obtener un estimado burdo de la desviacin estndar: s

rango
4

Para interpretar un valor conocido de la desviacin estndar: si se conoce la desviacin estndar,


utilizarla para calcular estimados burdos de los valores muestrales mnimos y mximos comunes por medio
de
Valor mnimo comn = media 2 X desviacin estndar
Valor mximo comn = media + 2 X desviacin estndar

Ejemplo. Resultados anteriores del National Health Survey sugieren que las circunferencias de las
cabezas de nias de dos meses de edad tienen una media de 40.05 cm y una desviacin estndar de 1.64
cm. Utilizar la regla prctica del intervalo para calcular el mnimo y el mximo comunes de las
circunferencias de las cabezas. (Estos resultados seran prcticos para un mdico al que le interese
identificar circunferencias infrecuentes, que seran el resultado de un trastorno como la hidrocefalia).
Despus, determinar si una circunferencia de 42.6 cm sera considerada infrecuente.
mnimo = media 2 (desviaciones estndar)
mximo = media + 2 (desviaciones estndar)
= 40.05 2 (1.64)
= 40.05 + 2 (1.64)
= 36.77 cm
= 43.33 cm
con base en estos resultados, esperamos que, generalmente, las nias de dos meses de edad
tengan una cabeza cuya circunferencia mida entre 36.77 cm y 43.33 cm. Como 42.6 cm est dentro de estos
lmites, se considerara una nia normal.
2.- REGLA EMPRICA PARA DATOS CON DISTRIBUCIN NORMAL (68-95-97.7): Esta regla
establece que las siguientes propiedades se aplican a conjuntos de datos que tienen una distribucin
aproximadamente normal.
Aproximadamente el 68 % de todos los valores estn dentro de una desviacin estndar de
la media.
Aproximadamente el 95 % de todos los valores estn dentro de dos desviaciones estndar
de la media.
Aproximadamente el 99.7 % de todos los valores estn dentro de tres desviaciones estndar
de la media.
El 99.7 % dentro de 3 s
El 95 % dentro de 2 s
El 68 % dentro de s

34 %

34 %

13.5 %

13.5 %
0.1 %

2.4 %

- 3s

2.4 %

- 2s

-s

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

+s

+ 2s

0.1 %

+ 3s

22

PROBABILIDAD Y ESTADISTICA

Frase

Significado
Entre ( x - s) y ( x + s)
Entre ( x - 2s) y ( x + 2s)
Entre ( x - 3s) y ( x + 3s)

Dentro de una desviacin estndar de la media


Dentro de dos desviaciones estndar de la media
Dentro de tres desviaciones estndar de la media

3.- Teorema de Chebyshev (1821-1894): Para cualquier conjunto de datos y cualquier constande k
mayor que 1, el porcentaje de los datos que debe caer dentro de k desviaciones estndar de cualquier lado
de la media es de por lo menos

1
k2

Ejemplo: Si todas las latas de una libra de caf llenadas por un procesador de alimentos tienen un peso
medio de 16.00 onzas con una desviacin estndar de 0.02 onzas, qu porcentaje de las latas,
como mnimo, debe contener entre 15.80 y 16.20 onzas de caf?
Ya que k desviaciones estndar o k (0.02) equivale a: 16.20 15.80 = 0.20
Tenemos que k (0.02) = 0.02 y k = 0.20/0.02 = 10. De acuerdo con el teorema de Chebyshev,
2
se deriva que por lo menos 1 1/10 = 0.99 o 99% de las latas debe contener entre 15.8 y
16.20 onzas de caf.
El teorema de Chebyshev se aplica a cualquier tipo de datos, pero slo nos indica por lo menos qu
porcentaje debe caer entre ciertos lmites.

Q3 Q1
2
Otra forma de calcular k es por medio de: K
P90 P10

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

23

PROBABILIDAD Y ESTADISTICA

NOCIONES SOBRE TEORIA DE


CONJUNTOS
PRINCIPIOS NECESARIOS PARA PROBABILIDAD

TEORA DE CONJUNTOS
Un conjunto es cualquier coleccin de objetos bien definidos, de tal manera que se pueda decir
siempre si un objeto pertenece o no al conjunto al cual nos referimos. Los objetos que componen un conjunto
se denominan elementos.
Los conjuntos se denotan con letras maysculas y se emplean letras minsculas para denominar sus
elementos y es posible determinar o establecer un conjunto con cualquiera de las formas siguientes:
1.- ENUMERACIN (NOTACIN TABULAR O POR EXTENSIN): En este mtodo los elementos que lo
integran se colocan dentro de llaves separados por comas, por ejemplo: A = {a,e,i,o,u}
2.- DESCRIPCIN (NOTACIN CONSTRUCTIVA, DE REGLA O POR COMPRENSIN): En esta forma se
enuncia una propiedad o atributo que caracterice a todos los elementos del conjunto, por ejemplo:
B = {los nmeros enteros menores que 2}
Otra forma de definir conjuntos, es aquella que consiste en el uso de una variable genrica, por
ejemplo x, es decir, un indicador de elementos y una frase o relacin matemtica que especifique con toda
precisin los elementos que se estn generando, todo ello encerrado en una llave, adems se usa el smbolo
| que se lee tal que, por ejemplo:
C = {x | x es una vocal} de donde A = {a,e,i,o,u}
D = { x | x + 7 = 10} de donde D = {3}
J = { x | x es un ro de Europa} de donde J = {Ro Rin}

CLASIFICACIN DE CONJUNTOS DE ACUERDO CON SU CARDINALIDAD


De acuerdo con el nmero de elementos que forman parte de un conjunto se tiene la siguiente
clasificacin.
1) CONJUNTO VACO: Es aquel conjunto que carece completamente de elementos, se representa por o
con las llaves vacas, por ejemplo:
Sea H el conjunto de funcionarios mexicanos honrados, H = , H ={ }
2) CONJUNTO UNITARIO: Se puede representar con cualquier letra y es todo aquel que nicamente tiene
un elemento por ejemplo:
El conjunto de satlites naturales de la Tierra.
3) CONJUNTO FINITO: Se puede representar con cualquier letra y es todo aquel en donde puede
efectuarse el conteo exacto de sus elementos.
4) CONJUNTO INFINITO: Se pueden distinguir dos situaciones:

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

24

PROBABILIDAD Y ESTADISTICA

a)

CONJUNTO INFINITO NO CONTABLE: Es un conjunto con una cardinalidad elevada pero por
dificultades generalmente de carcter fsico o tecnolgico no se puede efectuar el conteo exacto
de sus elementos, por ejemplo:
El conjunto de molculas en un vaso de agua
El conjunto de estrellas de la Va Lctea.

b) CONJUNTO INFINITO CONTABLE: Es todo aquel donde efectivamente existe un nmero infinito
de elementos, por ejemplo:
Conjunto de nmeros naturales.
5) CONJUNTO UNIVERSAL: Es el conjunto que se compone de todos los elementos que se estn
analizando, su smbolo es U, por ejemplo:
Sea el conjunto U = {los estados de la Repblica Mexicana},
seran subconjuntos entre otros, los siguientes:
A = {Tlaxcala, Aguascalientes}
B = {Durango}

RELACIN DE PERTENENCIA
Dado el conjunto A = {1, 2, 3} para expresar que 2 es un elemento del conjunto A se emplea el smbolo
el cual se lee es un elemento de o pertenece a por lo tanto se indica:
2 A.
Cuando un elemento no pertenece a un conjunto se usa el smbolo que se lee no es un elemento
de o no pertenece a por lo tanto 5 A.

CLASIFICACIN DE CONJUNTOS DE ACUERDO CON SUS RELACIONES


De acuerdo con la relacin que puede haber entre una pareja de conjuntos se clasifican en:
1) Conjuntos comparables.- Se dice que dos conjuntos son comparables si todos los elementos de un
conjunto pertenecen tambin al otro conjunto, tambin se dice que el primero es un subconjunto del
segundo o bien que el segundo es un superconjunto del primero.

2) Conjuntos no comparables.- Cuando no se cumple la condicin anteriormente establecida se dice que


los conjuntos no son comparables, existen dos situaciones diferentes:
a) Conjuntos traslapados.- Son aquellos que comparten a uno o varios elementos comunes pero
ninguno de ellos tiene totalmente a los elementos del otro.
b) Conjuntos disjuntos o ajenos.- Son aquellos que no tienen ningn elemento en comn.

Para utilizar correctamente al smbolo que relaciona conjuntos la parte abierta deber estar dirigida
hacia el superconjunto de mayor cardinalidad y la parte cerrada hacia el subconjunto o el conjunto de menor
cardinalidad.

Dados los conjuntos:


A = {a, b, c, d, e}
B = {b, d, e}

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

AB BA

25

PROBABILIDAD Y ESTADISTICA

OPERACIONES ENTRE CONJUNTOS


Las operaciones entre conjuntos cumplen con la propiedad de cerradura, es decir, dan como resultado
a otro conjunto formado por los elementos que dependern de los elementos de conjuntos originales, as
como del tipo de operacin u operaciones combinadas que se realicen. Las operaciones entre conjuntos que
son de utilidad para el clculo de probabilidades son:
1)

Unin.- Se representa mediante una letra U simple y se tiene como resultado otro conjunto
formado por todos los elementos de los dos conjuntos originales, evitando la repeticin de
elementos en aquellos casos en los que comparten uno o ms elementos, en la forma constructiva
esta operacin se define como:
A B = {x | x A o x B}
A = {a, b, c, d, g}

B = {b, c, d, e, f}

A B = {a, b, c, d, e, f, g}

A esta operacin tambin se le llama reunin de conjuntos ya que lo que se hace es reunir en otro
conjunto a los elementos de los conjuntos originales.
2)

Interseccin.- Se representa mediante una U invertida () y se obtiene como resultado a otro


conjunto formado por los elementos comunes de los dos conjuntos originales, en la forma
constructiva esta operacin se define como.
A B = {x | x A y x B}
A B = {b, c, d}

3) Complemento.- Se puede representar en las formas A , A*, A. Que debe leerse "a
complementado" "complemento de a", se obtiene como resultado otro conjunto formado por
elementos del conjunto universal que no se encuentren en el conjunto original:
A= {x | x A}
sean: A = {a, b, d, g}, U = {a, b, c, , j}, A= {c, e, f, h, i, j }
3)

Diferencia.- Tambin se le conoce como resta o sustraccin entre conjuntos, la diferencia de A


B, en este orden, es el conjunto de todos los elementos que pertenecen a A pero no a B. Algunos
autores expresan la diferencia como A \ B, por ejemplo:
A B = {x | x A y x B}
A = {1, 2, 3, 4, 5} B = {1, 2}
A B = {3, 4, 5,}
BA={ }

4)

Operacin producto.- El producto de A X B es el producto de todos los posibles pares ordenadas,


tales que la primera componente del par ordenado es un elemento de A y la segunda componente
es un elemento de B. La expresin A X B se lee A cruz B y se expresa:
A X B = {(x,y) |X A y Y B}
Se lee la pareja (x, y) tal que x pertenece al conjunto A y al conjunto B
A = {a, e}

B = {1, 2, 3}

A X B = {(a, 1), (a, 2), (a, 3), (e, 1), (e, 2), (e, 3)}
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

26

PROBABILIDAD Y ESTADISTICA

6) Diagrama de rbol.- Si en un problema en que sea necesario obtener el producto de tres o ms


conjuntos y el desarrollo resulta complicado, para actuar con cierta seguridad se utiliza lo que se
conoce como diagrama de rbol.

Si uno de los conjuntos A, B o C es un conjunto vaco, el resultado de A X B X C es un conjunto vaco.

Sean los conjuntos:


A = {a, b, c}
B = {2, 4}
C = {3, 4, 5}

3
4
5

(a, 2, 3)
(a, 2, 4)
(a, 2, 5)

3
4
5

(a, 4, 3)
(a, 4, 4)
(a, 4, 5)

3
4
5

(b, 2, 3)
(b, 2, 4)
(b, 2, 5)

3
4
5

(b, 4, 3)
(b, 4, 4)
(b, 4, 5)

3
4
5

(c, 2, 3)
(c, 2, 4)
(c, 2, 5)

3
4
5

(c, 4, 3)
(c, 4, 4)
(c, 4, 5)

Obtener el conjunto producto


A X B X C, con el diagrama
de rbol

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

27

PROBABILIDAD Y ESTADISTICA

LEYES DEL LGEBRA DE CONJUNTOS


1.- Leyes de idempotencia
1a.

AA=A

1b.

AA=A

2.- Leyes asociativas


2a.

(A B) C = A (B C)

2b. (A B) C = A (B C)

3.- Leyes conmutativas


3a. A B = B A

3b. A B = B A

4.- Leyes distributivas


4a. A (B C) = (A B) (A C)

4b. A (B C) = (A B) (A C)

5.- Leyes de identidad


5a.

A=A

5b. A U = A

6a.

AU=U

6b.

A=

7b.

A A =

6.- Leyes de complemento


7a. A A = U
C

8a.

8b. U = , = U

C C

(A ) = A

7.- Leyes de De Morgan


9a. (A B) = A B
C

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

9b.

(AB) = A B
C

28

PROBABILIDAD Y ESTADISTICA

DIAGRAMA DE VENN EULER


Los diagramas de Venn son representaciones grficas de los conjuntos que nos permiten visualizarlos.
Ejemplo: En las operaciones siguientes el rea sombreada es el resultado de cada una, excepto en el
ltimo, porque el resultado es el conjunto vaco

1.

U
A

2.

U
A

AB

4.

U
A

6.

U
A

8.

U
A

APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz

9.

U
A

(A B)

(A B)

7.

AB

5.

AB

U
A

3.

A B

AB

29

Вам также может понравиться