Академический Документы
Профессиональный Документы
Культура Документы
ESTADISTICA DESCRIPTIVA
ORIGEN HISTRICO
La estadstica, tuvo sus inicios en los grandes imperios de la antigedad, los primeros antecedentes
que se conocen para llevar un registro de sus pertenencias son las tablillas de arcilla utilizadas por los
babilonios 5000 a.c. Ms tarde las culturas posteriores a los babilonios realizaban registros de bienes,
soldados, esclavos, etc. Y ms tarde la implementacin de censos de poblacin.
A mediados del siglo XVII la estadstica tuvo un gran desarrollo cuantitativo, ya que en esa poca, los
imperios del viejo continente tenan la necesidad de llevar un buen control administrativo de sus actividades
comerciales y blicas, entre otras, donde sus registros y operaciones consistan en nmeros.
Posteriormente se inicia el estudio de la probabilidad, que junto con la estadstica permite estudiar
problemas donde intervienen fenmenos aleatorios que no se pueden predecir.
En la actualidad la estadstica junto con el clculo de probabilidades tienen una gran aplicacin en
todas las actividades que realiza el hombre, tales como: predicciones, censos, control de calidad, etc.
No es posible ubicar exactamente en la historia la aparicin de la estadstica, sin embargo, se supone
que su desarrollo estuvo ligado con el surgimiento de los diferentes sistemas de numeracin y escritura
creados por las civilizaciones antiguas en diferentes pocas y lugares, todo esto permita el registro y
comunicacin de los datos relacionados con diferentes actividades y se hicieron ms complejos en el
transcurso del tiempo.
Actividad 1
Desarrolla la siguiente actividad y reprtala a tu profesora, en hojas tamao carta, engrapada, con
nombre completo y grupo.
Ahora vamos a conocer ms sobre estadstica y como se emplea en el mbito acadmico, social y global.
CONCEPTO DE ESTADSTICA
Estadstica es un conjunto de tcnicas para la coleccin, manejo, descripcin y anlisis de informacin,
de manera que las conclusiones obtenidas de ella tengan un grado de confiabilidad especificado.
CLASIFICACIN DE LA ESTADSTICA
La estadstica para su estudio se divide en dos grandes ramas:
Estadstica descriptiva: Es la parte encargada de la recoleccin, clasificacin, ordenamiento, presentacin y
descripcin de un conjunto de datos (como la edad de una poblacin, altura de los
estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de
describir apropiadamente las diversas caractersticas de ese conjunto.
Estadstica inferencial: Tambin se le conoce como Estadstica Inductiva, y es la parte que se encarga de
estudiar y analizar las medidas descriptivas y en base a esto, sacar conclusiones y
tomar de decisiones con el mayor grado de confiabilidad.
PROBABILIDAD Y ESTADISTICA
TABULAR. Mediante una tabla, en la cual se encuentran los datos organizados y clasificados del objeto que
se estudia.
MEDIDAS ESTADSTICAS. Mediante nmeros, de los cuales se obtienen al aplicar un mtodo o
procedimiento a un conjunto de datos.
GRAFICAS. Mediante un diagrama, en el cual se presentan de una manera objetiva los datos organizados en
una figura ilustrativa.
2.- Fenmenos aleatorios: Son aquellos que no obedecen a ninguna ley y generalmente pueden tener 2
ms resultados diferentes, mediante su observacin repetida y el estudio de sus datos se pueden llegar a
obtener predicciones y tomar decisiones con el ms alto grado de confiabilidad, por ejemplo, los juegos de
azar, los terremotos, huracanes, la economa, etc.
POBLACIN Y MUESTRA
Para la recoleccin de datos se ha ideado y desarrollado diferentes mtodos que tienen como
principal objetivo hacer que la muestra sea representativa de la poblacin, ya que de esta manera, las
conclusiones que se obtengan del estudio de la muestra se podrn hacer extensivas a toda la poblacin.
Muestra: Es una parte de una poblacin, es fundamental que una muestra sea representativa de la
poblacin de la cual procede, ya que de esta manera los resultados y las conclusiones que se
obtengan al estudiar la muestra se podrn hacer extensivas a toda la poblacin.
PROBABILIDAD Y ESTADISTICA
Las variables cuantitativas. Son aquellas que se representan a travs de un valor numrico, que en
una recopilacin de datos se obtiene mediante conteo o medicin de las caractersticas en estudio. Se
clasifican en discretas y continuas.
Las variables discretas. Son las que estn asociadas a un proceso de conteo, es decir que solo
pueden tomar algn valor de una escala de medicin, por ejemplo en un saln de clases puede haber 32
33 alumnos, pero nunca 32.4 alumnos.
Las variables continuas. Estn asociadas a un proceso de medicin y pueden adquirir cualquier valor
en una escala de medicin, estos es, que si tienen dos valores dados, siempre puede existir otro valor
intermedio, por ejemplo un hombre puede medir 1.71m, otro 1.72m y un tercero un valor comprendido entre
estos, tal como 1.714m.
PROBABILIDAD Y ESTADISTICA
FUENTES DE INFORMACIN.
La estadstica puede obtener informacin a travs de los siguientes medios:
1.- La entrevista: Consiste en un encuentro concertado entre dos o ms personas para obtener o
intercambiar datos sobre temas concretos.
2.- La encuesta: Consiste en un cuestionario elaborado previamente para la obtencin de datos sobre temas
especficos.
3.- El censo: Consiste en un padrn de personas, bienes y actividades que la mayora de los gobiernos
realizan en forma peridica.
4.- Publicaciones especializadas: Es posible obtener informacin a travs de las memorias o almanaques
que se publican peridicamente por parte de algunas empresas sobre las actividades que se realizaron.
5.- Datos experimentales: Proceden de los laboratorios de investigacin de empresas o instituciones
educativas, generalmente se tratan de reas especificas de tiempo.
6.- Medios de comunicacin masiva: Es poco frecuente pero se podra en algunos casos obtener
informacin de inters de la tv, radio, peridicos y revistas.
7.- Observacin. Consiste en recopilar informacin mediante la simple observacin.
8.- Investigacin. Consiste en recopilar informacin que ya se tiene concentrada o escrita, la cual se puede
obtener en bibliotecas, hemerotecas, mapotecas, videotecas, internet, etc.
Actividad 2
Desarrolla la siguiente actividad y reprtala a tu profesora, en hojas tamao carta, engrapada, con
nombre completo y grupo.
La estadstica descriptiva tiene como objetivo resumir o describir las caractersticas importantes de
un conjunto de datos.
Para ello es necesario conocer que la estadstica tiene dos ramas de datos; datos no agrupados y datos
agrupados. Y empezaremos con los ms sencillos de trabajar, los datos no agrupados.
DATOS NO AGRUPADOS
No existen reglas de carcter general para decidir cundo se debe agrupar a un conjunto de datos o
cundo es preferible mantenerlos en su forma individual, la mayora de los autores y de los investigadores
sugieren que hasta aproximadamente 25 30 se deben obtener en forma individual, de esta manera se
conservar el mayor detalle de un grupo poco numeroso de datos.
Actividad 3
Desarrolla la siguiente actividad y reprtala a tu profesor(a), en hojas tamao carta, engrapada, con
nombre completo y grupo.
PROBABILIDAD Y ESTADISTICA
Ejemplo1:
Los siguientes datos representan el conteo del nmero de cromosomas encontrados en el ncleo celular de
18 tomas de tejido de la herbcea Claytonica Virgnica sometida a radioactividad para un estudio de
ingeniera gentica, de los cuales necesitamos describir caractersticas importantes por medio de la
estadstica descriptiva.
24,29,28,29,28,31,38,32,28,28,30,28,30,32,30,30,32,31.
Ordenamiento: Es la primera manipulacin a la que deber ser sometido un conjunto de datos, como su
nombre lo indica, consiste en ordenarlos preferentemente de manera creciente.
Ordenndolos: __________________________________________________________________________
Para poder describir estos datos necesitamos medirlos, para ello hacemos uso de ciertas medidas que a
continuacin veremos.
MEDIDAS ESTADSTICAS
Existen tres mediciones que se estudian en la estadstica descriptiva:
Estas medidas se utilizaran tanto para datos no agrupados como datos agrupados
x
i 1
Poblacin
Muestra
PROBABILIDAD Y ESTADISTICA
REGLA DE REDONDEO
Una regla sencilla para redondear respuestas es la siguiente:
Aumente una posicin decimal ms a las que estn presentes en el conjunto original de datos.
De tal manera que el resultado por la regla de redondeo ser:
2.- Mediana ( X ) Md: Se define como el valor del dato que divide a la informacin en dos partes iguales,
para los datos no agrupados se tienen dos criterios:
a) Si se tiene un nmero impar de datos, entonces existir un dato que quede en la parte central de
todo el ordenamiento y el valor de la mediana ser igual con el valor del dato central.
b) Cuando se tiene un nmero par de datos, en la parte central del ordenamiento quedar una pareja
de datos y en ese caso el valor de la mediana ser igual al promedio de valores de los datos
centrales:
24,28,28,28,28,28,29,29,30,30,30,30,31,31,32,32,32,38
3.- Moda ( X ) Mo: Se define como el valor del dato que se repite el mayor nmero de veces, en algunos
casos puede no existir, entonces se dice que la muestra o poblacin no hay moda, en otros casos
puede haber varias modas, entonces se dice que la distribucin de datos es bimodal, trimodal,
multimodal.
Nota: Algunos autores dicen que cuando existen 4 ms modas esta medida se declara inexistente.
4.- Media geomtrica (G): En algunos casos esta medida tiene ventajas sobre la media aritmtica ya que no
es tan sensible con datos con variables extremos, sin embargo, esto slo ocurre cuando se obtiene un
gran nmero de datos, se utiliza bsicamente para promediar razones, tasas de cambio y valores que
muestran una progresin geomtrica., se obtiene:
Poblacin
Gn
i 1
xi
Muestra
G n 1
i 1
xi
PROBABILIDAD Y ESTADISTICA
Del ejemplo 1:
5.- Media armnica (H): Esta medida se utiliza preferentemente cuando se trabaja con cantidades que
varan en el tiempo, por ejemplo: velocidades, frecuencias, aceleraciones, etc. Se calcula usando todos
los elementos en un conjunto de valores, se utiliza bsicamente para ciertas tasas que pueden ser
expresadas recprocamente. Sin embargo, es til en casos especiales para promediar razones. Se
obtiene mediante:
Poblacin
n
n
i 1
Muestra
1
xi
n 1
1
x
i 1
i
n
Del ejemplo 1:
Q1
n
4
DECILES
D1
n
10
PERCENTILES
P1
n
100
Q2 mediana
D2
2n
10
P34
34n
100
Q3
3n
4
D5 mediana
P50 mediana
D9 etc.
P93 etc.
PROBABILIDAD Y ESTADISTICA
Ejercicio. Obtener los cuartiles para los datos del ejemplo 1. n = 18,
Q1
Para Q1:
Para Q2:
Para Q3 : Q3
n
18
31
MEDIDAS DE DISPERSIN
Las medidas de dispersin, as como las de tendencia central, pueden calcularse tanto para un
conjunto de datos individuales como para una tabla de distribucin de frecuencias. Las medidas de
dispersin permiten cuantificar con diferentes criterios el grado de disgregacin que tienen los datos de una
poblacin o muestra.
Las ms utilizadas son el rango, la desviacin cuartil, la desviacin media, la varianza y la desviacin
estndar.
1.- El rango (R): Es la diferencia entre los valores extremos, el mayor y el menor, en l estn distribuidos
todos los dems valores, por eso tambin se le llama recorrido o longitud. Se usa poco debido a que es
muy influenciable por la presencia de valores extremos de poca frecuencia; se piensa que cuanto mayor
es el rango mayor es la dispersin de los datos, lo cual conduce a apreciaciones falsas.
R X n X1
R = __________________
2.- Rango intercuartil (RI): Tambin se le conoce como desviacin cuartlica, es el resultado de la diferencia
entre el tercer cuartil Q3 y el primero Q1, geomtricamente tambin representa la longitud de un intervalo
de nmeros reales en donde en la mayora de los casos estn distribuidos los datos ms significativos o
de mayor peso. Cuando se quiere eliminar los datos ms extremos se utiliza el rango intercuartil, es aqu
donde se deben encontrar los datos ms significativos por la poda que se hace.
Rango Intercuartil = RI = Q3 - Q1
RI = __________________
3.-El rango semintercuartil (QD) o desviacin cuartil, es la mitad del rango intercuartil y mide la dispersin
con mayor precisin que el rango, sin embargo, presenta las limitaciones siguientes:
a) No toma en consideracin todos los valores de la distribucin de frecuencias y puede suceder que los
valores menores a Q1 o superiores a Q3 estn muy compactos o muy dispersos, y el valor de Q sera
el mismo.
b) No es posible, conociendo nicamente Q, hacer la ubicacin precisa de una observacin dentro de la
distribucin de frecuencias.
c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones matemticas que
usa la estadstica.
Q Q1
QD 3
2
2
4.- Varianza (s ): Es la media aritmtica de los cuadrados de desviaciones respecto a la media aritmtica. La
varianza sirve de base para calcular la desviacin estndar, desviacin tpica o desviacin cuadrtica
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz
PROBABILIDAD Y ESTADISTICA
media que es la ms importante de todas las medidas de dispersin, en muchos casos las unidades de
la varianza carecen por completo de sentido fsico.
n
Poblacin
S2
( xi x ) 2
i 1
S2
X
i 1
2
i
X2
Muestra
S2
( xi x ) 2
i 1
n 1
5.- Desviacin estndar (s): Se calcula como la raz cuadrada de la varianza, e indica qu tan diferentes
son entre s los datos que se analizan.
S S2
Con esta ltima medicin termnanos de medir nuestros datos no agrupados, recordando que la primera
medicin y la ltima son las ms importantes de en procesos estadstico.
GRAFICAS
Ahora el ltimo paso graficar, para este tipo de datos solo ser necesario realizar la clsica grafica de
pastel.
Para esto necesitamos una pequea tabla donde estarn nuestros datos, sus frecuencias y su
porcentaje de acuerdo al total de datos.
La pregunta clave Qu es la frecuencia? Bueno, La frecuencia es la cantidad de presencias que tienen
el dato; o sea, el datos 28 se presenta cinco veces.
Dato
24
28
29
30
31
32
38
total
f
1
5
2
4
2
3
1
18
%
5.6%
27.8%
11.1%
22.2%
11.1%
16.7%
5.6%
100%
PROBABILIDAD Y ESTADISTICA
Ahora conoceremos la otra rama DATOS AGRUPADOS, para ello necesitamos agruparlos antes de
medirlos, por lo cual usaremos algunos mtodos tabulares.
Consideramos grande un grupo que contiene ms de 30 datos. Las definiciones bsicas de grupos
grandes son exactamente iguales a las de grupos pequeos; no obstante, debido al mayor nmero de datos,
ser preciso modificar nuestros mtodos, si queremos conservar cierta comodidad en el trabajo.
EJEMPLO
Se utilizar una muestra de tamao 73, tomada del siguiente estudio de rendimientos obtenidos en
laboratorio relativo a las plantas de maz atacadas por el barrenado europeo.
10
PROBABILIDAD Y ESTADISTICA
6.81
6.90
8.82
7.90
7.17
6.91
6.86
8.14
7.49
8.64
5.88
10.27
8.06
7.82
7.74
7.78
4.56
5.47
7.62
6.65
6.66
6.76
6.67
7.16
6.07
5.67
7.25
8.26
7.75
7.12
8.61
6.48
9.00
6.26
6.67
7.36
4.00
3.86
8.72
5.60
6.43
6.25
8.52
7.10
6.78
9.16
7.64
7.71
7.63
7.23
6.72
9.02
5.85
8.82
7.52
6.73
7.63
8.96
8.65
8.51
10.08
6.68
7.60
6.95
5.64
Lo primero que se debe hacer es poner los datos en orden, del menor al mayor, por lo que se tiene:
3.81
3.86
4.00
4.56
5.26
5.47
5.60
5.64
5.67
5.85
5.88
6.07
6.25
6.26
6.43
6.48
6.65
6.65
6.66
6.67
6.67
6.68
6.72
6.73
6.76
6.78
6.81
6.86
6.90
6.91
6.95
7.10
7.12
7.16
7.17
7.23
7.25
7.36
7.44
7.49
7.52
7.60
7.62
7.63
7.63
7.64
7.64
7.71
7.74
7.75
7.78
7.82
7.90
7.98
8.06
8.14
8.26
8.26
8.51
8.52
8.61
8.64
8.65
8.72
8.82
8.82
8.96
9.00
9.02
9.16
10.08
10.27
10.34
Clasificacin de los datos: Cuando se trata de grandes cantidades de datos, hay que clasificar la
informacin en categoras o clases que nos permitan representar grficamente la situacin, as como
ayudarnos a calcular los dems datos estadsticos descriptivos.
Formacin de una tabla de frecuencias. Una forma de presentacin que ser muy til para nuestros
propsitos es el que resulta de organizar los datos en Tablas de Frecuencias o Tablas de Distribucin de
Frecuencias. En este tipo de tablas se divide la amplitud de los valores numricos de los datos en un cierto
nmero de intervalos o clases, y se cuenta cuantas observaciones pertenecen a cada una de ellas.
El nmero de observaciones que pertenecen a una clase o intervalo se denomina frecuencia o
frecuencia absoluta (f).
El agrupamiento se hace por clases o intervalos de clase que son intervalos de valores reales dentro
de los cuales se encuentran comprendidos los valores de algunos de los datos.
A la anchura o tamao de clase se le denomina Intervalo de Clase.
11
PROBABILIDAD Y ESTADISTICA
T .I c
Lmites de clase
LI
- LS
1
2
3
4
5
6
7
total
Nota:
1. De un solo vistazo, se puede verificar, gracias a las pautas numricas, que las clases son correctas.
2. La anchura de clase es la distancia del lmite inferior de una clase al lmite inferior de la clase
siguiente (no del inferior al superior de la misma clase)
12
PROBABILIDAD Y ESTADISTICA
1
2
3
4
5
6
7
Lmites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total
L.R.C.
L.R.I. L.R.S.
0.94
0.94
0.94
0.94
0.94
0.94
0.94
4
5
7
25
17
12
3
73
X
X
1
2
3
4
5
6
7
Lmites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total
L.I . L.S .
2
3.81 4.74
4.275
2
c
0.94
0.94
0.94
0.94
0.94
0.94
0.94
4
5
7
25
17
12
3
73
L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385
FRECUENCIA RELATIVA ( fr )
El nmero que resulta de dividir la frecuencia absoluta de cada clase entre el nmero total de las
observaciones se denomina frecuencia relativa de clase. Esta indica que proporcin de observaciones del
total pertenecen a cada clase.
Se obtiene dividiendo la frecuencia absoluta del intervalo entre el nmero total de datos. La suma de
todas las frecuencias relativas de un conjunto de datos es igual a uno.
fr
f
No.totaldedatos
fr1
4
0.0548
73
13
PROBABILIDAD Y ESTADISTICA
1
2
3
4
5
6
7
Limites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total
0.94
0.94
0.94
0.94
0.94
0.94
0.94
4
5
7
25
17
12
3
73
L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385
fr
4.275
5.215
6.155
7.095
8.035
8.975
9.915
fa f1 f 2 ... f n
fa 0 4 4 fa1
fa 4 5 9 fa 2
FRECUENCIA ACUMULADA RELATIVA (far)
La frecuencia acumulada relativa se obtiene sumando sucesivamente las frecuencias relativas.
1
2
3
4
5
6
7
Limites de clase
LI
- LS
3.81 - 4.74
4.75 5.68
5.69 6.62
6.63 7.56
7.57 8.50
8.51 9.44
9.45 10.38
total
0.94
0.94
0.94
0.94
0.94
0.94
0.94
4
5
7
25
17
12
3
73
L.R.C.
L.R.I. L.R.S.
3.805 - 4.745
4.745 - 5.685
5.685 - 6.625
6.625 - 7.565
7.565 - 8.505
8.505 - 9.445
9.445 - 10.385
fr
4.275
5.215
6.155
7.095
8.035
8.975
9.915
0.0548
0.0685
0.0959
0.3425
0.2329
0.1644
0.0411
1.0001
fa
far
1.- La media:
x i fi
i 1
14
PROBABILIDAD Y ESTADISTICA
G xi
fr
4.- La mediana:
n
fi
73
4
5
3
...
4.275 5.215
9.915
n
fa a
Md L.R.I . 2
f
7.08
*c
El intervalo que contiene la mediana ser aquel que contenga la mitad de los datos (fa).
L.R.I.= limite real inferior que contienen a la mediana
faa = frecuencia acumulada anterior a la que contiene a la mediana
fi = frecuencia del intervalo que contiene a la mediana
c = tamao del intervalo
16
* 0.94 7.3958 7.40
Md 6.625 2
25
5.- Moda:
1
c
Mo LRI
1 2
PROBABILIDAD Y ESTADISTICA
25 7
* 0.94 7.2757 7.28
X 6.625
25 7 25 17
MEDIDAS DE UBICACIN
a
Qk LRI c
f
Donde LRI: Es el lmite real inferior de la clase en donde se localiza la medida de ubicacin.
a: la diferencia del cuartil calculado y la frecuencia acumulada del intervalo anterior de la clase
calculada
f: Es la frecuencia de los datos donde se localiza la medida de ubicacin.
c: Es el ancho de clase.
Para Q1:
Q1
nm 73(1)
18.25
4
4
2.25
Q1 6.625
0.94 6.7096 6.71
25
Para Q2 = 7.40
Para Q3:
Q3
nm 733
54.75
4
4
Para D3:
)(
nm 733
21.90
10
10
5.9
D3 6.625
0.94 6.8468 6.85
25
D3
MEDIDAS DE DISPERSIN
1.- Rango:
R = marca de clase superior marca de clase inferior
R = xs xi
R = 9.915 4.275 = 5.64
2.- Rango intercuartilar: Se obtiene de la misma forma que para los datos no agrupados.
RI = Q3 - Q1
RI = 8.42 6.71 = 1.71
16
PROBABILIDAD Y ESTADISTICA
s2
3.- Varianza:
x2
x2
S S2
Al igual que los datos no agrupados, esta es la ltima medicin que se realiza en este proceso de medicin.
Despus de realizar las medidas correspondientes a nuestros datos, la forma ms fcil de visualizar estas
mediciones es por medio de grficos. Se sugiere solo representar a los datos agrupados.
17
PROBABILIDAD Y ESTADISTICA
1.- HISTOGRAMA: Es la representacin grfica ms usada para fines estadsticos. Para su construccin se
parte del diagrama de barras verticales donde la base de cada barra representa los limites reales de
clase y la altura, la frecuencia absoluta o relativa.
Para que haya continuidad en el histograma se usan los lmites reales de los intervalos con objeto
que cuando se estn trazando las barras entre un intervalo y otro no exista separacin alguna.
f
12
10
8
6
4
L.R.C.
2.- POLGONO DE FRECUENCIAS: Se toma la altura de cada intervalo (ordenada de cada marca de clase)
y luego se une con segmentos de recta cada punto medio para obtener el polgono de frecuencias.
f
12
10
8
6
4
18
PROBABILIDAD Y ESTADISTICA
3.- LA OJIVA.- Para dibujar el polgono de frecuencias acumuladas u ojiva, se toma la columna de fra o fa
para indicar la altura de cada intervalo y marcar un punto sobre el eje vertical para al final unir los
puntos, en el horizontal se identifica con los lmites reales superiores de cada intervalo. Toda ojiva inicia
con una frecuencia relativa igual a cero asociada al lmite real inferior del primer intervalo; y siempre es
abierta.
fa
50
45
40
35
30
25
20
15
10
5
L.R.C.
19
PROBABILIDAD Y ESTADISTICA
Moda
Mediana
Media
Media
Mediana
Moda
Grfica 1
Grfica 2
TIPOS DE CURVAS DE FRECUENCIAS
Las curvas que aparecen, en la prctica adoptan ciertas formas caractersticas, como ilustran las
siguientes grficas.
Simtrica o en forma de
la Campana
Asimtrica (sesgada) a la
derecha (sesgo positivo)
En forma de J
En forma de J inversa
Bimodal
Asimtrica (sesgada) a
izquierda (sesgo negativo)
En forma de U
Multimodal
20
PROBABILIDAD Y ESTADISTICA
La asimetra puede cuantificarse mediante el coeficiente de Pearson (Karl Pearson, matemtico ingls,
1857-1936).
Pearson 1 cuando no hay moda
Cuando el resultado es negativo indica que la media es menor que la mediana, es decir, est a la
izquierda de la mediana.
MOMENTOS Y CURTOSIS
La deformacin respecto al eje horizontal de una distribucin de frecuencias se conoce como curtosis o
aplastamiento. Una medida cualitativa de la forma de las distribuciones de frecuencias las clasifica en:
Leptocrticas: Sus datos se concentran en un reducido intervalo de valores.
Mesocrticas: Estas presentan una concentracin de valores alrededor de la media, y una reduccin de
stos hacia los extremos. A stas se le conoce tambin como distribuciones normales o
campanas de Gauss.
Platicrticas: En ellas los datos se distribuyen de manera relativamente uniforme en todo el rango de
valores.
Leptocrtica
Mesocrtica
Platicrtica
El coeficiente de curtosis puede calcularse por medio de los momentos de la distribucin de frecuencias.
El primer momento es igual a cero (siempre), y que el segundo momento es siempre igual a la varianza de la
distribucin.
Los momentos se calculan utilizando la siguiente frmula:
n
xi x
i 1
Dnde:
es el momento
n es el nmero de momento
N es el nmero total de valores
Xi es cada valor
2 2
21
PROBABILIDAD Y ESTADISTICA
rango
4
Ejemplo. Resultados anteriores del National Health Survey sugieren que las circunferencias de las
cabezas de nias de dos meses de edad tienen una media de 40.05 cm y una desviacin estndar de 1.64
cm. Utilizar la regla prctica del intervalo para calcular el mnimo y el mximo comunes de las
circunferencias de las cabezas. (Estos resultados seran prcticos para un mdico al que le interese
identificar circunferencias infrecuentes, que seran el resultado de un trastorno como la hidrocefalia).
Despus, determinar si una circunferencia de 42.6 cm sera considerada infrecuente.
mnimo = media 2 (desviaciones estndar)
mximo = media + 2 (desviaciones estndar)
= 40.05 2 (1.64)
= 40.05 + 2 (1.64)
= 36.77 cm
= 43.33 cm
con base en estos resultados, esperamos que, generalmente, las nias de dos meses de edad
tengan una cabeza cuya circunferencia mida entre 36.77 cm y 43.33 cm. Como 42.6 cm est dentro de estos
lmites, se considerara una nia normal.
2.- REGLA EMPRICA PARA DATOS CON DISTRIBUCIN NORMAL (68-95-97.7): Esta regla
establece que las siguientes propiedades se aplican a conjuntos de datos que tienen una distribucin
aproximadamente normal.
Aproximadamente el 68 % de todos los valores estn dentro de una desviacin estndar de
la media.
Aproximadamente el 95 % de todos los valores estn dentro de dos desviaciones estndar
de la media.
Aproximadamente el 99.7 % de todos los valores estn dentro de tres desviaciones estndar
de la media.
El 99.7 % dentro de 3 s
El 95 % dentro de 2 s
El 68 % dentro de s
34 %
34 %
13.5 %
13.5 %
0.1 %
2.4 %
- 3s
2.4 %
- 2s
-s
+s
+ 2s
0.1 %
+ 3s
22
PROBABILIDAD Y ESTADISTICA
Frase
Significado
Entre ( x - s) y ( x + s)
Entre ( x - 2s) y ( x + 2s)
Entre ( x - 3s) y ( x + 3s)
3.- Teorema de Chebyshev (1821-1894): Para cualquier conjunto de datos y cualquier constande k
mayor que 1, el porcentaje de los datos que debe caer dentro de k desviaciones estndar de cualquier lado
de la media es de por lo menos
1
k2
Ejemplo: Si todas las latas de una libra de caf llenadas por un procesador de alimentos tienen un peso
medio de 16.00 onzas con una desviacin estndar de 0.02 onzas, qu porcentaje de las latas,
como mnimo, debe contener entre 15.80 y 16.20 onzas de caf?
Ya que k desviaciones estndar o k (0.02) equivale a: 16.20 15.80 = 0.20
Tenemos que k (0.02) = 0.02 y k = 0.20/0.02 = 10. De acuerdo con el teorema de Chebyshev,
2
se deriva que por lo menos 1 1/10 = 0.99 o 99% de las latas debe contener entre 15.8 y
16.20 onzas de caf.
El teorema de Chebyshev se aplica a cualquier tipo de datos, pero slo nos indica por lo menos qu
porcentaje debe caer entre ciertos lmites.
Q3 Q1
2
Otra forma de calcular k es por medio de: K
P90 P10
23
PROBABILIDAD Y ESTADISTICA
TEORA DE CONJUNTOS
Un conjunto es cualquier coleccin de objetos bien definidos, de tal manera que se pueda decir
siempre si un objeto pertenece o no al conjunto al cual nos referimos. Los objetos que componen un conjunto
se denominan elementos.
Los conjuntos se denotan con letras maysculas y se emplean letras minsculas para denominar sus
elementos y es posible determinar o establecer un conjunto con cualquiera de las formas siguientes:
1.- ENUMERACIN (NOTACIN TABULAR O POR EXTENSIN): En este mtodo los elementos que lo
integran se colocan dentro de llaves separados por comas, por ejemplo: A = {a,e,i,o,u}
2.- DESCRIPCIN (NOTACIN CONSTRUCTIVA, DE REGLA O POR COMPRENSIN): En esta forma se
enuncia una propiedad o atributo que caracterice a todos los elementos del conjunto, por ejemplo:
B = {los nmeros enteros menores que 2}
Otra forma de definir conjuntos, es aquella que consiste en el uso de una variable genrica, por
ejemplo x, es decir, un indicador de elementos y una frase o relacin matemtica que especifique con toda
precisin los elementos que se estn generando, todo ello encerrado en una llave, adems se usa el smbolo
| que se lee tal que, por ejemplo:
C = {x | x es una vocal} de donde A = {a,e,i,o,u}
D = { x | x + 7 = 10} de donde D = {3}
J = { x | x es un ro de Europa} de donde J = {Ro Rin}
24
PROBABILIDAD Y ESTADISTICA
a)
CONJUNTO INFINITO NO CONTABLE: Es un conjunto con una cardinalidad elevada pero por
dificultades generalmente de carcter fsico o tecnolgico no se puede efectuar el conteo exacto
de sus elementos, por ejemplo:
El conjunto de molculas en un vaso de agua
El conjunto de estrellas de la Va Lctea.
b) CONJUNTO INFINITO CONTABLE: Es todo aquel donde efectivamente existe un nmero infinito
de elementos, por ejemplo:
Conjunto de nmeros naturales.
5) CONJUNTO UNIVERSAL: Es el conjunto que se compone de todos los elementos que se estn
analizando, su smbolo es U, por ejemplo:
Sea el conjunto U = {los estados de la Repblica Mexicana},
seran subconjuntos entre otros, los siguientes:
A = {Tlaxcala, Aguascalientes}
B = {Durango}
RELACIN DE PERTENENCIA
Dado el conjunto A = {1, 2, 3} para expresar que 2 es un elemento del conjunto A se emplea el smbolo
el cual se lee es un elemento de o pertenece a por lo tanto se indica:
2 A.
Cuando un elemento no pertenece a un conjunto se usa el smbolo que se lee no es un elemento
de o no pertenece a por lo tanto 5 A.
Para utilizar correctamente al smbolo que relaciona conjuntos la parte abierta deber estar dirigida
hacia el superconjunto de mayor cardinalidad y la parte cerrada hacia el subconjunto o el conjunto de menor
cardinalidad.
AB BA
25
PROBABILIDAD Y ESTADISTICA
Unin.- Se representa mediante una letra U simple y se tiene como resultado otro conjunto
formado por todos los elementos de los dos conjuntos originales, evitando la repeticin de
elementos en aquellos casos en los que comparten uno o ms elementos, en la forma constructiva
esta operacin se define como:
A B = {x | x A o x B}
A = {a, b, c, d, g}
B = {b, c, d, e, f}
A B = {a, b, c, d, e, f, g}
A esta operacin tambin se le llama reunin de conjuntos ya que lo que se hace es reunir en otro
conjunto a los elementos de los conjuntos originales.
2)
3) Complemento.- Se puede representar en las formas A , A*, A. Que debe leerse "a
complementado" "complemento de a", se obtiene como resultado otro conjunto formado por
elementos del conjunto universal que no se encuentren en el conjunto original:
A= {x | x A}
sean: A = {a, b, d, g}, U = {a, b, c, , j}, A= {c, e, f, h, i, j }
3)
4)
B = {1, 2, 3}
A X B = {(a, 1), (a, 2), (a, 3), (e, 1), (e, 2), (e, 3)}
APUNTES REALIZADOS POR: Ing. Citlali Sofa Rincn Ruz
26
PROBABILIDAD Y ESTADISTICA
3
4
5
(a, 2, 3)
(a, 2, 4)
(a, 2, 5)
3
4
5
(a, 4, 3)
(a, 4, 4)
(a, 4, 5)
3
4
5
(b, 2, 3)
(b, 2, 4)
(b, 2, 5)
3
4
5
(b, 4, 3)
(b, 4, 4)
(b, 4, 5)
3
4
5
(c, 2, 3)
(c, 2, 4)
(c, 2, 5)
3
4
5
(c, 4, 3)
(c, 4, 4)
(c, 4, 5)
27
PROBABILIDAD Y ESTADISTICA
AA=A
1b.
AA=A
(A B) C = A (B C)
2b. (A B) C = A (B C)
3b. A B = B A
4b. A (B C) = (A B) (A C)
A=A
5b. A U = A
6a.
AU=U
6b.
A=
7b.
A A =
8a.
8b. U = , = U
C C
(A ) = A
9b.
(AB) = A B
C
28
PROBABILIDAD Y ESTADISTICA
1.
U
A
2.
U
A
AB
4.
U
A
6.
U
A
8.
U
A
9.
U
A
(A B)
(A B)
7.
AB
5.
AB
U
A
3.
A B
AB
29