Вы находитесь на странице: 1из 36

GRUPO: HORARIO DE 12:00 A 13:00

ALUMNO: RIVERA RODRIGUEZ EDGAR URIEL

INSTITUTO TECNOLOGICO DE PIEDRAS NEGRAS

FECHA: 24 DE ENERO DE 2017


1.1 Introduccin................................................................................................. 2
1.1.1 Datos no agrupados................................................................................ 4
1.1.2 Medidas de tendencia central...................................................................4
1.1.3 Medidas de posicin............................................................................... 6
1.1.4 Medidas de dispersin.............................................................................. 12
1.1.5 Medidas de forma..................................................................................... 13
...................................................................................................................... 14
1.2 Datos Agrupados............................................................................................ 15
1.2.1 Tabla de frecuencia................................................................................... 16
1.2.2 Medidas de tendencia central y de posicin..................................................18
1.2.3 Medidas de dispersin............................................................................... 21
1.2.4 Medidas de asimetra y curtosis..................................................................23
1.3 Representaciones Graficas..........................................................................27
.......................................................................................................................... 29
.......................................................................................................................... 30
1.3.1 Diagrama de dispersin.........................................................................32
1.4 Teorema de chebyshev................................................................................. 32

1
1.1 Introduccin

La estadstica descriptiva es un conjunto de tcnicas que tienen por objeto


organizar y presentar de manera conveniente para su anlisis, la informacin
contenida en una muestra. Dentro de ella existen bsicamente tres tipos de
tcnicas:

1.- Distribucin de Frecuencias


2.- Grficas
3.- Parmetros numricos

1.- Distribucin de frecuencias


La construccin de Tablas de Distribucin de Frecuencias es muy usual en la
estadstica, hace ms eficiente el anlisis de conjuntos grandes de datos. Se
utiliza principalmente para el anlisis de datos cuantitativos, no obstante,
tambin es comn realizar agrupaciones de datos cualitativos, el objetivo
es cuantificar el nmero de veces que se observ cada unidad de
informacin.

Ejemplo

En los estudios demogrficos de un pas suele ser de inters la poblacin de cada


una de las diferentes razas: Blanca, China, rabe, India, Negra, Mestiza. Se
selecciona de manera aleatoria un grupo de 2500 personas de la poblacin del
pas y se investiga cul es su origen.
Los resultados se obtendran de manera personal, ya que seran las respuestas a
la pregunta cul es su raza de origen?, sin embargo, un primer intento
para analizar la informacin es agruparla, y el resultado sera una tabla como la
siguiente:

Raza del Nmero de


encuestado personas
Blanca 500
China 800
rabe 300
India 250
Negra 300
Mestiza 350

2
2.- Grficas

Existen tambin varios tipos de grficas, o representaciones grficas, cada uno de


ellos de acuerdo al tipo de informacin que se est usando y los objetivos
que se persiguen al presentar la informacin.

Para las distribuciones de frecuencias la representacin grfica ms comn es el


histograma. En el eje horizontal (o de las abscisas) se representan los intervalos
de los datos, marcndose de manera continua las fronteras entre cada uno de los
stos. Est compuesto rectngulos, cuyo nmero coincide con la cantidad de
intervalos considerados, el ancho de la base de cada uno de esos rectngulos es
la misma siempre y coincide con las fronteras de los intervalos, y la altura
corresponde a la frecuencia de cada intervalo.

Ejemplo:

3
3.- Parmetros Numricos
Se utilizan para ayudar a describir el comportamiento de la muestra con un poco
ms de precisin.

Se dividen en:

1.- Medidas de tendencia central


2.- Medidas de dispersin
3.- Parmetros de forma

1.1.1 Datos no agrupados

Los datos no agrupados son el conjunto de observaciones que se presentan en


su forma original tal y como fueron recolectados, para obtener informacin
directamente de ellos.

Cuando en la muestra que se ha tomado de la poblacin o proceso que se desea


analizar se tienen menos de 30 datos, estos son analizados sin necesidad de
formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no
agrupados.

Ejemplo:

Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir,


vienen los 20 nios y as como te dan la edad as la anotas)

2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 nios)

Estos son datos no agrupados por qu no los has clasificado y contado.


1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 nios)

Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad
menor a la edad mayor, no estn contabilizados ni clasificados solamente estn
ordenados.

1.1.2 Medidas de tendencia central

4
Son valores que se encuentran dentro del rango de la muestra y que se pueden
considerar como representativos de la misma. Entre las ms usuales estn la
media aritmtica, la mediana y la moda.

1.-Media aritmtica

Valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total
de datos.

es el smbolo de la media aritmtica.

Formula:

Ejemplo:

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

2.- Mediana:

Es el valor que ocupa el lugar central de todos los datos cuando stos estn
ordenados de menor a mayor.

Para calcular la mediana:

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin


central de la misma.

Ejemplo: 2, 3, 4, 4, 5, 5, 5, 6, 6= 5

5
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre
las dos puntuaciones centrales.

Ejemplo: 7, 8, 9, 10, 11, 12 = 9.5

3.-Moda:
Es aquella que se repite con mayor frecuencia dentro de la muestra.

Ejemplos:

1, 2, 3, 4, 5, 5, 5, 6 *La moda es 5

- Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no


hay moda.

2, 2, 3, 3, 6, 6, 9, 9

- Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el


promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8*La moda es 4

1.1.3 Medidas de posicin


Son indicadores usados para sealar que porcentaje de datos dentro de una
distribucin de frecuencias superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo
que tambin se les llama Medidas de Tendencia Central.

Las medidas de posicin ms comunes utilizadas en estadstica son:

Cuartiles:

Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales: primero,


segundo y tercer cuartil.

6
*Para calcular los cuartiles

a) Para datos impares

2, 5, 3, 6, 7, 4, 9

b) Para datos pares


*Sumas los datos y los divides entre 2.

2, 5, 3, 4, 6, 7, 1, 9

c) Para datos agrupados

Buscamos la clase donde se encuentra , en la tabla de las


frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra la mediana.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

Ejemplo:

Calcular los cuartiles de la distribucin de la tabla:

7
fi Fi

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

8
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al
noveno decil).

Los Deciles dan los valores correspondientes al 10%, al 20%... y al 90% de


los datos.

*D5 coincide con la mediana.

La ecuacin para el clculo de los Deciles se modifica ligeramente, en la

frmula empleada para los cuartiles se cambia por y en la expresin se


cambia el cuatro por 10, quedando:

Por ejemplo en anlisis realizados por pediatras las tablas de crecimiento se


realizan sobre la ojiva o grfica de frecuencia cumulada.

9
Intervalos Promedi Nmero Frecuencia
o de de acumulada
pacientes
das

1 da a 9 das 5 5 5

10 da a 19 das 14.5 6 11

20 da a 29 das 24.5 8 19

30 da a 39 das 34.5 8 27

40 da a 49 das 44.5 4 31

50 da a 59 das 54.5 5 36

60 da a 69 das 64.5 7 43

70 da a 79 das 74.5 8 51

80 da a 89 das 84.5 4 55

90da a 100 94.5 8 63


das

10
Considerando Sustituyendo en la frmula
tenemos:

Lo que indica que el 40% de los pacientes atendidos a peticin de la clnica, para
anlisis de glucosa, se realiz en 36.975 das.

Para el clculo del quinto decil observamos que independiente de la muestra

Es decir, el quinto Decil corresponde a la mediana y por consiguiente al segundo


cuartil.

*El resto de los Deciles se pueden obtener de manera similar.

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes


iguales: (primero al noventa y nueve percentil).

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%


de los datos.

* P50 coincide con la mediana.

Ejemplo:

Obtener los percentiles 23 y 71 del siguiente conjunto de datos:

43 47 10 14 5 34 11 11 5 37 41 11 24 9 10 12 25 31 3 34 16 1 7 20 38 32 12
48

Solucin: Primero, ordenamos los 28 datos (ntese entonces que n = 28).

11
1 3 5 5 7 9 10 10 11 11 11 12 12 14 16 20 24 25 31 32 34 34 37 38 41 43 47
48

* El percentil 23 estara en la posicin: 23(28+1)/100 = 6.67.

sta sera la posicin #6 + 0.67 la diferencia entre la posicin #7 y la #6.

La posicin #6 tiene valor de 9, y la #7 el valor de 10. Por esto, P23 = 9 +


0.67 (10 9) = 9.67.

* El percentil 71 estara en la posicin: 71(28+1)/100 = 20.59.

sta sera la posicin #20 + 0.59 la diferencia entre la posicin #21 y la


#20.

La posicin #20 tiene valor de 32, y la #21 el valor de 34.

Por esto, P71 = 32 + 0.59 (34 32) = 33.18.

1.1.4 Medidas de dispersin


Se miden con respecto a la media. Estas medidas nos permiten, describir el
comportamiento de la muestra, y validar la representatividad de la media
como caracterstica de todo el conjunto de datos.

Las medidas de dispersin son:

1.-Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribucin


estadstica.

2.-Desviacin media

La desviacin respecto a la media es la diferencia entre cada valor de la variable


estadstica y la media aritmtica.

Di = x - x

12
La desviacin media es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media.

La desviacin media se representa por

Ejemplo:

Calcular la desviacin media de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

1.1.5 Medidas de forma


Nos permiten identificar la forma en que se separan o aglomeran los valores de
acuerdo a su representacin grfica. Estas medidas describen la manera como los
datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de
la informacin.

A) Simetra

Los coeficientes de simetra indicarn si la distribucin es simtrica y, caso de no


serlo, el tamao y la tendencia de su asimetra. Para ello, se distinguen dos tipos
de distribuciones, las que tienen forma de campana y las que no la tienen,
emplendose expresiones alternativas para su clculo.

1. Si la distribucin tiene forma de campana se utiliza la expresin:

13
De tal forma que cuando es igual a cero la distribucin es simtrica, si
es menor, asimtrica negativa o tendida a la derecha, y si es mayor,
asimtrica positiva o tendida a la izquierda.

2. Si la distribucin no tiene forma de campana o se desconoce este hecho se


calcula la simetra mediante el coeficiente:

Cuando la distribucin es simtrica coinciden la media y la mediana, y que


si adems tiene forma de campana ambas son iguales a la moda.

b) Curtosis
Esta medida determina el grado de concentracin que presentan los valores en la
regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos
identificar si existe una gran concentracin de valores (Leptocrtica), una
concentracin normal (Mesocrtica) o una baja concentracin (Platicrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

14
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( )
la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta
frmula se interpretan:

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante


difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen
aceptar los valores cercanos ( 0.5 aprox.).

(g2 > 0) la distribucin es Leptocrtica

(g2 < 0) la distribucin es Platicrtica

*Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y
un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal.

1.2 Datos Agrupados

Son un conjunto de informacin con un patrn establecido de dichos datos para la


facilitacin de su manejo. Los datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la informacin obtenida de una investigacin sea
manejable con mayor facilidad.

Su fin es resumir informacin.


implica: ordenar, clasificar y expresarlos en una tabla de frecuencias.
Se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque
contemos con ms de 20 elementos, debe de verificarse que los datos n
sean significativos, Esto es: que la informacin sea repetitiva, tambin
debemos de verificar que los datos puedan clasificarse. Y que dicha
clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos est
pidiendo).
Una vez que ya hemos ordenado y clasificado, presentaremos la
informacin obtenida mediante una tabla de frecuencias
la agrupacin de los datos puede ser simple o mediante intervalos de clase.

15
Ejemplo:

Investigar la edad a un grupo de 20 Nios

- 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6

- 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Ordenados)

a) Los puedes ordenar, de edad menor a la edad mayor, (no estn


contabilizados ni clasificados solamente estn ordenados). Para que sean
datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuntos
nios haba de cada ao.

16
Edad Frecuencia
1 2
2 4
3 7
4 4
5 2
6 1
Total: 20

b) tambin los puedes agrupar en clases, rangos, grupos o intervalos por


ejemplo de 2 aos para este caso.

Edad Frecuencia
1-2 6
3-4 11
5-6 3
Total: 20

1.2.1 Tabla de frecuencia


Son herramientas de Estadstica donde se colocan los datos en columnas
representando los distintos valores recogidos en la muestra y las frecuencias.

Elementos de las Tablas de frecuencias


Datos
Son los valores de la muestra recogida en el estudio estadstico.

Frecuencia absoluta
La frecuencia absoluta (ni) es el nmero de veces que aparece un
determinado valor en un estudio estadstico. Nmero de veces que se repite
el -esimo valor de la variable. La suma de las frecuencias absolutas es
igual al nmero total de datos, que se representa por n.

Frecuencia absoluta acumulada

17
La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias
absolutas de todos los valores inferiores o iguales al valor considerado.

N1 = n1

N2 = n1 + n2 = N1 + n2

N3 = n1 + n2 + n3 = N2 + n3

Nk = n.

Se interpreta como el nmero de observaciones menores o iguales al -


esimo valor de la variable.

Frecuencia relativa

La frecuencia relativa (fi) proporcin de veces que se repite un determinado


dato.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el nmero total de datos.

fi = ni/n

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada

La frecuencia relativa acumulada (Fi) es el nmero de observaciones


menores o iguales al -esimo valor de la variable pero en forma relativa.

F1 = fl

F2 = f1+ f2 = F1 + f2

F3 = f1+ f2 + f3 = F2 + f3

Fk = 1

Ejemplo:

*Los pesos de los 65 empleados de una fbrica vienen dados por la


siguiente tabla:

18
Peso fi
[50, 60) 8
[60, 70) 10
[70, 80) 16
[80,90) 14
[90, 100) 10
[100, 110) 5
[110, 120) 2

xi fi Fi ni Ni
[50, 60) 55 8 8 0.12 0.12
[60, 70) 65 10 18 0.15 0.27
[70, 80) 75 16 34 0.24 0.51
[80,90) 85 14 48 0.22 0.73
[90, 100) 95 10 58 0.15 0.88
[100, 110) 105 5 63 0.08 0.96
[110, 120) 115 2 65 0.03 0.99
65 1

*Construir la tabla de frecuencias.

19
1.2.2 Medidas de tendencia central y de posicin

* Lo importante en una tendencia central es calcular un valor central que


acte como resumen numrico para representar al conjunto de datos. Estos
valores son las medidas o ndices de tendencia central.

Medidas de tendencia central.


La media aritmtica

Es el valor central alrededor del cual estn la mayora de las observaciones.


Slo puede calcularse para variables cuantitativas (nmeros).
Se calcula sumando todos los valores de la variable divididos por el nmero
total de observaciones.

_
X = Xi / n
_
X = Media aritmtica.
= Smbolo sumatorio (indica que se estn sumando todas las X que hay).
Xi= Valor que toma la variable u observacin del sujeto i.
n = Nmero total de observaciones.

*Para frecuencias absolutas:


_
X = niXi / ni

*Para frecuencias relativas:


_
X = piXi

La mediana

Se utilizara cuando la distribucin sea muy asimtrica.

20
Los valores extremos no le afectan (a diferencia de la media aritmtica) ya
que para su clculo slo se toman los valores que ocupan posiciones
centrales.
Se puede calcular para todo tipo de variables, excepto cualitativas.

La Mediana de una variable X, representada por Md, se define como el valor de la


variable que divide la distribucin de frecuencias en dos partes iguales,
conteniendo cada una el 50% de las observaciones.

*Clculo de mediana con pocos caso

1 Se ordenan las puntuaciones n de mayor a menor.


2 Se Observa si el nmero de observaciones n es par o impar.
*Si es impar, la mediana es el valor de la posicin central.
*Si es par, la mediana es la media aritmtica de los dos valores centrales.

La moda

- Se puede calcular para variables cualitativas y cuantitativas.


- Se representa por Mo y se define como el valor o categora de la variable
con mayor frecuencia absoluta.
- Si los datos estn agrupados en intervalos, la moda se puede calcular
excepto si el intervalo modal coincide con el intervalo abierto.
- Si la variable es cualitativa, la moda es la categora con la mxima
frecuencia.
- -Si la variable es cuantitativa, la moda es el valor con la mxima frecuencia
absoluta.
- -Si la variable es cuantitativa con datos en intervalos., se localiza el
intervalo modal (intervalo con la frecuencia mxima) y la moda es el punto
medio de dicho intervalo.

Podemos tener distinto nmero de modas en la distribucin (1= unimodal)


(2=bimodal) (3=trimodal); etc.

Medidas de posicin

Percentiles

Tambin llamados centiles, son los 99 valores de la variable que dividen


en 100 partes iguales la distribucin de frecuencias.

Percentil k (Pk): Es un valor de la variable de inters que deja por debajo


de s un porcentaje k de sujetos, donde k = 1,2...99

21
Ejemplo P40 = 25 (25 es la puntuacin en un examen)
Quiere decir que los sujetos con X= 25 estn por encima del 40% de los
sujetos.

Clculo de los percentiles:

Pk = Li + (nk/100-nd) I/nc
Li= Lmite exacto inferior del intervalo crtico
n = Nmero de observaciones
nd= Frecuencia absoluta acumulada por debajo del intervalo crtico
nc= Frecuencia absoluta del intervalo crtico
I = Amplitud del intervalo

Cuartiles y Deciles

Cuartiles:
3 valores de la distribucin que dividen en 4 partes de igual frecuencia a la
distribucin.

Primer Cuartil (Q1) = Deja por debajo de s al 25% y por encima al 75% (Q1= P25)
Segundo Cuartil (Q2) = Deja por debajo de s al 50% y por encima al 50% (Q2=
P50 = Md)
Tercer Cuartil (Q3) = Deja por debajo de s al 75% y por encima al 25% (Q3= P75)

Deciles:
Son 9 valores que dividen en 10 partes iguales a la distribucin. Se representan
por D1, D2...D9...y al igual que los cuartiles, tambin se corresponden con cada
percentil: D1= P10; D2= P20 etc...

1.2.3 Medidas de dispersin

Parmetros estadsticos que indican cmo se alejan los datos respecto de la


media aritmtica. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersin ms utilizadas son el rango, la desviacin estndar y la
varianza.

Rango

Indica la dispersin entre los valores extremos de una variable. Se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.

Para datos ordenados se calcula como:

22
R = x(n) - x (1)

Dnde: x(n): Es el mayor valor de la variable. X(n): Es el menor valor de la


variable.

Ejemplo:

52 32 = 20
*Resta el ms pequeo del ms grande. El rango es 20 puntos.

Desviacin media

Es la media aritmtica de los valores absolutos de las diferencias de cada dato


respecto a la media.

Dnde:

xi: valores de la variable.

n: nmero total de datos

Ejemplo:

Calcular la desviacin media de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Desviacin estndar

23
La desviacin estndar mide el grado de dispersin de los datos con respecto a la
media, se denota como s para una muestra o como para la poblacin. Se define
como la raz cuadrada de la varianza segn la expresin:

Mientras menor sea la desviacin estndar, los datos son ms homogneos, es


decir existe menor dispersin, el incremento de los valores de la desviacin
estndar indica una mayor variabilidad de los datos.

Ejemplo: Calcular la desviacin estndar de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Varianza

Parmetro utilizado para medir la dispersin de los valores de una variable


respecto a la media. Corresponde a la media aritmtica de los cuadrados de las
desviaciones respecto a la media. Su expresin matemtica es:

Calcular la varianza de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

24
1.2.4 Medidas de asimetra y curtosis
La asimetra y curtosis Informan sobre la forma de la distribucin de una
variable. Estas medidas permiten saber las caractersticas de su asimetra y
homogeneidad sin necesidad de representarlos grficamente.

Asimetra

Es la medida que indica la simetra de la distribucin de una variable respecto


a la media aritmtica, sin necesidad de hacer la representacin grfica. Los
coeficientes de asimetra indican si hay el mismo nmero de elementos a
izquierda y derecha de la media.

Tres tipos de curva de distribucin segn su asimetra son:

- Asimetra negativa: la cola de la distribucin se alarga para valores


inferiores a la media.
- Simtrica: hay el mismo nmero de elementos a izquierda y derecha de
la media. En este caso, coinciden la media, la mediana y la moda. La
distribucin se adapta a la forma de la campana de Gauss, o
distribucin normal.
- Asimetra positiva: la cola de la distribucin se alarga para valores
superiores a la media.

Existen tres coeficientes de asimetra:

25
1.-Coeficiente de asimetra de Fisher

El coeficiente de asimetra de Fisher CAF evala la proximidad de los datos a su


media x. Cuanto mayor sea la suma (xix)3, mayor ser la asimetra. Sea el
conjunto X=(x1, x2,, xN), entonces la frmula de la asimetra de Fisher es:

Si CAF<0: la distribucin tiene una asimetra negativa y se alarga a valores


menores que la media.

Si CAF=0: la distribucin es simtrica.

Si CAF>0: la distribucin tiene una asimetra positiva y se alarga a valores


mayores que la media.

2.-Coeficiente de asimetra
de Pearson

El coeficiente de asimetra de Pearson CAP mide la diferencia entre la media y la


moda respecto a la dispersin del conjunto X=(x1, x2,, xN).

Utilizado en distribuciones unimodales y poco asimtricas.

26
Si CAP<0: la distribucin tiene una asimetra negativa, puesto que la media
es menor que la moda.

Si CAP=0: la distribucin es simtrica.

Si CAP>0: la distribucin tiene una asimetra positiva, ya que la media es


mayor que la moda.

Coeficiente de asimetra de Bowley

El coeficiente de asimetra de Bowley CAB toma como referencia los cuartiles para
determinar si la distribucin es simtrica o no. Para aplicar este coeficiente, se
supone que el comportamiento de la distribucin en los extremos es similar. Sea el
conjunto X=(x1, x2,, xN), la asimetra de Bowley es:

Si CAB<0: la distribucin tiene una asimetra negativa, puesto que la


distancia de la mediana al primer cuartil es menor que al tercero.

Si CAB=0: la distribucin es simtrica, ya que el primer y tercer cuartil estn


a la misma distancia de la mediana.

27
Si CAB>0: la distribucin tiene una asimetra positiva, ya que la distancia de
la mediana al tercer cuartil es mayor que al primero.

Curtosis

Es una medida de forma que mide cun escarpada o achatada est una curva o
distribucin.

Este coeficiente indica la cantidad de datos que hay cercanos a la media, de


manera que a mayor grado de curtosis, ms escarpada (o apuntada) ser la forma
de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia entre cada


elemento del conjunto y la media, dividido entre la desviacin tpica elevado
tambin a la cuarta potencia. Sea el conjunto X=(x1, x2,, xN), entonces el
coeficiente de curtosis ser:

28
1.3 Representaciones Graficas
Buscan hacer intuitiva y rpida la descripcin de los datos. Son adecuadas para
describir frecuencias absolutas o relativas de variables cuantitativas. Las hay de
muchos tipos, las ms usuales son:

Diagramas de barras:

Se representa en el eje de ordenadas las modalidades y en abscisas las


frecuencias absolutas o las frecuencias relativas

Ejemplo:

El jefe de una empresa pregunta a sus empleados cuando prefieren disfrutar de


sus vacaciones. Les ofrece cinco quincenas.

Con las respuestas de los 290 trabajadores, construye una tabla:

*Se Dibuja el grafico de barras

29
Diagrama de Sectores o Circular
Consiste en asociar a cada valor de la variable un sector circular proporcional a su
frecuencia relativa. Son adecuados para variables cuantitativas sin orden.

El arco de cada porcin se


calcula usando la siguiente
regla de tres:

Ejemplo:

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 9


juegan al ftbol y el resto no practica ningn deporte.

30
Alumnos ngulo
Baloncesto 12 144
Natacin 3 36
Ftbol 9 108
Sin deporte 6 72
Total 30 360

Pictogramas:

Expresan con dibujos alusivos al tema de estudio las frecuencias de las


modalidades de la variable. Estos grficos se hacen representado a diferentes
escalas un mismo dibujo.

Histograma:

31
Representacin grfica de la distribucin de un conjunto de observaciones en una
serie de intervalos que cubre el rango de los valores. El nmero de observaciones
en cada intervalo est representado por una columna de rea proporcional.

Polgono de
frecuencias:
Indica la evolucin de las
frecuencias. Se
construye uniendo los
extremos superiores de las barras, de los diagramas de barras, o los puntos medios
de las bases superiores de los rectngulos de los histogramas. Est especialmente
indicado para variables continuas.

Ejemplo:

Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes


variaciones:

Hora Temperatura
6 7
9 12
12 14
15 11
18 12
21 10
24 8

32
1.3.1 Diagrama de dispersin

El Diagrama de Dispersin tiene el propsito de controlar mejor el proceso y


mejorarlo, resulta indispensable conocer cmo se comportan algunas variables o
caractersticas de calidad entre s, esto es, descubrir si el comportamiento de unas
depende del comportamiento de otras, o no, y en qu grado.

El Diagrama de dispersin es utilizado cuando se desea realizar un anlisis grfico


de datos bivariados, es decir, los que se refieren a dos conjuntos de datos. El
resultado del anlisis puede mostrar que existe una relacin entre una variable y la
otra.

33
1.4 Teorema de chebyshev

El teorema de Chebyshev nos dice que:

La probabilidad de que una variable aleatoria tome un valor contenido en K


desviaciones estndar de la media es cuando menos:

*Donde k = un nmero mayor que 1.

En trminos intuitivos, la varianza y la desviacin estndar de una distribucin de


una probabilidad mide el grado de dispersin:

Cuando la desviacin estndar es pequea, la probabilidad de obtener un valor


cercano a la media es alta.

Cuando la desviacin estndar es grande, la probabilidad de obtener un valor


cercano a la media es pequea.

Ejemplo:

34
35

Вам также может понравиться