Вы находитесь на странице: 1из 25

GUIA TALLER DE

ESTADISTICA
DESCRIPTIVA






UNI VE RS I DAD DE
L OS L L ANOS
E S C U E L A D E C I E N C I A S
B A S I C A S E I N G E N I E R I A
P R O G R A M A D E
A D M I N I S T R A C I O N D E
E M P R E S A S
P R O G R A M A D E E C O N O M I A
Ing. OSCAR BUENDIA P.
RECOPILACION DE FUNDAMENTOS TEORICOS Y TALLER
DE APLICACIONES Y TRABAJO INDEPENDIENTE

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
ESTADSTICA DESCRIPTIVA

La estadstica descriptiva tiene como propsito describir y resumir un conjunto de datos,
para ello, se emplean dos tipos de mtodos: mtodos grficos y mtodos numricos. Para
introducir los mtodos grficos y numricos se recurre a la construccin de las
Distribuciones de Frecuencia, mtodo utilizado para organizar y resumir datos. Una tabla de
frecuencias est formada por las categoras o valores de una variable y sus frecuencias
correspondientes; esta tabla se crea por medio de la tabulacin y agrupacin, se trabaja con
una sola variable; sin embargo, cuando el conjunto de datos es mayor, resulta laborioso
trabajar directamente con los valores individuales observados y entonces se lleva a cabo,
por lo general, algn tipo de agrupacin como paso preliminar, antes de iniciar cualquier
otro tratamiento de los datos. Las reglas para proceder a la agrupacin son diferentes segn
sea la variable, atributo, discreta o continua, para una variable discreta suele resultar
conveniente hacer una tabla en cuya primera columna figuren todos los valores de la
variable X
i
representados en el material, y en la segunda, la frecuencia n
i
con que ha
aparecido cada valor de X en las observaciones.

Notacin y/o simbologa estndar a manejar:

La letra X mayscula representar a la variable con la que estamos trabajando. La letra
X mayscula con subndices, X
1
, X
2
, X
3
, servir para representar un valor concreto de
la variable X en el sujeto 1, 2, 3,... Cuando queramos referirnos a un valor concreto
cualquiera de la variable X escribiremos Xi. Denotaremos por Xn el ltimo valor que
toma la variable.

El nmero de elementos que componen la muestra ser n (N si est considerando una
poblacin).

Se llama frecuencia absoluta de un valor Xi, y se simboliza por n
i
(en alguna literatura la
representan por f
i
) al nmero de veces que se repite el valor Xi en la muestra. La suma
de las frecuencias debe ser igual al nmero de elementos que componen la muestra,
esto es,

n
i
= = n
1
+ n
2
+ n
3
+ + n
n
= n

La frecuencia relativa es la fraccin del total de observaciones que presentaron un valor
Xi en particular y se simboliza por hi. Para su clculo se hace el cociente entre la
frecuencia absoluta y el nmero total de datos, es decir

b

=
n
i
n


La frecuencia relativa puede denotar un porcentaje o una probabilidad de seleccin; la
suma de las frecuencias relativas debe ser igual (o aproximadamente igual) a 1, esto es,

hi = = h
1
+ h
2
+ h
3
+ + h
k
= 1
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

La frecuencia absoluta acumulada (F
i
o N
i
) es la suma de los distintos valores de la
frecuencia absoluta tomando como referencia un individuo dado. Cabe mencionar que la
ltima frecuencia absoluta acumulada es igual al nmero de casos, es decir,

F
1
= f
1

F
2
= f
1
+ f
2
= F
1
+ f
2

F
3
= f
1
+ f
2
+ f
3
= F
2
+ f
3

.
.
.
F
n
= f
1
+ f
2
+ f
3
+ + f
n-1
+ f
k
= F
k-1
+ f
k
= n
La frecuencia relativa acumulada es el resultado de dividir cada frecuencia absoluta
acumulada (Fi) por el nmero total de datos; se suele representar con la notacin Hi;
cabe mencionar que la ltima frecuencia relativa acumulada es igual a 1; es decir,

TABULACION PARA VARIABLE DISCRETA

De esta manera, la distribucin de frecuencias para una VARIABLE DISCRETA estar
dada de la siguiente manera:

X
i
n
i
h
i
N
i
H
i
X
1 n
n
1
Hh
1
N
1
H
1
X
2
Nn
2
Hh
2
N
2
H
2
X
3
Nn
3
Hh
3
N
3
H
3

X
n
nn
n
hh
n
N
n
H
n

ni = n hi = 1


Ejemplo:
El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto
de la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, y
ha obtenido los siguientes datos:

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO


Determinar:
a. Cul es la poblacin objeto de estudio?
b. Qu variable estamos estudiando?
c. Qu tipo de variable es?
d. Construir la tabla de frecuencias.
e. Cul es el nmero de familias que tiene como mximo 2 hijos?
f. Cuntas familias tienen ms de 1 hijo, pero como mximo 3?
g. Qu porcentaje de familias tiene ms de 3 hijos?
Solucin:
a. La poblacin objeto de estudio es el conjunto de familias de un determinado pas.
b. La variable que estamos estudiando es el nmero de hijos por familia
c. El tipo de variable es discreta ya que el nmero de hijos solo puede tomar determinados
valores enteros (es imposible tener medio o un cuarto de hijo).
d. Para construir la tabla de frecuencias tenemos que ver cuntas familias tienen un
determinado nmero de hijos. Podemos ver que el nmero de hijos, toma los valores
existentes entre 0 hijos, los que menos y, 6 hijos los que ms; de esta manera se tiene:

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO


e. El nmero de familias que tienen dos o menos hijos es: 2 + 4 + 21 = 27.
f. El nmero de familias que tienen ms de un hijo pero tres como mximo es: 21 + 15 = 36.
g. Por ltimo el porcentaje de familias que tiene ms de tres hijos, son aquellos que tienen
4; 5 y 6 es decir: 6 + 1 + 1 = 8.
h. El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia relativa de
dichos valores multiplicado por 100: (0,12 + 0,02 + 0,02)* 100 = 0,16*100 = 16%.

TABLAS DE FRECUENCIA PARA VARIABLES CONTINUAS

Cuando nos encontramos con una distribucin con un gran nmero de datos, o con
VARIABLES CONTINUAS se suelen agrupar los datos en intervalos de clase para facilitar
la comprensin de los datos; sin embargo, este proceso presenta un problema no deseable
en estadstica: se pierde informacin sobre la distribucin de los datos. La agrupacin de
datos en intervalos de clase consiste en formar grupos de valores consecutivos de la
variable y poner cada uno de estos grupos en cada fila en lugar de poner una sola
puntuacin. Cabe mencionar que la tabla de frecuencias para variables continuas presenta
la misma estructura que las descritas anteriormente para variables discretas, aadiendo un
par de elementos que se describirn a continuacin.

En primer lugar se debe definir la cantidad de intervalos a emplear; se recomienda que el
nmero de intervalos (m) debe variar entre 5 y 15. Para determinar el nmero de intervalos
existen varios mtodos:

Por la experiencia del investigador.
Por frmulas:
m =

n

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
m = 1+ 3,3Log n
(Frmula de Sturgess)

Una vez establecida la cantidad de intervalos en los cuales se van agrupar los datos, se
debe determinar la longitud de cada uno de ellos, la cual depender del criterio establecido
para presentar la informacin. La longitud puede variar de intervalo a intervalo, sin embargo,
se acostumbra a trabajar con intervalos de igual amplitud. Para determinar la amplitud de
los intervalos (C) se recurre a la siguiente frmula:

C =
R
m


R es el rango y se obtiene por diferencia entre X
mx
y X
mn
, m es el nmero de intervalos.

Para operar se emplea la marca de clase (X)

, el punto medio de un intervalo (denotada en


algunos libros por m). Las marcas de clase pueden obtenerse de 3 maneras:

1. Definirla como la semisuma de los valores extremos del intervalo, esto es sumar los
extremos, y dividir entre 2.
2. Se obtiene la primera marca de clase por el mtodo anterior y si la amplitud (C) es
constante, se le suma a la primera marca de clase obtenida y as sucesivamente.
3. Se divide la amplitud de cada intervalo (C) por dos y se le suma al lmite inferior del
intervalo o se le resta al lmite superior del intervalo.

INTERVALO x ni hi Ni Hi
X
1
- X
2
x
n
n
1
Hh
1
N
1
H
1
X
2


X
3
x Nn
2
Hh
2
N
2
H
2
X
3
X
4
x Nn
3
Hh
3
N
3
H
3

X
n-1
- X
n
nn
n
hh
n


Ejemplo
Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de sus
habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma
categora de esa ciudad. Los datos obtenidos en miles de pesos fueron:


UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

Se pide:
a. Cul es la poblacin objeto de estudio?
b. Qu variable estamos estudiando?
c. Qu tipo de variable es?
d. Qu problema plantea la construccin de la tabla de frecuencias?
e. Cuntos hoteles tienen un precio entre 3,25 y 3,75?
f. Cuntos hoteles tienen un precio superior a 4,75?
g. Qu porcentaje de hoteles cuestan como mucho 4,25?

REPRESENTACIN GRFICA DE LA INFORMACIN

Las grficas proporcionan datos en un diagrama de dos dimensiones. En el eje horizontal se puede
mostrar los valores de la variable (las caractersticas que se estn midiendo), y en el eje vertical se
sealan las frecuencias de las clases mostradas en el eje horizontal.

1. GRFICO CIRCULAR O DE SECTORES

Permite apreciar de un solo golpe de vista la posicin y magnitud de los valores de la variable. El
rea de cada sector es proporcional a la frecuencia que representa.


Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos
con respecto al total, es decir, cuando se est usando una escala categrica, conviene
utilizar una grfica llamada de pastel o circular. Si se desea resaltar una de las categoras
que se presentan, es vlido tomar esa "rebanada" de la grfica y separarla de las dems



UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado, comparar
dos grficos circulares (por ejemplo, si se quisieran comparar las proporciones de
matrculas en licenciatura por reas de conocimiento en licenciatura para dos aos distintos)
resulta muy difcil y, por tanto, no es muy aconsejable. En ocasiones existen categoras
con pocas frecuencias (por ejemplo, dos o tres con frecuencias relativas menores al 1%
cada una), haciendo que la grfica resulte "pesada" y las etiquetas se encimen. Una posible
solucin es juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), pero
entonces habra que ponderar si se hace una grfica extra con dichas observaciones
nicamente, haciendo la anotacin pertinente, o simplemente se ignoran por no resultar
significativas.

2. DIAGRAMA DE BARRAS

Se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una VARIABLE
DISCRETA. En el eje de abscisas, situaremos los diferentes valores de la variable. En el
eje de ordenadas la frecuencia. Levantaremos barras o columnas SEPARADAS de
altura correspondiente a la frecuencia adecuada.



3. HISTOGRAMAS

Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia:
es para VARIABLES CONTINUAS. Si la amplitud del intervalo es la misma, elevaremos
columnas UNIDAS, a altura la frecuencia correspondiente. Si la amplitud del intervalo es
diferente, el rea del rectngulo columna ser proporcional a la frecuencia representada.

En el eje horizontal (o de las abscisas) se representan los intervalos de los datos,
marcndose de manera continua las fronteras entre cada uno de los stos. De esta manera,
el histograma est compuesto rectngulos, cuyo nmero coincide con la cantidad de
intervalos considerados, el ancho de la base de cada uno de esos rectngulos es la misma
siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia
de cada intervalo. Es importante observar que resulta difcil utilizar este tipo de
representacin cuando existen intervalos abiertos o cuando los intervalos no son iguales
entre s.

EXCEL no permite crear histogramas automticamente, como un grfico circular o de
barras, pero si se pueden crear (vea Estadstica y muestreo, Ciro Martnez).
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO



4. POLGONO DE FRECUENCIAS

Se forma al unir las marcas de clase de los intervalos, bsicamente con el fin de
comparar el comportamiento de dos o ms variables.






5. OJIVAS

Se parecen a los polgonos de frecuencias, pero son bien diferentes; se usan para
graficar las frecuencias acumuladas.

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

En resumen:









UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
REDUCCIN DE DATOS

La reduccin de datos tiene por objetivo, como su nombre lo indica, reducir toda la serie
de datos a un solo valor que represente alguna caracterstica de esta serie da datos.
Este valor representativo se denomina estadstico, el cual puede ser de dos clases:
Parmetro cuando el estadstico se obtiene a partir de informacin poblacional, lo cual
es muy poco frecuente.
Estadgrafo, cuando se refiere a una muestra, que es lo ms comn.
Los estadsticos permiten medir principalmente 4 caractersticas de los conjuntos de datos:
1. Tendencia central
2. Dispersin
3. Apuntamiento
4. Simetra o forma

MEDIDAS DEPOSICIN O TENDENCIA CENTRAL

Describen cmo los datos recolectados u observados se agrupan en torno a un valor central
representativo. Expresndolo de otra forma, Una de las caractersticas ms sobresalientes
de la distribucin de datos es su tendencia a acumularse hacia el centro de la misma; esta
caracterstica se denomina tendencia central. Las medidas de posicin o de tendencia
central nos permiten determinar la posicin de un valor respecto a un conjunto de datos, el
cual consideraremos como representativo o tpico para el total de las observaciones.

Las medidas de tendencia central tienden a localizarse en el centro de la informacin, son
de gran importancia en el manejo de las tcnicas estadsticas, sin embargo, su
interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la
representatividad de ellas est asociada con el grado de concentracin de la informacin.

Las principales medidas de tendencia central pueden ser de 2 clases:

Tendencia central: moda, mediana, media aritmtica, media geomtrica
No centrales o de posicin: cuartiles, deciles, percentiles.

La frmula de clculo de cada una de ellas depende de cmo se encuentren presentados
los datos: agrupados (tabulados) o sin agrupar (sin tabular). Por datos agrupados
entenderemos los presentados en una tabla de frecuencias (variable discreta o continua),
mientras que por datos sin agrupar se entender los que se encuentran enlistados.



UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
TENDENCIA CENTRAL

1. MODA.

Es el valor de la variable que ms se repite, es decir, que tiene la mayor frecuencia
absoluta. Tiene la ventaja de que no se ve afectada por valores atpicos. Tambin es
posible que pueda haber ms de una moda (distribuciones bimodales, trimodales etc.) o
que no haya moda.





2. MEDIANA.

Busca determinar el valor que tiene aquella observacin que divide la cantidad de
observaciones en dos mitades iguales. Por lo tanto es necesario atender a la
ordenacin de los datos, y debido a ello, este clculo depende de la posicin relativa de
los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a
mayor (o viceversa).

ESTIMACIN PARA DATOS SIN AGRUPAR

Hay que tener en cuenta la cantidad de datos que se recolectaron; es decir, si se tiene
un nmero de datos IMPAR o si por el contrario, el nmero de datos es PAR.

A. Nmero impar de observaciones: La mediana es el valor del dato central as, la
mediana puede expresarse como:

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO

B. Nmero impar de observaciones: La mediana est determinado por el valor de la
semisuma (promedio aritmtico) de los valores de los dos datos centrales, es decir:



ESTIMACIN DATOS AGRUPADOS

VARIABLE DISCRETA

En el caso de variables discretas donde cada categora es el valor de la variable, se
puede tomar como un caso de intervalo de amplitud 1 y en este caso el clculo de la
mediana funciona exactamente como lo visto para datos sin agrupar; sin embargo, existe un
par de reglas prcticas basadas en las frecuencias absolutas que pueden ser de utilidad:





VARIABLE CONTINUA

Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con
precisin los valores que toman los datos, ya que esa informacin se ha perdido en
privilegio del agrupamiento interval. Por lo tanto, en este caso, debemos buscar otro mtodo
para determinar el valor de la mediana. Consideremos como Ij x al lmite inferior del j-simo
intervalo, de manera anloga como Sj x al lmite superior del j-simo intervalo.

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO





3. MEDIA ARITMTICA (X

si es muestral, si es poblacional)

Es la medida de posicin ms empleada, la ms conocida y sencilla de calcular, de gran
estabilidad en el muestreo y sus frmulas admiten tratamientos algebraicos. Tambin se le
conoce como promedio aritmtico o simplemente como la media de un conjunto de
observaciones.

Para datos sin agrupar o tabular:

X

=
X
i
n


Para datos agrupados:

X

=
X
i
n
i
n


UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
PROPIEDADES DE LA MEDIA

1. La suma de las diferencias de los datos con respecto a la media aritmtica es igual a
cero.


2. La suma de las diferencias cuadrticas de los datos, con respecto a la media
aritmtica es mnima; es mnima para ; quiere decir que para cualquier otro
parmetro p, diferente a la media aritmtica hacer mayor la expresin


3. La media aritmtica de una constante es igual a la constante.

4. Si a cada uno de los resultados de una variable le sumamos o le restamos una
constante C, la media aritmtica de la nueva variable queda alterada en esa
constante.


5. Si cada uno de los datos se multiplica por una constante K, entonces la media
aritmtica queda multiplicada por esa constante.


6. Empleando las dos propiedades anteriores, podemos calcular la media de una
combinacin lineal de variables, esto es, una transformacin de variables. La media
aritmtica de la nueva variable es:


7. La media de una muestra es igual a la media ponderada de las sub-muestras,
tomndose como ponderacin los tamaos de las sub-muestras.



RELACIN MODA-MEDIANA-MEDIA

Las distribuciones simtricas que slo contienen una moda, siempre tienen el mismo valor
para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de
tendencia central, pues ya est hecha la seleccin.
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO



MEDIDAS DE DISPERSIN

Una vez localizado el centro de la distribucin de un conjunto de datos, el siguiente paso es
buscar una medida de la variabilidad o dispersin de los datos; como se mencion
anteriormente, las medidas de tendencia central tienen como objetivo sintetizar los datos en
un valor representativo; como complemento, las medidas de dispersin nos dicen que tan
representativas son estas medidas de tendencia central como sntesis de la informacin; de
esta manera, las medidas de dispersin cuantifican la separacin, dispersin, la variabilidad
de los valores de la distribucin respecto al valor central como la media aritmtica. Cuanto
menor es la dispersin, tanto mayor ser la precisin del sistema de medicin. Si los
estadgrafos de posicin se relacionan con el concepto de exactitud, los de dispersin se
relacionan con la precisin de las tcnicas.


IMPORTANCIA DE LAS MEDIDAS DE DISPERSIN.

1. Proporcionan informacin adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central
es menos representativa de los datos.

2. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos
ser capaces de identificarlos antes de abordar esos problemas.

3. Cuando se desea comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersin de valores con respecto al centro de distribucin o esto
presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar
escoger distribuciones que tengan las dispersiones ms grandes.


UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
MEDIDAS DE DIISPERSIN

1. VARIANZA (S
2
,
2
).

La varianza de una poblacin (denotada por S
2
; es la letra griega sigma) de N
observaciones x1, x2, x3,, xN, cuya media aritmtica es m, se define como el promedio de
los cuadrados de las desviaciones con respecto a su media.

Para DST:





Para DT:

S
2
=
X
i
2
n
i
+
(X
i
n
i
)
2
n
n
i=1
n


NOTA: cuando se trabaja con muestras pequeas (n 30) se divide por n 1.

Propiedades de la varianza.

1. Es siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente
cuando:



2. La varianza de una constante vale 0.
3. Si a todos los valores de la variable se le suma una constante la varianza no se
modifica.


SE OBTIENE A
PARTIR DE LA
DEFINICION
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
4. Si todos los valores de la variable se multiplican por una constante la varianza queda
multiplicada por el cuadrado de dicha constante.




5. Si en una distribucin obtenemos una serie de subconjuntos disyuntos, la varianza de la
distribucin inicial se relaciona con la varianza de cada uno de los subconjuntos
mediante la expresin


En donde:

N
i
es el nmero de elementos del subconjunto
S

2
es la varianza de cada subconjunto

Cabe mencionar que para la varianza, las unidades son el cuadrado de las unidades de los
datos originales. Estas unidades no son intuitivamente claras o fciles de interpretar. Por
esta razn, tenemos que hacer un cambio significativo en la varianza para calcular una
medida til de la desviacin, que sea menos confusa. Esta medida se conoce como la
desviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar,
entonces, est en las mismas unidades que los datos originales.




2. DESVIACIN ESTNDAR (S si es muestral, si es poblacional)

Tambin recibe el nombre de desviacin tipo, desviacin tpica o desvo tpico. Como se
mencion anteriormente, la desviacin estndar de la poblacin (o de la muestra) es
simplemente la raz cuadrada de la varianza. Como la varianza es el promedio de las
distancias al cuadrado que van desde las observaciones a la media, la desviacin estndar
es la raz cuadrada del promedio de las distancias al cuadrado que van desde las
observaciones a la media. La desviacin estndar est en las mismas unidades que las que
se usaron para medir los datos.

UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
La desviacin estndar slo puede utilizarse en el caso de que las observaciones se hayan
medido con escalas de intervalos o razones.

A mayor valor de la desviacin estndar, mayor dispersin de los datos con respecto a su
media. Es un valor que representa los promedios de todas las diferencias individuales de las
observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se
entiende entonces que cuando este valor es ms pequeo, las diferencias de los valores
respecto a la media, es decir, los desvos, son menores y, por lo tanto, el grupo de
observaciones es ms homogneo que si el valor de la desviacin estndar fuera ms
grande. O sea que a menor dispersin mayor homogeneidad y a mayor dispersin, menor
homogeneidad.

3. COEFICIENTE DE VARIACIN (CV).

Es una medida que permite compara dispersiones de variables con diferente unidad de
medida o de diferentes poblaciones.

CV =
S
X

x 100

Criterio de interpretacin del CV:



VALOR CV MUESTRA
0 - 10% HOMOGNEA CONFIABLE
10 20%
TIENDE A
HOMOGNEA
SE ACEPTA
CON
RESERVA
> 2% HETEROGNEA
NO ES
CONFIABLE


TALLER

1. Consulte acerca del origen, historia y desarrollo de la estadstica.

2. Consulte acerca del operador sumatoria y sus propiedades ().


3. La revista Forbes (febrero de 1997) public las siguientes cifras acerca de las
condiciones y estilos de vida en varias ciudades norteamericanas:


UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO


a. Identifique los diferentes tipos de variables presentes.
b. Consulte qu son variables nominales y ordinales e identifquelas.
c. Determine la tendencia de cada variable utilizando la moda

4. Consulte hacer de qu es muestreo, razones para tomar una muestra, clases de
muestreo y criterios para seleccionar el tipo de muestreo.

5. Un laboratorio produce un antibitico que garantiza el control de como mnimo el 87%
de la poblacin de la bacteria Streptococcus aureum. El INVIMA mont en diciembre de
2004 en Bogot un ensayo para comprobar la calidad del medicamento haciendo una
prueba de campo con 100 pacientes y obtuvo los siguientes resultados de porcentaje de
control de la bacteria al final del tratamiento:

98 94 95 86 86 94 85 80 93 85
79 80 84 85 90 90 90 96 94 86
85 86 87 90 74 79 79 85 86 90
85 85 90 85 80 80 80 85 86 90
96 74 79 70 85 86 90 90 80 85
86 90 94 94 96 85 80 93 74 80
93 74 79 96 85 74 85 85 90 85
94 96 96 98 74 70 70 86 86 86
80 85 86 85 90 74 80 86 85 90
96 80 80 85 90 74 86 85 90 85


4.1 Determine qu tipo de variable es y por qu.
4.2 Elabore la tabla de distribucin de frecuencias y pngale el ttulo correspondiente
aplicando los parmetros tcnicos vistos en clase.
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
4.3 Elabore la grfica correspondiente para cada una de las cuatro frecuencias (absoluta,
absoluta acumulada, relativa y relativa acumulada) con su respectivo ttulo.
4.4 Indique cul es la moda en esta serie de datos e interprtela.
4.5 Calcule la media aritmtica aplicando la frmula para datos tabulados e interprtela
4.6 Calcule e interprete la varianza y la desviacin Standard e interprtelas.
4.7 Calcule el coeficiente de variacin y determine la confiabilidad de la media obtenida.
4.8 Con base en los resultados obtenidos de procesar la informacin, el INVIMA debera
autorizar la salida al mercado de este medicamento o impedirlo. Sustente su respuesta.
6. FEDEARROZ ha recibido en enero de 2005 la siguiente informacin acerca de la
productividad en Toneladas por hectrea de arroz de la variedad Oryzica 3 en los
principales departamentos productores:

DEPARTAMENTO REND. PROMEDIO
Tolima 7,8 Ton./H
Huila 7,5
Valle del Cauca 8,1
Meta 6,5
Casanare 6,0
Cesar 7,3
Crdoba 7,5
Cundinamarca 7,0
Sucre 7,3
Magdalena 6,8
Santander 5,8

5.1 Determine qu tipo de variable estadstica es y por qu.
5.2 Indique qu tipo de medida de posicin debe calcular para determinar el promedio
nacional de produccin de arroz Oryzica 3 a nivel nacional con la informacin disponible
y por qu debe usarla.
5.3 Calcule e interprete el promedio nacional de rendimiento de la variedad de arroz
Oryzica 3 e interprtelo.
5.4 Estime las medidas de dispersin que correspondan e interprtelas.
5.5 Se puede usar el coeficiente de variacin para determinar la confiabilidad del
promedio obtenido? Si es posible, calclelo e interprtelo.
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
7. El Vicepresidente Financiero de una Compaa de Bucaramanga est analizando las
variaciones en el IPC (ndice de Precios al Consumidor) durante los ltimos meses en
octubre de 2004 para hacer proyecciones sobre la variacin de sus costos de
produccin con base en el IPC publicado por el Gobierno y encuentra la siguiente
informacin mensual:

4,50 3,96 3,91 4,01 4,06 3,92 5,34 4,21
4,01 3,96 3,91 3,87 3,91 3,76 3,75 3,81
3,18 3,29 3,10 3,05 3,12 3,00 2,94 2,90
1,95 1,96 2,01 1,75 1,32 1,46 1,28 1,33
0,94 0,98 0,76 1,02 0,64 0,72 0,58 0,63
0,38 0,34 0,27 0,24 0,26 0,19 0,21 0,20


4,06 4,10 3,98 3,82 3,61 3,85 3,24
3,77 3,44 3,90 3,71 3,65 3,45 3,40
2,91 2,89 2,82 2,51 2,80 2,26 2,06
1,16 1,05 1,06 1,05 1,08 1,04 1,01
0,67 0,59 0,61 0,53 0,41 0,48 0,40
0,28 0,17 0,15 0,17 0,15 0,16 0,15

6.1 Elabore la tabla de distribucin de frecuencias correspondiente con su ttulo.
6.2 Grafique las 4 frecuencias bsicas.
6.3 Calcule la media aritmtica e interprete.
6.4 Calcule la media geomtrica y la tasa de crecimiento del IPC.
6.5 Proyecte el IPC ESPERADO a 6 meses y a 12 meses despus (teniendo en cuenta si
se trata de un crecimiento o de un decremento).
6.6 Calcule e interprete las medias de dispersin.
6.7 Seale si la tasa calculada es confiable o no y sustente su opinin.
8. CORMACARENA est realizando un estudio de biodiversidad forestal maderable en un
rea de 1,5 Km
2
en la Sierra de la Macarena, jurisdiccin del municipio de La Macarena
(Meta) en enero de 2005 y obtiene la siguiente informacin:

# ESPECIE
1 Cedro amargo
2 Flor morado
3 Cedro Rojo
4 Flor morado
5 Flor amarillo
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
6 Ocobo
7 Mo
8 Flor morado
9 Flor morado
10 Cedro amargo
11 Ocobo
12 Flor amarillo
13 Flor morado
14 Cedro amargo
15 Flor morado
16 Cedro rojo
17 Ocobo
18 Acacia
19 Cedro amargo
20 Acacia

7.1 Determine qu tipo de variable es y por qu.
7.2 Elabore la tabla de distribucin de frecuencias y pngale el ttulo correspondiente
aplicando los parmetros tcnicos vistos en clase.
7.3 Elabore la grfica correspondiente para cada una de las cuatro frecuencias (absoluta,
absoluta acumulada, relativa y relativa acumulada) con su respectivo ttulo.
7.4 Indique cul es la moda en esta serie de datos e interprtela.
7.5 Calcule la media aritmtica aplicando la frmula (si es posible) para datos tabulados e
interprtela
7.6 Calcule e interprete la varianza y la desviacin Standard (si es posible) e interprtelas.

8. En la revista Forbes, de mayo 24 de 1997 se publicaron las edades de los ejecutivos
diferentes empresas y se obtuvo la siguiente tabla:
UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO


8.1 Construya la distribucin de frecuencias correspondiente
8.2 Grafique las frecuencias (emplee EXCEL)
8.3 Calcule las medidas de tendencia central e interprtelas (EXCEL)
8.4 Calcule e interprete las medidas de dispersin (EXCEL)
8.5 Concluya acerca de la confiabilidad del estudio.

9. Consulte en qu consisten las medidas de posicin, explquelas y establezca qu
diferencia hay con respecto a las de tendencia central.

10. Janna Vice usa dos mquinas diferentes para fabricar papeleras para las
fotocopipadoras de Kodak y al evaluar las mquinas encuentra la siguiente informacin
en cuanto al tamao de las papeleras hechas por cada mquina:

Mquina 1: 12,2; 11,9; 11,8; 12,1; 11,9; 12,4; 11,3; 12,3 pulgadas
Mquina 2: 12,2; 11,9; 11,5; 12,1; 12,2; 11,9; 11,8 pulgadas

La empresa debe usar la mquina que presente mayor homogeneidad de tamao de las
papeleras, cul debera usar? (use EXCEL)

11. Resuelva en:
CIRO MARTNEZ, CAP 3 ejercicios 71, 74, 85, 88, 93
CAP 4 ejercicios 2, 5, 6, 8, 12, 14, 24, 27


UNIVERSIDAD DE LOS LLANOS
FACULTAD DE CIENCIAS HUMANAS
DEPARTAMENTO DE CIENCIAS BSICAS
ESTADSTICA DESCRIPTIVA

RECOPILADO POR ING. OSCAR BUENDIA PERDOMO
BIBLIOGRAFA CONSULTADA
Estadstica para Administracin y Economa
Levin
Prentice Hall
Estadstica y Muestreo
Ciro Martnez Bencardino
Ecoe Ediciones
Estadstica para Administracin y Economa
William Mendenhall & James Reinmuth
Grupo Editorial Iberoamrica
Probabilidad y Estadstica
George Canavos
Mc Graw Hil.
Estadstica aplicada a los negocios y a la economa
Allen Webster
Mc Graw Hill

Вам также может понравиться