Вы находитесь на странице: 1из 20

Apuntes de Estadstica Descriptiva. Prof.

Neftali Faundez
Estadstica Descriptiva Univariada
El trmino estadstica tiene tres acepciones gramaticales perfectamente definidas:
a) Estadstica, en su acepcin ms comn, no es ms que una coleccin de datos numricos
ordenados y clasificados segn un determinado criterio. os referimos a este significado cuando
!a"lamos de estadsticas de coti#aciones "urstiles, estadstica demogrficas, etc. $iene a ser
sinnimo del trmino serie estadstica, utili#adas como informacin.
") Estadstica, en una segunda acepcin, es la ciencia que, utili#ando como instrumento a las
matemticas y el clculo de pro"a"ilidades, estudia las leyes de comportamiento de aquellos
fenmenos que, no estando sometidos a leyes fsicas, dependen del a#ar. En una segunda fase
generali#a dic!as leyes y "asndose en ellas predice e infiere resultados. El trmino Estadstica
%atemtica &iene a ser el nom"re propio de esta acepcin.
c) Estadstica, finalmente, significa en su ltima acepcin la tcnica o el mtodo que se sigue para
recoger, organi#ar, resumir, presentar, anali#ar, generali#ar y contrastar los resultados de las
o"ser&aciones de los fenmenos reales.
En todo caso, la estadstica tiene por o"'eto el estudio de los colecti&os y de las relaciones que
e(isten entre ellos, entendiendo por colecti&o, po"lacin o uni&erso un con'unto grande de elementos
personas o cosas. )s, pues, la estadstica necesita de una masa de elementos para poder ser aplicada,
puesto que trata de !allar leyes de comportamiento del con'unto en general y no de cada uno de los
elementos en particular.
*a po"lacin puede ser, segn su tama+o, finita o infinita. Es po"lacin finita aquella que tiene un
nmero determinado, por grande que sea, de elementos, mientras que una po"lacin infinita es
aquella que tiene un nmero infinitos de elementos. Esta distincin tan slo e(iste en teora, pues, en
la prctica, no nos encontraremos nunca con po"laciones de infinitos elementos, sino, en todo caso
con po"laciones de un nmero grande de elementos.
,uando la po"lacin es muy grande, se !ar difcil la o"ser&acin de los caracteres a estudiar en cada
uno de los elementos, de"ido al enorme costo que acarreara la o"ser&acin de toda la po"lacin y
de"ido tam"in a la enorme capacidad de tra"a'o y al tiempo necesario para lle&ar a ca"o dic!a
o"ser&acin e(!austi&a. Estos incon&enientes pueden ser superados mediante la eleccin de una
muestra lo suficientemente representati&a de la po"lacin, entendiendo por muestra una parte del
con'unto total de elementos que componen la po"lacin.
-ado un con'unto de o"ser&aciones de una &aria"le . /po"lacin), la Estadstica -escripti&a estudia
procedimientos para sinteti#ar la informacin que contienen.
*os tipos de &aria"les a estudiar son:
a) $aria"le cualitati&a, es aquella que no toma &alores numricos y descri"en cualidades, las
o"ser&aciones no se pueden ordenar, solo se pueden clasificar y0o enumerar.
") $aria"le cuantitati&a discreta, es aquella que toma generalmente &alores enteros, pues pro&ienen
de conteos.
c) $aria"le cuantitati&a contina, es aquella que toma &alores dentro de un inter&alo de la recta real.
En resumen se tiene:
Continua
Cuantitativa
Discreta
Variable
Cualitativa
Ejemplos:
1. El nmero de accidentes que ocurren diariamente en una industria.
1
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
2. *itros de "encina para un autom&il.
3. 2emperatura registrada cada media !ora en una estacin meteorolgica.
*as &aria"les suelen denotarse por letras maysculas tales como: ., 3 , 4,..etc., mientras que los
&alores o"ser&ados de estas por letras minsculas, tales como: (, y, #,...etc.
Distribucin de frecuencia
*a toma de datos es la o"tencin de una coleccin de los mismos que no !an sido ordenados
numricamente.
5na ordenacin es la colocacin de los datos numricos tomados, en orden creciente o decreciente
de magnitud. *a diferencia entre el mayor y el menor de los nmeros se llama recorrido o rango de
los datos, es decir:
Rango !
"m#$ima%
& !
"mnima%
5na distri"ucin de frecuencias o ta"la de frecuencias es el agrupamiento u ordenacin de los datos
en clases o categoras con las frecuencias correspondientes a cada una6 donde la frecuencia de cada
clase es el nmero de o"ser&aciones que sta contiene.
*os datos ordenados y resumidos en una ta"la de frecuencias, se llaman datos agrupados.
Ejemplo 1.
*os resultados o"tenidos al o"ser&ar el estado de 78 artculos producidos una determinada mquina,
dio origen a la siguiente distri"ucin de frecuencias:
,lases 9recuencias /fi)
:ie#as )cepta"les ;8
:ie#as <ec!a#adas 1=
:ie#as -udosas =
2otal 78
Es claro que en este caso la &aria"le o"ser&ada es : . > estado de la pie#a, la que es una &aria"le
cualitati&a. :or otra parte, fi se conoce con el nom"re de frecuencia a"soluta.
Ejemplo 2.
:ara estimar la cantidad de madera disponi"le en una regin "oscosa, un propietario decide contar el
nmero de r"oles con dimetro mayor que ?8 centmetros en reas cuadradas de 1= ( 1= metros
seleccionados al a#ar6 para ello, se seleccionaron al a#ar @= cuadrados de 1= ( 1= en la regin,
o"ser&ndose el nmero de r"oles /con dimetros mayores que ?8 cm.) en cada uno de ellos. *os
datos son los siguientes:
A 18 7 ; 7
B B B 7 ;
? B 7 A B
18 C = 18 @
A 7 A 7 ;
En este caso, la distri"ucin de frecuencias es :
'lases
!i
fi (i fri ) (ri)
@ 1 1 C C
? 1 @ C 7
C 1 ? C 1@
@
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
= 1 C C 1;
* 3 + 12 2,
A C 11 1; 8.CC
7 ; 1A @C 8.;7
B = @@ @8 8.77
18 ? @= 1@ 1.88
-otal 2. 1.//
0ota:
9i , se llama frecuencia acumulada a la iDsima clase6 fri >
i
f
n
, se llama la frecuencia relati&a de la iD
sima clase y se suele representar en porcenta'e. )s, por e'emplo la frecuencia relati&a de la quinta
clase es 8.1@ lo que indica que el 1@E de los @= cuadrados seleccionados tienen ; r"oles con un
dimetro mayor de ?8 cm6 9ri , se llama frecuencia relati&a acumulada a la iDsima clase.
:or otra parte, cuando el nmero de &alores posi"les de una &aria"le discreta o continua sea grande,
con&iene agrupar los datos en Fnter&alos de ,lases.
:ara ilustrar como se reali#a este tipo de agrupamiento consideramos el siguiente e'emplo:
Ejemplo.
*os siguientes datos son los lapsos, en minutos, necesarios para que =8 clientes de un Ganco
,omercial lle&en a ca"o una transaccin "ancaria:
@.? 8.@ @.B 8.C @.7 @.C C.; ?.7 1.=
@.C C.C =.7 @.7 ?.? 8.C 1.? 1.1 =.=
?.? B.A @.= =.; B.= C.@ 1.@ 8.= ;.7
1.7 C.A 8.A ;.@ 1.@ ;.? A.; 1.C 8.=
A.7 8.7 8.B 8.C 1.? @.A ?.C =.= 1.C
?.1 ?.A A.@ 1.; 1.B
1. He de"e determinar el rango de la &aria"le, que est dado por:
Rango !"n% & !"1% 1.+ & /.2 1..
2. He determina el nmero de clases a ser utili#ados. 5na forma de determinarlo, es usando la <egla
de Hturge, es decir, I > 1 J ?.? log/n). En este caso se tiene que I > ;.;, es decir, podramos elegir ;
A clases. 2omemos K > ; clases.
0ota.
Lo descrito en el punto 2, es un criterio para la deterinaci!n del n"ero de clases, sin
ebar#o, podra tabi$n ser considerado %&'.
3. 5na &e# determinado el nmero de clases, se de"e determinar la amplitud que de"e tener cada
inter&alo o clase.
A
R
K
= = 1=7? 1; . .
2. He seleccionan a!ora los lmites de clases que definen los inter&alos, de manera que los inter&alos
tengan la misma amplitud.
(ronteras fi 3c fr) (i (r) 3c4fi
L8.1= D 1.A=) 17 8.B= ?; 17 ?; 1A,1
L1.A= D ?.?=) 1? @.== @; ?1 ;@ ??,1=
L?.?= D C.B=) A C.1= 1C ?7 A; @B,8=
LC.B= D ;.==) ; =.A= 1@ CC 77 ?C,=
?
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
L;.;= D 7.1=) C A.?= 7 C7 B; @B,C
L7.1= D B.A=M @ 7.B= C =8 188 1A,B
-otal =8 1A1,1
N"s. : mi se conoce con el nom"re de marca de clase y se o"tiene sumando las fronteras y di&idiendo
por @. *os inter&alos de clase se conocen con el nom"re de lmites aparentes y las fronteras con el
nom"re de lmites reales.
'onstruccin de 5r#ficos
O ,on frecuencia se dice que una imagen equi&ale a mil pala"ras. ,iertamente, los especialistas en
estadstica !an utili#ado tcnicas grficas para descri"ir en forma ms &&ida con'untos de datos. -e
!ec!o los !istogramas y los polgonos se utili#an para descri"ir datos cuantitati&os que se !an
agrupado en distri"uciones de frecuencia, de frecuencia relati&a o porcenta'es O.
,uando se trata de &aria"les cualitati&as generalmente se usa el grfico de "arras y el grfico circular
/a&eriguar como se construye)6 cuando se tra"a'a con &aria"les cuantitati&as discretas se utili#a el
grfico de lneas /a&eriguar como se construye), y, cuano se est con &aria"les cuantitati&as continuas
se tra"a'a con el !istograma, el polgono de frecuencia y la o'i&a, los que se descri"en a continuacin:

678-95R:3:
El !istograma nos permite representar datos de mediciones que corresponden a &aria"les aleatorias.
*os datos se di&iden en inter&alos de clases y la longitud de cada inter&alo se considera como el
anc!o de un rectngulo cuya altura es proporcional a la frecuencia del inter&alo.
;<ara =u> sirve?
:ermite determinar si los datos tienen una distri"ucin simtrica o asimtrica, y, en algunos, si son
unimodales, "imodales o multimodales.
*os e(tremos del inter&alo se conocen con el nom"re de colas que pueden ser cortas, medianas o
largas.
'onstruccin
,onsideremos el e'emplo desarrollado en clases:
5na &e# agrupados los datos en una ta"la de frecuencia, se u"ica so"re el e'e !ori#ontal los &alores
correspondientes a los lmites reales de cada clase, a continuacin, so"re el e'e &ertical se u"ican las
frecuencias como se muestra en la siguiente figura.
17
1?
A
;
C
C
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
@

8.1= 1.A= ?.?= C.B= ;.== 7.1= B.A=
0otas
1. 5na alternati&a para o"tener !istogramas es u"icar so"re el e'e &ertical en lugar de la frecuencia
a"soluta, a la frecuencia relati&a el que reci"e el nom"re de !istograma de frecuencia relati&a, o
"ien las frecuencias acumuladas el cual reci"e el nom"re de !istograma de frecuencia acumulada6
al mismo tiempo es posi"le o"tener !istogramas de frecuencias relati&as porcentuales e
!istogramas de frecuencias acumuladas porcentuales.
@. Ntra alternati&a es utili#ar las marcas de clase so"re el e'e !ori#ontal en lugar de los lmites reales
o fronteras.
Ejercicio:
,onsiderando el e'emplo &isto en clases graficar:
1.D El !istograma de frecuencia relati&a.
@.D El !istograma de frecuencia acumulada considerando en el e'e !ori#ontal a las marcas de clase.
<9@75909 DE (RE'UE0'7:
El polgono de frecuencia est formado por los segmentos que unen las frecuencias asociadas a las
marcas de clase de los rectngulos del !istograma. :ara el e'emplo anterior , el polgono de
frecuencia correspondiente es :
17
1?
A
;
C
@

&/.*. 8.1= 1.A= ?.?= C.B= ;.== 7.1= B.A= 1/...
donde P es la frecuencia asociada a la respecti&a marca de clase. :uesto que el rea encerrada "a'o la
cur&a de"e representar el 188 E de la informacin, es necesario conectar los puntos medios primero
y ltimo con el e'e !ori#ontal, para a"arcar el rea total de la distri"ucin o"ser&ada.
Esto se logra conectando el primer punto medio o"ser&ado con el punto medio de una clase llamada
Oprimera clase ficticiaO que tiene 8 o"ser&aciones y conectando el ltimo punto medio o"ser&ado con
el punto medio de una clase llamada Osegunda clase ficticiaO que tiene 8 o"ser&aciones. Estas marcas
de clase siempre de"en ser mostradas en el polgono de frecuencias.
; <ara =u> sirve ?
*os polgonos de frecuencias proporcionan una til ayuda &isual para comparar dos o ms con'untos
de datos /compara"les entre s).
9A7B:
=
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
:ara construir una o'i&a, se grafican so"re el e'e !ori#ontal nica y e(clusi&amente los lmites reales
de las clases o fronteras y so"re el e'e &ertical las frecuencias acumuladas /o "ien las frecuencias
relati&as porcentuales acumuladas cuyo nom"re es o'i&a porcentual).
=8 P
C7 P
CC P
?7 P
?1 P

17 P

8.1= 1.A= ?.?= C.B= ;.== 7.1= B.A= *mites <eales
En este caso podemos interpretar la o'i&a de la siguiente forma:

,uotas anuales mero de personas

%enor que 8.1= 8
%enor que 1.A= 17
%enor que ?.?= ?1
3enor =ue 2.1. 3,
%enor que ;.== CC
%enor que 7.1= C7
%enor que B.A= =8

El nmero de personas que demoran a lo ms C.B= minutos en sus transacciones comerciales es de
17.
;
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
Estadgrafos de -endencia 'entral C Bariabilidad
Qasta aqu nos !emos preocupado de la distri"ucin de un con'unto de datos, ya sea grficamente o
por medio de una distri"ucin de frecuencias. E(isten dos medidas de inters para cualquier con'unto
de datos: *a locali#acin de su centro y su &aria"ilidad. *a tendencia central de un con'unto de datos
es la disposicin de estos &alores para agruparse ya sea al rededor del centro o de ciertos &alores
numricos. *a &aria"ilidad de un con'unto por otro lado, es la dispersin de las o"ser&aciones en el
con'unto de datos.
3edidas de -endencia 'entral
E(isten principalmente tres medidas de tendencia central: La (edia, La (oda ) La (ediana.
a) *a %edia )ritmtica de un con'unto de nDo"ser&aciones se o"tiene sumando todos los &alores del
con'unto y di&idiendo por n. Esta cantidad se suele llamar simplemente la media y se designa por
x
. Esto es:
x
x
n
i
i
n
=

=1
Hi los datos estn agrupados en una distri"ucin de frecuencias se tiene que el promedio o media se
calcula de la siguiente manera:
x
f m
n
i i
i
K
=

=1
donde fi corresponde a la frecuencia a"soluta de la iDsima clase y mi su respecti&a marca de clase.
") *a %ediana de un con'unto de datos, es el &alor para el cual todas las o"ser&aciones se ordenan
de manera creciente, la mitad de stas es menor que este &alor y la otra mitad es mayor. Hi el
nmero de o"ser&aciones en el con'unto es impar, la mediana es el &alor de la o"ser&acin que se
encuentra en la mitad del con'unto ordenado. Hi el nmero es par se considera la mediana como el
promedio aritmtico de los &alores de las dos o"ser&aciones centrales pre&ia ordenacin de los
datos.
:uesto que la %ediana es un &alor que se "asa en la secuencia ordenada de las o"ser&aciones en un
con'unto de datos, es necesario sa"er que la e(istencia de algunos &alores e(tremos no afectar su
&alor. :or lo tanto, si un con'unto de datos contiene unos cuantos &alores e(tremos y un nmero
muy alto de o"ser&aciones, la mediana puede ser una medida de tendencia central muc!o ms
adecuada
que la media. Reneralmente los con'untos de datos que descri"en informacin acerca de ingresos
caen en esta categora.
:ara datos agrupados, la mediana es aquel &alor que di&ide en dos partes iguales la distri"ucin de
frecuencia relati&a y se calcula de la siguiente forma:
Med LRI
n
F
f
A
k
k
k
= +

@
1
P
donde:
*<FK : *mite real inferior de la clase mediana / la clase que contiene a la mediana).
n : mero total de o"ser&aciones.
A
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
fK : 9recuencia a"soluta de la clase que contiene a la mediana.
9KD1 : 9recuencia acumulada a la clase anterior a la clase que contiene a la mediana.
) : )mplitud de la clase que contiene a la mediana.
c) *a moda de un con'unto de o"ser&aciones es el &alor de la o"ser&acin que ocurre con mayor
frecuencia en el con'unto. *a moda muestra !acia que &alor tienden los datos a agruparse. En
con'untos relati&amente peque+os, puede ocurrir que no e(ista un par de o"ser&aciones cuyo &alor
sea el mismo. En esta situacin no es clara la definicin de moda. 2am"in puede suceder que la
frecuencia ms alta se encuentre compartida por dos o ms o"ser&aciones. En estos casos la moda
tiene una utilidad limitada como medida de tendencia central.
:ara datos agrupados la moda se calcula de la siguiente forma:
Mod LRI
a
a b
A
k
= +
+

P
donde:
*<FK : *mite real inferior de la clase modal /clase que contiene a la moda).
a : E(ceso de la frecuencia modal so"re la frecuencia de la clase contigua inferior.
" : E(ceso de la frecuencia modal so"re la frecuencia de la clase contigua superior.
) : )mplitud de la clase que contiene a la moda.
3edidas de Dispersin
Dentro de las medidas de dispersin ms utilizadas estn: el rango des!rito anteriormente"# la
$arianza# la des$ia!in estndar % el !oefi!iente de $aria!in# las &ue se des!riben a !ontinua!in:
@a BarianDa
*a &arian#a de las o"ser&aciones (1, (@, (?, ..., (n es, en esencia, el promedio del cuadrado de las
distancias entre cada o"ser&acin y la media del con'unto de o"ser&aciones. *a &arian#a se denota
por sS y est dada por:
a) :ara datos no agrupados.
s
x x
n
i
i
n
@
@
1
=

=
/ )

") :ara datos agrupados.
s
f m x
n
i i
i
k
@
@
1
=

=
/ )

Hin em"argo, e(iste una forma alternati&a que da una medicin an ms precisa de la estimacin de la
&arian#a po"lacional tanto para los datos agrupados como para los no agrupados, llamada &arian#a
de ,oc!ran.
a) :ara datos no agrupados.
s
x x
n
i
i
n
@
@
1
1
=

=
/ )

") :ara datos agrupados.
7
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
s
f m x
n
i i
i
k
@
@
1
1
=

=
/ )

*a &arian#a es una medida ra#ona"lemente "uena de la &aria"ilidad de"ido a que si muc!as de las
diferencias son grandes /o peque+as) entonces el &alor de la &arian#a sS ser grande /o peque+o).
El &alor de la &arian#a puede sufrir un cam"io muy desproporcionado, an ms que la media, por la
e(istencia de algunos &alores e(tremos del con'unto.
*a ra# cuadrada de la &arian#a reci"e el nom"re de desviacin est#ndar y la denotamos por s.
*a &arian#a y la des&iacin estndar no son medidas de &aria"ilidad distintas, de"ido a que esta
ltima no puede determinarse a menos que se cono#ca la primera. ) menudo se prefiere la des&iacin
estndar en relacin a la &arian#a, porque se e(presa en las mismas unidades fsicas que las
o"ser&aciones /es decir, puede ser interpretada en trminos fsicos).
Es importante destacar que e(isten otras medidas de &aria"ilidad que estn "asadas en el &alor
a"soluto de las diferencias entre las o"ser&aciones (1, (@,..., (n y la media o la mediana, dependiendo
de cual de las dos se emplee como medida de tendencia central, en estas otras medidas se encuentra
el llamado coeficiente de &ariacin /,$) que se descri"e a continuacin.
B
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
'oeficiente de Bariacin
Es otra medida de &aria"ilidad y permite comparar el grado de dispersin entre dos o ms
distri"uciones e(presadas en distintas unidades de medida. El coeficiente de &ariacin se denota por
,$ y se o"tiene de la siguiente forma:
'(
s
x
= P188
0ota.
)sta defini!in es $lida tanto para los datos agrupados !omo para los no agrupados.
El ,$ es independiente de las unidades de medidas utili#adas y es e(presado generalmente en
porcenta'e. 5n incon&eniente de este coeficiente, es que de'a de ser til cuando la media /o
promedio) tiende a cero.
9bservaciones
1. En general, es difcil dar una interpretacin precisa de los &alores de la &arian#a y de la des&iacin
estndar, puesto que la &aria"ilidad depende muc!o de la unidad de medida. En todos los casos,
cuando crece la dispersin de una po"lacin, tam"in crece el &alor de sS y s. :or otra parte, si
sS>s>8, significa que no e(iste &aria"ilidad entre los datos, todos los &alores de la &aria"le son
iguales entre s, es decir, ( es una constante.
@. 5na regla prctica que a menudo proporciona una "uena apro(imacin al grado de dispersin de
un con'unto de o"ser&aciones, esta"lece que: O)lrededor de un ;7E de todos los &alores caern
dentro de una des&iacin estndar a am"os lados de la media, apro(imadamente un B=E de todos
los &alores caern dentro de dos des&iaciones estndar a am"os lados de la media y un BBE caern
dentro de tres des&iaciones estndar a am"os lados de la media.O
Esta regla prctica se "asa en la suposicin de que la po"lacin tiene una distri"ucin simtrica o
apro(imadamente simtrica de forma acampanada conocida como la distri"ucin normal.
?. Hi la mayor parte de los &alores estn a la derec!a /i#quierda) de la moda, se dice que la
distri"ucin est sesgada a la derec!a /i#quierda) o que tiene sesgo positi&o /negati&o), y en tal
caso se tiene que:
Mod Med x < <
, /sesgo positi&o)
Mod Med x > >
, /sesgo negati&o)
C.D Hi el o"'eti&o es recomendar una medida de centrali#acin para descri"ir adecuadamente a un
con'unto de datos, el criterio es el siguiente:

*i x s enton!es x es la me+or medida
*i x s enton!es la mediana es la me+or medida


>
<
@
@
, .
, .
9tras 3edidas Descriptivas "de <osicin%
,ada una de las medidas descritas !asta aqu, consisten en un nmero que descri"e cierta
caracterstica de una &aria"le .. Hin em"argo, en algunas circunstancias puede ser ms til utili#ar
ms de un nmero para e(poner un con'unto de datos. :or e'emplo, Huponga que una persona est
encargada de conseguir personal para una compa+a y est de &isita en cierta 5ni&ersidad, esta
persona est no slo interesada en el promedio o mediana de los alumnos de ltimo a+o, sino que
adems le interesa el promedio de los alumnos de ltimo a+o que estn en el 18E o en el @8E
superior de su clase, y as sucesi&amente.
18
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
:ara una clasificacin an muc!o ms precisa es que se utili#an los llamados cuartiles, deciles y
percentiles, que se descri"en a continuacin:
'uartiles
*os cuartiles de un con'unto de datos ordenados son aquellos nmeros que di&iden a ste, en cuatro
partes porcentualmente iguales. El primer cuartil T1, es el &alor en el cual o por de"a'o del cual queda
un @=E de todos los &alores de los datos, el segundo cuartil T@, es precisamente la mediana, pues es
el &alor que de'a a su i#quierda el =8E de los datos y a su derec!a el otro =8E y, el tercer cuartil T?,
es el &alor en el cual o por de"a'o del cual queda un A=E de los datos.
:ara los datos agrupados los cuartiles se o"tienen de la siguiente forma:
, LRI
k
n
F
f
A k
k k
k
k
= +

C
1 @ ?
1
P , , ,

donde
*<FK : *mite real inferior /o frontera inferior) de la clase que contiene al KD simo cuartil.
: mero de datos.
9KD1 : 9recuencia acumulada !asta la clase anterior a la clase que contiene al KDsimo cuartil.
fK : 9recuencia a"soluta de la clase del KDsimo cuartil.
) : 2ama+o o amplitud de la clase del KDsimo cuartil.
Deciles
*os deciles son ciertos nmeros que di&iden al con'unto de datos ordenados en die# partes
porcentualmente iguales. *os deciles se denotan por -1, -@, ..., -B y se leen primer decil, segundo
decil, etc.
:ara los datos agrupados los deciles se o"tienen de la siguiente forma:
D LRI
k
n
F
f
A k
k k
k
k
= +

18
1 B
1
P , ,...,
donde
*<FK : *mite real inferior /o frontera inferior) de la clase que contiene al KD simo decil.
n : mero de datos.
9KD1 : 9recuencia acumulada !asta la clase anterior a la clase que contiene al KDsimo decil.
fK : 9recuencia a"soluta de la clase del KDsimo decil.
) : 2ama+o o amplitud de la clase del KDsimo decil.
<ercentiles
*os percentiles son, tal &e#, las medidas ms utili#adas para proporcionar sitios de u"icacin o
clasificacin de personas cuando se atienden caractersticas tales como: peso, estatura, etc.
*os percentiles di&iden al con'unto de datos en cien partes porcentualmente iguales.
:ara los datos agrupados los percentiles se o"tienen de la siguiente forma:
11
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
- LRI
k
n
F
f
A k
k k
k
k
= +

188
1 BB
1
P , ,..,
donde
*<FK : *mite real inferior /o frontera inferior) de la clase que contiene al KD simo percentil.
n : mero de datos.
9KD1 : 9recuencia acumulada !asta la clase anterior a la clase que contiene al KDsimo percentil.
fK : 9recuencia a"soluta de la clase del KDsimo percentil.
) : 2ama+o o amplitud de la clase del KDsimo percentil.
3edidas de :simetra
) continuacin se presentan algunas medidas de asimetra o de deformacin. *a deformacin
consiste, en anali#ar la simetra /o asimetra) de las distri"uciones respecto de la -istri"ucin ormal.
1.& 5na distri"ucin unimodal es simtrica si y slo si: f1 > fK, f@ > fKD1, f? > fKD@, ..., etc.
2.& En el caso de una distri"ucin simtrica y unimodal se cumple la siguiente relacin:
%edia > %ediana > %oda
3.& 5na distri"ucin se dice asimtrica, si no es simtrica.
)lgunos estadsticos de )simetra o coeficientes de asimetra ms usados son:
1.& :rimer coeficiente de asimetra, )H1 y se o"tiene de la siguiente manera:
A*
x Mod
s
1
=

2.& Hegundo coeficiente de asimetra, )H@ y se o"tiene de la siguiente manera:
A*
x Med
s
@
?
=
/ )
3.& ,oeficiente cuartil de deformacin, )s.
A
, , ,
, ,
s
=
+

? @ 1
? 1
@
*os dos primeros coeficientes fueron propuestos por Iarl :earson y el tercero por ). Goeley.
Hegn el &alor que se o"tenga para estos coeficientes, podemos o"tener:
1.& o e(istencia de )simetra si %edia > %ediana > %oda /los coeficientes sumen el &alor cero).
2.& E(istencia de asimetra positi&a /los coeficientes son mayores que cero), lo que indica que la
distri"ucin de la &aria"le tiende !acia los &alores ms grandes que ella puede asumir.
3.& E(istencia de asimetra negati&a /los coeficientes son menores que cero), lo que indica que la
distri"ucin de la &aria"le tiende !acia los &alores ms peque+os que esta puede asumir.
1@
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
Ejemplo.
-e acuerdo con la re&ista Fnformacin al ,onsumidor en su nmero de fe"rero de 1BBB, las
cuotas anuales de C8 compa+as para un seguro de ? millones de pesos para !om"res de ?= a+os de
edad son las siguientes /en miles de pesos):
7@ 7= 7; 7A 7A 7B 7B B8 B1 B1
B@ B? BC B= B= B= B= B= BA B7
BB BB 188 188 181 181 18? 18? 18? 18C
18= 18= 18; 18A 18A 18A 18B 118 118 111
<ealice un estudio completo de la informacin anterior. El estudio de"e contener los siguientes
puntos.
1. <econocimiento, clasificacin de la &aria"le en estudio y unidad o"ser&a"le.
@. 2a"la de distri"ucin de frecuencia. Uustifique.
?. ,lculo de las medidas de tendencia central y su correspondiente interpretacin.
C. ,lculo de las medidas de dispersin.
=. Estudio de simetra de los datos y comente el sesgo de ellos /si e(iste).
;. Eleccin de la me'or medida de tendencia central.
A. -eterminar T1 , T? , -B y :C= e interprtelos de manera adecuada.
7. Qistograma, polgono de frecuencia y o'i&a.
Desarrollo.
1. *a &aria"le en estudio es :
.> $alor de una cuota anual que de"e pagar un !om"re de ?= a+os para un seguro de ?
millones de pesos.
. es una &aria"le cuantitati&a discreta. *a unidad o"ser&a"le es pesos.
@. a) El rango de la &aria"le, est dado por R !"n% & !"1% 111 & ,2 21.
") El nmero de clases es I>1 J ?.?log/C8) > ;.@7, es decir, E *.
c) *a amplitud es
A = =
@B
;
C7? =8 . .
.
d) 9inalmente la ta"la de distri"ucin de frecuencia es:
*mites de
clase
*mites <eales
o 9ronteras
fi mi 9i fri 9ri fiPmi
7@ D 7; 71.= D 7;.= ? 7C ? ?0C8 ?0C8 @=@
7A D B1 7;.= D B1.= A 7B 18 A0C8 180C8 ;@?
B@ D B; B1.= D B;.= 7 BC 17 70C8 170C8 A=@
BA D 181 B;.= D 181.= 7 BB @; 70C8 @;0C8 AB@
181 D 18; 181.= D 18;.= A 18C ?? A0C8 ??0C8 A@7
18A D 111 18;.= D 111.= A 18B C8 A0C8 1.88 A;?
2otal C8 1.88 311/
?. a) *a media es
x =
+ +
=
7C ? 18B A
C8
BA A=
P ... P
.
, es decir, las cuotas anuales que cancelan en
promedio las C8 compa+as es de VBAA=8 / o "ien las cuarenta compa+as pagan en promedio VBAA=8
al a+o)
") *a clase mediana se o"tiene o"ser&ando la columna de 9i , y ser aquella clase que
contenga !asta n 0 @ o"ser&aciones. En el e'emplo, la mediana se encuentra en la cuarta clase, luego
se tiene que
Med = +

= B;=
@8 17
7
= BA A= . P .
)s, se tiene que el =8E de las compa+as paga menos de VBAA=8 como cuota anual del seguro y el
otro =8E, paga ms de VBAA=8.
1?
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
c) *a clase modal se o"tiene o"ser&ando la columna de fi , y ser aquella que alcance el &alor
de fi ms alto. En el e'emplo se tienen dos clases con las frecuencias ms altas /la tercera y cuarta
clase) por lo que el clculo se de"e reali#ar dos &eces.
Mod
1
B1=
1
1 8
= B;= = +
+
= . P .
Mod
@
B;=
8
8 1
= B;= = +
+
= . P .
,omo es posi"le o"ser&ar a partir del clculo de las dos clases anteriores, e(iste un nico &alor para
la moda por lo que se dice que el con'unto es unimodal.
Este &alor indica que las cuarenta compa+as coinciden en el pago anual de la cuota que alcan#a un
&alor de VB;=88.
C. a) El &alor de las &arian#a es dado por
s
@
;1@1AB = .
y el de la des&iacin estndar es +.,22 .
") El coeficiente de &ariacin es en este caso ,$ > 7E.
7. a) Qistograma
fi
7
A
;
=
C
?
71.= 7;.= B1.= B;.= 181.= 18;.= 111.= *mites <eales
") :olgono de 9recuencia
fi
1C
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
7
A
;
=
C
?
a 71.= 7;.= B1.= B;.= 181.= 18;.= 111.= " *mites <eales
donde a > 7C D = > AB y " > 18B J = > 11C.
c) N'i&a
9i
C8 P
?? P
@; P
17 P
18 P

? P

71.= 7;.= B1.= B;.= 181.= 18;.= 111.= *mites <eales
1=
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
Ejercicios
1.D Huponga que 5d. tiene un mapa de todos los pases del mundo que entregan informacin
detallada de los aspectos que se mencionan a continuacin:
a) mero de !a"itantes de cada pas.
") )rea de cada pas.
c) ,ontinente en que se encuentra cada pas.
d) 2ama+o de la ciudad: menos de medio milln, entre medio milln y un milln de !a"itantes,
entre un milln y cinco millones, ms de cinco millones de !a"itantes.
e) om"re de la capital.
<econo#ca y clasifique cada &aria"le en estudio.
@.D Fndicar en cada caso la &aria"le y el tipo de escala:
a) Estudiantes matriculados en un Fnstituto :rofesional en un nmero de a+os.
") Estado ci&il.
c) Estatura de ni+os de Iinder.
d) i&el HocioDEconmico.
e) mero de pulsaciones por minuto.
?.D En un da determinado nacieron @@ "e"s en el Qospital <egional de ,oncepcin. Hus pesos en
Kilos fueron:
?.= C.8 C.8 ?.8 ?.8 C.8 @.= @.= =.= C.= C.8
@.8 @.? @.A ?.? C.? ?.A ?.7 ?.@ ?.1 ?.8 ?.7
a) Fndique la &aria"le en estudio.
") ,onstruya una ta"la de distri"ucin de frecuencia para estos datos.
c) -etermine e interprete: media, des&iacin estndar, T1, T?, -B y :=8.
d) Rrafique el !istograma, el polgono de frecuencia y la o'i&a.
C.D *os siguientes datos son los lapsos, en minutos, necesarios para que =8 clientes de un Ganco
,omercial lle&en a ca"o una transaccin "ancaria:
@.? 8.@ @.B 8.C @.7
@.C C.C =.7 @.7 ?.?
?.? B.A @.= =.; B.=
1.7 C.A 8.A ;.@ 1.@
A.7 8.7 8.B 8.C 1.?
?.1 ?.A A.@ 1.; 1.B
@.C C.; ?.7 1.= @.A
8.C 1.? 1.1 =.= ?.C
C.@ 1.@ 8.= ;.7 =.=
;.? A.; 1.C 8.= 1.C
a) -etermine la media, mediana, moda, des&iacin estndar y coeficiente de &ariacin para el
con'unto de datos no agrupados.
") Esta"le#ca un esquema de agrupamiento adecuado para este con'unto de datos.
c) <epita /a) pero considerando los datos agrupados.
d) Fnterprete la media y des&iacin estndar para los datos agrupados.
e) WTu medida de centrali#acin recomendara 5d. para este con'unto de datosX Uustifique su
respuesta.
f) ,onsiderando los datos agrupados. WTu porcenta'e de datos est dentro de @s con
respecto a la mediaX
=.D ) continuacin se presentan ? con'untos de datos:
1;
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
i) 1, @, ?, C, =, ;6 ii) 1, 1, 1, ;, ;, ;6 iii) D1?, @, ?, C, =, @8.
,alcule la media y &arian#a para cada con'unto. WTu puede concluir respecto de estos
resultadosX
;.D He !a efectuado la siguiente informacin de una ta"la de frecuencia con seis inter&alos de
amplitud constante:
i 9ronteras %arca de clase frec. a"s. frec. )cumulada f. rel. f. rel. )cum.
1 8.= D 1B.= A
@ @B B0188
? ?;
C ?=
= 7B0188
; D 11C.=
a) ,omplete la ta"la 'ustificando cada paso.
") ,onstruya el !istograma y la o'i&a.
c) ,alcule e interprete T1, T@, T?, -1 y -B y :B8.
A.D Huponga que se est in&estigando la rapide# para efectuar una manio"ra y su relacin con el
se(o de la persona en cierta compa+a. *os datos recopilados fueron resumidos en la siguiente
ta"la:
2iempo /en %inutos) 9recuencia
de %u'eres
9recuencias
de Qom"res
1 D = 1= 1=
= D 7 1= @8
7 D 1@ A 18
1@ D @8 ? 1=
W,ul de los dos grupos tiene un comportamiento ms !omogneo con respecto a la rapide#X
Uustifique usando medidas adecuadas.
7.D El Uefe de -epartamento de :ersonal de cierta empresa, resumi en la grfica ad'unta, los
sueldos lquidos de sus 1@8 funcionarios administrati&os:
Rrfico
Hueldo lquido
/por V 18.888)

8 @ C ; 7 18 1@ Hueldo lquido
a) <econo#ca y clasifique la &aria"le en estudio y la unidad o"ser&a"le.
") ,onstruya una ta"la de distri"ucin de frecuencias a partir del grfico.
c) ,alcule %edia, %ediana, %oda y des&iacin estndar e interprtelos.
d) ,onstruya una o'i&a.
e) WTu porcenta'e de funcionarios reci"ieron un sueldo lquido inferior a C= /V C=.888)
f) WTu porcenta'e de la informacin est dentro de @s con respecto a la mediaX
1A
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
B.D ,onsidere la siguiente informacin relacionada con el nmero de personas que ganan cierto
sueldo "ruto mensual /en miles de pesos).
*mites reales fi %i %i fi 9i 9i 0

fi 0
n
18
(
18
@x 17 J ?x
18 ==
B
1@
78 1?
2otales
*a persona encargada de tomar los datos, sufri un accidente en su !o'a de registros, por lo cual
se le pide a 5d. que complete la ta"la anterior sa"iendo que x > =?.A=, para que responda las
siguientes preguntas:
a) Rrfique el !istograma y el polgono de frecuencia.
") W,ul es el sueldo promedio que reci"en las personas mensualmenteX
c) WTu porcenta'e de personas reci"en ms de V A=.888.D pero menos de V7=.888.DX
d) -etermine el &alor del tercer cuartil e interprete de manera adecuada.
e) WTu medida de centrali#acin recomendara 5d. para este con'unto de datosX
Uustifique su respuesta.
f) WEs este con'unto de datos unimodalX
18.D *os siguientes datos representan el nmero de interrupciones por da de tra"a'o, de"ido a fallas
mecnicas en una planta procesadora de alimentos: =, A, 1, @, C.
a) -efina y clasifique la &aria"le en estudio.
") N"tenga la mediana e interprtela.
c) W,ul es la modaX
d) ,alcule la media aritmtica.
e) ,alcule la &arian#a y des&iacin estndar. Fnterprete.
11.D *as siguientes mediciones del peso /en gramos) !an sido registradas para A8 ratas de ?1 das de
ra#a comn.
a) Esta"le#ca un esquema de agrupamiento adecuado a los datos.
") Rrafique el !istograma. WTu puede decir de la simetra de los datosX
c) WTu medida de centrali#acin recomendara 5d.X
d) WEstn los datos sesgados a la derec!aX
e) WEs el con'unto de datos no agrupados "imodalX
f) N"tenga T@, -= y :=8 W,mo son estos &aloresX
g) <econo#ca y clasifique la &aria"le en estudio. W,ul es la unidad o"ser&a"leX
18@ 1@8 11; BC 1@8 11@ 11@ 18;
1@@ 11; B7 11; 11C 1@8 1@C 11@
1@8 18; 1@@ 1@C 11@ 117 1@7 187
1?8 18; 18@ 1C8 18@ 1@@ 11@ 118
118 187 118 11; 117 117 187 18@
18C 1@@ 11@ 11; 118 11@ 117 B7
B7 187 118 18@ 118 1@8 1@; 11C
117 11@ 118 7C 118 18; 11@ 11C
18C 11@ 1@8 18; 11; 188
1@.D *a distri"ucin de frecuencia del nmero de &idas perdidas anualmente en los principales
tornados en los Estados 5nidos entre 1B88 y 1BA? aparecen a continuacin /&er ta"la en la
siguiente !o'a).
a) Rrafique el !istograma de frecuencia relati&a.
") ,omente so"re la forma de la distri"ucin.
17
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
c) WTu medida de centrali#acin recomendara 5d. para esta informacinX
d) N"tenga -?, -= y -B e interprtelos.
mero de %uertes 9rec. )"soluta
@C
7
@= D CB 1;
=8 D AC 1;
A= D BB 11
188 D 1CB ;
1=8 D 1BB @
@88 D @CB C
@=8
1
1?.DEn el centro de ,omputacin de la uni&ersidad, se registr el nmero diario de detenciones del
computador de"ido a errores de la mquina, por un perodo de ;@ das y se o"tu&ieron los
siguientes datos:
8
8 @ 8 8 8 ? 8 8
1 7 = 8 8 C ? ; @
8 ? 1 1 8 1 8 1 8
@ @ 8 8 8 1 @ @ 8
8 1 ; C ? ? 1 C 8
8 ? 1 @ @ 8 8 8 1
1 8 @ 8 8 C C @ @
a) <econo#ca y clasifique la &aria"le de inters.
") ,onstruya una ta"la de distri"ucin de frecuencia adecuada para los datos.
c) N"tenga el !istograma, polgono de frecuencia y una o'i&a porcentual. ,omente acerca de la
simetra.
d) WTu puede decir de la &aria"ilidad de los datosX
e) ,ompare las medidas de tendencia central de los datos agrupados y no agrupados.
f) WE(iste sesgo alguno en los datosX ,omente.
g) N"tenga :@=, :=8, :A= e interprtelos.
!) WTu porcenta'e de los datos se encuentran dentro de @sX ,onsidere los datos agrupados.
1C.D *a siguiente ta"la de distri"ucin de frecuencia representa los pagos por almacenamiento para
los =8 ms grandes detallistas durante el a+o 1BB=.
*mite de clase fi
1.18 D 1.7; C
1.7A D @.;? 1C
@.;C D ?.C8 11
?.C1 D C.1A B
C.17 D C.BC A
C.B= D =.A1 1
=.A@ D ;.C7 @
;.CB D A.@= @
a) )nalice la &aria"ilidad en el con'unto de datos.
") ,onstruya la o'i&a e interprete su significado para el ltimo inter&alo de clase.
c) ,onstruya un !istograma de frecuencia porcentual.
d) N"ser&e el !istograma o"tenido anteriormente, WTu puede deducir acerca del comportamiento
de estos datosX
1=.D ) partir de un estudio epidemiolgico del total de cloro orgnico presente en muestras de lec!e
se registran las mediciones de C8 donantes, las que se muestran a continuacin.
1B
Apuntes de Estadstica Descriptiva. Prof.Neftali Faundez
@A C? =@ =? =? =? ;1 ;? ;? ;=
;7 A8 7@ A= 7? B= B; BA 181 18=
118 11= 11= 11= 11= 1@; 1@A 1?C 1C= 1=@
1=? 17@ 1B8 1BA 1BA @7@ ?@@ ?@@ ?C@ =@1
a) N"tenga las medidas de tendencias central y medidas de dispersin para los datos no agrupados.
") Esta"le#ca un esquema de agrupamiento.
c) N"tenga las medidas de tendencia central y las medidas de dispersin para los datos agrupados .
d) ,omente los resultado o"tenidos en a) y c).
e) WTu medida de centrali#acin recomendara 5d. para este con'unto de datosX Uustifique su
respuesta.
f) N"ser&ando el !istograma de frecuencia, comente la simetra de los datos y diga si los datos ests
sesgados.
g) Hi su respuesta es si diga 'ustificadamente de que tipo de sesgo se trata.
!) N"tenga T1, T@ y T? e interprtelos.
1;.D ,onsidere la siguiente distri"ucin de frecuencias:
9ronteras fi
DC D D@ C
D@ D 8 ?
8 D @ @
@ D C C
C D ; 1
a) Rrafique el !istograma.
") Rrafique. *a o'i&a.
1A.D *os &arones que entre los @8 y ;8 a+os contra'eron matrimonio durante el a+o 1BB1 en
Espa+a, presentan la siguiente distri"ucin por edades.
Edades $arones /miles)
@8 D @= C1
@= D ?8 1@?
?8 D ?= CC
?= D C8 1?
C8 D =8 A
=8 D ;8 ?
a) <epresente grficamente la distri"ucin utili#ando el !istograma.
") ,alcular el coeficiente de asimetra de :earson. ,omente.
c) WTu porcenta'e de la informacin est dentro de @ sX
17.D 5na muestra de 7888 familias !a presentado la siguiente distri"ucin con respecto al nmero de
!i'os:
Y de !i'os 8 1 @ ? C = ; A 7 B
9rec. )"soluta 1CB @;@@ 1A?= 71@ ;C8 ?1= @@C 1;? ;7 1@
-etermine el signo de su asimetra.
@8

Вам также может понравиться