Вы находитесь на странице: 1из 25

Universidad Nacional del Altiplano

Facultad de Ciencias Sociales


Escuela Profesional de Ciencias de la Comunicacin Social

ANLISIS E INTERPRETACIN

Luego de estudiar los cuadros y grficos como formas para ordenar y describir un
conjunto de datos para tomar decisiones, observamos que el anlisis resulta an
incompleto, pues se hace necesario que todos los datos contenidos en los cuadros de
distribucin de frecuencias, se puedan resumir an ms para facilitar el anlisis e
interpretacin de la informacin utilizando ciertos indicadores.
Estos indicadores llamados tambin medidas de resumen o ESTADGRAFOS permiten
hallar un solo valor numrico, el mismo que representa a toda la poblacin o muestra en
estudio.
Para realizar el proceso de ANLISIS y seguidamente la INTERPRETACIN es necesario
considerar que existen diferentes tipos de anlisis y pueden ser segn:

1. NMERO DE VARIABLES
Teniendo en cuenta la presentacin de la informacin, es decir cuadros de una, dos,
tres o ms entradas; se puede realizar el anlisis:
Univariante
Bivariante
Multivariante

El anlisis estadstico segn el nmero de variables permite:


1. Resumir y comparar las observaciones sobre una sola variable.
2. Descubrir la asociacin, dependencia, relacin y/o influencia existente entre dos o
ms variables.
3. Realizar inferencia aplicando estimaciones (sea puntual o intervlica) y pruebas
de hiptesis.

2. ANLISIS UNIVARIANTE
Las medidas de resumen o estadgrafos ms importantes son:
A. Medidas de tendencia central:
Media aritmtica
Mediana
Moda
B. Medidas de posicin:
Cuartiles
Deciles
Percentiles

C. Medidas de dispersin:
Rango

..::.. Pg. 1 ..::..


Estadstica Ing. Ronald Mamani Mayta

Desviacin estndar
Varianza
Coeficiente de variacin

3. ANLISIS BIVARIANTE
A. CORRELACIN
Anlisis de regresin simple

4. ANLISIS MULTIVARIANTE
A. REGRESIN MLTIPLE

MEDIDAS O ESTADGRAFOS DE TENDENCIA CENTRAL

Son estadgrafos que permiten hallar un solo valor numrico e indican el centro de un
conjunto de datos, este valor numrico describe un conjunto de datos, sealando la
caracterstica que destaca en la informacin, dentro de ellas tenemos:
Media aritmtica
Mediana
Moda

1. MEDIA ARITMTICA ( )
Denominada tambin MEDIA o PROMEDIO, es una de las medidas de tendencia central
de mayor uso. La media muestral se simboliza por X y la media poblacional de denota
por , se obtiene de acuerdo a lo siguiente:

a) Para datos no agrupados


Se halla sumando todos los datos de la distribucin y dividiendo dicha suma entre
el total de datos.
Sea una variable cuantitativa y 1 , 2 , , una muestra de tamao "" de
valores de la variable, se define la media aritmtica de X como:
1 + 2 + 3 + +
=

Esta expresin se puede escribir tambin, como:


n

x i
X i 1

Ejemplo: Consideremos la edad en aos de 8 docentes de la EP de Ciencias de la


Comunicacin Social: 40, 38, 45, 32, 42, 35, 37 y 47; hallar la edad promedio.

Solucin: El promedio, media o media aritmtica est dada por:

..:: Pg. 2 ::..


Estadstica Ing. Ronald Mamani Mayta

x
40 38 45 32 42 35 37 47
i
X i 1
39.5 40
8 8
Interpretacin: La edad promedio de los 8 docentes de la EP de Ciencias de la
Comunicacin Social es 40 aos.

Ejemplo: El coeficiente de inteligencia (CI) de 10 estudiantes de la UNA Puno es el


siguiente: 100, 95, 102, 115, 98, 98, 100, 115, 102 y 95, hallar e interpretar la media
aritmtica.

b) Para datos agrupados


En Cuadros de frecuencias sin intervalos: Suma de todos los valores
multiplicados por sus frecuencias y dividido por el nmero total, esto es:
n

fx i i
X i 1
n

f
i 1
i

Ejemplo: El siguiente cuadro de distribucin de frecuencias corresponde al


nmero de hijos de una muestra de 20 familias, hallar e interpretar la media
aritmtica.
N de hijos
0 3
1 6
2 7
3 3
4 1
TOTAL 20

Solucin: Primero calculamos el producto de las categoras de la variable por


sus respectivas frecuencias absolutas y sumamos, esto es:
N de hijos
0 3 0
1 6 6
2 7 14
3 3 9
4 1 4
TOTAL 20 33
n

fx i i
33
X i 1
n
1.65 2
f
20
i
i 1

Interpretacin: El nmero promedio de hijos de la muestra de 20 familias es


2.
..:: Pg. 3 ::..
Estadstica Ing. Ronald Mamani Mayta

Ejemplo: Conocida la distribucin de frecuencias del tiempo de duracin en


horas de una muestra de bateras de dispositivos mviles, hallar e interpretar
la media aritmtica.

Tiempo de duracin

(horas)
8 8
10 16
12 12
15 8
17 24
20 32

En cuadros de distribucin de frecuencias con intervalos: Media de las


marcas de clase

Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en


una cabina de internet durante los meses de abril a julio, se pide hallar e
interpretar la media.

Ingresos Marca de

(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120

Solucin: Primero calculamos el producto de las marcas de clase por sus


respectivas frecuencias absolutas y sumamos, luego aplicando la frmula
tenemos:
Ingresos Marca de

(S/.) clase ( )
[110 115> 112.5 5 562.5
[115 120> 117.5 10 1175.0
[120 125> 122.5 25 3062.5
[125 130> 127.5 35 4462.5
[130 135> 132.5 22 2915.0
[135 140> 137.5 23 3162.5
TOTAL 120 15340.0

..:: Pg. 4 ::..


Estadstica Ing. Ronald Mamani Mayta

fx i i
15340
X i 1
n
127.83 128
f
120
i
i 1

Interpretacin: El ingreso promedio de la cabina de internet durante los meses


de abril a julio es de S/. 128 diarios.

Ejemplo: El siguiente cuadro muestra el consumo diario de cigarrillos en una


muestra de 80 personas, hallar e interpretar la media aritmtica.

Consumo
cigarrillos
(unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6

VENTAJAS DE LA MEDIA ARITMTICA


Es til cuando los datos siguen aproximadamente una progresin aritmtica o
estn distribuidos en forma normal o simtrica.
Es un estadgrafo de gran estabilidad, porque toma en cuenta todos los datos.
Nos permite estimar y probar parmetros en estadstica inferencial.

DESVENTAJAS DE LA MEDIA ARITMTICA


La media es sensible a la variacin de las puntuaciones, es decir el valor de cada
dato afecta al valor de la media, cuando algunos valores extremos son incluidos
la media puede ser no representativa por ejemplo teniendo los datos 2, 4, 5, y
89 la media es 25 y podemos observar que no est cerca de ninguno de los
cuatro valores por lo tanto no es representativa. En cambio, s tenemos los
datos 23, 25, 26 y 26 la media es 25 por lo tanto es representativa de este
conjunto de datos.
No se puede calcular si algn intervalo es de lmite abierto y los dems cerrados
o viceversa (todos deben ser iguales).
No es recomendable si tenemos valores muy extremos.

2. MEDIANA ()
Es una medida de tendencia central que divide a un conjunto de observaciones
ordenadas en forma ascendente o descendente en dos grupos iguales.
Sea una variable por lo menos ordinal y sea 1 , 2 , , una muestra de tamao
de observaciones de la variable, se define como Mediana "Me" de un conjunto de

..:: Pg. 5 ::..


Estadstica Ing. Ronald Mamani Mayta

nmeros arreglados en forma ascendente al nmero que est en el centro de ese


arreglo o la media aritmtica de los dos valores medios.

a) Para datos no agrupados


Si el n de datos es impar: valor central.
Me x n 1 si n es impar
2

Ejemplo: Consideremos el peso en kilogramos de una muestra de 11 personas:


65, 76, 48, 48, 68, 78, 90, 87, 67, 72, 78; hallar la mediana.

Solucin: Para calcular la mediana debemos ordenar los datos:


48 48 65 67 68 72 76 78 78 87 90

El tamao de la muestra es = 11, impar por lo tanto la mediana se determina


como:
Me x n 1 x 11 1 x6 72
2 2

Interpretacin: El peso mediano es de 72 Kg. o tambin el 50% de personas


tiene como mximo 72 Kg. y el 50% restante tienen pesos superiores a 72 Kg.

Si el n de datos es par: media aritmtica de los 2 puntos centrales.


xn xn
1
Me 2 2
si n es par
2

Ejemplo: Consideremos la edad en aos de ocho personas: 40, 38, 45, 32, 42,
35, 37 y 47; calcular la mediana.

Solucin: Para calcular la mediana ordenamos las observaciones.


32 35 37 38 40 42 45 47
Como el tamao de la muestra es = 8, un nmero par, la mediana es:
x8 x8
1
Me 2 2

x 4 x5 38 40
Me 39
2 2

Interpretacin: La edad mediana de estas personas es 39 aos. O tambin el


50% de estas personas tiene como mximo 39 aos de edad.

..:: Pg. 6 ::..


Estadstica Ing. Ronald Mamani Mayta

b) Para datos agrupados


1. Identificar intervalo crtico (o intervalo de clase donde est ubicada la
mediana).
n
Sea n par o impar la Me est ubicada en la posicin
2

2. Para hallar la mediana aplicamos la siguiente frmula:


n
FMe1
Me LMe 2 * AMe
FMe FMe1


Dnde:
LMe: Lmite inferior del intervalo de clase mediana.
n: Nmero total datos
FMe: Frecuencia absoluta acumulada del intervalo de clase mediana.
FMe-1: Frecuencia absoluta acumulada anterior al intervalo de clase mediana.
AMe: Amplitud del intervalo de clase mediana.

Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una
cabina de internet durante los meses de abril a julio, se pide hallar e interpretar la
media.

Ingresos Marca de

(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120

Solucin: Realizamos
1. Identificar el intervalo crtico o intervalo de clase mediana.
n 120
Me est ubicada en la posicin 60 , en el intervalo [125 130>
2 2

2. Aplicando la frmula tenemos:


120
40
Me 125 2 * 5 127.86 128
75 40

..:: Pg. 7 ::..


Estadstica Ing. Ronald Mamani Mayta

Interpretacin: El 50% de das durante los meses de abril a julio la cabina de


internet obtuvo ingresos diarios menores o iguales a S/. 128 y la otra mitad de das
obtuvo ingresos diarios superiores a S/. 128.

Ejemplo: El siguiente cuadro muestra el consumo diario de cigarrillos en una


muestra de 80 personas, hallar e interpretar la mediana.

Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6

VENTAJAS DE LA MEDIANA
La mediana es un estadgrafo que no est afectada por valores extremos, y por lo
tanto es ms representativa que la media aritmtica cuando alguno de los valores
de la variable se aleja mucho de los dems o cuando las series son poco simtricas.
Menos sensible que la media a la variacin de las puntuaciones.
Se puede calcular, aunque algn intervalo carezca de lmite.

3. MODA(Mo)
Es una medida de tendencia central que est representado por el valor que ms se
repite, en una serie estadstica es aquel valor de la variable que tiene una mayor
frecuencia.
La moda puede no existir y aunque exista puede ser que no sea nica.

1. Para datos no agrupados


Dado x1, x2, x3, , xn-1, xn, Mo = La observacin que ms se repite

Ejemplo: Si consideramos las notas de una muestra de estudiantes: 8, 11, 8, 15, 15,
11, 19, 17, 15, 19, 15, 17, 17, 11, 15; hallar la moda.

Solucin: Mo = 15 (nota),

Interpretacin: La mayora de los estudiantes tienen una nota de 15, esta


distribucin es UNIMODAL, porque tiene una sola moda.

Ejemplo: Si consideramos los pesos de una muestra de personas: 65, 76, 48, 48,
68, 78, 90, 87, 78, 67, 72, 78, 48; hallar la moda.

..:: Pg. 8 ::..


Estadstica Ing. Ronald Mamani Mayta

Solucin: Como 48 y 78 presentan la mayor frecuencia y son valores no


adyacentes, entonces:
Mo = 48 kg. y Mo = 78 kg.

Interpretacin: La mayora de estas personas pesa 48 kg. y 78 kg., esta


distribucin es BIMODAL, porque tiene dos modas.

Ejemplo: Si consideramos los pesos de una muestra de personas: 65, 76, 48, 49,
72, 48, 48, 49, 78, 49, 48, 49, 68, 78, 90, 87, 67; hallar la moda.

Solucin: Como los pesos 48 y 49 presentan la mayor frecuencia y son valores


adyacentes la moda est dada por:
(48 49)
Mo 48.5 kg.
2

Interpretacin: La mayora de estas personas tienen un peso aproximado de 48.5


kg.

Ejemplo: Si consideramos las notas de una muestra de alumnos: 8, 8, 8, 11, 11, 11,
15, 15, 15, 17, 17, 17, 19, 19, 19; hallar la moda.

Solucin: No se puede calcular la moda o no existe moda, esta distribucin es


AMODAL.

La moda tambin es til cuando la variable en estudio pertenece a la escala


nominal.

Ejemplo: La siguiente informacin corresponde a una muestra de excursionistas


segn preferencia por un lugar turstico, hallar la moda.
LUGAR TURSTICO FRECUENCIA
Amantani 20
Los Uros 32
Taquile 18
Juli 12
Sillustani 5
TOTAL 87

Solucin: Mo = Los Uros.

Interpretacin: El lugar turstico de mayor preferencia por la muestra de 20


excursionistas es Los Uros.

..:: Pg. 9 ::..


Estadstica Ing. Ronald Mamani Mayta

2. Para datos agrupados


1. Identificar la ubicacin del intervalo de clase modal: La que tiene mayor
frecuencia.
2. Para Hallar la moda aplicamos la siguiente frmula:
1
Mo LMo * AMo
1 2
1 f Mo f Mo 1
2 f Mo f Mo 1
Dnde:
LMo: Lmite inferior del intervalo de clase modal.
1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior.
2: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
fMo: Frecuencia absoluta correspondiente al intervalo de clase modal.
fMo-1: Frecuencia absoluta anterior al intervalo de clase modal.
fMo+1: Frecuencia absoluta posterior al intervalo de clase modal.
AMo: Amplitud del intervalo de clase modal.

Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una
cabina de internet durante los meses de abril a julio, se pide hallar e interpretar la
moda.

Ingresos Marca de

(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120

Solucin: Realizamos
1. Identificamos al intervalo de clase modal, en este caso es [125 130> porque
tiene la mayor frecuencia.

2. Hallamos los valores de:


f Mo f 4 35
f Mo 1 f 3 25
f Mo 1 f 5 22
3. Finalmente calculamos:

..:: Pg. 10 ::..


Estadstica Ing. Ronald Mamani Mayta

1 f Mo f Mo 1 35 25 10
2 f Mo f Mo 1 35 22 13
10
Mo 125 * 5 17.17 127
10 13

Interpretacin: La mayora de das durante los meses de abril a julio la cabina de


internet obtuvo ingresos diarios de S/. 127.

Ejemplo: El siguiente cuadro muestra el consumo diario de cigarrillos en un


amuestra de 80 personas, hallar e interpretar la moda.

Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6

VENTAJAS DE LA MODA
Al igual que la mediana no est afectada por los valores extremos.
Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
Se usa tambin para variables que pertenecen a la escala nominal.

DESVENTAJAS DE LA MODA
No es representativa a menos que la distribucin contenga un gran nmero de
datos y exista significativa repeticin de algunos de ellos.
Muchas veces la serie no tiene moda porque ningn valor se repite.
Cuando la serie tiene, dos, tres o ms modas, se hace difcil su interpretacin.

..:: Pg. 11 ::..


Estadstica Ing. Ronald Mamani Mayta

MEDIDAS DE POSICIN O CUANTILES

Son estadgrafos que dividen a una distribucin de frecuencias en otras proporciones


como: cuatro, diez o cien partes iguales, a menudo se expresan en porcentajes.
Se denomina cuantiles a los valores que dividen a los datos ordenados en 4, 10 100
partes iguales (cuando la distribucin contiene un nmero alto de intervalos o de marcas
de clase), entre las cuales tenemos:
a) Cuartiles
b) Deciles
c) Percentiles.

CUARTILES (Qi)
Son estadgrafos que dividen a la informacin ordenada en forma ascendente o
descendente en cuatro partes iguales, donde cada uno de ellos incluye el 25% de las
observaciones. Se denota por Qi, donde i = 1, 2, 3; el procedimiento para hallar los
cuartiles es:

1. Identificamos la clase cuartilica, es decir el intervalo de clase que contiene a Qi esto


(i )(n )
est dado por:
4
2. Para hallar el cuartil i aplicamos la siguiente frmula:

(i )(n)
FQi 1
Qi LQi 4 * AQ i 1, 2, 3
FQi FQi 1 i



Dnde:
LQi: Es el lmite inferior del intervalo de clase donde est ubicado el cuartil.
n: Es el nmero de datos observados.
FQi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase cuartilica.
FQi: Es la frecuencia absoluta acumulada del intervalo de clase cuartilica.
AQi: Es la amplitud del intervalo de clase cuartil.

Primer Cuartil: Q1
Es el valor que supera a no ms de un cuarto de las observaciones y es superado por no
ms de tres cuartos de ellas. Es decir, es el valor que deja 25% de las observaciones
menores o iguales a l y el 75% superiores a l.

Segundo Cuartil: Q2
Coincide con la mediana; es decir, Q2 = Me

..:: Pg. 12 ::..


Estadstica Ing. Ronald Mamani Mayta

Tercer Cuartil: Q3
Es el valor que supera a no ms de las tres cuartas partes de las observaciones y es
superado por no ms de un cuarto de ellas. Es decir, deja el 75 % de los datos inferiores o
iguales a l y el 25% de stas superiores a l.

Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una cabina
de internet durante los meses de abril a julio, se pide hallar e interpretar la moda.

Ingresos Marca de

(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120

Solucin Primer Cuartil:


1. Identificamos la ubicacin del cuartil 1, en este caso i = 1 est ubicado en:
(i )(n) (1)(120) 120
30
4 4 4
Esto indica que el intervalo de clase donde se ubica el cuartil 1 es el correspondiente
al dato X30, es decir [120 125> el tercer intervalo.
2. Hallamos el Cuartil 1 reemplazando en la frmula:
(1)(120)
15
Q1 120 4 * 5 122.5 123
40 15

Interpretacin: El 25% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 123 y el 75% de das restantes obtuvieron ingresos
superiores a S/. 123.

Solucin Segundo Cuartil:


1. Identificamos la ubicacin del cuartil 2, en este caso = 2 est ubicado en:
(i )(n) (2)(120) 120
60
4 4 2
Esto indica que el intervalo de clase donde se ubica el cuartil 2 es el correspondiente
al dato X60, es decir [125 130> el cuarto intervalo.

2. Hallamos el Cuartil 2 reemplazando en la frmula:

..:: Pg. 13 ::..


Estadstica Ing. Ronald Mamani Mayta

(2)(120)
40
Q2 125 4 * 5 12.3 128
75 40


Interpretacin: El 50% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 128 y el 50% de das restantes obtuvieron ingresos
superiores a S/. 128.

Solucin Tercer Cuartil:


1. Identificamos la ubicacin del cuartil 3, en este caso i = 3 est ubicado en:
(i )(n) (3)(120) 360
90
4 4 4
Esto indica que el intervalo de clase donde se ubica el cuartil 3 es el correspondiente
al dato X90, es decir [130 135> el quinto intervalo.

2. Hallamos el Cuartil 3 reemplazando en la frmula:


(3)(120)
75
Q3 130 4 * 5 133.4 133
97 75

Interpretacin: El 75% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 133 y el 25% de das restantes obtuvieron ingresos
superiores a S/. 133.

DECILES (Di)
Son estadgrafos que dividen la informacin ordenada en forma ascendente o
descendente en diez partes iguales, donde cada uno de ellos incluye el 10% de las
observaciones, Se denota por Di, donde i = 1, 2, 3, , 9; el procedimiento para hallar los
deciles es:

1. Identificamos la clase decilica, es decir el intervalo de clase que contiene a Di esto est
(i )(n )
dado por:
10
2. Para hallar el decil i aplicamos la siguiente frmula:

(i )(n)
FDi 1
Di LDi 10 * AD i 1, 2, 3, 4,, 9
FDi FDi 1 i

Dnde:
LDi: Es el lmite inferior del intervalo de clase donde est ubicado el decil.
n: Es el nmero de datos observados.
FDi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase decilica.
..:: Pg. 14 ::..
Estadstica Ing. Ronald Mamani Mayta

FDi: Es la frecuencia absoluta acumulada del intervalo de clase decilica.


ADi: Es la amplitud del intervalo de clase decil.

Primer Decil: D1
Es el valor que supera a no ms del 10% de las observaciones y es superado por no ms
del 90% de ellas, es equivalente a decir que D1 es el valor que deja 10% de las
observaciones menores o iguales a l y el 90% superiores a l.

Segundo Decil: D2
Es el valor que supera a no ms del 20% de las observaciones y es superado por no ms
del 80% de ellas, es equivalente a decir que D2 es el valor que deja 20% de las
observaciones menores o iguales a l y el 80% superiores a l.

Tercer Decil: D3
Es el valor que supera a no ms del 30% de las observaciones y es superado por no ms
del 70% de ellas, es equivalente a decir que D3 es el valor que deja 30% de las
observaciones menores o iguales a l y el 70% superiores a l.

Noveno Decil: D9
Es el valor que supera a no ms del 90% de las observaciones y es superado por no ms
del 10% de ellas, es equivalente a decir que D9 es el valor que deja 90% de las
observaciones menores o iguales a l y el 10% superiores a l.

Ejemplo: El siguiente cuadro corresponde a las notas en curso de Estadstica de 42


estudiantes del II semestre de la Escuela Profesional de Ciencias de la Comunicacin Social
de la UNA Puno, Hallar el primer, quinto y noveno decil.
Marca de
Notas fi Fi
clase (Xi)
[07 09> 8 6 6
[09 11> 10 9 15
[11 13> 12 13 28
[13 15> 14 7 35
[15 17> 16 4 39
[17 19> 18 3 42
TOTAL 42

Solucin Primer Decil:


1. Identificamos la ubicacin del 1 decil, en este caso i = 1, est ubicado en:
(i )(n) (1)(42) 42
4.2 4
10 10 10
Esto indica que el intervalo de clase donde se ubica el decil 1 es el correspondiente al
dato X4, es decir [07 09> el primer intervalo.
2. Hallamos el decil 1 reemplazando en la frmula:

..:: Pg. 15 ::..


Estadstica Ing. Ronald Mamani Mayta

(1)(42)
0
D1 7 10 * 2 8.4 8
60

Interpretacin: El 10% de estudiantes de la muestra en estudio tienen como mximo


notas iguales a 08 y el 90% de estudiantes restantes tienen notas mayores a 08 en el curso
de Estadstica Social.

PERCENTILES (Pi)
Son estadgrafos que dividen la informacin ordenada en forma ascendente o
descendente en cien partes iguales, donde cada uno de ellos incluye el 1% de las
observaciones, Se denota por Pi, donde i = 1, 2, 3, , 99; el procedimiento para hallar los
percentiles es:

1. Identificamos la clase percentilica, es decir el intervalo de clase que contiene a Di esto


(i )(n )
est dado por:
100
2. Para hallar el percentil i aplicamos la siguiente frmula:

(i )(n)
FPi 1
Pi LPi 100 * AP i 1, 2, 3, 4, , 99
FPi FPi 1 i



Dnde:
LPi: Es el lmite inferior del intervalo de clase donde est ubicado el percentil.
n: Es el nmero de datos observados.
FPi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase percentilica.
FPi: Es la frecuencia absoluta acumulada del intervalo de clase percentilica.
APi: Es la amplitud del intervalo de clase percentilica.

Primer Percentil: P1
Es el valor que supera a no ms del 1% de las observaciones y es superado por no ms
del 99% de ellas, es equivalente a decir que P1 es el valor que deja 1% de las
observaciones menores o iguales a l y el 99% superiores a l.

Octavo Percentil: P8
Es el valor que supera a no ms del 8% de las observaciones y es superado por no ms
del 92% de ellas, es equivalente a decir que P8 es el valor que deja 8% de las
observaciones menores o iguales a l y el 92% superiores a l.

El percentil 25, es igual al primer cuartil: P25 = Q1.


El percentil 50, es igual a la mediana: P50 = Me = Q2
El percentil 75, es igual al tercer cuartil: P75 = Q3.

..:: Pg. 16 ::..


Estadstica Ing. Ronald Mamani Mayta

Ejemplo: El siguiente cuadro corresponde a las notas en curso de Estadstica de 42


estudiantes del II semestre de la Escuela Profesional de Sociologa de la UNA Puno, Hallar
los percentiles 50, 75 y 90.
Marca de
Notas fi Fi
clase (Xi)
[07 09> 8 6 6
[09 11> 10 9 15
[11 13> 12 13 28
[13 15> 14 7 35
[15 17> 16 4 39
[17 19> 18 3 42
TOTAL 42

PERCENTIL 90:
1. Identificamos la ubicacin del percentil 90, en este caso i = 90, est ubicado en:
(i )(n) (90)(42) 3780
37.8 38
100 100 100
Esto indica que el intervalo de clase donde se ubica el percentil 90 es el
correspondiente al dato X38, es decir [15 17> el quinto intervalo.
2. Hallamos el percentil 90 reemplazando en la frmula:

(90)(42)
35
P90 15 100 * 2 16.4 16
39 35

Interpretacin: El 90% de estudiantes de la muestra en estudio tienen como mximo


notas iguales a 16 y el 10% de estudiantes restantes tienen notas mayores a 16 en el curso
de Estadstica.

Ejemplo: El siguiente cuadro muestra el consumo diario de cigarrillos en una muestra de


80 personas, hallar e interpretar la moda.

Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6

a) Hallar e interpretar el primer cuartil Q1.


b) Hallar e interpretar octavo decil D8.
c) Hallar e interpretar el sesentavo percentil P60.

..:: Pg. 17 ::..


Estadstica Ing. Ronald Mamani Mayta

EJERCICIO: Se tiene el siguiente cuadro de distribucin de frecuencias relativas de 200


personas, segn el tiempo de aos de servicio en una empresa.
Tiempo de
servicio hi
(Aos)
[ 2 5> 0.150
[ 5 8> 0.185
[ 8 11> 0.255
[11 14> 0.215
[14 17>

a) Cuntos empleados han trabajado entre 10 y 15 aos?


b) Qu porcentaje tiene 8 o ms aos de servicio, pero menos de 14?
c) Hallar e interpretar la media, mediana y moda.
d) Hallar e interpretar Q2, Q3, D3, D5, P50 y P70

..:: Pg. 18 ::..


Estadstica Ing. Ronald Mamani Mayta

MEDIDAS DE DISPERSIN

1. DEFINICIN
Las medidas de dispersin o variabilidad, son estadgrafos que miden el grado de
concentracin o dispersin de los valores de la variable con respecto al promedio o
valor central.
Los trminos concentracin y dispersin pueden ser utilizados de manera
equivalente, pues se da la relacin:
Alta dispersin Baja concentracin

Baja dispersin Alta concentracin

Es necesaria una medida del grado de dispersin o variacin con respecto al centro,
con la finalidad de ampliar la descripcin de los datos o de comparar dos o ms series
de datos.
Las medidas de dispersin ms utilizadas son:
El rango o recorrido.
El rango intercuartil.
El rango semiintercuartil.
La varianza.
La desviacin estndar.
Coeficiente de variacin.

1.1. RANGO O RECORRIDO (R)


El rango de variacin o recorrido de una variable estadstica, es simplemente la
diferencia entre sus valores extremos, se denota por:
=

El rango es una medida de dispersin fcil de calcular, pero es muy inestable, ya


que depende nicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se agrega un solo dato, por tanto su uso es muy limitado. El rango
nos da una idea de la heterogeneidad u homogeneidad de los datos.

Ejemplo: El tiempo que utilizan 6 nios de igual edad para para desarrollar una
misma tarea fueron los siguientes: 16, 12, 15, 18, 13, 14 minutos, hallar el rango.

Solucin: El rango ser.


= 18 12 = 6

1.2. RANGO INTERCUARTILICO (RI)


Llamado tambin amplitud o recorrido intercuartilico, es la diferencia entre los
cuartiles tercero y primero, es decir incluye los valores centrales, esto es:
= 3 1

..:: Pg. 19 ::..


Estadstica Ing. Ronald Mamani Mayta

El rango intercuartilico es una medida que excluye el 25% ms alto y el 25% ms


bajo, dando un rango dentro del cual se encuentra el 50% central de los datos
observados y a diferencia del rango total no se encuentra afectada por los valores
extremos.
Si el rango intercuartilico es muy pequeo entonces describe alta uniformidad o
pequea variacin de los valores centrales.

1.3. RANGO SEMI-INTERCUARTILICO (RSI)


Llamado tambin recorrido semi-intercuartilico est dado por el rango
intercuartilico dividido por 2, esta medida se basa en la posicin ocupada por el
50% de los valores centrales de la distribucin, est dado por:
3 1
=
2

El rango semi-intercuartilico se puede asociar con la mediana y se puede expresar


en funcin de ella.

NOTA: Si la distribucin es muy asimtrica, el rango semi-intercuartilico es


preferible a la desviacin estndar como medida de la dispersin.

1.4. VARIANZA
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de
los valores de una variable cuantitativa con respecto a su media aritmtica. Si los
valores tienden a concentrarse alrededor de su promedio, la varianza ser muy
pequea. Si los valores tienden a distribuirse lejos del promedio, la varianza ser
muy grande.

a) Varianza para datos no agrupados


2
N
X i
( X i ) 2 X i2 i1
N N

N
Varianza Poblacional: i1
2 i 1
N N

2
n
n n
x
i 1
i
( x i x) 2 x i2
n
Varianza Muestral: S 2 i 1 i 1
n n 1

..:: Pg. 20 ::..


Estadstica Ing. Ronald Mamani Mayta

b) Varianza para datos agrupados


2
k
f i X i
fi ( X i )2 fi X i
k k


2 i 1

N
Varianza Poblacional: i 1
2 i 1

N N

2
k
f i x i
f i ( xi x) 2 f i xi2 i 1
k k

n
Varianza Muestral: S i 1
2 i 1

n 1 n 1

1.5. DESVIACIN ESTNDAR


La desviacin estndar o tpica de los valores de una variable X, se define como
la raz cuadrada positiva de la varianza y se denota por:

a) Desviacin Estndar para datos no agrupados

2
N
N N


X i

( X i )2 Xi
2 i 1

N
Desviacin Estndar Poblacional: i 1
i 1

N N

2
n
xi
xi2 i 1
n n

( xi x ) 2 n
Desviacin Estndar Muestral: S i 1
i 1

n 1 n 1
b) Desviacin Estndar para datos agrupados
Desviacin Estndar Poblacional:
2
k
fi X i
f i X i i 1
k k

fi ( X i )2
2

N
i 1 i 1
N N

2
k
f i xi
f i X i i 1
k k

fi ( X i X )2
2

n
Desviacin Estndar Muestral: S i 1 i 1
n 1 n 1

..:: Pg. 21 ::..


Estadstica Ing. Ronald Mamani Mayta

Ejemplo: El siguiente cuadro corresponde a las notas en curso de Estadstica


Social de 42 estudiantes del III semestre de la Escuela Profesional de Sociologa
de la UNA Puno.
Marca de
Notas fi Fi
clase (Xi)
[07 09> 8 6 6
[09 11> 10 9 15
[11 13> 12 13 28
[13 15> 14 7 35
[15 17> 16 4 39
[17 19> 18 3 42
TOTAL 42

Hallar la varianza y desviacin estndar muestral.

Solucin: Para ello realizamos los siguientes clculos


Marca de
Notas fi Fi fiXi fiXi2
clase (Xi)
[07 09> 8 6 6 48 384
[09 11> 10 9 15 90 900
[11 13> 12 13 28 156 1872
[13 15> 14 7 35 98 1372
[15 17> 16 4 39 64 1024
[17 19> 18 3 42 54 972
TOTAL 42 510 6524

a) Varianza Muestral:
2
6
f i xi
i 1
6
5102

i 1
f i x i2
n
6524
42 8.08
S2
n 1 42 1

Interpretacin: La notas obtenidas por los estudiantes de la muestra en


estudio se dispersan en promedio, 8.08 u2 con respecto al valor central.

b) Desviacin Estndar Muestral:

S 8.0767 2.8429 2.84

Interpretacin: Las notas obtenidas por los estudiantes de la muestra en


estudio se dispersan en promedio, 2.84 unidades con respecto al valor central.

..:: Pg. 22 ::..


Estadstica Ing. Ronald Mamani Mayta

1.6. COEFICIENTE DE VARIACIN


El coeficiente de variacin CV, es una medida de dispersin relativa (libre de
unidades de medida), que se define como la desviacin estndar dividido por el
promedio aritmtico, mide el grado de concentracin en torno a la media, esto es:

a) Coeficiente de Variacin Poblacional:



. . = (100%)

b) Coeficiente de Variacin Muestral:



. . = (100%)

El coeficiente de variacin es una medida muy til para comparar la


variabilidad de dos o ms series de datos (grupos) que tengan distintas
unidades de medida y/o distintos promedios aritmticos.

Ejemplo: Considere las edades (en aos) de alumnos del Colegio de Aplicacin
de la UNA Puno:
Varones Mujeres

20 23 19 27 21 19 25 23 19 22 18 27 24 18 21
x 22.125 x 21.28571429
S 2.90012315 S 3.352326844
c.v. 13.11% c.v. 15.75%

Interpretacin: Las edades de los varones son ms homogneas puesto que


presentan menor coeficiente de variacin.

..:: Pg. 23 ::..


Estadstica Ing. Ronald Mamani Mayta

MEDIDAS DE FORMA DE LA DISTRIBUCIN

En trabajos propios de algunas disciplinas, surge con frecuencia la necesidad de calcular


una medida que muestre las direcciones de la dispersin de los datos con respecto a su
centro y que completan la descripcin de las distribuciones de frecuencias. Estas
caractersticas se llaman: Asimetra (que significa no tener simetra) y curtosis o
apuntamiento. Las medidas de dispersin slo indican la magnitud de las variaciones,
pero no dan informacin acerca de la direccin de las variaciones.

MEDIDAS DE ASIMETRA
El concepto de asimetra de una distribucin indica la deformacin horizontal de las
distribuciones de frecuencias. Una distribucin es asimtrica, cuando su curva (polgono)
de frecuencia es simtrica respecto al eje vertical. Es decir, si se le puede doblar a lo largo
del eje vertical de manera que coincidan los dos lados.

Asimetra Positiva: Se dir que una distribucin de frecuencia unimodal presenta


asimetra positiva o a la derecha, si tiene ramificacin extendida hacia la derecha o hacia
valores grandes de la variable. En este caso la media aritmtica es mayor que la moda. La
mediana por el hecho de dividir el conjunto de observaciones en dos partes iguales,
quedar comprendida entre ambas.

Asimetra Negativa: Se dir que una distribucin de frecuencia unimodal presenta


asimetra negativa o a izquierda, si tiene una ramificacin ms extendida hacia la
izquierda o hacia valores pequeos de la variable. La media aritmtica es menor que la
moda. La mediana por la misma razn anterior permanecer en el centro.

Asimetra Negativa Asimetra Asimetra Positiva

COEFICIENTE DE ASIMETRA:

a) El coeficiente de asimetra cuartlico o de BOWLEY, est dado en funciones de los


cuartiles:

Q3 2Q2 Q1
CA.
Q3 Q1

1. La distribucin es asimtrica (Promedio = Mediana = Moda), si CA = 0.


2. La distribucin es asimtrica positiva (Promedio > Mediana > Moda), si CA > 0.

..:: Pg. 24 ::..


Estadstica Ing. Ronald Mamani Mayta

3. La distribucin es asimtrica negativa (Promedio < Mediana < Moda), si CA < 0.

b) El coeficiente de asimetra en funcin de los percentiles (10, 90), est dado por :
P 2 P50 P10
CA. 90
P90 P10

NDICE DE CURTOSIS O APUNTAMIENTO

Se entiende por curtosis, a la medida de deformacin vertical de una distribucin de


frecuencias, es decir la medida de apuntamiento o achatamiento de una distribucin.

La idea de apuntamiento de una distribucin con la frecuencia de dichos valores en la


distribucin de frecuencias indica la mayor o menor altura del mximo central, con
respecto a la altura de la curva normal con media y desviacin tpica que la distribucin
que se estudia.

CURTOSIS EN FUNCIN DE CUANTILES

El coeficiente est dado por:

Q3 Q1
K
2( P90 P10 )

i) si K = 0.263, la distribucin es normal o mesocrtica.


ii) si K < 0.263, la distribucin es achatada o leptocrtica.
iii) si K > 0.263, la distribucin es platicrtica.

Al igual que el caso de los coeficientes de


asimetra de una distribucin, los que
representan a la curtosis o apuntamiento
se utilizan para ayudar a describir las
caractersticas de una distribucin y no
precisamente como medidas, ya que a
veces el valor de la curtosis se contradice
con la realidad por estar relacionado con
la distribucin normal.

..:: Pg. 25 ::..

Вам также может понравиться