Академический Документы
Профессиональный Документы
Культура Документы
ANLISIS E INTERPRETACIN
Luego de estudiar los cuadros y grficos como formas para ordenar y describir un
conjunto de datos para tomar decisiones, observamos que el anlisis resulta an
incompleto, pues se hace necesario que todos los datos contenidos en los cuadros de
distribucin de frecuencias, se puedan resumir an ms para facilitar el anlisis e
interpretacin de la informacin utilizando ciertos indicadores.
Estos indicadores llamados tambin medidas de resumen o ESTADGRAFOS permiten
hallar un solo valor numrico, el mismo que representa a toda la poblacin o muestra en
estudio.
Para realizar el proceso de ANLISIS y seguidamente la INTERPRETACIN es necesario
considerar que existen diferentes tipos de anlisis y pueden ser segn:
1. NMERO DE VARIABLES
Teniendo en cuenta la presentacin de la informacin, es decir cuadros de una, dos,
tres o ms entradas; se puede realizar el anlisis:
Univariante
Bivariante
Multivariante
2. ANLISIS UNIVARIANTE
Las medidas de resumen o estadgrafos ms importantes son:
A. Medidas de tendencia central:
Media aritmtica
Mediana
Moda
B. Medidas de posicin:
Cuartiles
Deciles
Percentiles
C. Medidas de dispersin:
Rango
Desviacin estndar
Varianza
Coeficiente de variacin
3. ANLISIS BIVARIANTE
A. CORRELACIN
Anlisis de regresin simple
4. ANLISIS MULTIVARIANTE
A. REGRESIN MLTIPLE
Son estadgrafos que permiten hallar un solo valor numrico e indican el centro de un
conjunto de datos, este valor numrico describe un conjunto de datos, sealando la
caracterstica que destaca en la informacin, dentro de ellas tenemos:
Media aritmtica
Mediana
Moda
1. MEDIA ARITMTICA ( )
Denominada tambin MEDIA o PROMEDIO, es una de las medidas de tendencia central
de mayor uso. La media muestral se simboliza por X y la media poblacional de denota
por , se obtiene de acuerdo a lo siguiente:
x i
X i 1
x
40 38 45 32 42 35 37 47
i
X i 1
39.5 40
8 8
Interpretacin: La edad promedio de los 8 docentes de la EP de Ciencias de la
Comunicacin Social es 40 aos.
fx i i
X i 1
n
f
i 1
i
fx i i
33
X i 1
n
1.65 2
f
20
i
i 1
Tiempo de duracin
(horas)
8 8
10 16
12 12
15 8
17 24
20 32
Ingresos Marca de
(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120
fx i i
15340
X i 1
n
127.83 128
f
120
i
i 1
Consumo
cigarrillos
(unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6
2. MEDIANA ()
Es una medida de tendencia central que divide a un conjunto de observaciones
ordenadas en forma ascendente o descendente en dos grupos iguales.
Sea una variable por lo menos ordinal y sea 1 , 2 , , una muestra de tamao
de observaciones de la variable, se define como Mediana "Me" de un conjunto de
Ejemplo: Consideremos la edad en aos de ocho personas: 40, 38, 45, 32, 42,
35, 37 y 47; calcular la mediana.
x 4 x5 38 40
Me 39
2 2
Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una
cabina de internet durante los meses de abril a julio, se pide hallar e interpretar la
media.
Ingresos Marca de
(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120
Solucin: Realizamos
1. Identificar el intervalo crtico o intervalo de clase mediana.
n 120
Me est ubicada en la posicin 60 , en el intervalo [125 130>
2 2
Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6
VENTAJAS DE LA MEDIANA
La mediana es un estadgrafo que no est afectada por valores extremos, y por lo
tanto es ms representativa que la media aritmtica cuando alguno de los valores
de la variable se aleja mucho de los dems o cuando las series son poco simtricas.
Menos sensible que la media a la variacin de las puntuaciones.
Se puede calcular, aunque algn intervalo carezca de lmite.
3. MODA(Mo)
Es una medida de tendencia central que est representado por el valor que ms se
repite, en una serie estadstica es aquel valor de la variable que tiene una mayor
frecuencia.
La moda puede no existir y aunque exista puede ser que no sea nica.
Ejemplo: Si consideramos las notas de una muestra de estudiantes: 8, 11, 8, 15, 15,
11, 19, 17, 15, 19, 15, 17, 17, 11, 15; hallar la moda.
Solucin: Mo = 15 (nota),
Ejemplo: Si consideramos los pesos de una muestra de personas: 65, 76, 48, 48,
68, 78, 90, 87, 78, 67, 72, 78, 48; hallar la moda.
Ejemplo: Si consideramos los pesos de una muestra de personas: 65, 76, 48, 49,
72, 48, 48, 49, 78, 49, 48, 49, 68, 78, 90, 87, 67; hallar la moda.
Ejemplo: Si consideramos las notas de una muestra de alumnos: 8, 8, 8, 11, 11, 11,
15, 15, 15, 17, 17, 17, 19, 19, 19; hallar la moda.
Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una
cabina de internet durante los meses de abril a julio, se pide hallar e interpretar la
moda.
Ingresos Marca de
(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120
Solucin: Realizamos
1. Identificamos al intervalo de clase modal, en este caso es [125 130> porque
tiene la mayor frecuencia.
1 f Mo f Mo 1 35 25 10
2 f Mo f Mo 1 35 22 13
10
Mo 125 * 5 17.17 127
10 13
Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6
VENTAJAS DE LA MODA
Al igual que la mediana no est afectada por los valores extremos.
Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
Se usa tambin para variables que pertenecen a la escala nominal.
DESVENTAJAS DE LA MODA
No es representativa a menos que la distribucin contenga un gran nmero de
datos y exista significativa repeticin de algunos de ellos.
Muchas veces la serie no tiene moda porque ningn valor se repite.
Cuando la serie tiene, dos, tres o ms modas, se hace difcil su interpretacin.
CUARTILES (Qi)
Son estadgrafos que dividen a la informacin ordenada en forma ascendente o
descendente en cuatro partes iguales, donde cada uno de ellos incluye el 25% de las
observaciones. Se denota por Qi, donde i = 1, 2, 3; el procedimiento para hallar los
cuartiles es:
(i )(n)
FQi 1
Qi LQi 4 * AQ i 1, 2, 3
FQi FQi 1 i
Dnde:
LQi: Es el lmite inferior del intervalo de clase donde est ubicado el cuartil.
n: Es el nmero de datos observados.
FQi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase cuartilica.
FQi: Es la frecuencia absoluta acumulada del intervalo de clase cuartilica.
AQi: Es la amplitud del intervalo de clase cuartil.
Primer Cuartil: Q1
Es el valor que supera a no ms de un cuarto de las observaciones y es superado por no
ms de tres cuartos de ellas. Es decir, es el valor que deja 25% de las observaciones
menores o iguales a l y el 75% superiores a l.
Segundo Cuartil: Q2
Coincide con la mediana; es decir, Q2 = Me
Tercer Cuartil: Q3
Es el valor que supera a no ms de las tres cuartas partes de las observaciones y es
superado por no ms de un cuarto de ellas. Es decir, deja el 75 % de los datos inferiores o
iguales a l y el 25% de stas superiores a l.
Ejemplo: El siguiente cuadro corresponde a los ingresos diarios (en soles) en una cabina
de internet durante los meses de abril a julio, se pide hallar e interpretar la moda.
Ingresos Marca de
(S/.) clase ( )
[110 115> 112.5 5
[115 120> 117.5 10
[120 125> 122.5 25
[125 130> 127.5 35
[130 135> 132.5 22
[135 140> 137.5 23
TOTAL 120
Interpretacin: El 25% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 123 y el 75% de das restantes obtuvieron ingresos
superiores a S/. 123.
(2)(120)
40
Q2 125 4 * 5 12.3 128
75 40
Interpretacin: El 50% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 128 y el 50% de das restantes obtuvieron ingresos
superiores a S/. 128.
Interpretacin: El 75% de das durante los meses de abril a julio la cabina de internet
obtuvo como mximo ingresos de S/. 133 y el 25% de das restantes obtuvieron ingresos
superiores a S/. 133.
DECILES (Di)
Son estadgrafos que dividen la informacin ordenada en forma ascendente o
descendente en diez partes iguales, donde cada uno de ellos incluye el 10% de las
observaciones, Se denota por Di, donde i = 1, 2, 3, , 9; el procedimiento para hallar los
deciles es:
1. Identificamos la clase decilica, es decir el intervalo de clase que contiene a Di esto est
(i )(n )
dado por:
10
2. Para hallar el decil i aplicamos la siguiente frmula:
(i )(n)
FDi 1
Di LDi 10 * AD i 1, 2, 3, 4,, 9
FDi FDi 1 i
Dnde:
LDi: Es el lmite inferior del intervalo de clase donde est ubicado el decil.
n: Es el nmero de datos observados.
FDi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase decilica.
..:: Pg. 14 ::..
Estadstica Ing. Ronald Mamani Mayta
Primer Decil: D1
Es el valor que supera a no ms del 10% de las observaciones y es superado por no ms
del 90% de ellas, es equivalente a decir que D1 es el valor que deja 10% de las
observaciones menores o iguales a l y el 90% superiores a l.
Segundo Decil: D2
Es el valor que supera a no ms del 20% de las observaciones y es superado por no ms
del 80% de ellas, es equivalente a decir que D2 es el valor que deja 20% de las
observaciones menores o iguales a l y el 80% superiores a l.
Tercer Decil: D3
Es el valor que supera a no ms del 30% de las observaciones y es superado por no ms
del 70% de ellas, es equivalente a decir que D3 es el valor que deja 30% de las
observaciones menores o iguales a l y el 70% superiores a l.
Noveno Decil: D9
Es el valor que supera a no ms del 90% de las observaciones y es superado por no ms
del 10% de ellas, es equivalente a decir que D9 es el valor que deja 90% de las
observaciones menores o iguales a l y el 10% superiores a l.
(1)(42)
0
D1 7 10 * 2 8.4 8
60
PERCENTILES (Pi)
Son estadgrafos que dividen la informacin ordenada en forma ascendente o
descendente en cien partes iguales, donde cada uno de ellos incluye el 1% de las
observaciones, Se denota por Pi, donde i = 1, 2, 3, , 99; el procedimiento para hallar los
percentiles es:
(i )(n)
FPi 1
Pi LPi 100 * AP i 1, 2, 3, 4, , 99
FPi FPi 1 i
Dnde:
LPi: Es el lmite inferior del intervalo de clase donde est ubicado el percentil.
n: Es el nmero de datos observados.
FPi-1: Es la frecuencia absoluta acumulada anterior al intervalo de clase percentilica.
FPi: Es la frecuencia absoluta acumulada del intervalo de clase percentilica.
APi: Es la amplitud del intervalo de clase percentilica.
Primer Percentil: P1
Es el valor que supera a no ms del 1% de las observaciones y es superado por no ms
del 99% de ellas, es equivalente a decir que P1 es el valor que deja 1% de las
observaciones menores o iguales a l y el 99% superiores a l.
Octavo Percentil: P8
Es el valor que supera a no ms del 8% de las observaciones y es superado por no ms
del 92% de ellas, es equivalente a decir que P8 es el valor que deja 8% de las
observaciones menores o iguales a l y el 92% superiores a l.
PERCENTIL 90:
1. Identificamos la ubicacin del percentil 90, en este caso i = 90, est ubicado en:
(i )(n) (90)(42) 3780
37.8 38
100 100 100
Esto indica que el intervalo de clase donde se ubica el percentil 90 es el
correspondiente al dato X38, es decir [15 17> el quinto intervalo.
2. Hallamos el percentil 90 reemplazando en la frmula:
(90)(42)
35
P90 15 100 * 2 16.4 16
39 35
Consumo
cigarrillos
(Unidades/da.)
[0 2> 15
[2 4> 26
[4 6> 20
[6 8> 13
[8 10> 6
MEDIDAS DE DISPERSIN
1. DEFINICIN
Las medidas de dispersin o variabilidad, son estadgrafos que miden el grado de
concentracin o dispersin de los valores de la variable con respecto al promedio o
valor central.
Los trminos concentracin y dispersin pueden ser utilizados de manera
equivalente, pues se da la relacin:
Alta dispersin Baja concentracin
Es necesaria una medida del grado de dispersin o variacin con respecto al centro,
con la finalidad de ampliar la descripcin de los datos o de comparar dos o ms series
de datos.
Las medidas de dispersin ms utilizadas son:
El rango o recorrido.
El rango intercuartil.
El rango semiintercuartil.
La varianza.
La desviacin estndar.
Coeficiente de variacin.
Ejemplo: El tiempo que utilizan 6 nios de igual edad para para desarrollar una
misma tarea fueron los siguientes: 16, 12, 15, 18, 13, 14 minutos, hallar el rango.
1.4. VARIANZA
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de
los valores de una variable cuantitativa con respecto a su media aritmtica. Si los
valores tienden a concentrarse alrededor de su promedio, la varianza ser muy
pequea. Si los valores tienden a distribuirse lejos del promedio, la varianza ser
muy grande.
N
Varianza Poblacional: i1
2 i 1
N N
2
n
n n
x
i 1
i
( x i x) 2 x i2
n
Varianza Muestral: S 2 i 1 i 1
n n 1
2 i 1
N
Varianza Poblacional: i 1
2 i 1
N N
2
k
f i x i
f i ( xi x) 2 f i xi2 i 1
k k
n
Varianza Muestral: S i 1
2 i 1
n 1 n 1
2
N
N N
X i
( X i )2 Xi
2 i 1
N
Desviacin Estndar Poblacional: i 1
i 1
N N
2
n
xi
xi2 i 1
n n
( xi x ) 2 n
Desviacin Estndar Muestral: S i 1
i 1
n 1 n 1
b) Desviacin Estndar para datos agrupados
Desviacin Estndar Poblacional:
2
k
fi X i
f i X i i 1
k k
fi ( X i )2
2
N
i 1 i 1
N N
2
k
f i xi
f i X i i 1
k k
fi ( X i X )2
2
n
Desviacin Estndar Muestral: S i 1 i 1
n 1 n 1
a) Varianza Muestral:
2
6
f i xi
i 1
6
5102
i 1
f i x i2
n
6524
42 8.08
S2
n 1 42 1
Ejemplo: Considere las edades (en aos) de alumnos del Colegio de Aplicacin
de la UNA Puno:
Varones Mujeres
20 23 19 27 21 19 25 23 19 22 18 27 24 18 21
x 22.125 x 21.28571429
S 2.90012315 S 3.352326844
c.v. 13.11% c.v. 15.75%
MEDIDAS DE ASIMETRA
El concepto de asimetra de una distribucin indica la deformacin horizontal de las
distribuciones de frecuencias. Una distribucin es asimtrica, cuando su curva (polgono)
de frecuencia es simtrica respecto al eje vertical. Es decir, si se le puede doblar a lo largo
del eje vertical de manera que coincidan los dos lados.
COEFICIENTE DE ASIMETRA:
Q3 2Q2 Q1
CA.
Q3 Q1
b) El coeficiente de asimetra en funcin de los percentiles (10, 90), est dado por :
P 2 P50 P10
CA. 90
P90 P10
Q3 Q1
K
2( P90 P10 )