Академический Документы
Профессиональный Документы
Культура Документы
Estadística
Descriptiva
Lic. Est. Sandra Loaiza Chumacero
Estadística Descriptiva
Un punto que es necesario resaltar es la elección del título apropiado para cada
cuadro, tabla o grafico. Debe evitarse incluir palabras o frases que distorsionan el
mensaje que proporcionan y que de alguna manera, inducen a establecer una
relación con una situación específica.
Ejemplo 01:
Tabla Nº 01
Actividades que realizan las mujeres. Chiclayo Diciembre 2012.
Frecuencia Frecuencia
Número de
relativa relativa
Actividad que realiza mujeres
simple simple %
ni hi hi%
Estudiante 79 0.56 56.43
Trabaja 23 0.16 16.43
Estudia y trabaja 31 0.22 22.14
Ama de casa 7 0.05 5.00
TOTAL 140 1.00 100.00
1. Frecuencia absoluta simple (ni): Resulta del conteo de cada una de las
categorías de la variable.
2. La frecuencia relativa simple (hi): Permite mostrar la porción o fracción del número
total de observaciones en cada clase. Para convertir una distribución de frecuencia
a una distribución de frecuencias relativas, cada una de las frecuencias de clase se
divide entre el número total de frecuencias
n
hi i
n
n1 79 n 23
h1 0.56 h2 2 0.16
n 140 n 140
h 1 %= 0.56*100=56.43 h 2 %=0.16*100=16.43
Ejemplo 02:
Tabla N° 02
Gráficos
1.- Titulo: Expresa el contenido del grafico y por lo general, es igual o parecido al
título del cuadro estadístico que sirvió de referencia, debe indicar claramente la
naturaleza del fenómeno representado.
2.- Escalas: Para graficar se utiliza el sistema cartesiano, compuesto por dos ejes:
uno horizontal llamado abscisa; y el otro vertical llamado ordenada. Ambos ejes
se cortan en un punto llamado origen.
Las escalas vienen a ser la graduación de ambos ejes, según la naturaleza de las
variables y frecuencias correspondientes.
4.- Fuente: Indica el origen de los datos estadísticos que se está representando en
el gráfico.
Gráfico de barras
Gráfico N° 01
Gráfico N° 02
Gráfico de Sectores
Nota: También se pueden utilizar efectos tridimensionales para lograr una mejor
presentación.
Ejemplo 3: En relación con el ejemplo anterior del estudio de las preferencias de los
productos cosméticos también se analizo la actividad que realizan según el uso habitual de
los productos.
Tabla N° 03
Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de consumo de productos
cosméticos. Dic. 2012.
Gráfico N° 03
En este caso se puede apreciar, es conveniente adicionar una leyenda para indicar el color
que representa a cierta información. Por otro lado, también puede observarse que existe
una separación entre cada grupo de barras verticales equivalente a la mitad del ancho de
cada grupo se debe tener en cuenta que si los nombres o etiquetas de las categorías son
grandes es preferible utilizar el gráfico de barras horizontales, cuya construcción es similar
a lo indicado anteriormente. Del mismo modo se pueden presentar gráficos en tres
dimensiones.
Número de trabajadores
4 5 7 7 7 8 8 7 7 7
10 10 8 9 5 6 7 5 8 8
5 6 6 6 9 7 8 9 5 6
8 10 9 8 7 10 9 4 8 9
a) Construya una tabla de distribución de frecuencias absolutas para estos datos.
b) Interprete cada frecuencia absoluta.
Solución:
1.- En primer lugar se observa que el conjunto de observaciones es de tamaño 40, luego
n = 40.
Frecuencia absoluta
Número de trabajadores simple
eventuales
ni
4 2
5 5
6 5
7 9
8 9
9 6
10 4
Total 40
Tabla N° 04
Diagrama de Barras
Como referencia, se puede utilizar la regla de Sturges, la cual indica que el número de
intervalos es dado por m= 1+3.3*log n, donde n es el número de observaciones.
2.- Determinar el valor del rango o amplitud de los datos, es decir, determinar:
R = X max - Xmin
R
A
m
4.- Generar los límites de los intervalos. Para el primer intervalo se considera límite
inferior al valor de la observación de menor magnitud, es decir, Linf.(1)= Xmin
Linf.(1)= Xmin
5.- Cada uno de los intervalos (L inf, Lsup) se considera cerrado a la izquierda y abierto a la
derecha, es decir, se considera desde L inf a menos de L sup.
Esta regla no se aplica necesariamente para el ultimo intervalo superior tiene el mismo
valor que la observación de mayor magnitud, deberá considerarse cerrado en ambos
extremos, es decir, se considera desde L inf(K) hasta L sup(K).
Una vez que se han definido los intervalos de clase, el paso siguiente consiste en
determinar las frecuencias absolutas, es decir, el número de observaciones que está
dentro de cada intervalo.
i
N i n j n1 n2 n3 n4 .......... ni N i1 ni
j 1
ni
hi
n
i
H i h j h1 h2 h3 h4 .......... hi H i1 hi
j 1
Ejemplo:
1. Rango:
R = X’max –X’min
Donde:
X’min = Xmin - C = 82 – 1= 81
C = constante = 1
2. Numero de intervalos:
4 4
a) m = 2.5 n = 2.5 50 = 2.5 * 2.6591 =6.6478 = 7
b) m = 1+3.3log 30 = 6.60 = 7
4. El primer intervalo: Del límite inferior de la variable, al Límite inferior mas la amplitud del
intervalo, de 82 a 8 2 + 1 9 = 1 0 1 es decir de 8 2 a 1 0 1 .
17 Lic. Est. Sandra Cecilia Loaiza Chumacero
Estadística Descriptiva
El segundo intervalo de 101 a 101 + 19, es decir de 101 a 120 y así en forma
sucesiva hasta obtener el intervalo que contenga el límite superior de la
variable en estudio.
Tabla Nº 02: Distribución del costo mensual por energía eléctrica de las viviendas
de la ciudad de Chiclayo. Enero 2010.
5 . La marca de clase Y;: se obtiene sumando los límites del intervalo y dividiendo entre
2,(82+101)/2=91.5 sirve para graficar el polígono de frecuencias.
n2= 7, viviendas gastan por el costo de energía mayor o igual de 101 soles pero menos de 120
soles, para este conteo no se toma en cuenta 120 por que ya se considera para el
próximo intervalo.
N1= 4, N 2 =n 1 + n 2 = 4 + 7 = 1 1
N2 =11, significa que en la encuesta hay 11 viviendas que pagan por energía eléctrica
un costo mayor o igual de 101 pero menos de 120 soles mensuales.
n1 4 n2 7
h1 0.08 h2 0.14
n 50 n 50
h2 = 0.14,
H2 = 0.22, es la proporción de viviendas que pagan por el consumo de energía eléctrica un costo
mayor o igual de 101 pero menos de 120 soles.
h 1 %= 0.08*100=8 h 2 %=0.14*100=14
h 2 %=14%
11. La frecuencia relativa porcentual acumulada: Hi%, se obtiene sumando iterativamente las
frecuencias relativas porcentual.
H2%= 22%, porcentaje de viviendas que pagan por el costo de energía eléctrica un
costo menor o igual de 82 pero menos de 101 soles.
Fuente: tabla Nº 02
Gráfico Nº 04: Ojiva menor que de la distribución del Costo mensual por energía eléctrica de las
viviendas de la ciudad de Chiclayo usando frecuencias relativas acumuladas porcentuales.
Son aquellas que se representan en unos ejes de coordenadas cartesianas mediante una línea
recta o quebrada, ya que los valores de las variables estadísticas serán aisladas, tanto en el caso de
variables discretas como las continuas, porque el dominio se divide en clases y se elige una marca
de clase.
Los polígonos de frecuencia y las ojivas son ejemplos de graficas de línea. Estos gráficos se utilizan
también para representar cronológicamente o sea de distribuciones analizadas a través del
tiempo.
En las series cronológicas el tiempo (años, meses, días, etc.) se ubica en eje horizontal, llamada
escala cronológica. En el eje vertical, llamada escala numérica o de valores, se representa el valor
de los datos. Ambas escalas, son independientes.
El grafico puede representar una sola variable en función del tiempo o más de una variable.
Ejemplo:
La USAT tiene esta información acerca del número de estudiantes matriculados desde el
año 2005 a 2011.
Gráfico Nº 05
F u e n te : D ir e cc i ón d e I n f o rm a c i ó n E s ta d í s t ic a U S A T .
Tablas de contingencia
Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble
entrada en las que cada entrada representa un criterio de clasificación (una variable categórica).
Como resultado de esta clasificación, las frecuencias (el número o porcentaje de casos) aparecen
organizadas en casillas que contienen información sobre la relación existente entre ambos
criterios.
A estas tablas de frecuencias se les llama tablas de contingencia.
Una tabla de contingencia se puede usar si:
Una variables es cualitativa y la otra es una variable cuantitativa.
Ambas variables son cualitativas, o ambas variables son cuantitativas, o
Ambas variables con cuantitativas
Para este ejemplo vamos a seleccionar el archivo base de datos tutoria.xls, supóngase que se
desea determinar el número de sesiones a las que participo según sexo, de un grupo de 50
estudiantes.
1.- Al final de la base de datos agregar una columna más con nombre CONTADOR. Dar en la barra
de herramientas Seleccionar la opción insertar, tabla dinámica.
Figura 1.
2.- El segundo paso es crear la tabla dinámica, seleccionado la base de datos. Así
mismo también elegiremos donde colocar la tabla dinámica si en la misma hoja de
calculo o en una nueva hoja.
Figura 2.
Figura 3.
4.- Se puede observar que aparece por defecto la suma de los números de
estudiantes encuestados, para cada combinación de las categorías de número de
sesiones (P1) por sexo. La tabla de contingencia se muestra en la figura 4.
Figura 4.
En esta tabla se puede observar en primer lugar que de los 50 estudiantes de los que
se tiene información 11 son hombres y 39 son mujeres. Asimismo se sabe que 37
manifestaron que es adecuado, 7 escaso, 4 excesiva y 2 no contestaron acerca del
número de sesiones programadas de tutoría.
Figura 5.
Ahora supongamos que se desea saber que porcentaje de cada sexo tiene uno de los
niveles de grado de instrucción para ello:
Seleccionamos en la lista de campos el contador, anticlip, seleccionamos la opción
configuración de campo valor. Seleccionamos la opción mostrar valores como %
de columna, y aceptar.
Figura 6.
Figura 7.
Se tiene como resultado una tabla de contingencia con los porcentajes por columna,
es decir según sexo.
Figura 8.
Grafico Nº 01:
Figura 9.
Gráfico Nº 02
F M
63.64%
76.92%
27.27%
9.09%
10.26% 7.69% 0.00%
5.13%
Adec uado E s c as o E x c es iva (en blanc o)