Вы находитесь на странице: 1из 53

Tema: Estadstica Descriptiva

1
Ing. Est. Jorsi Ericson Balczar Gallo

ESTADSTICA GENERAL

INTRODUCCIN

La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en
grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, viajes,
visitantes, ingresos, ventas y as sucesivamente.
Algunas personas podran pensar que la enseanza de la estadstica slo interesa a los
profesores, o bien a los investigadores que trabajan en los diferentes departamentos de una
universidad. Esta es una creencia errnea, puesto que la estadstica ha surgido desde la
misma estadstica y podemos encontrar Estadsticos en psicologa, economa, medicina,
ingeniera y otras reas.

Que es la estadstica?

Segn: Diccionario RAE

Ciencia o recuento de la poblacin, de los recursos naturales e industriales, del trfico o
de cualquier otra manifestacin de un Estado, provincia, pueblo, clase, etc.
Ciencia que utiliza conjuntos de datos numricos para obtener inferencias basadas en el
clculo de probabilidades.

La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre
sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con
la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

La Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de
decisiones.

Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.

Tema: Estadstica Descriptiva

2
Ing. Est. Jorsi Ericson Balczar Gallo
Para qu sirve la estadstica
1. Para la descripcin de datos.
2. Para conocer datos de poblacin a partir de datos de muestra.
3. Para ver las relaciones entre los datos.

Importancia de la Estadstica
La estadstica ha jugado un papel primordial en el desarrollo de la sociedad moderna, al
proporcionar herramientas metodolgicas generales para analizar la variabilidad, determinar
relaciones entre variables, disear en forma ptima estudios y experimentos y mejorar las
predicciones y toma de decisiones en situaciones de incertidumbre.
Las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad,
control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en
deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos;
y por otras personas que intervienen en la toma de decisiones.

LA ESTADSTICA Y LA INVESTIGACIN CIENTFICA

La Investigacin Cientfica
La investigacin es un proceso de produccin de conocimientos cientficos; es un proceso
sistemtico a travs del cual se recogen datos e informacin de la realidad objetiva para dar
respuesta a las interrogantes que se plantean.
No hay investigacin grande o pequea, simplemente investigar es buscar respuesta a
determinadas interrogantes, a travs de la aplicacin de procedimientos cientficos.

"PAPEL DE LA ESTADSTICA EN LA INVESTIGACIN CIENTFICA".

La Estadstica es considerada tambin como un suministro de un conjunto de herramientas
sumamente tiles en la investigacin.
No existe investigacin, proceso o trabajo encaminado a obtener informacin cuantitativa en
general, en la que la estadstica no tenga una aplicacin. La estadstica no puede ser ignorada
por ningn investigador, an cuando no tenga ocasin de emplear la Estadstica Aplicada en
todos sus detalles y ramificaciones.
El papel de la estadstica en la investigacin es, entonces, funcionar como una herramienta
en el diseo de investigaciones, en el anlisis de datos, y en la extraccin de conclusiones a
partir de ellos. Escasamente podr preveerse un papel mayor y ms importante
Tema: Estadstica Descriptiva

3
Ing. Est. Jorsi Ericson Balczar Gallo

El desarrollo cientfico y la investigacin no son posibles sin la estadstica


TRABAJO
Observar y describir diferentes problemas relacionados con su carrera.

CLASIFICACION O TIPOS DE ESTUDIOS
Segn el tiempo de ocurrencia de los hechos y registros de la informacin
Se clasifican en:
+ Retrospectivo: Son aquellos estudios que el investigador indaga sobre hechos
ocurridos en el pasado.
+ Prospectivo: Son aquellos estudios que el investigador registra la informacin segn
van ocurriendo los fenmenos.
Tema: Estadstica Descriptiva

4
Ing. Est. Jorsi Ericson Balczar Gallo

ESTADSTICA GENERAL

DIVISIN DE LA ESTADSTICA

La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica
Descriptiva y la Inferencial.

Estadstica Descriptiva:Se denomina estadstica descriptiva, al conjunto de mtodos
estadsticos que se relacionan con el resumen y descripcin de los datos, como tablas,
grficas, y el anlisis mediante algunos clculos.

Estadstica I nferencial Se denomina inferencia estadstica al conjunto de mtodos con los
que se hacen la generalizacin o la inferencia sobre una poblacin utilizando una muestra.
La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta,
por lo que es necesario que stas sean dadas con una medida de confiabilidad que es la
probabilidad.
Estas dos partes de la estadstica no son mutuamente excluyentes, ya que para utilizar los
mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica
descriptiva.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra
tomada.

TRMINOS DE ESTADSTICA
Los trminos estadsticos que se usan en estadstica es necesario conocerlos para poder
entender el lenguaje estadstico que se utiliza en el desarrollo de la asignatura:

Poblacin:
En forma general, en estadstica; se denomina poblacin, a un conjunto de elementos (que
consiste de personas, objetos, etc.), que contienen una
caracterstica observable comn.
La poblacin debe estar perfectamente definida en el
tiempo y en el espacio. Por lo tanto, al definir una
poblacin, se debe cuidar que el conjunto de elementos que
Tema: Estadstica Descriptiva

5
Ing. Est. Jorsi Ericson Balczar Gallo
la integran quede perfectamente delimitado. Si, por ejemplo, estamos analizando la edad de
los alumnos de la UCV_Piura, debemos especificar cules y cundo, entonces seria: 6537
alumnos de la UCV_Piura, en Abril del 2013.

La poblacin puede ser finita o infinita:

Poblacin Finita, Es el conjunto finito de unidades de anlisis donde se puede identificar a
un elemento inicial y/o a un elemento final. Por ejemplo, la poblacin de fabricas de
Lima Metropolitana, todos los estudiantes existentes en la Universidad Nacional de Piura.

Poblacin I nfinita, Conjunto infinito de elementos donde no se podra identificar a
una unidad inicial ni a la unidad final. Ejemplo, la poblacin de personas con hbitos de
fumar, poblacin de personas que consumen bebidas gaseosas, poblacin e personas que
consumen cervezas, los rboles de la selva peruana, etc.

Muestra: Es una parte o subconjunto de una poblacin en estudio. La muestra est
constituida de elementos seleccionados de una
manera deliberada, con el objeto de investigar las
propiedades de su poblacin.
Cuando no se puede acceder a los datos de toda la
poblacin, que es lo ms frecuente, y se debe trabajar
con slo los de la muestra, a la simple descripcin de los datos se aade el inters por
valorar hasta qu punto los resultados de la muestra son generalizables a la poblacin.
Se denomina muestra a una parte de la poblacin seleccionada de acuerdo con un plan o
regla, con el fin de obtener informacin acerca de la poblacin de la cual proviene.
Toda muestra debe ser representativa y adecuada.








2

o
o

2
X
S
S

Poblacin (N)
Muestra (n)
Muestreo
Inferencia
Poblacin (N)
Tema: Estadstica Descriptiva

6
Ing. Est. Jorsi Ericson Balczar Gallo

Variable: Es una caracterstica de inters, toma diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en
varias categoras. Las variables se representan con letras maysculas del abecedario.
Ejemplo:
- X: Tamao de pernos.
- Y: Tipo de edificacin
- Z: Dimensin de la edificacin
- R: Resistencia a la tensin de los cables del puente Bolognesi.
- P: Tipo de Ladrillos.
- Q: Peso mximo soportado por puente en la panamericana norte.
- M: Ph. Del yogurt.
- Q: Color de la edificacin.
- Z: Nmero de habitaciones por departamento.
- P: Nmero de lotes.
- M: Temperatura de cocido de ladrillos pandereta.
- N: Tipo de batera que usan los equipos de Oftalmologa para el servicio de zonas rurales
en el CLAS de la ciudad de Sullana en Julio del 2008.
- X: Gastos realizados por la empresa Graa y Montero en el mes de Febrero del 2013.
- Y: Edad de los alumnos del colegio Csar Vallejo.
- Z: Tiempo de servicio de los trabajadores de la constructora OKG.

Unidad de anlisis o unidad elemental: Es el objeto o elemento indivisible que ser
estudiado en una poblacin o en una muestra, sobre los cuales se va a obtener datos, de los
ejemplos anteriores seria:
- Cada perno producido.
- Cada edificio.
- Cada edificio.
- Cada cable del puente Bolognesi.
- Cada ladrillo.
- Cada puente.
- Cada puente de la panamericana norte.
- Cada yogurt.
Tema: Estadstica Descriptiva

7
Ing. Est. Jorsi Ericson Balczar Gallo
- Cada edificio.
- Cada zona de expansin urbana.
- Cada horneada de ladrillo pandereta.
- Cada equipo Oftalmolgico de las zonas rurales en el CLAS Sullana.
- Cada departamento de dicha empresa.
- Cada alumno de la Universidad Privada Csar Vallejo _Piura.
- Cada trabajador que labora en la empresa OKG.

Datos: Comnmente se le conoce como observaciones. Son los valores que toma la variable
en cada unidad estadstica.
De los ejemplos anteriores seria:
- x1=2 cm., x2=2.1 cm.
- y1=12.2, y2=13.5
- q1=amarillo, q2=rojo, q3=negra, q4=amarilla.
- Etc.

Unidad de medida. Son las unidades fsicas en las que son expresados los datos. Las
variables cualitativas no tienen unidad de medida.
De los ejemplos anteriores.
- M, cm, etc.
- Grados.
- Kg., Gr., Onzas., etc.
- Unidades, decenas.


LAS VARIABLES
Podemos iniciar el tema indicando que definir las variables me permitir dar respuesta a lo
que quiero estudiar. El sexo, la edad, el nivel socioeconmico, el seguimiento de un
determinado plan de cuidados, el tipo de droga que se consume, la percepcin de riesgo
frente a una determinada conducta, etc. son aspectos que con seguridad se abordarn si
estamos realizando un estudio sobre el consumo de drogas, pues bien, estos aspectos a
estudiar, son lo que denominamos las variables de estudio.


Tema: Estadstica Descriptiva

8
Ing. Est. Jorsi Ericson Balczar Gallo

CLASIFICACIN DE LAS VARIABLES
Medir es asignar valores a las variables del estudio. Su principal funcin es evitar la
subjetividad del investigador.
La forma de medir las variables va a determinar el anlisis matemtico, estadstico, de las
mismas.

Clasificacin segn su naturaleza:

VARIABLES CUALITATIVAS:
Miden una caracterstica, en trmino de cualidad, nunca de forma numrica.
Cada uno de los valores que puede tomar la variable se llama categoras. Deben incluir
todas las opciones posibles que puede adoptar la variable.
Pueden ser:
Escala nominal: Determina la igualdad o desigualdad de los individuos.
Sexo: masculino o femenino.
Fumador: S. No.
Estado Civil: soltero, casado, viudo, separado o divorciado.
Tipo de vivienda: Casa de playa, Casa de campo, Urbana, Rural.
Color de vivienda: Amarillo, Blanco, Verde, Azul, Celeste, etc.

Escala ordinal: Determina el orden de los individuos de mayor, menor o igual
que.
Habito de fumar: no fumador, fumador moderado, fumador importante.
Consumo de tabaco: Tabaco: 0 c/d, 1-10 c/d, > 10 c/d
Escala de dolor: Muy fuerte, Fuerte, Regular, Dbil, Muy Dbil.
Tamao de departamento: Pequeo, Regular, Grande.
Grado de instruccin: Sin instruccin, Primaria, Secundaria, Superior.

Si las variables cualitativas tienen solo dos categoras se llama variable cualitativa
dicotmica (Ejemplo: Sexo: Hombre. Mujer), y si tiene ms de dos, variable cualitativa
politmica (color de cabello: negro, rubio, castao, pelirrojo)


Tema: Estadstica Descriptiva

9
Ing. Est. Jorsi Ericson Balczar Gallo
VARIABLES CUANTITATIVAS:
Miden una caracterstica de forma numrica, miden una cantidad. Pueden ser:
Variables Discretas: Entre dos valores consecutivos no existe otro valor, es decir toman
solo valores enteros. Se obtienen siempre por conteo.
Ejemplo.
- Nmero de hijos.
- Nmero de maquinas registradoras.
- Nmero de mquinas empacadoras de cemento.
- Nmero de estaciones de servicio.
- Nmero de cajeros automticos.
- Nmero de ingenieros.
- Nmero de obreros.
- Nmero de departamentos.

Variables Continuas: Entre dos valores consecutivos se pueden encontrar infinitos
valores, es decir toman valores decimales. Se obtienen siempre por alguna medicin o un
clculo matemtico.
Ejemplo:
- Peso de pernos
- Talla.
- Tiempo de vida til de una mquina de sellado.
- Temperatura.
- rea de los terrenos
- Volumen de mezcla.
- Tiempo de duracin.
- Capacidad de carga.
- Resistencia a la tensin.
- Temperatura de cocin.
Tema: Estadstica Descriptiva

10
Ing. Est. Jorsi Ericson Balczar Gallo


ELEMENTOS DE UNA VARIABLE
La identificacin y definicin de variables es la tarea ms delicada de toda investigacin y
del trabajo estadstico. Tngase presente que las variables se deducen a partir de los
objetivos de un estudio o investigacin. En consecuencia, para tener xito en la seleccin de
variables, es recomendable distinguir los siguientes cinco elementos:
a) Nombre o denominacin de la variable.
b) Definicin o conceptualizacin de la variable.
c) Un conjunto de categoras o niveles, que es definida por el investigador. Las
categoras no son nicas, lo mnimo es dos categoras y dependen de los objetivos
de la investigacin.
d) Procedimiento para categorizar o agrupar las unidades de anlisis.
e) Algunas medidas de resumen o indicadores.

Ejemplo:
Veamos la variable Estado Civil:
a) Nombre: Estado Civil o conyugal
b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes y
costumbres del pas.
c) Categoras:
(01) Soltero
(02) Casado
(03) Conviviente
(04) Divorciado
(05) Viudo
CUALITATIVAS CUANTITATIVAS

VARIABLES
Continua Discreta Nominal Ordinal
Tema: Estadstica Descriptiva

11
Ing. Est. Jorsi Ericson Balczar Gallo
d) Categorizacin: Cul es su estado civil?
e) Medidas de Resumen Indicadores:
- Distribucin Porcentual
- Tasa de Nupcionalidad
- Etc.

Veamos la variable cuantitativa, Ingreso:
a) Nombre: Ingresos
b) Definicin: Son los recursos monetarios netos, incluyendo todas las bonificaciones
que percibe una persona por su ocupacin principal y secundaria durante el periodo
de referencia de la encuesta.
c) Categoras: Puede proponerse en forma de niveles o simplemente intervalos.
Primera forma: Segunda forma:
(01) Alto
(02) Medio
(03) Bajo
(01) Menos de 300
(02) De 301 a 500
(03) De 501 a 700
(04) De 701 a mas

d) Categorizacin: Cul fue su ingreso total en el ltimo mes?
e) Medidas de resumen, Indicadores: Ingreso promedio, Ingreso mediano, etc.














Tema: Estadstica Descriptiva

12
Ing. Est. Jorsi Ericson Balczar Gallo

EJERCICIOS 01

De los enunciados siguientes Identificar la poblacin, muestra, unidad de anlisis, dato
y la variable (tipo de variable y sus elementos)

1) Se desea saber el tiempo de vida de los motores en las motocar YAMAHA cierto estudio
se hizo en la ciudad de Tumbes yPiura ya que son ciudades donde el calor es intenso
todo el ao y el motor de cierto objeto de estudio sufre en estas condiciones climticas.

2) En la UCV_PIURA se quiere saber cul es el deporte ms practicado por los alumnos,
para lo cual se tom informacin de 200 alumnos elegidos al azar de las diferentes
escuelas de dicha universidad.

3) Se desea saber cul es el tamao y el peso de las reglas T que los alumnos de la facultad
de Ing. Civil de la UCV_PIURA utilizan;para obtener dicha informacin se eligi a 50
alumnosal azar de dichacarrera profesional.

4) La UCV_PIURA necesita informacin sobre lugar de procedencia de los alumnos que
vienen a integrarse a nuestra casa de estudio en el segundo semestre del presente ao.


Trabajo 02
Investigar, presentar y exponer acerca de:
Recoleccin de datos:
- Concepto
- Fuentes de datos
- Tcnicas de recoleccin de datos.
- Censo y Encuesta







Tema: Estadstica Descriptiva

13
Ing. Est. Jorsi Ericson Balczar Gallo

RECOPILACIN DE DATOS
La recopilacin de datos es el momento en la cual el investigador se pone en contacto
directo con los sujetos, objetos o elementos sometidos al estudio con el propsito de obtener
los datos o respuestas de las variables consideradas; a partir de estos datos se prepara la
informacin estadstica y se calcula las medidas de resumen e indicadores para el anlisis
estadstico.
Para recoger la informacin se toma en cuenta las siguientes modalidades: Las fuentes de
informacin, los sistemas de recoleccin y las tcnicas de recoleccin.

FUENTES DE INFORMACION
Es el lugar, la institucin o persona donde estn los datos para cada una de las variables o
aspectos de la investigacin. Las fuentes de informacin pueden ser:

a) Fuentes internos: Es la informacin recopilada por la empresa (o la institucin) de
los resultados de su propia gestin. Son pues las observaciones que constantemente
realizan los departamentos: Administrativos, contables, comerciales, tcnicos, etc.
Ejemplo. Reportes financieros, Reportes de operaciones, que estn dados por la
informacin de la produccin, ventas, compras, estados de prdidas y ganancias,
Reportes especiales, es informacin adicional para un anlisis especfico.

b) Fuentes externas: Son informaciones estadsticas elaboradas por instituciones de
investigacin, ya sean pblicas o privadas, o dependencias especializadas,
generalmente requeridas a nivel nacional o sectorial.

c) Fuentes Primarias: Cuando los datos se obtienen directamente de la misma persona
o entidad (unidad de observacin) utilizando ciertas tcnicas.
Ejemplo. Llevar a cabo una encuesta para conocer el grado de satisfaccin laboral de
los trabajadores de la fbrica CEPICAFE.
ndices de precios al consumidor.

d) Fuentes Secundarias: Cuando los datos ya han sido elaborados y procesados por
otras personas o instituciones.
Ejemplo. La informacin estadstica que publica el INEI de los diferentes ministerios
del Per.

SISTEMA DE RECOLECCIN
Son procedimientos que se utilizan para recoger informacin, puede ser:

a) Los Registros: Son libros, padrones en donde se anotan en forma regular
permanente y obligatoria los hechos ocurridos.
Ejemplo. Registros civiles, RENIEC, Registros Pblicos, etc.

b) Las Encuestas: Son procedimientos de obtencin de informacin estructurada segn
criterios previos de sistematizacin que se efecta con propsito especfico en la
poblacin o en un sector de ella. Pueden ser:
b.1) Encuesta Censal: Cuando abarca toda la poblacin en estudio.
Ejemplo. Censo de poblacin y vivienda de 1993.
b.2)Encuesta Muestral: Cuando abarca una parte de la poblacin en estudio.
Ejemplo. Llevar una encuesta a 150 alumnos de la UCV-Piura.
Tema: Estadstica Descriptiva

14
Ing. Est. Jorsi Ericson Balczar Gallo

TECNICAS DE RECOLECCION
Son procedimientos que se utilizan para recolectar informacin segn la naturaleza del
trabajo de investigacin. Pueden ser:
El cuestionario, la entrevista, el anlisis de contenido, etc.

a) La observacin: Es la accin de mirar con rigor, en forma sistemtica y profunda,
con el inters de descubrir la importancia de aquello que se observa.

b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas
sistemticamente elaboradas que se formulan al encuestado o entrevistado con el
propsito de obtener datos de las variables consideradas en estudio.


c) La entrevista: Es un dialogo entre personas, es una tcnica donde una persona
llamada entrevistador, encuestador o empadronador solicita al entrevistado le
proporcione algunos datos e informacin.

d) Anlisis de contenidos: Es la tcnica ms elaborada y que goza de mayor prestigio
en el campo de la observacin documental. El fin o propsito del anlisis del
contenido consiste en determinar los puntos ms importantes de un documento para
observar y reconocer el significado de los mismos en sus elementos, como palabras,
frases, etc., y en clasificarlos adecuadamente para su anlisis y explicacin.



























Tema: Estadstica Descriptiva

15
Ing. Est. Jorsi Ericson Balczar Gallo


ORGANIZACIN Y CLASIFICACIN DE DATOS
Una vez que se ha llevado a cabo la recoleccin de datos es necesario organizarlos y
presentarlos adecuadamente de tal manera que facilite su comprensin, descripcin y
anlisis del fenmeno en estudio y obtener conclusiones vlidas para la toma de decisiones.
Se consideran las siguientes actividades: Revisin y correccin de los datos, construccin de
tablas de distribucin de frecuencias y representacin tabular y grfica.

Revisin y Correccin de los Datos
Todo anlisis estadstico, por acabado y seguro que sea, es capaz de suministrar respuestas
inadecuadas si ste se basa en una informacin incorrecta, es por eso que es necesario
inspeccionar la validez y confiabilidad de los datos para corregir los errores y omisiones de
acuerdo a ciertas reglas.


CUADROS O TABLAS ESTADSTICAS
Un cuadro estadstico es el arreglo ordenado, columnas y filas, de datos estadsticos o
caractersticas relacionadas, con el objeto de ofrecer informacin estadstica de fcil lectura,
comparacin e interpretacin. Un cuadro estadsticos es le resultado de trabajos previos
(planeamiento, recopilacin, tabulacin, clculos, etc.)

Partes principales:
1) Nmero del Cuadro, es le cdigo o elemento de identificacin que permite ubicar el
cuadro en el interior de un documento.

2) Titulo, es la descripcin resumida del contenido del cuadro.
Responder a las clsicas preguntas:Que, Donde, Como y Cuando
- Que: Qu informacin contiene el cuadro?
Que hay en el cuadro, se refiere al hecho observado o la caracterstica principal.
- Como: Cmo est arreglada o clasificada la informacin?
Como estn ordenados o clasificados los datos en el cuadro.
- Donde:A dnde corresponde la informacin tabulada?
Se refiere al lugar geogrfico o institucin a la que corresponde la informacin.
- Cuando:A qu perodo de tiempo se refiere la informacin?
A que momento o periodo de tiempo esta referida la informacin puede ser un
momento especifico o puntual, como tambin un periodo de varios aos, mese o
semanas, etc.

3) Encabezamiento o conceptos,Es la descripcin resumida sobre contenido de las filas y
columnas que contiene el cuadro de informacin.

4) Cuerpo,Comprende al contenido numrico de la informacin del cuadro.


5) Fuente, Se anotar el nombre de la unidad responsable de la formulacin y
presentacin del tabulado de informacin estadstica.

Tema: Estadstica Descriptiva

16
Ing. Est. Jorsi Ericson Balczar Gallo

CUADRO N 01
DISTRIBUCIN DE 20 EMPRESAS SEGN EL NUMERO DE
TRABAJADORES EN PIURA, ABRIL DEL 2008

N
Trabajadores
f
i
h
i
F
i
100
110
120
130
140
150
2
4
8
10
4
2
0.07
0.13
0.27
0.33
0.13
0.07
2
6
14
24
28
30
Total 30 1
Fuente: Oficina de RRHH de las 20 empresas


Trminos utilizados:
- Frecuencia absoluta simple (
i
f ): indica el nmero de veces que se repite
un atributo, caracterstica, valor o el nmero de valores de un conjunto de
datos que se encuentran en un intervalo. La suma total de estas frecuencias
es igual al total de datos (n o N).

- Frecuencia porcentual simple ( %
i
h ): se define en cada fila como
% 100
i
i
f
h
n
= . La suma total de estas frecuencias es el 100.00%. Cuando
no esta expresada en porcentaje se denomina frecuencia relativa simple (
i
h ).


- Frecuencia absoluta acumulada ( )
i
F : indica la cantidad de datos que se
encuentran hasta cierto valor o clase.

- Frecuencia porcentual acumulada ( %
i
H ): indica el porcentaje de datos
que se encuentran hasta cierto valor o clase.


- Marca de clase (

i
Y ): es el punto medio de cada intervalo, es decir

2
i s
i
L L
Y
+
= .


Nota.-
Las frecuencias acumuladas se observan cuando estamos estudiando variables
cuantitativas, la marca de clase se utilizar cuando trabajemos con intervalos.



Titulo
Encabezamiento
Cuerpo
Fuente
N de cuadro
Tema: Estadstica Descriptiva

17
Ing. Est. Jorsi Ericson Balczar Gallo

ELABORACIN DE CUADROS DE DISTRIBUCIN DE FRECUENCIAS

A) VARIABLES CUALITATIVAS
EJEMPLO 1.1. En una encuesta aplicada a los alumnos de Ing. Civil de la UCV_PIURA
acerca de las preferencias de una marca de bebida gaseosa por sus colores: Negro(N),
Blanco(B), Rojo(R), 20 consumidores dieron las siguientes respuestas:

B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.

Construir la distribucin de frecuencias. Graficar la distribucin

SOLUCION.
La tabulacin de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es
la distribucin de frecuencias del cuadro 1.2.

Cuadro 1: Distribucin de 20alumnos de Ing. Civil de la
UCV_PIURA, segn su color preferido de una marca de bebida
gaseosa, 2013.

Color de bebida
gaseosa


Frecuencias

Frecuencias

Frecuencias
X Absolutas:
i
f Relativas:
i
h Porcentajes:
i
p
Negro (N) 9 0.45 45
Blanco (B) 8 0.40 40
Rojo (R) 3 0.15 15
Total 20 1.00 100
Fuente: Elaboracin propia.





Tema: Estadstica Descriptiva

18
Ing. Est. Jorsi Ericson Balczar Gallo



ELABORACIN DE GRFICOS

GRFICO DE BARRAS

Grfico 1: Distribucin de 20alumnos de Ing. Civil de la UCV_PIURA, segn su
color preferido de una marca de bebida gaseosa, 2013.

0
1
2
3
4
5
6
7
8
9
Negro
Blanco
Rojo
Personas
0.45
0.40
0.15


Fuente: Cuadro 01










Tema: Estadstica Descriptiva

19
Ing. Est. Jorsi Ericson Balczar Gallo

Grafico Circular
El grfico 2 es la representacin mediante grfica de sectores circulares del cuadro 1 La
frecuencia 45% es equivalente a 0 45 360 162 . = , la frecuencia 40% es equivalente a
0 40 360 144 . = , y la frecuencia 15% es equivalente a 0 15 360 54 . =


Grfico 2: Distribucin de 20alumnos de Ing. Civil de la UCV_PIURA, segn su color
preferido de una marca de bebida gaseosa, 2013.
B
15%
45%
40%
N
R


Fuente: Cuadro 01



Ejercicio.
En una muestra se recolecto datos sobre la marca de bateras que usaban 30 radios porttiles
del ejrcito peruano de la Ciudad de Piura.
Co ca se co ca
Ca co ca ca Se
Se co se co Co
Co se co ca Co
So co ca ca Co
Co co co co Ca

Donde:
ca: Panasonic
co: Duracell
se: Akita
so: National
Tema: Estadstica Descriptiva

20
Ing. Est. Jorsi Ericson Balczar Gallo

Poblacin o muestra: 30 baterias
Variable: marca de bateria


B) VARIABLE CUANTITATIVA
B.1) CUADRO SIN INTERVALOS
Suponga que se han recolectado n valores de alguna variable discreta X. El procedimiento
ms simple de organizar estosn datos, consiste en ordenar estos valores numricos en forma
ascendente.
Si todos losn datos son distintos entre si, se obtendr una distribucin de frecuencias de n
valores de la variable X, donde cada uno de estos valores tienen frecuencia absoluta igual a
uno.
Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k ( n k s )
valores distintos de X, digamos,
k
x x x ,..., ,
2 1
, con frecuencias absolutas respectivas
k
f f f ,..., ,
2 1
, la distribucin de frecuencias de estos n datos se resume en el cuadro 1.3
(observar que es similar al cuadro 1.1).
Cuadro 2: Distribucin de frecuencias de variable discreta
Valores de Frecuencias Frecuencias Frecuencias
La variable X Absolutas
i
f Relativas
i
h Porcentajes
i
p
1
x
1
f
1
h
1
p
2
x
2
f
2
h
2
p
... ... ... ...
k
x
k
f
k
h
k
p
Total n 1.00 100.00
Fuente:..
Las frecuencias absolutas relativas y porcentajes poseen , en el caso de variable discreta y
continua, el mismo significado y propiedades, que en el caso de la variable cualitativa.
Cuando es grande el nmero de datos observados de una variable discreta, su organizacin
es muy engorrosa. En este caso, para resumir los datos y poder calcular las medidas
descriptivas, es conveniente seguir el mtodo de organizacin de variable continua por
intervalos que se describe en la seccin 1.4.3 siguiente.


Grfica
La representacin grfica ms comn de una distribucin de frecuencias de variable discreta
es del tipobastn que consiste en trazar en cada valor distinto de la variable, segmentos de
recta proporcionales a su frecuencia.
Tambin, se pueden usar barras rectangulares para graficar una distribucin de frecuencias
de variable discreta.

Tema: Estadstica Descriptiva

21
Ing. Est. Jorsi Ericson Balczar Gallo

EJEMPLO 1.2.
Ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20 hogares
de la ciudad de Piura, marc las siguientes respuestas:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

Construir la distribucin de frecuencias de la variable X. Graficar.

SOLUCION.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3,
4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de frecuencias de X se
da en el cuadro 1.4.

Cuadro 2: Familias de la ciudad de Piura, segn su nmero de hijos.
Nmero de Frecuencias Frecuencias Frecuencias
Hijos Absolutas relativas Porcentajes
X
i

f
i

h
i

p
i

0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
Fuente: Elaboracin propia.


GRAFICO DE BASTONES

Grafico 03: Familias de la ciudad de Piura, segn su nmero de hijos.
0 1 2 3 4
X
1
2
3
4
5
6
7
0.05
0.35
0.20
0.30
0.10
f
i
h
i

Fuente: Cuadro 02
Tema: Estadstica Descriptiva

22
Ing. Est. Jorsi Ericson Balczar Gallo

En la grfica de bastones, se indican las frecuencias absolutas y relativas en cada valor
distinto de la variable.



Ejercicio.
Se tomo a 20 empresas de transportes de la Ciudad del norte del pas la cual se tiene
datos de la cantidad de aos dando servicio de transporte puntos tursticos del norte del
pas:
6 5 4 4 3
3 4 4 5 5
4 5 6 2 4
3 4 6 5 3
Elabora un cuadro de distribucin de frecuencias


B.1) CUADRO SIN INTERVALOS
La distribucin de frecuencias por intervalos o clases se usa cuando la variable estadstica es
continua o cuando el nmero de valores distintos de una variable discreta es muy grande
(ms de 20 lneas en el monitor de una computadora).
Esta distribucin se obtiene dividiendo el rango de variacin de los datos en k intervalos y
determinando el nmero de datos que contiene cada intervalo (Cuadro 1.5).

Cuadro 1.5. Distribucin de frecuencias por intervalos
Frecuencia
s

Intervalos
i
I Conteo

Absolutas
i
f Relativas
i
h
Porcentajes
i
p
1
I ///...
1
f
1
h
1
p
2
I ///...
2
f
2
h
2
p
... ... ... ... ...
k
I ///...
k
f
k
h
k
p
Total n 1.00 100.00
Fuente:..


Para construir la distribucin de frecuencias de intervalos hay varios procedimientos. En
este texto se conviene y recomienda:
R1. Elegir no ms de 20 intervalos ni menos de 5, ya que muchos intervalos pueden
complicar innecesariamente los clculos de las medidas descriptivas, y pocos intervalos
podran omitir caractersticas importantes de los datos. En este texto elegimos todos los
intervalos de igual amplitud A.
R2. El nmero de intervalos elegido, debe dar una distribucin de frecuencias mono modal,
es decir, una distribucin cuyas frecuencias van aumentando progresivamente hasta una
frecuencia mxima y luego van disminuyendo tambin progresivamente.
Tema: Estadstica Descriptiva

23
Ing. Est. Jorsi Ericson Balczar Gallo

Construccin de la distribucin de frecuencias
Dados n valores de alguna variable cuantitativa X continua (o discreta con ms de 20
valores distintos) uno de los mtodos para construir la distribucin de frecuencias es:

1. Determinar el rango (R) de variacin de los datos que se define por
min max
X X R =
;
donde
max
X es el dato mximo y
min
X es el dato
mnimo.

2. Determinar el nmero de intervalos, k, teniendo en cuenta la recomendacin R1.
Un valor aproximado del nmero de intervalos, k, nos proporciona la regla de Sturges,
donde,
k = 1 + 3.3log(n), n > 10 ; redondeado el nmero al entero inmediato mayor.
Por ejemplo, si se tienen n = 45 datos sin decimales, entonces,
k = + = 1 3 3 45 6 4556 . log( ) . . Luego, k podr elegirse como 6, 7, 8, o cualquier otro nmero
entero, teniendo en cuenta las recomendaciones R1 y R2.
Alternativamente se puede utilizar , n k = donde 400 25 s sn .

3. Determinar la amplitud A del intervalo, dividiendo el rango entre el nmero de intervalos.
Esto es,
A R k = .
Si la divisin A R k = no es exacta en el nmero de decimales de los datos, entonces,
el nmero A se aproxima por exceso de manera que se cubra todo el rango, esto es, de
manera que kA R > .
Si los datos son enteros, A es entero, si los datos tienen un decimal, A tiene un
decimal, etc. Por ejemplo, si los datos tienen dos decimales y si = k R/ 5.3416, se elige
= A 5.35. (no 5.34).

4. Determinar el Exceso:
E= R-R= A*K-R

5. Determinar los extremos de los intervalos de la siguiente manera:
[ , [
min min 1
A X X I + =
[ 2 , [
min min 2
A X A X I + + =
[ 3 , 2 [
min min 3
A X A X I + + =
..
] , ) 1 ( [
min min
kA X A k X I
k
+ + =


Observe que se cierra por la derecha el ltimo intervalo. Esto se debe a que si la
divisin R/k es exacta en el nmero de decimales de los datos, entonces,
kA X X + =
min max
.
Tema: Estadstica Descriptiva

24
Ing. Est. Jorsi Ericson Balczar Gallo


EJEMPLO 1.3. Los ingresos quincenales en dlares (variable X) de 45 personas son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
Construir una distribucin de frecuencias de 8 intervalos.


SOLUCION:
1) De los datos, se encuentra =
max
X 89 y =
min
X 26. El rango de variacin de los datos es:
R = = 89 26 63
2) La amplitud del intervalo se elige a partir del valor
A
R
k
= = =
63
8
7875 . .
Como los datos son enteros, elegimos 8 = A .

2) Los intervalos, el conteo y las frecuencias absolutas de los 45 ingresos quincenales se
dan en el cuadro 1.6:

3)
Cuadro 3: Distribucin de los ingresos de 45 personas
Frecuencias
Intervalos Conteo Absoluta Relativa Porcentaje
I
i

f
i

i
h p
i
%

[26,34[ / 1 0.022 2.2
[34,42[ // 2 0.044 4.4
[42,50[ //// 4 0.089 8.9
[50,58[ ///// ///// 10 0.222 22.2
[58,66[ ///// ///// ///// / 16 0.356 35.6
[66,74[ ///// /// 8 0.178 17.8
[74,82[ /// 3 0.067 6.7
[82,90] / 1 0.022 2.2
Total 45 1.000 100.0
Fuente: Elaboracin propia.



Tema: Estadstica Descriptiva

25
Ing. Est. Jorsi Ericson Balczar Gallo

Ejercicio.
Estos datos corresponden a las puntuaciones de 60 ingresantes a la Escuela de Ingeniera
Industrial en el ltimo examen de admisin para el ingreso a la UCV Piura.
65 43 88 59 35 76 21 45 62 41
36 78 50 48 62 60 35 53 65 74
49 37 60 76 52 48 61 34 55 82
84 40 56 74 63 55 45 67 61 58
79 68 57 70 32 51 33 42 73 26
56 72 46 51 80 54 61 69 50 35





GRAFICOS PARA CUADROS CON INTERVALOS (otro ejemplo)
HISTOGRAMA:
Es una grafica que se utiliza para representar la distribucin de frecuencias absolutas o
relativas simples.
Consiste en un grupo de rectngulos adyacentes que tienen sus bases en el eje de las
abscisas (donde se representa los intervalos de clase de la variable) y altura igual a las
frecuencias de cada clase.

C
A
N
T
I
D
A
D
0
5
10
15
20
25
1
5

-

1
9
1
0

-

1
4
2
0

-

2
4
2
5

-

2
9
30
35
3
0

-

3
4
EDAD (aos)






Tema: Estadstica Descriptiva

26
Ing. Est. Jorsi Ericson Balczar Gallo














POLGONO DE FRECUENCIA:
Tambin es un grafico que se utiliza para representar la distribucin de frecuencias
absolutas o relativas simples.
Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante el par
de valores de marca y frecuencia correspondientes. Para fines de grfico, se hace
necesario incrementar un intervalo de clase en cada extremo, con frecuencias cero.

C
A
N
T
I
D
A
D
0
5
10
15
20
25
7
30
35
EDAD (aos)
12 17 22 27 32 37





Tema: Estadstica Descriptiva

27
Ing. Est. Jorsi Ericson Balczar Gallo
C
A
N
T
I
D
A
D
0
5
10
15
20
25
7
30
35
EDAD (aos)
12 17 22 27 32 37


OJIVAS:
Son grficos que se utilizan para representar las frecuencias acumuladas absolutas o
relativas, y que consiste en un grafico lineal que nos permite observar la cantidad de
elementos que quedan por encima o por debajo de determinados valores.
Las ojivas son de dos tipos:
ojivas menor que, ojivas o ms.
Para su elaboracin se trabaja con los lmites inferiores de cada intervalote clase y las
frecuencias acumuladas correspondientes.

GRAFICO N 12
COMISARIA X
DISTRUBUCION ACUMULADA
MENOR QUE DE PERSONAS
DETENIDAS POR DELITO DE ROBO,
SEGN EDAD - JUNIO 2005

GRAFICO N 13
COMISARIA X
DISTRUBUCION ACUMULADA O
MAS DE PERSONAS DETENIDAS
POR DELITO DE ROBO, SEGN
EDAD - JUNIO 2005

Tema: Estadstica Descriptiva

28
Ing. Est. Jorsi Ericson Balczar Gallo
N
U
M
E
R
O

D
E

P
E
R
S
O
N
A
S
0
40
60
80
100
120
10 20 25 15 30 35
20
EDAD (aos)

N
U
M
E
R
O

D
E

P
E
R
S
O
N
A
S
0
40
60
80
100
120
10 20 25 15 30 35
20
EDAD (aos)


















PRACTICA DIRIGIDA
1. En el tema de estadstica nos referamos a un atleta de decatln cuya media de
puntuacin en las 10 pruebas era de 801.6 puntos. Especifica en este estudio estadstico
quin es la poblacin y qu tipo de variable se considera.

2. Indi ca que vari abl es son cual i tati vas y cual es cuanti tati vas:
a. Comi da Favori t a.
b. Profesi n que t e gust a.
c. Nmero de gol es marcados por t u equi po favori t o en l a l t i ma
t emporada.
d. Nmero de al umnos de l a UCV-PIURA. El col or de l os oj os de
t us compaeros de cl ase.
e. Coefi ci ent e i nt el ect ual de t us compaer os de cl ase.
f. Nmero de art cul os defect uosos.
g. Porcent aj e de art cul os defect uosos.
Tema: Estadstica Descriptiva

29
Ing. Est. Jorsi Ericson Balczar Gallo
h. Peso en gr. de pernos.
i . Capaci dad de car ga del mont acar ga.

3. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes
caractersticas
- Profesin - Ao de nacimiento - Nacionalidad -
Edad
- Grado de instruccin - Estado civil - Nmero de hijos
- Ingreso mensual familiar promedio - Nmero de telfono
- Nmero de DNI - Direccin

4. De l as si gui ent es vari abl es i ndi ca cul es son di scretas y cual es
conti nas.
a. Nmero de acci ones vendi das cada d a en l a Bol sa.
b. Temperat ur as regi st radas cada hor a en un observat ori o.
c. Per odo de duraci n de un aut omvi l .
d. El di met ro de l as r uedas de vari os coches.
e. Nmero de hi j os de 50 fami l i as.

5. Cl asi fi car l as si gui ent es vari abl es en cual i tati vas y
cuanti tati vasdi scretas o conti nuas.
a. La naci onal i dad de una persona.
b. Nmero de l i t ros de agua cont eni dos en un depsi t o.
c. Nmero de l i bro en un est ant e de l i brer a.
d. Suma de punt os t eni dos en el l anzami ent o de un par de dados.
e. La profesi n de una persona.
f. El rea de l as di st i nt as bal dosas de un edi fi ci o.
g. Nmero de maqui nas remal l adoras.
h. Nmero de pernos produci dos di ari ament e.
6. Al investigar el nivel socioeconmico en una encuesta a Profesores de la I.E. San
Miguel de Piura en el mes de Diciembre del 2010 con los valores: Bajo(B), medio (M),
alto(A), 20 profesores dieron las siguientes respuestas: M, B, B, M, A, B, B, M, M, B,
M, B, B, A, M, B, M, A, M, B. Construir la distribucin de frecuencias y trazar su
grfica.

7. En la Librera TODO BARATO en el mes de Enero del 2010 se realizo un inventario
de 20 lotes de 48 libros cada uno y se encontr el siguiente nmero de libros con errores
por lote: 3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 3, 4, 3, 2, 3.
a. Construir la distribucin de frecuencias relativas y frecuencias relativas
acumuladas. Graficar.
b. Qu porcentaje de lotes tienen dos o ms pero menos de 4 artculos defectuosos?

8. Las punt uaci ones obt eni das por un grupo de en una prueba de
est ad st i ca a l os al umnos de La UCV- Pi ura en el mes de Marzo del
2011 han si do:
Tema: Estadstica Descriptiva

30
Ing. Est. Jorsi Ericson Balczar Gallo
11 17 12 13 1 20 8 20 1 16
9 1 14 1 5 12 9 17 7 5

a. Const rui r l a tabl a de di stri buci n de f recuenci as y di buj a el
pol gono de f recuenci as.

9. Organiza los datos y realiza un diagrama de tronco y hojas para luego realizar su cuadro
con 5 intervalos de igual amplitud (k=5) y tambin utilizando la regla de Sturges con
los sueldos anuales de las siguientes personas que trabajan en la fbrica de Cementos
Pacasmayo en Lima en Enero del 2010 de la planilla de la empresa.
33320 20967 28537 29411 31611 23188 21638 32865 22513 27742 28384 24582
21081 23820 22992 26768 30092 29148 27361 30021 21809 23890 31914 26621
23437 21959 28536 20546 28931 25562 22241 32418 32880 23899 32506 26533
23511 20107 33388 28752 26794 28823 24631 22675 33419 27174 27103 25728

10. Se ha medido a 30 enfermos del Hospital Regional de Piura en el mes de enero del
2009 el contenido de calcio en la sangre, datos recolectados de su registro medico,
dndose los valores siguientes:
8.46 12.46 9.23 12.40 10.17 11.58 10.01 11.32 11.19 10.40
9.43 8.89 8.99 9.88 11.74 10.90 12.88 11.78 12.62 8.93
12.57 9.86 12.16 8.37 12.29 11.83 8.71 10.24 11.13 8.98

a. Agrupa en intervalos y represntalo grficamente de una manera adecuada.
b. Interpreta los resultados ms importantes en esta tabla.

11. Los puntajes de una prueba de aptitud de Alumnos de la I.E. San Juan Bautista del
2010 en Barranca se tabularon en una distribucin de frecuencias de 6 intervalos de
igual amplitud. Si se tienen: marcas de clase,

, frecuencias: h h
1 6
= ,
h h
3 5
= , h
4
0 25 = . , h h h
2 4 1
= , h h
3 1
0 10 = + . , y F
6
60 = , completar la distribucin de
frecuencias absolutas y graficar el polgono
12. Durant e est e ao se han cont abi l i zado de l os regi st ros l os si gui ent es
naci mi ent os en l a zona nort e del Per en el ao 2009, del acat a medi co
se obt uvo l o si gui ent e:
HOSPITAL A B C D F
N de NACIMIENTOS 331 592 141 499 196

Di buj ar par a est os dat os un pictograma de cunas que represente el nmero de
nacimientos en cada hospital (el rea de la cuna debe ser proporcional a la frecuencia).

13. El nmero de est r el l as de l os hot el es de Per en el ao 2009 segn
un i nforme del Mi ni st eri o de Econom a en febr ero del 2010 emi t i do
por INEI vi ene dado por l a si gui ent e ser i e:
3 5 4 2 2 5 2 4 2 4 3 3 2 2 2 3 3 5
a. Const rui r l a t abl a de di st ri buci n de frecuenci as y di buj a el
di agr ama de barr as.

Tema: Estadstica Descriptiva

31
Ing. Est. Jorsi Ericson Balczar Gallo
14. Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea,
resultando los siguientes: 21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8
22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9
12.2 13.4 15.1 19.1
a) Construir una distribucin de frecuencias de 6 intervalos de igual amplitud y a
partir de sta

15. Las cal i fi caci ones det ermi nadas segn el regi st ro acadmi co de un
profesor de 50 al umnos en Mat emt i cas del l a I. E. San Mi guel de
Pi ura en el ao 2008 han si do l as si gui ent es:
20 12 14 0 10 0 1 0 19 13
3 6 18 5 17 20 14 0 6 8
3 12 13 6 3 3 4 20 11 9
3 20 4 5 4 16 2 9 0 10
8 12 20 14 18 3 17 13 7 19

a. Const rui r l a tabl a de di stri buci n de f recuenci as y di buj a el
di agrama de barras .

16. Las notas del examen parcial de estadstica de Educacin de la Universidad
Nacional de Piura en el II ciclo del 2010 dieron la siguiente distribucin de frecuencias
a) Completar la distribucin de frecuencias.
b) Graficar el Histograma de frecuencias respectivo.
c) Qu porcentaje de las notas se encuentran aproximadamente en el intervalo:[8, 14].
Nota


[ , [ 0.15
[6 , [ 0.45
[ , [ 0.70
[ , [ 13.5
[ , ] 0.10
17. Los pesos recol ect ados de una encuest a a l os 65 empl eados de l a
fbri ca BACKUS de l a Ci udad de Li ma en el ao 2009 vi enen dados
por l a si gui ent e t abl a:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
f
i
6 2 8 13 9 4 1

a. Const rui r l a tabl a de f recuenci as .
b. Represent ar el hi stograma y el pol gono de f recuenci as .

18. La distribucin de los tiempos, en minutos, que utilizaron 65 personas para realizar
una prueba de aptitud aparece representada en el siguiente histograma. Qu porcentaje
de las personas emplearon entre 9 y 11.5 minutos ?.




Tema: Estadstica Descriptiva

32
Ing. Est. Jorsi Ericson Balczar Gallo







19. En SAGAFALABELLA, el sueldo mnimo y mximo de 200 empleados de su
planilla en el mes de Enero de 2010 es de $150 y $300 respectivamente. Tales sueldos
se tabulan en una distribucin de frecuencias de 5 intervalos de igual amplitud. Si se
sabe que 20 empleados ganan al menos 150$, pero menos de $180, 60 ganan menos de
210$, 110 ganan menos de $240, 180 ganan menos de $270 y el 10% restante de
empleados gana a lo ms$ 300; reconstruir la distribucin y graficar su polgono de
frecuencias.

20. La demanda diaria de azcar (en decenas de kilos) en el 2010 recopilada de su
registro de ventas durante ciento noventa das en COSTOS SAC , se tabul en una
distribucin de frecuencias simtrica de cinco intervalos de amplitud iguales a 4. Si la
marca de clase del intervalo central es igual a 12 y si la curva de frecuencias absolutas
satisface la relacin: f x x ( ) ( ) = + 12 70
2
reconstruir la distribucin y graficar su
histograma.

21. La organizacindel tiempo (minutos) registrados en un informe, que tardaron 100
obreros de CONSTRUCTICOS SAC para ejecutar la reparacin de un colegio en el mes
de Enero del 2010, ha dado una tabla de frecuencias de cuatro intervalos de igual
amplitud cuyo histograma correspondiente es simtrico. Si el intervalo ?] , 6 [
1
= I , la
frecuencia absoluta: 5 2
1 2
+ = f f , y si se sabe que el 85% de los obreros demoran
menos de 12 minutos. Completar la distribucin de frecuencias.
22. Los 40 al umnos de l a Uni versi dad Naci onal de Pi ura en el mes de
Enero de 2009 de una cl ase han obt eni do l as si gui ent es punt uaci ones,
sobre 50, en un examen de Est ad st i ca.
30 3 47 24 40 34 0 36
3 19 39 25 7 1 19 1
10 4 5 14 44 19 19 48
9 34 28 31 49 1 50 8

a. Const rui r l a tabl a de f recuenci as .
b. Di buj ar el hi stograma y el pol gono de f recuenci as .







Tema: Estadstica Descriptiva

33
Ing. Est. Jorsi Ericson Balczar Gallo
































REDUCCION DE DATOS

En las tres semanas anteriores estn referidos, con cierto detalle, a la clasificacin
de variables, recoleccin de datos, construccin de tablas de frecuencia y a la
representacin grafica, como fase preliminar en la descripcin y anlisis
estadstico. El objetivo principal de estas primeros temas, ha sido determinar la
naturaleza y formas de la distribucin de frecuencias, como base para la
reduccin de datos a travs de ciertas caractersticas descriptivas y medidas de
resumen.

En el problema de comparar dos o mas distribuciones de frecuencias, puede
resultar fcil hacer una comparacin grafica de las frecuencias, sin embargo,
existen dificultades para hacer comparaciones cuantitativas. Estadsticamente para
Tema: Estadstica Descriptiva

34
Ing. Est. Jorsi Ericson Balczar Gallo
facilitar este anlisis comparativo es necesario disponer de algunos indicadores o
medidas de resumen.

Estas caractersticas descriptivas (cantidad), constituyen los llamados
ESTADIGRAFOS, que son indicadores o medidas de resumen estadsticos.

En general, para llegar a determinar los ESTADIGARFOS se sigue el siguiente
esquema:

















MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Son valores que reflejan el centramiento o punto central de la variable estudiada.
Son tres: la media, la mediana y la moda.

MEDIA ARITMTICA
Es el valor promedio de todos los valores de la variable, o el centro de gravedad
de la distribucin de datos. Se representa como si se trata de la media de la
poblacin de referencia y como x si se trata de una media muestral.
La media puede calcularse en las variables cuantitativas continuas y discretas. La
frmula es:
Recopilacin de datos
DATOS ORIGINALES
Organizacin y procesamientos
de datos
DISTRIBUCION DE FRECUENCIAS
Reduccin de datos
CARACTERISTICAS DESCRITIVAS
ESTADIGRAFOS
Tema: Estadstica Descriptiva

35
Ing. Est. Jorsi Ericson Balczar Gallo
n
x x x x
n
x
X
n
i
+ + + +
= =

. ..........
3 2 1


xi= Sumatorio de todos los valores de la variable
n = nmero total de todos los individuos

Ejemplo:
Calcular la media de edad de un grupo de 6 personas, cuyas edades son 5, 6,7, 8,
9 y 10 aos.
5 . 7
6
10 9 8 7 6 5
=
+ + + + +
= X


LA MEDIANA
- Cuando se tiene un numero impar de datos, la mediana es igual al termino
central:


Ejemplo: Consideremos el peso en kilogramos de una muestra de 11 alumnos de
las Escuela Profesional de Estomatologa del turno Tarde:
65 76 48 48 68 78 90 87 67 72 78
Entonces n = 11
Ordenamos los datos
48 48 65 67 68 72 76 78 78 87 90
Ahora buscamos el trmino medio:

11 1 6
2
Me x x
+
= = , es decir el sexto valor de la serie es la mediana, Me = 72

- Cuando se tiene un numero par de datos, la mediana es igual:



Ejemplo: Supongamos que tenemos datos sobre los sueldos en soles que reciben
mensualmente el personal que labora en el hospital de la ciudad de Piura.
445 510 323 425 428 440 432 510

1
2
1
2 2
2
n
n n
si n es impar
Me x
si n es par
x x
Me
+
+
=
+
=
+
+
=
+
=
1
2
1
2 2
2
n
n n
si n es impar
Me x
si n es par
x x
Me
Tema: Estadstica Descriptiva

36
Ing. Est. Jorsi Ericson Balczar Gallo
Entonces n = 8 y ya estn ordenados
8 8 1
4 5 2 2
432 440
436
2 2 2
x x
x x
Me
+
+
+ +
= = = =


LA MODA O EL VALOR MODAL (MO):
Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica.
Ejemplo:
- El conjunto: 2 2 5 7 9 9 9 10 10 11 13 tiene la moda Mo = 9
- El conjunto: 3 5 8 10 12 16 18 no tiene moda.
- El conjunto: 2 3 4 4 4 5 5 7 7 7 9 tiene dos modas 4 y 7; es una
distribucin bimodal.


MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

LA MEDIA ARITMTICA PARA DATOS AGRUPADOS EN TABLAS DE
FRECUENCIAS
Los datos se pueden presentar en tablas sin intervalos y en tablas con intervalos,
en ambos casos se usa la Media aritmtica Ponderada
M(Y) =
1
y
i i
i
Y f
n
=


LA MEDIANA PARA DATOS AGRUPADOS

1. La mediana en tablas sin intervalos
a) Que
2
n
no coincide con algn Nj se tiene que:
1
2
j j
n
N N

< <
Entonces Me = Yi

b) Que
2
n
coincide con algn Nj, se tiene que:
1
2
j j
n
N N

= <
Entonces:
( )
1
2
:
j i j
Me Y Y

+


2. La mediana en tablas con intervalos
Tema: Estadstica Descriptiva

37
Ing. Est. Jorsi Ericson Balczar Gallo
a. Hallamos
2
n
1
2
j j
n
N N

< <
1
1
2
j
i
j j
n
N
Me L c
N N

(
= +
(

(



LA MODA PARA DATOS AGRUPADOS

1. La moda en tablas sin intervalos
Una vez agrupados los datos en una tabla de frecuencia, el valor modal ser el
valor de la variable que mas se repite o que tiene la mayor frecuencia. La mayor
frecuencia se denotara con
j
n .
La moda Mo =
j
n

2. La moda en tablas con intervalos

1
1 1
j
i
j j
n
Mo L c
n n
+
+
(
= +
(
+
(







MEDIDAS DE POSICIN

MEDIDAS DE POSICIN PARA DATOS AGRUPADOS

LOS CUARTILAS (Q
K
) PARA DATOS AGRUPADOS
Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles:
- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los
datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad
de los datos
Tema: Estadstica Descriptiva

38
Ing. Est. Jorsi Ericson Balczar Gallo
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los
dato
Usamos la siguiente formula:
3 , 1
4
1
1
=
(
(
(
(

+ =

K
N N
N
kn
C L Q
j j
j
I K


DECILES: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, tal que entre dos decilas consecutivas se encuentre no mas del
10% del total de las observaciones.
En total hay nueve decilas: D1, D2, D3, D4, D5,.., D9.
9 , 1
10
1
1
=
(
(
(
(

+ =

K
N N
N
kn
C L D
j j
j
I K

PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados.
Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y
por encima queda el 85%
99 , 1
100
1
1
=
(
(
(
(

+ =

K
N N
N
kn
C L P
j j
j
I K

PROPIEDADES DE LA MEDIA ARITMETICA

1.- E(a) = a , a es una constante

2.- E(aX) = a*E(X) , a es una Constante , X es Variable aleatoria

3.- E(X+a) = E(X) + a , a es una constante y X es una variable aleatoria

4.- E(X+Y) = E(X) + E(Y) , X y Y son dos variables aleatorias

5.- E(aX + bY)=a*E(X)+b*E(Y) , a y b son constantes, X y Y son variables aleatorias.




Tema: Estadstica Descriptiva

39
Ing. Est. Jorsi Ericson Balczar Gallo



































MEDIDAS DE DISPERSIN

Introduccin

Las medidas de tendencia central no son suficientes para describir un conjunto de valores
de alguna variable estadstica. Los promedios determinan el centro, pero nada indican
acerca de cmo estn situados los datos respecto al centro.

En primer lugar se necesita una medida del grado de dispersin o variabilidad con respecto
al centro con la finalidad de ampliar la descripcin de los datos o de comparar dos o ms
series de datos.

Tema: Estadstica Descriptiva

40
Ing. Est. Jorsi Ericson Balczar Gallo
En segundo lugar se necesita una medida del grado de asimetra o deformacin en ambos
lados del centro de una serie de datos, con el fin de describir la forma de la distribucin de
los datos. Esta medida se denomina ndice de asimetra.

En tercer lugar se necesita una medida que nos permita comparar el apuntamiento o curtosis
de distribuciones simtricas con respecto a la distribucin simtricanormal. Esta medida se
denomina ndice de apuntamiento o curtosis.

Las estadsticas de asimetra y apuntamiento se incluyen en este captulo dada su poca
importancia.

El lector debera correr paquetes de computo entre otros el MCEST para las aplicaciones de
este capitulo.


3.2 Medidas de dispersin
Las medidas de dispersin o variabilidad son nmeros que miden el grado de
separacin de los datos con respecto a un valor central, que generalmente es la media
aritmtica.
Las principales medidas de dispersin son:
el rango,
el rango intercuartil,
la varianza,
la desviacin estndar, y
el coeficiente de variacin.


3.2.1 Rango o recorrido de una variable
Definicin. El rango de variacin o recorrido,R, de una serie de datos, es la diferencia entre
sus valores mximo y mnimo. Esto es,
min max
x x R =


siendo
x
max
el valor mximo y
x
min
el valor mnimo.
El rango es una medida de dispersin muy fcilmente calculable, pero es muy inestable,
ya que depende nicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se aade o elimina un slo dato. Por tanto su uso es muy limitado.
Por ejemplo, dadas las dos series de datos
a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9
b) 1, 2, 3, 4, 5, 6, 7, 8, 9
Ambas series tienen la misma media, 5, y el mismo rango, 8, pero las dos series no tienen la
misma dispersin, ya que la segunda tiene mayor variabilidad.
El empleo del rango como medida de comparacin de variacin puede estar justificado
cuando se precise rpidamente de una medida de dispersin y no haya tiempo de
calcular algunas de las otras.
Tema: Estadstica Descriptiva

41
Ing. Est. Jorsi Ericson Balczar Gallo

3.2.2 Rango intercuartil y rango semiintercuartil

Definicin. El rango intercuartil,RI, es la diferencia entre sus cuartiles tercero y primero.
Esto es,
1 3
Q Q RI =


El rango intercuartiles una medida que excluye el 25% ms alto y el 25% ms bajo,
dando un rango dentro del cual se encuentra el 50% central de los datos observados y a
diferencia del rango total no se encuentra afectada por los valores extremos.
Si el rango intercuartil es muy pequeo entonces describe alta uniformidad o
pequea variabilidad de los valores centrales.
Por ejemplo, si en una distribucin de frecuencias de 100 ingresos quincenales se
encuentran los cuartiles $ 62
1
= Q , y $ 70
3
= Q , entonces, el rango intercuartil es
. 8 $ 62 70 $
1 3
= = = Q Q RI Esto, indica que el 50% de los ingresos quincenales de los 100
empleados vara dentro del valor $8.
El rango intercuartil se aplica a variables medidas en escala por lo menos ordinal.
Definicin. El rango semiintercuartil,RSI, es igual al rango intercuartil dividido por 2.
El rango semiintercuartil se puede asociar con la mediana y se puede expresar en funcin
de ella. Si una distribucin es normal los cuartiles
3 1
y Q Q son equidistantes de la mediana.
Se deduce entonces, que el rango intercuartil y la mediana RSI, son la misma distancia.
Adems, como exactamente el 50% de los datos se encuentran en el rango intercuartil,
entonces, el intervalo: medianaRSI contiene tambin exactamente el 50% de los datos. Si
la distribucin es asimtrica, el intervalo: medianaRSI contendra aproximadamente el
50% de los datos.
Por ejemplo, si en la distribucin de los 100 ingresos quincenales donde $ 62
1
= Q , y
$ 70
3
= Q , el rango semiintercuartil es $4. Si la mediana fuera igual a $66, entonces,
aproximadamente el 50% de los datos se hallan comprendidos en el intervalo $66 4.

NOTA. Si la distribucin es muy asimtrica, el rango intercuartil (o el semiintercuartil) es
preferible a la desviacin estndar como medida de la dispersin.




Varianza y Desviacin estndar
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de los
valores de una variable cuantitativa con respecto a su media aritmtica. Si los valores
tienden a concentrarse alrededor de su media, la varianza ser pequea. Si los valores
tienden a distribuirse lejos de la media, la varianza ser grande.
La varianza calculada a partir de una muestra ser denotada por
2
s y referida a una
poblacin se denotar por
2
o .
Definicin. La varianza se define como la media aritmtica de los cuadrados de las
diferencias de los datos con respecto a su media aritmtica.

Tema: Estadstica Descriptiva

42
Ing. Est. Jorsi Ericson Balczar Gallo
La varianza es una medida de dispersin con unidades de medicin al cuadrado, por
ejemplo, $
2
, Km
2
, etc.

Definicin.La desviacin estndares la raz cuadrada positiva de la varianza.

La desviacin estndar calculada a partir de una muestra se denotar por s y referida a la
poblacin por o. Esto es,
2
s s = ,
2
o = o .


Clculo de la varianza

1) Varianza de datos no tabulados
La varianza de n valores
n
x x x ,..., ,
2 1
, de alguna variable cuantitativa X cuya media es x ,
es el nmero:
n
x x
s
n
i
i

=
1 =
2
2
) (


Es fcil verificar que:

= =
=
n
i
i
n
i
i
x n x x x
1
2 2
1
2
) (



Por lo tanto,
2 1
2
2
x
n
x
s
n
i
i
=

=







EJEMPLO 3.1
Calcularla varianza y la desviacin estndar de los 45 ingresos quincenales sin tabular
del ejemplo 1.3
SOLUCION
45 = n ,
=

=
n
i
i
x
1
2682$,
= =
45
2682
x
59.6,
=
n
i
x
=1 i
2
166,244$
2
Luego, la varianza es el nmero
Tema: Estadstica Descriptiva

43
Ing. Est. Jorsi Ericson Balczar Gallo
= = =

= 2 2 1
2
2
) 6 . 59 (
45
244 , 166
x
n
x
s
n
i
i
142.151$
2
.

Mientras, que la desviacin estndar es: = = = 151 . 142
2
s s 11.923$
Observar que la varianza est en $
2
, mientras que la desviacin estndar est en $.

2) Varianza de datos tabulados

2a) Variable discreta
La varianza de n valores de una variable estadstica discreta X que se clasifican en k
valores distintos
k
x x x ,..., ,
2 1
con frecuencias absolutas respectivas f f f
k 1 2
, ,..., , y cuya media
aritmtica es x se calcula utilizando la frmula:
n
x x f
s
k
i
i i

=
1 =
2
2
) (

Se verifica que
= =
=
k
i
i i
k
i
i i
x n x f x x f
1
2 2
1
2
) (

Por lo tanto,
2 1
2
2
x
n
x f
s
k
i
i i
=

=


EJEMPLO 3.2
Calcular la varianza y la desviacin estndar del nmero de hijos de la muestra de 20
familias del ejemplo 1.2.
SOLUCION.
La distribucin del ejemplo 1.2 se repite en el cuadro 3.1 donde se ha insertado una
columna de productos
2
) (
i i
x f .
Entonces, = n 20, k=5,
=

=
k
i
i i
x f
1
44,
= =
20
44
x
2.2,

=
k
i i
x f
=1 i
2
118
Luego, la varianza es el nmero
= = =

=
2 2
1
2
2
) 2 . 2 (
20
118
x
n
x f
s
k
i
i i
1.06 hijos
2
.
La desviacin estndar es: = = = 06 . 1
2
s s 1.03 hijos.

Tema: Estadstica Descriptiva

44
Ing. Est. Jorsi Ericson Balczar Gallo
Cuadro 3.1 Computo de la varianza:
Caso de variable discreta
i
x
i
f
i i
x f
2
i i
x f

0 1 0 0
1 4 4 4
2 7 14 28
3 6 18 54
4 2 8 32
Total 20 44 118

2b) Varianza de datos tabulados por intervalos
La varianza de n valores de alguna variable X, tabulados en k intervalos, con marcas de
clases
k
m m m ,..., ,
2 1
, frecuencias absolutas respectivas
k
f f f ,..., ,
2 1
y con media x es el
nmero:
n
x y f
s
k
i
i i

=
1 =
2
2
) (

Se puede verificar que:

= =
=
k
i
i i
k
i
i i
x n y f x y f
1
2 2
1
2
) (


Por lo tanto,
. =
) (y
2 1
2
2
1
2
1
2
1 =
2
2
x
n
y f
n
y f y f n
n
x f
s
k
i
i i
k
i
k
i
i i i i
k
i
i i

=
= =




EJEMPLO 3.3
Calcular la varianza y la desviacin estndar de los 45 ingresos quincenales tabulados del
ejemplo 1.3.
SOLUCION.
La distribucin del ejemplo 1.3 se repite en el cuadro 3.2 donde se ha insertado una
columna de productos
2
i i
m f .
Cuadro 3.2. Clculo de la varianza para datos agrupados por intervalos
Ingresos Marcas N#.Personas Productos Productos
i
I y
i

i
f
i i
y f
2
i i
y f
[26,34[ 30 1 30 900
[34,42[ 38 2 76 2888
Tema: Estadstica Descriptiva

45
Ing. Est. Jorsi Ericson Balczar Gallo
[42,50[ 46 4 184 8464
[50,58[ 54 10 540 29160
[58,66[ 62 16 992 61504
[66,74[ 70 8 560 39200
[74,82[ 78 3 234 18252
[82,90] 86 1 86 7396
Total 45 2702 167764
= n 45, k= 8, =

=
k
i
i i
y f
1
2702,
= =
45
2702
x
60.044,

=
k
i i
y f
1 = i
2
167,764
Luego, la varianza es el nmero
= = =

= 2 2 1
2
2
) 044 . 60 (
45
764 , 167
x
n
y f
s
k
i
i i
122.754 $
2
.
La desviacin estndar es: = = = 754 . 122
2
s s 11.079 dlares.
Observar que la varianza de los mismos datos no tabulados es 142.151$
2
.

NOTA (Clculo de la varianza con frecuencias relativas)
La varianza se calcula tambin con frecuencias relativas (o porcentajes). En efecto, si se
hace n f h
i i
= en la varianza de datos tabulados, se tiene
2
1
2 2
x m h s
k
i
i i
=

=
, donde
=
=
k
i
i i
m h x
1

NOTA (Varianza poblacional)
La varianza
2
o de una poblacin finita de N datos
N
x x x ,..., ,
2 1
sin tabular y cuya media es
, se define por:
2 1 =
2
1 =
2
2
) (
=

= o

N
x
N
x
N
i
i
N
i
i

Si formamos todas las muestras posibles de tamao n y calculamos sus varianzas
utilizando la frmula n x x s
i
=
2 2
) ( , resulta que la media de todas estas varianzas vale:

2
1
o

n
n
.
Para que la media de todas las varianzas sea igual a
2
o , basta multiplicar a
2
s por
) 1 ( n n . Por esta razn, algunos autores definen la varianza (en estadstica descriptiva ) con
denominador 1 n . Estas 2 varianzas se tratan en el captulo 9 de estimacin de parmetros.


3.2.4 Coeficiente de variacin
Tema: Estadstica Descriptiva

46
Ing. Est. Jorsi Ericson Balczar Gallo
Definicin. El coeficiente de variacin,C.V. es una medida de dispersin relativa (libre de
unidades de medidas), que se define como la desviacin estndar dividido por la media
aritmtica. Esto es,
, . .
x
s
V C =
o en %
El coeficiente de variacin se utiliza para comparar la variabilidad de dos o ms series de
datos que tengan medias iguales o diferentes o que tengan unidades de medida iguales o
diferentes (por decir, una serie en kilogramos y otra serie en metros).
Por dar un ejemplo, si dos secciones H1 y H2 de matemtica I, tienen la misma
desviacin estndar igual a 14, no podemos concluir que los dos horarios tienen la misma
variabilidad. As mismo, si las desviaciones estndares de H1 y H2 son iguales a 2 y 4
respectivamente no podemos concluir que las notas de H2 son ms dispersas que las de H1.
La variabilidad depende de las medias de los dos grupos.
Si la media del horario H1 es 16 y la media del horario H2 es 11, los coeficientes de
variacin respectivos son:
127% o 27 . 1
11
14
. . 87.5%, o , 875 . 0
16
14
. .
2
2
2
1
1
1
= = = = = =
x
s
V C
x
s
V C

Es decir, las calificaciones obtenidas en H1 son ms homogneas o tienen menor
variabilidad que las calificaciones del horario H2.

3.2.5 Uso de las medidas de dispersin
La varianza viene expresada en unidades cuadrticas en las que vienen expresados los
datos. La desviacin estndar viene expresada en las mismas unidades en las que vienen
expresados los datos. El coeficiente de variacin viene expresada en nmeros abstractos
(suprimiendo las unidades en las que vienen expresados los datos).
1) Si dos o ms series de datos (observados en el mismo tipo de medicin) tienen
medias aritmticas iguales (o casi iguales) es ms dispersa la serie que tiene mayor
medida de variabilidad: Rango, o RI, o
2
s , o s, o CV.
Si hay marcada asimetra, es preferible comparar con el rango intercuartil.
2) Si dos o ms series de datos, no tienen medias iguales (o casi iguales), o no tienen las
mismas unidades de medicin, entonces, es ms dispersa la serie que tenga mayor
coeficiente de variacin.

NOTA (Valores estandarizados)
Cuando se necesiten comparar valores observados que pertenecen a diferentes
distribuciones de datos, las que difieren en su media aritmtica o en su varianza, o difieren
en el tipo de unidad de medida, entonces se usa el valor estndar Z que se define
s
x X
Z

=

El lector puede verificar que la variable Z estandariza cualquier media en 0 y cualquier
varianza en 1. (Probar que: 0 = z , y 1
2
=
s
Z
)

EJEMPLO 3.4
Tema: Estadstica Descriptiva

47
Ing. Est. Jorsi Ericson Balczar Gallo
En una evaluacin de Matemticas e Historia resultan las medias 13 y 17 y las
desviaciones estndar 3 y 4, respectivamente. Si un alumno obtiene 14 en Matemticas y 16
en Historia, en cul de los dos cursos tiene mejor rendimiento relativo?.
SOLUCION
El hecho de que tenga 16 en Historia y 14 en Matemticas no significa que tiene mejor
rendimiento en Historia.
Se deben calcular los rendimientos relativos con la puntuacin estandarizada Z
En Matemticas 333 . 0
3
13 14
=

= z
En Historia 25 . 0
4
17 16
=

= z
En consecuencia, tiene mejor rendimiento relativo en Matemticas.




3.2.6 Propiedades de la varianza.
1) La varianza es un nmero real no negativo y viene expresada en unidades cuadrticas.
Mientras, que la desviacin estndar viene expresada en las mismas unidades en las que
vienen expresados los datos.
2) Dadas, la media x y la varianza
X
s
2
de n datos de una variable X, la suma total de los
cuadrados de los valores es igual a n
s
x
X
( )
2 2
+ . Para datos no tabulados se tiene por
ejemplo,
x n
s
x
i
i
n
X
2
1
2
2
= +

=
( )

3) Si cada uno de n los valores x
i
es transformado en y ax b
i i
= + , entonces, la varianza de los
n valores y
i
es,

Y X
s a s
2 2 2
=
(verificar!).
Consiguientemente, s a s
Y X
=
Como casos particulares se tiene:
Si
b y
i
=
, entonces,

Y
s
2
0 =
. Es decir, si losn datos son iguales a una constante,
entonces, su varianza es igual a cero.
Si b x y
i i
+ = , entonces,

Y X
s s
2 2
=
. Es decir, si sumamos a cada dato una constante, la
varianza (y la desviacin estndar) no cambian.
Si
i i
ax y = , entonces,

Y X
s a s
2 2 2
=
. Es decir, si multiplicamos a cada dato por una
constante, a, la varianza de los nuevos valores es igual que la varianza de los antiguos
valores multiplicada por a
2
.

4) La varianza y la desviacin estndar pueden ser calculadas tambin en distribucin de
frecuencias de intervalos de amplitud diferentes, siempre que puedan determinarse las
Tema: Estadstica Descriptiva

48
Ing. Est. Jorsi Ericson Balczar Gallo
marcas de las clases. Por otra parte, dependen de todos los datos y son sensibles a la
variacin de cada uno de estos. Basta que uno de los datos vare, para que varen aquellas.

5) Dados k series de datos con tamaos, medias y varianzas respectivas
2
1 1 1
, , s x n
,
2
2 2 2
, , s x n
, ...,
2
, ,
k k k
s x n , entonces, la varianza,
s
T
2
, de los n n n n
k
= + + + ...
2 1

datos es:
.
) (

1
2
1
2
2
n
x x n
n
s n
k
i
i i
k
i
i i
s
T

= =

+ =


6) Desigualdad de Chebyshev.
Cualquiera sea la forma de la distribucin de frecuencias (simtrica o asimtrica), el
intervalo ] , [
X X
ks x ks x + , k >1 contiene por lo menos el
2
1
1
k

en % de los datos.
El porcentaje de datos que se hallan fuera del intervalo es menor que el
2
1
k
en % .
Por ejemplo, el intervalo ] 2 , 2 [
X X
s x s x + contiene por lo menos el
4
3
2
1
1
2
=
o 75%,
de los datos.
El intervalo ] 3 , 3 [
X X
s x s x + contiene por lo menos el 88.89%, (8/9), de los datos.
El intervalo ] 4 , 4 [
X X
s x s x + contiene por lo menos el 93.75%, (15/16), de los datos.

EJEMPLO 3.5
En el mes de Enero el sueldo promedio de los trabajadores del sector industrial era de
$200. Para el mes de Julio se considera un aumento del 30% al sueldo del mes de Enero ms
un adicional de $50. Si el coeficiente de variacin en Enero era de 0.25, se puede decir
que la distribucin de sueldos en Julio es ms homognea?
SOLUCION
Sea X: Sueldos de Enero, Y: Sueldos de Julio
La media de Enero es: = x $200.
Coeficiente de variacin en Enero, CV= 0.25
La desviacin estndar de Enero es = = x CV s
X
0.25200 = $50
La relacin entre las dos variables es:
Y = 1.30X+ 50,
Entonces, la media de los sueldos de Julio es
310 50 ) 200 ( 3 . 1 50 3 . 1 = + = + = x y

La varianza de los sueldos de Julio es
= =
2 2 2
) 3 . 1 (
X Y
s s (1.3)
2
(50)
2
= 4225
Tema: Estadstica Descriptiva

49
Ing. Est. Jorsi Ericson Balczar Gallo
La desviacin estndar: = = 4225
Y
s 65
Coeficiente de variacin en Julio:
= = =
310
65
y
s
CV
Y
0.2097.
Comparando los coeficientes de variacin de Enero y Julio se puede decir que la distribucin
de los sueldos de Julio es ms homognea.

EJEMPLO 3.6
Si el ingreso de 120 obreros tiene una media de $300 y una desviacin estndar de $30
a) Cuntos obreros por lo menos tienen sueldos comprendidos en el intervalo [$240,
$360]?.
b) Determinar el intervalo que contiene al menos el 88.889% de los ingresos
c) Si el mnimo sueldo es $210, en qu porcentaje se puede afirmar que los ingresos son
superiores a $390?
SOLUCION.
a) = x $300, = s $30, de la relacin
] 360 , 240 [ )] 30 ( 300 ), 30 ( 300 [ = + k k
resulta 2 = k . Entonces el,
4
3
2
1
1
2
=
o 75%(120)=90 obreros por los menos tienen
ingresos en el intervalo [240, 360].
b) Si al menos el 88.889% de los obreros tienen ingresos en el intervalo
)] 30 ( 300 ), 30 ( 300 [ k k +
entonces,
8889 . 0
1
1
2
=
k
. De donde resulta 3 = k .
Luego, el intervalo es [$210, $390].
c) Fuera del intervalo [$210, $390] est menos del 11.11% de los ingresos. Si el mnimo es
$210, entonces, el porcentaje de ingresos mayor que $390 es menos de 11.11%.

EJEMPLO 3.7
El costo inicial de produccin, X ; de una muestra de 80 objetos de cierto tipo, tiene una
desviacin estndar de $30. La media del costo de produccin es de $250 para el 60% de la
muestra y de $200 para el resto. El costo final de produccin Y es dado por la relacin:
Y = 1.2X+ 5.
Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo
final de produccin, cunto se recaudara por la venta total?.
SOLUCION.
=
X
s $30, = x 2500.60 + 2000.40 = $230
De Y = 1.2X+ 5, se tiene, = + = + = 5 ) 230 ( 2 . 1 5 2 . 1 x y 281. Tambin,
= =
2 2 2
) 2 . 1 (
X Y
s s (1.2)
2
(30)
2
= 1296
Tema: Estadstica Descriptiva

50
Ing. Est. Jorsi Ericson Balczar Gallo
Recaudacin total=
= + =

=
) ( 80
2 2
80
1
2
y s y
Y
i
i
80(1296+(281)
2
) = 6,420,560.


3.3 Indices de asimetra
Definicin. Se dice que una distribucin de frecuencias es simtrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. Tambin se dice que una
distribucin es simtrica si su curva de frecuencias es simtrica con respecto al centro de los
datos.
Dos distribuciones pueden tener la misma media y la misma desviacin estndar, pero
pueden diferir en el grado de asimetra.
Si la distribucin es simtrica, entonces, la media, la mediana y la moda coinciden. En
contraposicin, si estos 3 promedios no coinciden la distribucin tiene que ser asimtrica.
Existen varias medidas de la asimetra de la distribucin de los datos, una de ellas es el
coeficiente o ndice de asimetra de Pearson.
Definicin. El ndicede asimetra de Pearson es el nmero
As
x Mo
s
=


Como en distribuciones asimtricas se verifica : x Mo x Me ~ 3( ), entonces, otra
forma de expresar el ndice de asimetra es:

S
A
x Me
s
=
3( )
.


Interpretacin.
Si la distribucin de los datos es simtrica, As = 0. Ver la figura 3.1.a, donde se
observa, adems, que coinciden los tres promedios: Mo Me x = = .
Si 0 = As , la distribucin es asimtrica. Adems, es asimtrica positiva o sesgada a
la derecha, si As > 0, (Fig. 3.1 b donde x Me Mo < < ). Y, es asimtrica negativa o
sesgada a la izquierda si As < 0 (Fig. 3.1.c donde Mo Me x < < )





a) Simtrica b) Asimetra positiva c) Asimetra negativa
Figura. 3.1


Por ejemplo, la distribucin de los 45 ingresos quincenales del ejemplo 1.3 tabulados
en ocho intervalos tiene asimetra negativa:
191 . 0
079 . 11
) 75 . 60 44 . 60 ( 3 ) ( 3
=

=
s
Me x
As


NOTA. (Otros ndices de asimetra)

Tema: Estadstica Descriptiva

51
Ing. Est. Jorsi Ericson Balczar Gallo
El ndice de asimetra de Pearson utilizando momentos es definido por:
3
3
) 2 )( 1 ( s n n
nM
As

=

donde

=
=
n
i
i
x X M
1
3
3
) ( , = n nmero de casos, = s la desviacin estndar.
Este ndice es utilizado por los paquetes de computo estadstico para determinar la
asimetra de distribuciones de la forma dato-frecuencia.
Para ndatos tabulados en k intervalos, un mtodo alternativo es utilizar el ndice de
asimetra de Fisher definido por:
3
3
/
s
n M
As =

donde:

=
=
k
i
i i
x m f M
1
3
3
) (
, = s la desviacin estndar
Si la distribucin es simtrica 0 = As . Si As > 0, es asimtrica positiva y si As < 0, es
asimtrica negativa.
Por ejemplo, continuando con el ejemplo 1.3, el ndice de asimetra de los 45 ingresos
quincenales tabulados en la forma dato-frecuencia es = As 0.375. Y de los mismos datos
tabulados en 8 intervalos es: = As 0.3.
NOTA (Ojivas asimtricas y simtricas). Las ojivas o curvas de frecuencias acumuladas,
presentan formas particulares segn el tipo de asimetra. Por ejemplo, en la figura 3.2a la
curva de frecuencia acumulada A es de una distribucin con asimetra extrema negativa. La
Ojiva C es de asimetra extrema positiva. La ojiva B es de una distribucin simtrica. En la
figura 3.2b la diagonal D es la ojiva de una distribucin normal. La curva F es la ojiva de
una distribucin simtrica leptocrtica, y la E de una platicrtica. (ver 3.4 curtosis)























Fig. 3.2a Ojivas asimtricas relativas Fig. 3.2b Ojivas simtricas relativas

Tema: Estadstica Descriptiva

52
Ing. Est. Jorsi Ericson Balczar Gallo
3.4 Curtosis
La curtosis es la propiedad de una distribucin de frecuencias por la cual se compara
la dispersin de los datos observados cercanos al valor central con la dispersin de los datos
cercanos a ambos extremos de la distribucin. La curtosis se mide en comparacin a la curva
simtrica normal o mesocrtica (fig. 3.3a)












Fig. 3.3Curtosis de curvas simtricas

Una curva simtrica con curtosis mayor que de la normal es denominada curva
leptocrtica(fig. 3.3c).
Una curva simtrica con curtosis menor que de la normal es denominada curva
platicrtica (fig. 3.3b).
Existen varias maneras de medir la curtosis de la distribucin de los datos.

Curtosis basado en percentiles
Esta medida de curtosis es muy poco usada por ser muy inestable. Sin embargo, describe
muy bien el concepto.
En una curva normal, el cociente del rango intercuartil (percentil 75 menos el percentil
25) entre la diferencia del percentil 90 menos el percentil 10 es aproximadamente igual 0.5.
A medida que
25 75
P P y
10 90
P P sean iguales (valor del cociente casi uno), la distribucin
ser leptocrtica, y a medida que
25 75
P P sea cada vez ms pequeo con respecto a
10 90
P P
(valor del cociente casi cero) la distribucin ser platicrtica.
La curtosis utilizando percentiles se define por el cociente:
5 . 0
10 90
25 75

=
P P
P P
K

Interpretacin. Si la distribucin es normal, K tiende a 0. Si K tiende a 0.5, es
leptocrtica, y si K tiende a 0.5, es platicrtica.
Por ejemplo, la distribucin de los 45 ingresos quincenales del ejemplo 1.3 tabulados en
8 intervalos tiene curtosis = = 5 . 0 ) 45 5 . 73 ( ) 4 . 53 75 . 66 ( K 0.03. Sin embargo, no se puede
relacionarla con una distribucin normal, por que sta distribucin de frecuencias no es
simtrica.


NOTA. (Otras medidas de curtosis)

Tema: Estadstica Descriptiva

53
Ing. Est. Jorsi Ericson Balczar Gallo
La curtosis utilizando momentos es definida por la expresin:
4
2 2 4
) 3 )( 2 )( 1 (
) 1 ( 3 ) 1 (
s n n n
n M M M n n
K

+
=

donde

=
=
n
i
j
i j
x X M
1
) (
, = n nmero de casos, = s la desviacin estndar.
Esta curtosis es utilizado por los paquetes de computo estadstico para determinar la
curtosis de distribuciones de la forma dato-frecuencia.
Para ndatos tabulados en k intervalos, la curtosis se calcula por:
3
/
4
4
=
s
n M
K

donde:

=
=
k
i
i i
x m f M
1
4
4
) (
, = s la desviacin estndar.
Si la distribucin es normal, K=0. Si K>0, es leptocrtica, y si K<0 es platicrtica.
Por ejemplo, continuando con el ejemplo 1.3, la curtosis de los 45 ingresos quincenales
tabulados en la forma dato-frecuencia es = K 1.021. Y de los mismos datos tabulados en 8
intervalos es = K 0.244. Sin embargo, no se puede decir que es leptocrtica, por que la
distribucin de los datos no es simtrica.