Вы находитесь на странице: 1из 75

UNIVERSIDAD ALAS PERUANAS

FILIAL HUANCAYO

FACULTAD DE CIENCIAS EMPRESARIALES

ESCUELA ACADMICO PROFESIONAL DE CONTABILIDAD

Docente:
Mg. Elsa Lagos Quispe

CAPITULO I

LA INVESTIGACIN CIENTFICA

1.1 La investigacin cientfica

El propsito de realizar una investigacin es dar respuesta a un problema.

Este problema se origina porque no existe informacin respecto a un problema en


concreto, y es ese desconocimiento inicial el que impulsa cualquier proceso de
investigacin.

La caracterstica fundamental de la investigacin cientfica es la de dar respuesta a


las cuestiones que se plantean siguiendo un camino trazado con rigurosidad,
objetividad y sistematicidad. Este modo de proceder se denomina mtodo cientfico.

1.2 Tipo de investigaciones:

El diseo, los datos que se


recolectarn, la manera de
obtenerlos, el muestreo y
otros componentes del
proceso de investigacin son
distintos en estudios
exploratorios, descriptivos,
correlacionales y explicativos.

1.2.1 Investigaciones Exploratorias:

Los estudios exploratorios tienen lugar cuando el objetivo es examinar o


explorar un tema poco estudiado o no abordado antes. Este es el tipo de
investigacin que de manera especial atienden los mtodos de
investigacin cualitativa.

1.2.2 Investigaciones Descriptivas:

Los estudios descriptivos describen los fenmenos que estamos observando


pero identificando diferentes reas o dimensiones del problema. En algunos
casos se requiere describir la situacin como se encuentra en el momento
de la investigacin.

1.2.3 Investigaciones Correlacionales:

Se establecen correlaciones o relaciones entre dos o ms variables, es decir


se trata de conocer si una determinada variable est asociada con otra,
pero no explica las relaciones causales entre ellas.

1.2.4 Investigaciones Explicativas:

Este tipo de investigacin se trata de establecer posibles relaciones


causales y explica por qu dos o ms variables estn relacionadas.

1.3 Diseo de investigacin:

Se refiere al plan o estrategia


concebida para responder a las
preguntas de investigacin.
El diseo seala al investigador
lo que debe hacer para alcanzar
sus objetivos de estudio,
contestar las interrogantes que
se ha planteado y analizar la
certeza de la hiptesis
formulada en un contexto
particular.

Tipos de Diseo de Investigacin

1.3.1 La investigacin experimental:

Es la manipulacin de una o ms variables independientes (causas) para


conocer sus consecuencias sobre una o ms variables dependientes
(efectos), dentro de una situacin controlada por el investigador.

La investigacin experimental requiere de muchos controles pues hay que


eliminar el efecto de otras variables a fin de llegar a conclusiones ciertas. Por
esta razn este tipo de diseo es de poco uso en las ciencias sociales donde
muchas variables afectan el comportamiento de los fenmenos sociales. Sin
embargo algunas variaciones de ellos podran ser utilizadas.

Las investigaciones experimentales se dividen en experimentos puros, pre-


experimental y cuasi- experimentales.

1 Los experimentos puros.

a. Cuando se manipulan intencionalmente una o ms variables


independientes.

La variable independiente es la que se considera como supuesta


causa en una relacin entre variables, es la condicin antecedente; y
al efecto provocado por dicha causa se le denomina variables
dependiente (consecuente).

b. Medicin del efecto de la variable independiente sobre la variable


dependiente

Se debe asegurar que efectivamente sea la variable independiente la


que haya afectado.

c. Control de la validez interna de la situacin experimental.

Se debe demostrar que es la variable independiente y no otra la que


est afectando a la variable dependiente. Esta condicin se lograr
con fuertes controles experimentales para poder asegurar la relacin
causal entre ambas variables.

2 Los diseos pre-experimentales

Se denominan as porque su grado de control es mnimo. Los diseos


pre-experimentales se clasifican en tres tipos y a pesar de sus
debilidades son muy utilizadas en la investigacin.

1.3.2 La investigacin no experimental

Este tipo de investigacin implica la observacin del hecho en su condicin


natural sin intervencin del investigador.

Se clasifican en:

1 Transversal: recolectan datos en solo momento, en un tiempo nico,


pueden ser descriptivos o correlacinales.

2 Longitudinales: Mide las variables en diferentes momentos del tiempo


para conocer su evolucin.

1.4 Elementos bsicos de da estadstica

Existen tres elementos bsicos como son: la poblacin o muestra (unidades de


anlisis), las variables o caractersticas y los datos.

1.4.1 Los elementos o unidades de anlisis (poblacin) que pueden ser personas,
instituciones, objetos, familias animales y otras unidades ms complejas.
Estas unidades tienen una caracterstica en comn, en cuanto constituyen el
objeto de estudio de una investigacin.

1.4.2 Las variables, dimensiones o caractersticas que se desea conocer en relacin


a las unidades de anlisis, tales como edad, ingresos, consumo de carne,
costos, etc. las variables se definen en funcin de los objetivos de estudio.

1.4.3 Los datos o valores que alcanzan las unidades en las variables estudiadas, son
las respuestas o resultados que se obtienen cuando las unidades de anlisis
son interpelados o preguntados. Habr tantos como elementos tiene la
poblacin en un estudio.

1.5 Seleccin de la muestra cuantitativa

Al realizar un estudio de investigacin necesitamos utilizar slo una parte del


universo, es decir una muestra, la cual conduce a resultados similares a los del
universo completo, pero con la ventaja de que los datos se vuelven accesibles en
tiempo, costo y posibilidad real de conseguirlos.

Muestreo.- es el trabajo que lleva a un investigador a tomar la informacin solo de


una parte de los elementos de la poblacin estadstica.

Muestra.- es el conjunto de elementos de los que se toma informacin en el proceso


de muestreo.

Tamao muestral.- es el nmero de elementos que la componen.

1.5.1 Definicin de trminos

a. Unidad de anlisis: Es el elemento de la poblacin en el que vamos a


ejecutar la observacin y en la cual se obtiene el dato. Una unidad ser
entonces un trabajador, un gerente, una empresa, un centro de salud,
etc.

b. Poblacin o universo: se refiere a un colectivo finito o infinito de


elementos individuales. Poblacin es un conjunto completo de individuos
u objetos que poseen alguna caracterstica comn observable. Asimismo
es el nmero de elementos que definen la cobertura de un estudio.
Poblacin es el universo de estudio que est integrado por la totalidad
de todas las unidades de anlisis.

c. Unidad de muestreo: al realizar la muestra es posible que se haga sobre


unidades que no siempre sern las unidades de anlisis. Si se hace una
muestra estratificada referido a trabajadores que estn en empresas con
una condicin especfica, puede ser la muestra primaria las empresas
como unidad de muestreo, pero las unidades de anlisis sern los
trabajadores.

d. Marco de muestreo: (Marco de la poblacin muestreada) Para poder


elaborar un marco de muestreo, ser necesario de disponer de un
listado de unidades de muestreo, a esta relacin de unidades de
muestreo se le denomina marco.

e. Muestra

El concepto de muestra en investigacin se refiere a una parte del


universo de la poblacin. A un grupo determinado de personas que se

encuentran delimitado por una caracterstica o una serie de


caractersticas especficas. Asimismo se define como un conjunto de
unidades de muestreo primarias que deben ser representativas y tener
un tamao mnimo apropiado, del cual puede hacerse inferencias sobre
la poblacin.

El tamao de la muestra depende principalmente de la variabilidad de la


poblacin y del grado de precisin requerido.

Si la muestra contiene todas las unidades de la poblacin se llama


muestreo exhaustivo, la cual se conoce como censo.

f. Error: los errores estadsticos son de dos clases.

Error no muestral: comprende los sesgos y equivocaciones en cualquiera


de las etapas desde la recoleccin de datos hasta la obtencin de
resultados. Se presenta tanto en el muestreo como en el censo y se
debe a errores en el proceso de toma de datos.

Error muestral: slo se presenta cuando se trabaja con una muestra y se


calcula como la diferencia que existe entre el valor que se requiere
calcular en la muestra y el valor que existe en la poblacin.

Por tanto

Error total= Error no muestral + Error de muestreo

En un censo existe slo error no muestral o error censal.

El erro no muestral puede presentarse al realizar mal las entrevistas,


entrevistar por comodidad a un individuo no seleccionado, entre otros
errores humanos y/o deliberados.

1.5.2 Muestreo probabilstico

En la teora del muestreo es importante distinguir las muestras aleatorias o


probabilsticas de las muestras no probabilsticas.

Una muestra aleatoria o probabilstica es escogida por el mtodo de


probabilidades, segn el cual ni el investigador ni las unidades de muestreo
pueden decir que unidades sern incluidas en la muestra. La eleccin se
logra solamente por accin del azar. En estas muestras las probabilidades
de eleccin son conocidas.

Para una muestra por probabilidades, el error de muestreo puede medirse


y controlarse por la teora de las probabilidades. Los errores sistemticos
de seleccin, falta de respuesta y estimacin son eliminados o por lo menos
contenidos dentro de lmites conocidos.

Algunos procedimientos de muestreo probabilstico.

Un muestreo es probabilstico cuando puede calcularse con anticipacin,


cual es la probabilidad de poder obtener cada una de las muestras que
sean posibles a partir de una poblacin o universo.

a. Muestreo aleatorio simple: tomar una muestra aleatoria simple


garantiza que cada muestra de algn tamao dado tenga la misma
probabilidad de ser seleccionada.

Se diferencian dos formas:

Muestreo aleatorio simple sin reposicin.- cuando un sujeto u objeto


slo tiene una oportunidad de ser escogido.

Muestreo aleatorio simple con reposicin: cuando un sujeto u objeto


ms de una oportunidad de ser escogido.

Este tipo de muestreo es conveniente para poblaciones homogneas,


donde los resultados tienden a ser concentrados. Una poblacin

homognea puede ser la de los trabajadores de una empresa pblica


de la zona centro de Huancayo. Una poblacin heterognea puede ser
la de los trabajadores de una empresa pblica y privada de Huancayo,
Lima y Huancavelica.

El muestreo aleatorio simple implica los siguientes aspectos:

Definir la poblacin, es decir, con quienes o con que se va a


trabajar (objetos o sujetos).

Confeccionar un listado ya sea alfabtico o numrico de cada uno y


todos los miembros de la poblacin definida.

Seleccionar la muestra por medio de un procedimiento donde el


azar determina cuales son los miembros que van a constituir la
muestra.

b. Muestreo sistemtico: Una muestra sistemtica es obtenida cuando los


elementos son seleccionados en una forma ordenada. La forma
ordenada depende del nmero de elementos incluidos en la poblacin
y el tamao de la muestra. El nmero de elementos en la poblacin
primero se divide entre el nmero deseado en la muestra. El cociente
indicar cada que cantidad de elementos se deben realizar los saltos o
espacios en la poblacin para seleccionar los elementos de la muestra,
(cada 5, cada7, o de tres en tres, etc.). El primer elemento de la
muestra es seleccionada al azar.

Este diseo resulta adecuado para poblaciones homogneas como para


heterogneas, ya que al seleccionar realiza un recorrido por toda la
poblacin investigada.

c. Muestreo Estratificado: Para obtener una muestra aleatoria


estratificado primero se divide la poblacin en grupos, llamados
estratos, los elemento de la muestra dentro de cada estrato son
seleccionados al azar o por un mtodo sistemtico. Las estimaciones
de la poblacin, basadas en la muestra estratificada, usualmente
tienen mayor precisin (o menor error muestral) que si la poblacin
entera se hubiera muestreado mediante muestreo aleatorio simple. El
nmero de elementos seleccionados de cada estrato puede ser
proporcional al tamao del estrato en relacin con la poblacin.

Este tipo de muestreo es til cuando la poblacin es homognea y


puede dividirlo en grupos, de tal forma que dentro de cada grupo sea
lo ms homognea posible y entre los grupos que se formen lo ms
heterogneo.

Hombres Mujeres

d. Muestreo en racimos: En este tipo de muestreo se reduce costos,


tiempo y energa porque las unidades de anlisis estn incluidas en las
unidades muestrales que nos interesan.

Se divide el rea de la poblacin en secciones (o racimos), se eligen al


azar unas cuantas de estas secciones y luego se escogen todos los
miembros de los racimos seleccionados.

Distritos

10

1.5.3 Consideraciones para el tamao de la muestra.

Para cada uno de los tipos de muestreo existen diferentes frmulas para
calcular el tamao de la muestra.

Frmula para calcular el tamao de la muestra cuando la poblacin es


desconocida.

Z 2 * p * (1 p )
1
2
n=
E2

Donde:

Z=nivel de confianza, comnmente se usa el 95% y tiene un valor de 1,96.


El investigador fija su nivel de confianza, que es la probabilidad de obtener
resultados similares en varias muestras de la misma poblacin. El valor se
determina en tablas hechas de la normal.

E = Error de estimacin. Es la variacin esperada entre lo que se encuentra


en la muestra y las diferencias en la poblacin. Este error puede ser
determinado por el investigador en base a su mayor o menor deseo de
variaciones. Si se desea tener poco error el tamao de la muestra crece, y
si se admite una mayor dimensin del error, la muestra se debe disminuir.
Normalmente estas decisiones se toman en funcin a recursos de costos y
tiempos. Se coloca en decimales.

n=tamao de la muestra.

P = proporcin de la variable en estudio, usualmente cuando se desconoce


este valor, es decir cuando no se tiene informacin sobre la poblacin a
investigar, se asume el valor de p=0.5

Si se conoce el tamao de la poblacin el tamao de la muestra ajustada


sera:

N
najustado =n*
N+n

11

Frmula para calcular el tamao de la muestra cuando la poblacin es


conocida

Z2 *p*(1-p)*N
1-
2
n=
Z2 *p*(1-p) E2 N 1
1-
2

1.5.4 Muestreo no probabilstico

Este tipo de muestreo no garantiza la representatividad de la muestra en


trminos numricos, pero si garantiza la presencia de todos los actores. La
muestra es elegida y decidida por el investigador. En una muestra no
probabilstica, la seleccin de un elemento de la poblacin para que forme
parte de la muestra se muestra en consideraciones distintas a las
probabilidades. La probabilidad de que cada elemento individual pertenezca
a la muestra es desconocida, la fidelidad de los resultados no se sujeta al
anlisis de probabilidades. No se puede estimar el error de muestreo y por
lo tanto no permiten las generalizaciones.

a. Caractersticas comunes de este tipo de muestreo

No se basa en la teora de probabilidades; por lo tanto, no es


posible calcular la exactitud.

No es posible el clculo de la confianza de las estimaciones, la


precisin de la muestra resultante.

El investigador elige los casos que ms le interesan, con el propsito


de lograr informacin ms nutrida.

Es posible obtener buenos resultados, siempre en cuando el


investigador tenga un conocimiento claro y preciso de la poblacin
que quiera observar y de lo que en ella desea observar.

Las inferencias alcanzas planos lgicos y hasta de opinin.

12

Son los ms apropiados para las investigaciones cualitativas, ya que


en este tipo de investigaciones no se busca la representatividad de
los resultados, sino e punto de vista.

b. Cuando se aplica muestreo no probabilstico

Cuando se pretende estudiar una poblacin rara o marginal.

Cuando no hay marco disponible para propsitos de muestreo.

Cuando se consideran que no se requieren cifras exactas sobre la


representatividad estadstica de los resultados.

c. Cmo se determina el tamao de la muestra

En la prctica se obtiene mediante el juicio y el sentido comn de los


investigadores, que se basan en la experiencia.

Para determinar el tamao de la muestra en estos casos, los


investigadores se basan en criterios como: presupuesto disponible,
reglas empricas y nmero de subgrupos que se va a analizar.

d. Seleccionar un mtodo de muestreo

Depende de factores como los objetivos del estudio, los recursos


financieros disponibles, las limitaciones de tiempo y la naturaleza del
problema que est investigando.

Tcnicas de muestreo no probabilstico.

a. Muestreo de juicio o criterio

Se realiza mediante la seleccin de la muestra poblacional tomando el


criterio de un especialista o del mismo investigador. Ellos definirn de
acuerdo al estudio, quienes sern y donde estarn las personas que
nos brinden mayor calidad en la informacin para la investigacin.

13

b. Muestreo por bola de nieve

Consiste en ubicar a dos o ms personas de la muestra y luego de


hablar con ellos pedirles que nombren a una persona que conozcan
que sea similar a ellos o que presenten las mismas caractersticas de
inters. Se utiliza cuando se requiere ubicar a personas de grupos
pequeos o que son muy difciles de ubicar.

Ejemplo

Desamparados, trabajadores forneos, indocumentados, etc.

c. Muestreo por conveniencia

Conocido tambin como muestra accesible. Consiste en ubicar a un


conjunto de personas que sean fciles de reunir y trabajar con ellas.

Se utiliza cuando se desea explorar aspectos generales o hacer un


diagnstico preliminar sobre algn tema o cuando se necesita
obtener informacin de forma rpida. Es til para prever problemas
que pudieran presentarse en el transcurso de la investigacin y
acerca de los cuales no se tiene informacin.

La validez de este tipo de muestra se basa en la necesidad de realizar


diagnsticos previos o de conocer algunos datos de modo anterior a
una revisin exhaustiva. Sin embargo este tipo de muestreo es de
utilidad para estudios de satisfaccin del cliente, estudio de clientes
incgnito y para recoger percepciones de la poblacin.

14

d. Muestreo por cuotas

En este caso lo que se hace es asignar una cantidad de sujetos segn


los segmentos. La definicin del nmero de personas asignadas
depende de la informacin previa que tenga el investigador.

La poblacin se fracciona en subgrupos y de cada poblacin se fija


una cuota, que consiste en nmero de individuos, que renen unas
determinadas condiciones. Una vez determinado la cuota se eligen
los primeros que se encuentren (siendo mejor los ms
representativos o adecuados) que cumplan con tales condiciones.

La asignacin de las cuotas puede ser proporcional o igual, de la


misma manera que en el muestreo aleatorio estratificado, pero no
tiene el carcter de aleatoriedad. Mtodo muy utilizado en encuestas
de opinin.

15

Gua de Prctica N 1
1. Se requiere obtener una muestra sistemtica que seleccione egresados de un
programa acadmico de la Universidad Alas Peruanas, que tiene 1200 de ellos. La
variable clave del estudio es dicotmica y se dice que la proporcin es del 25%,
adems se desea un error de 4% y una confiabilidad del 90%.

2. Se tiene que seleccionar una muestra de 40 personas, de una comunidad selvtica de


500 habitantes, con el fin de realizar una encuesta sobre los servicios de salubridad
que reciben. Los habitantes estn repartidos en 5 colonias, sabiendo que hay 100,
150, 50, 125 y 75 habitantes distribuidas de la primera hasta la quinta colonia.
Determina el nmero de muestra de cada estrato.

3. Una determina empresa tiene 6 100 empleados, se requiere determinar cmo es el


clima institucional en la empresa, usando una confiabilidad del 95%, con un error
admisible del 6% y considerando la proporcin de empleados no satisfechos es de
30%. Calcula el nmero de empleados a consultar, si se tiene en cuenta adems, que
se tiene diferentes categoras de empleados que pueden influir en la opinin de los
trabajadores, se adiciona la siguiente informacin con respecto al nmero de
trabajadores. Contabilidad y costos 80, Administracin 150, operativos 5 600,
seguridad 180 y otros cargos 90.

4. De una poblacin de 600 jvenes, de una universidad de la sierra central, se


pretende conocer la aceptacin de los programas humorsticos televisivos. Se desea
tomar una muestra de 20 para saber la cantidad de jvenes a entrevistar distribuidos
en 4 semestres y con ello tener una informacin adecuada, teniendo la siguiente
informacin 1er sem.: 150 alumnos, 2do sem.: 100 alumnos, 3er sem.: 200 alumnos
y 4to sem.: 150 alumnos. Adems de conocerse que el 5% de la poblacin juvenil
son estudiantes del 2do semestre. Calcula el nmero de muestra que debe incluirse
por cada semestre.

5. Determina el tamao de muestra por rea. Si se tiene una poblacin de 2000


trabajadores de la SUNAT de una ciudad de los cuales 600 pertenecen al rea de
Defensora del contribuyente, 900 al rea de Orientacin y el resto al rea de
Cobranza. Utilice una confianza del 93%, un error de 100 adems se sabe que el
mayor y menor valor salario son: 4 500 y 1 500.

16

CAPITULO II

ORGANIZACIN DE DATOS

2.1 Variables

Una variable estadstica es una caracterstica observable, susceptible de adoptar o


tomar diferentes valores o ser categorizada. La variable adquiere un valor
determinado en cada unidad de anlisis.

Variable es un aspecto especfico de la realidad referido a la unidad de anlisis y es


susceptible de ser medido o cuantificado, todas las variables tienen una escala de
registro, pueden ser una caracterstica medible (peso, ingresos, talla, etc.) o una
caracterstica cualitativa no medible o contable (nmero de hijos por familia, estado
civil, nacionalidad, nmero de dientes careados por nio, sexo, etc.); en general
variable estadstica es una caracterstica que puede tomar diferentes valores o ser
categorizada. (vila, 2000).

Si conforme se observa una caracterstica se encuentra que toman valores distintos


en diferentes lugares o zonas, se dice que esta caracterstica es una variable.
2.1.1 Clasificacin de las variables segn su naturaleza.
a. Variables cualitativas
Las variables cualitativas tambin son consideradas como estadsticas
de atributos o categricas, es cuando expresan una cualidad,
caracterstica o atributo, sus datos se expresan mediante una palabra o
en forma literal, es no numrico.

Ejemplo: profesiones, lugar de nacimiento, estado civil, grado de


instruccin de los empleados de un hospital, los colores de preferencia,
causas de accidentes, estado nutricional, calidad de un medicamento,
actividad econmica, posicin poltica, etc.

17

b. Variables cuantitativas
Cuando denotan una cantidad, tienen carcter numrico y pueden
resultar de la operacin de contar o medir (conteo o medicin). Es decir,
los resultados son expresados en forma numrica.

Ejemplo: edad, talla, presin arterial de los pacientes, ingresos


monetarios, viviendas por centro poblado, niveles de desempleo,
produccin, utilidades por empresa, etc.

b.1 Variables cuantitativas discretas o contables


Son aquellas que tienen un nmero finito de valores posibles.
Usualmente se las asocia a procesos de conteo, donde el resultado
es expresado mediante nmeros naturales (enteros no negativos).
Ejemplo: nmero de hijos por familia, nmero de accidentes de
transportes por mes, poblacin por distritos, habitaciones por
vivienda, nmero de alumnos desaprobados por asignatura, etc.
b.2 Variables cuantitativas continuas o medibles
Cuando la variable es susceptible de medirse; cuyos valores se
obtienen por medicin o comparacin con una unidad o patrn de
medida, pueden tener cualquier valor dentro de un rango o
recorrido, por tanto se expresan por cualquier nmero real.
Ejemplo: temperatura corporal, rendimiento acadmico de
contabilidad, peso, talla, ingresos monetarios, utilidades por
empresa, horas trabajadas, etc.

2.1.2 Clasificacin de las variables segn la escala de medicin

a. Variables Nominales

Son aquellas variables que establecen la distincin de los elementos en


diversas categoras, sin implicar algn orden entre ellas, distribuye a la
unidad de anlisis en dos o ms categoras. Sus valores se expresan
como cualidades o atributos.

18

Ejemplo: gnero, estado civil, causa de accidentes, deportes que


practican, profesiones, tipo de alteracin gstrica, causas de muerte,
agrupacin poltica de preferencia, etc.

b. Variables ordinales

Son aquellas variables que implican orden entre sus categoras pero no
grados de distancia iguales entre ellas; estn referidas a un orden o
jerarqua, donde las categoras expresan una posicin de orden. Es
posible establecer un orden creciente o decreciente entre sus
categoras. Sus valores se expresan como cualidades o atributos.

Ejemplo: calidad de un medicamento, grado de instruccin, clase


social, rango de agresividad, orden de mrito, estado nutricional,
estado de conservacin de las viviendas, etc.

c. Variables de intervalo

Son aquellas variables que suponen orden y grados de distancia


iguales entre las diversas categoras, pero no tienen un origen natural
(el cero), sino convencional. Sus valores se expresan como cantidades
o nmeros.

Ejemplo: temperatura corporal, puntaje obtenido en una escala,


coeficiente de inteligencia, ndice de precios al consumidor, etc.

d. Variables de razn

Conocido tambin como variables de proporcin; es cuando adems


de distinguir entre los elementos, establecer un orden y distancias
iguales entre sus categoras poseen un origen nico natural (existencia
del cero absoluto). Sus valores se expresan como cantidades o
nmeros.

Ejemplo: edad, peso, consumo per-cpita de leche, ingresos


monetarios, accidentes de trabajo, calidad de productos, tasa de
mortalidad, ahorro familiar, tasa de analfabetismo, tasa de poblacin
infantil ocupada, ndice de desercin estudiantil, etc.

19

Cualquier variable de razn o de intervalo puede ser transformada a


una variable ordinal o nominal construyendo categoras o clases
convenientes; no obstante, el proceso inverso no es posible.

2.2 Distribucin de frecuencias

Una distribucin de frecuencias (o tabla de frecuencias) es una tabla que resume


los datos mostrando la frecuencia o nmero de elementos que hay dentro de cada
una de sus clases, que deben ser mutuamente excluyentes y colectivamente
exhaustivas.

Por tanto el objetivo es ordenar y proveer informacin acerca del conjunto de datos
que no podra obtenerse rpidamente por simple observacin de los datos
originales.

Por ello nos permitimos presentar las siguientes tablas:

2.2.1 Tablas Unidimensionales: Nos permite observar una sola variable.

Tabla N 1. Nmero de trabajadores por empresa una ciudad

Empresa Nmero de empresas


A 60
B 45
C 55
D 40
E 36
F 40
G 36
H 30
I 20
J 23
Total 385

20

2.2.2 Tablas bidimensionales: Nos permite observar dos variables

Tabla N 2.
Nmero de trabajadores por empresa y gnero una ciudad

Nmero de Gnero Total


trabajadores

Empresa M F

A 22 30 52
B 30 15 45
C 45 48 93
D 55 32 87
E 55 25 80
F 42 18 60
G 32 12 44
H 14 23 37
I 14 13 27
J 10 10 20
Total 319 226 545

2.2.3 Tablas multidimensionales: Nos permite observar tres o ms variables

Tabla N 3.
Nmero de trabajadores por empresa, gnero, aprobados y
desaprobados de una ciudad.

Nmero de Gnero- Aprobados y


trabajadores Desaprobados

Semestre Total
Masculino Femenino
Acadmico

A D A D
A 30 40 30 20 120
B 30 15 17 23 85
C 25 33 15 24 97
D 45 32 30 20 127
E 55 25 45 30 155
F 42 18 24 20 104
G 32 12 12 16 72
H 14 23 12 14 63
I 14 13 18 20 65
J 18 14 12 15 59
Total 305 225 215 202 947

21

2.3 Elaboracin y descripcin de una tabla de frecuencias

Al recoger la informacin se obtiene una gran nmero de datos de las diferentes


variables estadsticas, los cuales estn desordenados y no nos permiten emitir un
juicio razonable del fenmeno a observar; por lo que es necesario disponer, los
datos obtenidos de la investigacin en una tabla especial, en forma ordenada de
acuerdo a un criterio determinado.

Una tabla de frecuencias se puede presentar de las siguientes formas:

2.3.1 Tablas de frecuencias para variables cualitativas

Supngase en una muestra de n unidades se observa k categoras o

modalidades k1 ; k2 ; k3 ;...; kn de alguna variable cualitativa X. La tabulacin

se observa en el cuadro N 1.

Tabla N 1. Cuadro mostrando las frecuencias simples

Categoras Frecuencias Frecuencias Frecuencias


absolutas relativas porcentuales
Variable X
simples fi simples hi simples hi %

k1 f1 h1 h1 %
k2 f2 h2 h2 %
k3 f3 h3 h3 %
. . . .
. . . .
. . . .
kk fk hk hk %

Total 1,00 100

a. Frecuencias simples

La frecuencia absoluta simple f i , es el nmero de datos observados

en cada categora o modalidad. La suma de todas las frecuencias

22

absolutas simples es igual al total n de datos observados, es decir:


k

f
i 1
i n

La frecuencia relativa simple hi , se define para cada

fi
i , i 1; 2;3;...; k por hi la suma de todas las frecuencias
n
k
relativas es igual a 1, es decir: h
i 1
i 1

La frecuencia relativa simple porcentual hi % , se define para cada

i , i 1; 2;3;...; k por hi % hi *100% la suma de todas las


k
frecuencias relativas es igual a 100, es decir: h % 100
i 1
i

b. Frecuencias acumuladas

Con variables cualitativas no tiene ningn significado las frecuencias


acumuladas.

Con las variables discretas y si la distribucin de frecuencias es de la


forma dato y frecuencia, las frecuencias absolutas, relativas y
porcentuales se pueden acumular en la forma menor o igual que un valor
determinado de la variable.

La frecuencia absoluta acumulada Fi

La frecuencia absoluta acumulada Fi del valor xi de la variable X es la

suma de las frecuencias absolutas de los valores menores o iguales a xi.


Esto es si la variable discreta X tiene valores distintos
x 1 ; x 2 ; x 3 ;...; x k con frecuencias absolutas

respectivas f1 ; f 2 ; f 3 ;...;f k , entonces,

k
Fi fi , i 1;2;3;...; k
i 1

23

La frecuencia relativa acumulada H i , se define por:

i
Hi hj , i 1;2;3;...; k
j 1

Fi
Hi ; i 1;2;3;...; k
n

La frecuencia porcentual acumulada H i % , se define por

H i % H i * 100%

Ejemplo ilustrativo

Al preguntar a los estudiantes de una universidad sobre la preferencia de


tres cursos Matemtica (M), Estadstica (E) y Comunicacin (C)
respondieron:

C M M C E M M C C M

C M M E C M C E C M

La tabulacin de esta informacin se muestra en el siguiente cuadro

Cuadro N 2. Cuadro mostrando las frecuencias simples de las


preferencias

Frecuencias Frecuencias Frecuencias


Cursos
absolutas relativas relativas
simples simples porcentual
fi hi simples
hi %

Matemtica 9 0,45 45
Estadstica 3 0,15 15
Comunicacin 8 0,40 40

Total 20 1,00 100

24

2.3.2 Tablas de frecuencias para datos cuantitativos

a. Tabla de frecuencias para datos discretos

Supongamos que en una muestra de n unidades de alguna variable


discreta X. el procedimiento adecuado para organizar estos n datos es
ordenndolos en forma ascendente de sus valores.

Si todos los datos los n datos son distintos entre s, se obtendr una
distribucin de frecuencias de n valores de la variable X, donde cada uno
de estos valores tienen frecuencia uno.

Si algunos valores se repiten, y si al terminar de ordenar se obtiene k

( k n ) valores diferentes de X, digamos x1 ; x2 ; x3 ;...; xk con

frecuencias absolutas respectivas f1 ; f 2 ; f 3 ;...; f k , como se muestra

en el cuadro N 3.

Cuadro N 3.
Cuadro mostrando las frecuencias simples y acumuladas

Valores de la fi hi hi % Fi Hi Hi%
variable X

x1 f1 h1 h1 % F1 H1 H1 %
x2 f2 h2 h2 % F2 H2 H2%
x3
f3 h3 h3 % F3 H3 H3%
.
. . . . . .
.
.
. . . . . .
xk . . . . . .
fk hk hk % Fk Hk Hk %

Total n 1,00 100

Ejemplo ilustrativo

Construir la tabla de distribucin de frecuencias del nmero de alumnos


ausentes por aula (Variable X) en una muestra de 20 aulas, resultando la
siguiente informacin:

2 1 2 4 1 3 2 3 2 0
3 2 1 3 2 3 3 1 2 4

25

La tabulacin de esta informacin se muestra en el cuadro N 4

Cuadro N 4. Cuadro mostrando las frecuencias simples y acumuladas


de nmero de alumnos ausentes en un aula

Nmero de fi hi hi %
alumnos
ausentes X
0 1 0,05 5
1 4 0,20 20
2 7 0,35 35
3 6 0,30 30
4 2 0,10 10
Total 20 1,00 100

b. Tabla de frecuencias por intervalos

La distribucin de frecuencias por intervalos o clases se utiliza cuando la


variable estadstica es continua o cuando el nmero de valores distintos
de una variable discreta es muy grande.

Cuadro N 4. Cuadro mostrando las frecuencias simples y acumuladas de nmero


de alumnos ausentes en un aula

Intervalos Conte fi hi hi % Fi Hi Hi %
Ii o

I1 lll.. f1 h1 h1 % F1 H1 H1 %
I2 llll... f 2 h2 h2 % F2 H2 H2 %
I3 ll.. f3 h3 h3 % F3 H3 H3 %
. . . . . . . .
. . . . . . . .
. . . . . . . .
Ik lll.. f k hk hk % Fk Hk Hk %

Total 20 1,00 100

Pasos para construir la tabla de frecuencias agrupadas en intervalos de


clase:

1. Determinar el rango o amplitud de los datos (R): R X max X min

Donde:

26

X max , valor de la observacin de mayor magnitud


X min , valor de la observacin de menor magnitud

2. Determinar el nmero de intervalo de clase (K). Es recomendable que el nmero


de intervalo de clases est entre 5 y 15. Se puede calcular con la regla de
Sturges:
K 1 3.3log10 (n)

Donde:
n: nmero de observaciones disponibles
K: intervalo de clases, cuyo valor es redondeado al entero ms cercano.

Redondeo al entero inmediato mayor. Por ejemplo si se tiene que n=48 datos,

entonces K 1 3,3log10 (48) 6,5481 , donde: K 7

Alternativamente se puede utilizar K n , 25 n 400

3. Determinar el tamao de cada intervalo de clase (TIC) o amplitud (A)

R
TIC A
K

Si el valor de A no es entero en el nmero de decimales de los datos, entonces,


el nmero A se aproxima por exceso de manera que se cubra todo el rango, esto
es de manera que KA R

4. Generar los lmites de los intervalos:

Para el primer intervalo se considera como lmite inferior (Li) el valor de la


observacin de menor magnitud; es decir:

I 1 X min , X min A
I 2 X min A , X min 2A
I 3 X min 2A , X min 3A
.
.
.
I k X min (k 1) A , X min kA

27

Nota: Cada uno de los intervalos (LIi , LSi) se considera cerrado a la izquierda y
abierto a la derecha; es decir se considera desde LIi a menos de LSi. Esta regla
no se aplica al ltimo intervalo, el cual se considera cerrado a la derecha; es
decir, se considera desde LIk hasta LSk.

Una vez que se ha definido los intervalos de clase, el paso siguiente consiste en
clasificar cada observacin en uno de dichos intervalos y determinar las
frecuencias absolutas; es decir, el nmero de observaciones que estn dentro de
cada intervalo. A partir de estas frecuencias se obtienen, las frecuencias relativas
y porcentuales correspondientes a cada intervalo.

Para representar grficamente la informacin se puede usar cualquier tipo de


frecuencia. En especial se recomienda utilizar las frecuencias relativas o
porcentuales, puesto que permiten analizar la informacin independientemente
del nmero de observaciones captadas, siendo adems posible comparar los
resultados con los obtenidos en estudios similares, siempre que los intervalos de
clase sean iguales, o al menos similares.

El procedimiento descrito anteriormente puede ser aplicado tambin cuando se


tiene datos cuantitativos discretos cuyo nmero de resultados posibles es grande
(mayor de 20) y su representacin grfica mediante los procedimientos descritos
en la seccin anterior no resulta apropiada.

2.4 Representaciones grficas

La visualizacin constituye un componente esencial en el anlisis que enfatiza el


examen en profundidad de la estructura de datos y cuyo uso es de larga tradicin
en ciencia.
El objetivo del anlisis visual puede decirse que consiste en recoger los argumentos
suficientes para poder emitir un juicio preciso sobre el comportamiento general de
los datos.
Se recomienda elaborar grficos porcentuales, en lugar de grficos con las
frecuencias absolutas.

Los grficos son representaciones con figuras geomtricas o de superficie, con el


objeto de ilustrar de manera comparativa la dimensin de una variable con las de
otras variables similares o relacionadas.

28

Para una rpida comprensin de situaciones o variaciones en cantidades, es muy


til traducir los nmeros en grficos o imgenes. Todo grfico es la expresin
artstica de datos reales y observados, permite visualizar de manera instantnea, las
cantidades y el comportamiento de variables.

2.4.1 Principales partes de un Grfico

Titulo.- como en los cuadros es una descripcin del contenido del grfico,
debe indicar claramente la naturaleza del fenmeno representado

Los diagramas.- Est dado por el propio dibujo del grfico y como en el
cuerpo del cuadro, estn representados los datos indicados en el ttulo.

Escalas o leyendas.- Son indicaciones donde se precisa la correspondencia


entre los elementos del grfico y la naturaleza de las medidas representadas.

Fuente.- Se indica la procedencia de los datos estadsticos representados.

2.4.2 Principales tipos de Grficos

a. Grfico de Barras

Es apropiado para variables cualitativas nominales u ordinales, asimismo


se puede representar variables cuantitativas discretas en datos no
agrupados. En este tipo de grfico cada barra representa la frecuencia
de cada categora de la variable y la longitud de la barra es proporcional
a la frecuencia de esa categora.

Si la escala es nominal las categoras pueden ir en cualquier orden, pero


si la escala es ordinal las categoras deben ir ordenadas.

Hay tres tipos de barras:

Barras simples, barras agrupadas y barras apiladas; tal como se


muestra en la siguiente figura:

29

Figura N 1. Grfico de barras de la distribucin de alumnos por


preferencia de cursos

b. Grfico de Sectores (pie)

Se utiliza principalmente, para representar distribuciones de frecuencias


relativas (%) de una variable cualitativa o cuantitativa discreta. En este
grfico se hace corresponder la medida del ngulo de cada sector con la
frecuencia correspondiente a la clase en cuestin. Si los 360 del crculo
representan el 100% de los datos clasificados, a cada 1% le
corresponde 3,6, luego para obtener el tamao del ngulo para un
sector dado bastara con multiplicar el porciento correspondiente por
3,6 (por regla de tres simple)

Mediante un sector circular se representan las medidas angulares


correspondientes a las diferentes categoras, respetando el orden
establecido en la tabla, partiendo de un punto dado de la circunferencia.
Ese punto dado generalmente es el punto ms alto de la circunferencia
(12 en el reloj). Si lo que se representa en cada sector no puede
colocarse, dentro del mismo, se elabora una leyenda o se coloca fuera,
adyacente del mismo. De preferencia utilizar trama o colores diferentes
de tal forma que la grfica sea ms vistosa y llamativa a la vista del
lector.

30

Figura N 2. Grfico de sectores de la distribucin de alumnos por


preferencia de cursos

c. Diagrama de tallo y hojas

La representacin en tallo y hojas constituye un diagrama semigrfico


que se obtiene despus de ordenar todas las observaciones y presentar
la distribucin resultante de manera que se favorece el examen de las
caractersticas fundamentales de las distribuciones de datos. El principio
bsico constituye que todo nmero puede ser separado en dos partes
significativas: el tallo y la hoja. Por ejemplo el nmero 39 puede
separarse en el tallo, asociado en este caso a la decena 3, y la hoja a la
unidad 9. A partir de criterios empricos, no normativos, este diagrama
es recomendable para muestras de tamao entre 20 y 200
observaciones, sus caractersticas son:

Conserva los valores originales de la variable.

No requiere agrupar los datos en intervalos de clase.

Permite localizar los valores centrales de la distribucin.

Facilita la identificacin de concentraciones de datos o la existencia


de saltos, discontinuidades en la que no aparece ninguna
observacin.

Permite valorar la amplitud de la distribucin, su dispersin, y la


existencia de valores alejados.

31

Simplifica el estudio visual de la forma de la distribucin.

d. Grfico de lneas

Para representar un conjunto de datos discretos se construye un


sistema de ejes XY. Por cada valor de variable se traza un lnea vertical
de altura proporcional ya sea a la frecuencia absoluta o porcentual del
valor de la variable de preferencia la porcentual.

Figura N 3. Grfico de lneas de la distribucin de calificativos por


alumnos

hi%

Calificativos

e. Histograma

El histograma es una grfica muy comn para representar variables


cuantitativos. La variable de inters se coloca en el eje horizontal, se
dibuja en rectngulo por cada intervalo de clase con una altura
correspondiente a su frecuencia absoluta, relativa o porcentual. A
diferencia de un grfico de barras el histograma no tiene separaciones
entre rectngulos de clases adyacentes.

El investigador debera valorar, en relacin con los objetivos del trabajo,


el pblico a quien va dirigida su investigacin, su formacin
metodolgica, su conocimiento del tema y el medio de expresin de sus
resultados para poder tomar una decisin sobre que representacin
resulta ms informativa bajo criterios ecolgicos de comunicacin.

32

Figura N 4. Grfico de histograma de la distribucin de calificativos


por alumnos

fi

Intervalos de calificativos

Cuando el investigador pretende comparar su distribucin observada


con una distribucin terica de probabilidad como el modelo de la ley
normal, se traza una estimacin de dicho modelo a partir de los datos
observados.

16 20 25 30 35 40
Edad

f. Polgono de frecuencias

Es una grfica que consiste en serie de segmentos que unen los puntos
cuyas abscisas son las marcas de clase y cuyas ordenadas son
proporcionales a sus frecuencias respectivas que pueden ser frecuencias

33

absolutas, relativas o porcentuales. Para cerrar el polgono, se ampla un


intervalo hacia la izquierda de la primera marca de clase, con amplitud
similar al TIC y un intervalo hacia la derecha de la ltima marca de clase
y a las que se les asigna una frecuencia de cero.

Figura N 4. Grfico de polgono de la distribucin de calificativos por


alumnos

fi 14

12

10

0
0 20 40 60 80 100 120

Marca de clase de calificativos

g. Ojiva o polgono de frecuencia acumulada

El diagrama integral para una variable contina se denomina tambin


polgono de frecuencias acumulado y se obtiene como la poligonal
definida en abscisas a partir de los extremos de los intervalos en los que
se haya organizado la tabla de frecuencias de la variable, y ordenadas
por alturas que son proporcionales a las frecuencias acumuladas
absolutas o relativas.

Figura N 4. Grfico de ojiva de la distribucin de calificativos por


alumnos

70

60

50

40

30
Fi
20

10

0
0 20 40 60 80 100 120
34
Calificativos

GUA DE PRCTICA N 2
6. Para llevar a cabo el estudio sobre el volumen de ventas (en miles de soles) de 36
empresas se recurri a la contabilidad revisada, seleccionadas al azar encontrndose
los siguientes resultados.

11.7 5.7 10.1 8.5 6.4 2.1 5.8 4.6 8.7


7.8 4.4 9.8 15.4 2.5 4.6 7.4 12.1 5.4
4.5 7.2 6.7 8.4 6.1 5.7 4.7 5.2 4.6
9.1 3.7 5.3 7.4 3.2 1.5 6.7 7.7 8.4

Con estos datos elabore cuadro de distribucin de frecuencia y represente el


histograma.

7. El gerente de una importante empresa de administracin clasific las especialidades


de sus 64 miembros en Contabilidad (C), Mercadotecnia (M), Estadstica (E) y
Finanzas (F). Los datos son los siguientes:

CFMCFCEMECMCEFCCMECMEFCEFCCFCCMM

CECMFCMFCFCCFMCFCMMEEMFMCEEFCMEF

a. Determinar cul es la variable a analizar y si es cualitativa o cuantitativa.


b. Especificar cules son las categoras para dicha variable teniendo en cuenta que
deben ser exhaustivas y excluyentes.
c. Realizar la tabla de distribucin de frecuencias.
d. Construir todos los grficos que sea posible.
e. Convertir los datos a porcentajes y construir un grfico de barras verticales.
f. Dar conclusiones.

8. Las prdidas y ganancias para las 50 firmas ms grandes (por concepto de ventas)
en la lista de las 500 mejores empresas de la revista Fortuna para un determinado
ao aparecen a continuacin en millones de soles. El valor ms bajo es una prdida
de 4453 millones de soles, y el ms alto es una ganancia de 5 600 millones de soles.
Realice una tabla de frecuencias con el nmero apropiado de clases (con y sin el
software SPSS).

-4453 -795 423 184 97


5600 1567 454 258 939
-2258 1773 709 535 460
-2827 1484 -578 1461 -387
2636 20 368 601 -404
1920 -1021 755 -273 63
3006 1080 -732 1681 308
1403 17 -617 -142 73
1294 311 1154 454 97
1293 942 -1086 2056 505

35

9. El siguiente grfico circular muestra los datos extrados de una encuesta sobre 500
empresas de determinada ciudad. Se agreg el valor en grados de cada uno de los
ngulos para reconstruir la tabla de frecuencias correspondiente.

Figura N 1
Bancos
(54) Construcci
n (54)

Servicios
Industria
(36)
(86,4)

Transporte Comercio
(72) (57,6)

10. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15


horas en 60 importantes locales de ventas de automviles de cierta ciudad:

0 2 5 0 1 4 1 0 2 1 5 0 1 3 0
1 4 0 2 4 1 2 4 0 4 3 5 0 1 3
0 2 3 0 4 2 5 1 1 2 2 1 6 5 0
0 2 1 3 1 6 4 2 0 2 3 3 0 0 4

a) Determinar la variable a analizar e indicar cul es su tipo.

b) Construir una distribucin de frecuencias absolutas y representarla mediante un


diagrama de lneas.

c) Construir una distribucin de frecuencias relativas y relativas porcentuales e


interpretar el significado de la cuarta frecuencia.

d) Construir una distribucin de frecuencias acumuladas crecientes y decrecientes,


representarlas grficamente e interpretar el significado de la segunda y quinta
frecuencia.

e) Si en el 80% o ms de los locales entran como mximo 4 personas, se decidir


no atender al pblico en ese horario (de 14 a 15 horas) y comenzar a atender a
partir de las 15 horas. En base a los datos, qu decisin se tomar? Justificar.

36

11. Un banco determin el tiempo (en minutos) que permanecen 70 de sus clientes
frente a dos de sus cajeros automticos ms frecuentados, transcribiendo la
informacin en las siguientes ojivas:

Ojivas

80

70

60

50
personas

40

30

20

10

0
1 2 3 4 5 6 7
tiempo (en minutos)

cajero A cajero B

Figura N 2

a. Cuntos clientes que frecuentan el cajero A tardan menos de 3 minutos?

b. Qu porcentaje de clientes que frecuentan el cajero B tarda 5 o ms minutos?

c. Cuntos clientes que frecuentan el cajero A tardan entre 2 y 3 minutos?

d. Cunto tiempo tardan los 50 clientes del cajero B que tardan menos?

e. Cul de los dos cajeros tienen ms clientes que tardan menos de 4 minutos?

f. Cuntos clientes de cada cajero tardan menos de 2 minutos o ms de 5?

g. Reconstruir la distribucin de frecuencias absolutas para cada cajero.

37

CAPITULO III

MEDIDAS DE POSICIN Y TENDENCIA CENTRAL

3.1 Introduccin

Cuando se dispone de un conjunto de datos, una de las inquietudes de mayor


inters es como resumir la informacin recolectada en indicadores que reflejen la
forma en que los datos se agrupan o concentran alrededor de ciertos valores de una
variable en estudio. El objetivo es determinar los valores que pueden ser
considerados como representativos de un conjunto de datos.

Los valores numricos que se toman como referencia para sealar el


comportamiento de un conjunto de datos se llaman medidas de tendencia o
medidas de posicin: En el presente captulo se estudia las medidas de tendencia
que se usan con mayor frecuencia, tales como; el promedio aritmtico, la media
ponderada, la mediana, la moda, etc.

Las medidas de posicin nos facilitan informacin sobre la serie de datos que
estamos analizando. Estas medidas permiten conocer diversas caractersticas de
esta serie de datos.

Las medidas de posicin son de dos tipos:

Medidas de posicin o tendencia central: informan sobre los valores medios de


la serie de datos.

Medidas de posicin no centrales: informan de cmo se distribuye el resto de


los valores de la serie.

3.2 Medidas de tendencia central

Las medidas o estadsticos de resumen son ndices numricos que reducen o


resumen un conjunto de nmeros (datos) a unos cuantos para representarlos
adecuadamente, describiendo sus principales caractersticas. Las principales
medidas de resumen son las de tendencia central, de dispersin y forma de la
distribucin.

38

Las medidas de tendencia central son las siguientes: media aritmtica, media
ponderada, la mediana, la moda, etc.

3.2.1 Media aritmtica:

La media o promedio aritmtico o simplemente promedio de un conjunto de


datos se determina sumando todas las observaciones, luego dividiendo entre
el nmero de observaciones. Dependiendo de la informacin disponible
(poblacional o muestral) se puede tener:

Calculo de la Media aritmtica para datos no agrupados:

1 N X
Xi
i
Media o promedio poblacional = = i 1
N i 1 N

1 n X
Xi =
i
Media o promedio muestral X i 1
n i 1 n

Donde:
Xi : Valor de la i-sima observacin de la variable en estudio
N : Tamao de la poblacin
n : Tamao de la muestra

Este promedio presenta la desventaja de estar influenciado por los valores


extremos; es decir, si en un conjunto de observaciones existen valores muy
pequeos o muy elevados, el valor del promedio aritmtico quedar
influenciado por dichos valores y en estos casos ya no ser un indicador
representativo de la tendencia central de las observaciones.

Principales propiedades:

La media aritmtica es un valor representativo debido a que es el centro de


gravedad o punto de equilibrio de un conjunto de observaciones.

Si se sustituye el valor de cada observacin por el valor del promedio


aritmtico no vara la suma de todas las observaciones.

39

Si a cada observacin de una muestra se le suma una constante, el


promedio de las nuevas observaciones ser igual al promedio de la muestra
original ms la constante.

Si a cada observacin de una muestra se le multiplica por una constante, el


promedio de las nuevas observaciones ser igual al promedio de la muestra
original multiplicado por la constante.

Ejemplo

Halla la media aritmtica de las calificaciones que obtuvo Carlos en un


semestre en la asignatura de Matemtica:

11 12 13 14 15 12 11 10

Solucin:

n 8

X i
1112 13 14 15 12 11 10 88
X i 1
11
n 8 8

El calificativo promedio de Carlos en el presente semestre es 11 (once)

Clculo de la Media aritmtica para datos agrupados:

Cuando se tienen datos agrupados en tablas de frecuencia, el promedio


aritmtico puede ser calculado de la siguiente forma:

1 k
Media o promedio poblacional:
N
fi Mi
i 1

1 k
Media o promedio muestral: X
n
fi Mi
i 1

Donde:

Mi : Marca de clase del i-simo intervalo


fi : Frecuencia absoluta del intervalo i.
k : Nmero de intervalos de clase
N : Tamao de la poblacin
n : Tamao de la muestra

40

Para el caso de datos discretos organizados en cuadros de frecuencia se debe


considerar:

1 k
Media o promedio poblacional:
N
fi X i
i 1

1 k
Media o promedio muestral: X fi X i
n i 1

Donde:

Xi : Valor observado i de la variable en estudio

fi : Frecuencia absoluta del valor observado i

k : Nmero de valores diferentes observados

Ejemplo ilustrativo: Halla la media aritmtica de los siguientes


calificativos, correspondiente a un grupo de alumnos de una universidad
de pregrado

Calificativos de alumnos de pregrado

Calificativos 08 09 10 11 12 13 14
N de estudiantes 2 5 10 13 6 3 1
Elaboramos previamente un cuadro con los siguientes datos:

Calificativos (X) N de alumnos (fi) Xi*fi


8 2 16
9 5 45
10 10 100
11 13 143
12 6 72
13 3 39
14 1 14
suma 40 429

1 k 429
X
n i 1
fi X i
40
10, 725

Conclusin: la concentracin promedio de los calificativos de los 40


alumnos de pregrado de dicha universidad es 10,725

41

Ejemplo ilustrativo

El profesor Rulo desea conocer la media aritmtica de sus 60 alumnos


evaluados en el curso de Estadstica en la escala centesimal, para el cual los
resultados se tabularon en 9 intervalos de clase siendo los datos:

Intervalos 20 a 27 28 a 35 36 a 43 44 a 51 52 a 59 60 a 67 68 a 75 76 a 83 84 a 91

fi 4 3 6 5 13 11 9 7 2

Solucin

LIi-LSi Mi fi Mi*fi
20 a 27 23,5 4 94
28 a 35 31,5 3 94,5
36 a 43 39,5 6 237
44 a 51 47,5 5 237,5
52 a 59 55,5 13 721,5
60 a 67 63,5 11 698,5
68 a 75 71,5 9 643,5
76 a 83 79,5 7 556,5
84 a 91 87,5 2 175
suma 60 3458

1 k 3458
X
n i 1
fi M i
60
57, 63

La nota promedio de los 60 alumnos del profesor Rulo es 57,63 en escala


centesimal.

Los valores que obtienen al aplicar las expresiones para datos sin agrupar y
para datos agrupados sern iguales solamente si el promedio de las
observaciones en cada intervalo es numricamente igual a la marca de clase
del respectivo intervalo.

3.2.2 Media ponderada ( X p ):

La media o promedio ponderado de un conjunto de observaciones x1, x2, x3,


, xn, con pesos o ponderaciones W1, W2, W3, , Wn se define como:

42

n
w i x i w 1x 1 w 2 x 2 w 3x 3 ... w n x n
X i 1 =
p
n w 1 w 2 w 3 ... w n
w i
i 1

Donde:

Xi : Valor de la i-sima observacin

Wi :Ponderacin o importancia relativa de la i-sima observacin.

Este promedio es utilizado para el clculo de nmeros ndices, porcentaje


promedio, costo promedio, etc.; es decir, todos aquellos casos donde las
observaciones no tienen la misma importancia dentro de una poblacin o
muestra.

Ejemplo: Los costos de produccin y las cantidades producidas por tres


empresas productivas (A, B y C) son:

Centros de Produccin Costo de produccin (Xi) Cantidad producida (Wi)


(nuevos soles) (nmero de unidades)

A 1.20 500
B 1.60 200
C 1.05 900

Luego, el costo de produccin promedio por unidad producida, para la


empresa en conjunto ser:
n

w x 5001.20 200 1.60 900 1.05 1865


i i
Xp i 1
1,1656
n
500 200 900
w
1600
i
i 1

Este valor indica que el costo de produccin promedio por artculo, para la
empresa es de 1.1656 nuevos soles por cada unidad producida. Si se
hubieses utilizado el promedio aritmtico se tendra:

1, 20 1, 60 1.05 3,85
X 1, 283
3 3

43

Este valor indicara que el costo de produccin promedio por artculo, de los
centros de produccin es de 1.2833 nuevos soles, bajo el supuesto que las
tres sucursales (centros de produccin) producen el mismo nmero de
artculos. Para el ejemplo este promedio no es correcto, pues no se cumple
que el producto del promedio por el nmero de observaciones (n) es igual al
total; es decir, que el producto del promedio por la cantidad de artculos
producidos sea igual al costo total de produccin, el cual es 1865 nuevos
soles para el ejemplo.

n X 16001.2833 2053.28 nuevos soles 1865 nuevos soles

Pero , n X p 1600 1.165625 1865 nuevos soles

3.2.3 Media geomtrica ( X g ) :

La media geomtrica de un conjunto de n observaciones positivas


x1, x2, x3, , xn, se define como:

n
X g n X1. X 2 . X 3 .... X n n X i
i 1

Este promedio es utilizado en la elaboracin de nmeros ndices y para el


clculo de tasas promedio de variacin.

La media geomtrica se suele utilizar en series de datos como tipos de


inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto
multiplicativo sobre el de los aos anteriores. En todo caso, la media
aritmtica es la medida de posicin central ms utilizada.

Lo ms positivo de la media es que en su clculo se utilizan todos los valores


de la serie, por lo que no se pierde ninguna informacin.

Sin embargo, presenta el problema de que su valor (tanto en el caso de la


media aritmtica como geomtrica) se puede ver muy influido por valores
extremos, que se aparten en exceso del resto de la serie. Estos valores
anmalos podran condicionar en gran medida el valor de la media,
perdiendo sta representatividad.

44

Ejemplo: Un colegio de nivel primario de la selva central ha experimentado


un incremento en el nmero de alumnos matriculados del 15% en el ao
2010, 10% en 2011 y 16% en 2012. Hallar el promedio de crecimiento
anual.

X g 3 (1.15)(1.10)(1.16) 1.136361

Este resultado indica que el nmero de alumnos que se matricula en dicho


colegio se ha incrementado anualmente a un ritmo promedio del 13.6461%.

3.2.4 Media armnica:

La media armnica de un conjunto de n observaciones no nulas (diferentes


de cero) x1, x2, x3, , xn, se define como el recproco de la media aritmtica
de los recprocos de las observaciones; es decir:

1 n n
XA n
n

1 1 1 1 1 1

n i 1 X i
X
i 1

X1 X 2
...
Xn
i

Este promedio tiene la particularidad que los valores extremos de las


observaciones (valores muy pequeos o muy elevados) afectan al promedio
armnico con menor intensidad que al promedio geomtrico y al promedio
aritmtico.

Por otro lado, la media armnica es til para promediar razones que tienen
dimensiones fsicas tales como velocidad de produccin de artculos
farmacuticos, kilmetros por hora, costo por kilmetro, etc. Con frecuencia
resulta dificultosa distinguir que promedio debe utilizarse; por lo cual, como
una referencia debe tenerse en cuenta que cuando la unidad del valor
constante o unidad de evaluacin es igual a la unidad del numerador de una
razn, se usa el promedio armnico, y si es igual a la unidad del
denominador se usa el promedio aritmtico.

Ejemplo: Suponga que las velocidades de produccin de tres docentes son


0.5, 0.625 y 0.4 horas por estudiante. Hallar el tiempo promedio por
estudiante producido despus de una jornada de 6 horas de trabajo.

45

Puesto que cada docente trabaja 6 horas; luego, en la razn


estudiantes/hora, la unidad constante es el tiempo de trabajo (6 horas) por
lo cual se debe utilizar el promedio armnico.

3 3
XA 0.491803 horas / estudiante
1 1 1 6.1

0.5 0.625 0.4

Esto quiere decir que en promedio se necesita 0.491803 horas por


estudiante.

3.2.5 Mediana:

La mediana de un conjunto de observaciones ordenadas de acuerdo a su


magnitud, es el valor de la observacin que ocupa la posicin central de
dicho conjunto. La mediana para la poblacin se simboliza como Me y la
median para la muestra se simboliza como me.

Caractersticas:

La mediana divide a un conjunto de observaciones en dos partes iguales.


El 50% con valores mayores a la mediana y el otro 50% con valores
menores a la mediana.

Como medida de posicin, la mediana es influenciada por el nmero de


observaciones y no por los valores de las observaciones.

La suma de las desviaciones absolutas de las observaciones, con respecto


a la mediana, es menor o igual a la suma de las desviaciones absolutas de
las observaciones, con respecto a cualquier otro valor.

n n

X
i 1
i M e X i K , donde K R
i 1

Clculo de la mediana para datos no agrupados.

La mediana de un conjunto de n observaciones se obtiene de la siguiente


manera:

46

me X n 1 , si n es impar
2

Xn Xn
1
me 2 2
, si n es par
2

Ejemplo de mediana cuando se tiene el nmero de observaciones impar:

5, 8, 7, 9, 6, 5, 4

En este caso los datos ordenados son: 4, 5, 5, 6, 7, 8, 9; con n = 7:

me X 71 X 4 6
2

Interpretacin: El nmero medio es 6; esto significa que el 50% de los


valores son superiores a 6 y el otro 50% son inferiores.

Ejemplo de mediana cuando las observaciones es par: 5, 8, 7, 9, 6, 5, 4, 3

En este caso los datos ordenados son: 3, 4, 5, 5, 6, 7, 8, 9; con n = 8:

X8 X8
1 X4 X5 5 6
me 2 2
5.5
2 2 2

Interpretacin: El valor medio es 5.5; esto significa que el 50% de los


valores son superiores a 5.5 y el otro 50% son inferiores.

Clculo de la mediana para datos agrupados.

La mediana para datos agrupados en tablas de frecuencia se puede obtener


utilizando las frecuencias absolutas o las frecuencias relativas de la siguiente
manera:

n
2 F( k 1)
me LI K TIC
fk

47

tambin:

0.5 Fr( k 1)
me LI K TIC
frk

Donde:

K : intervalo que contiene a la mediana (primer intervalo donde Frk > 0.5).

F( k 1) , Fr( k 1) : Frecuencia acumulada (absoluta o relativa) del intervalo de

clase k-1

f k , frk : Frecuencia (absoluta o relativa) del intervalo de clase K.

Ejemplo: Con los datos de la tabla de frecuencia del ejemplo del profesor
n 60
Rulo, se tiene que el intervalo que contiene a la mediana es 30 es
2 2
decir k=5, puesto que su frecuencia absoluta acumulada es mayor que 30 y
por tanto:

LIi-LSi Xi fi Fi
20 a 27 23,5 4 4
28 a 35 31,5 3 7
36 a 43 39,5 6 13
44 a 51 47,5 5 18
Intervalo donde se ubica la Me
52 a 59 55,5 13 31
60 a 67 63,5 11 42
68 a 75 71,5 9 51
76 a 83 79,5 7 58
84 a 91 87,5 2 60
suma 60

0.5 Fr2 30 18
me LI3 TIC 52 *7 56, 46
fr3 13

Interpretacin: En el 50% de sus alumnos del profesor Rulo se encontr


nota promedio menores a 56,46 y en el otro 50% de los alumnos se
encontr promedios superiores a 56,46.

48

2.5.6 Moda:

La moda de un conjunto de observaciones se define como el valor, clase o


categora que ocurre con mayor frecuencia. La moda para la poblacin se
simboliza como Mo y la moda para la muestra se simboliza como mo.

Caractersticas:

La moda puede o no existir, puede existir ms de una moda.

No se ve afectada por los valores extremos.

Se aplica tanto a informacin cuantitativa como a informacin cualitativa.

La moda es una medida de tendencia inestable y es difcil de estimar.

Clculo de la moda para datos no agrupados

La moda de un conjunto de n observaciones se obtiene de la siguiente


manera:

Ejemplo 1: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4

Ordenando los datos se tiene: 4, 5, 5, 6, 7, 8, 9, siendo la mo = 5, pues es


el valor observado que se repite con mayor frecuencia.

Ejemplo 2: Si se tiene las observaciones: 5, 8, 5, 9, 6, 5, 4, 9

Ordenando los datos se tiene: 4, 5, 5, 5, 6, 8, 9, 9, con lo cual se deduce


que existen las modas mo1 = 5 y mo2 = 9, siendo la primera moda de
mayor importancia puesto que es el valor de la observacin de mayor
frecuencia.

Clculo de la moda para datos agrupados

La moda para datos agrupados en tablas de frecuencia se obtiene de la


siguiente manera:

49

d1
mo LI K TIC
d1 d 2

Donde:

K : intervalo o clase modal.

d1 f k f k 1 d1 frk frk 1

d 2 f k f k 1 d 2 frk frk 1

Ejemplo: Con los datos de la tabla de frecuencia del ejemplo del profesor
Rulo, se tiene que se tiene que el intervalo que contiene a la moda es k=5,
puesto que es el intervalo de mayor frecuencia absoluta simple y por tanto:

LIi-LSi Xi fi Fi
20 a 27 23,5 4 4
28 a 35 31,5 3 7
36 a 43 39,5 6 13
44 a 51 47,5 5 18
Intervalo donde se ubica la Mo
52 a 59 55,5 13 31
60 a 67 63,5 11 42
68 a 75 71,5 9 51
76 a 83 79,5 7 58
84 a 91 87,5 2 60
suma 60

K =5, d1 = f2 - f1= 13 -5 = 8, d2 = f2 f3 = 13 -11 = 2

d 8
mo LI K 1 TIC 52 (7) 57,6
d1 d2 8 2

Interpretacin: La concentracin notas que se ha observado con mayor


frecuencia (moda) se ubica alrededor de 57,6.

3.3 Usos de la media, mediana y moda

a. La media se utiliza:

- Cuando no existen valores extremos que afecten a la media

50

- Cuando se tenga que calcular otros valores estadsticos, como la varianza por
ejemplo.

b. La mediana se utiliza:

- Cuando se desea conocer el valor de posicin central.

- Cuando se tiene valores extremos que afectan a la media

c. La moda se utiliza:

- Cuando se desea conocer el valor de la observacin ms frecuente

- Cuando se analiza variables cualitativas

- Cuando se desea tener una estimacin rpida y aproximada.

Una relacin aproximada entre la media, la mediana y la moda es la siguiente:

mo x 3 x me

3.4 Medidas de posicin no centrales

Las medidas de posicin permiten estudiar la posicin relativa de cada observacin


individual respecto al grupo en el que ha sido registrado o grupo de referencia. La
ventaja de interpretar en trminos relativos las puntuaciones observadas posibilita
al investigador ubicar a los individuos del estudio en un esquema muestral de
referencia. Su valor consiste en que por estar basadas en el concepto de orden,
permiten la definicin de resmenes estadsticos que mejoran la calidad del
anlisis al tolerar o resistir el efecto producido por la presencia de valores atpicos,
propiedad denominada resistencia.

Las principales medidas de localizacin (fractiles) son los percentiles, vigentiles,


deciles, quintiles, cuartiles.

Las medidas de tendencia central, de dispersin y de forma de la distribucin,


describen las caractersticas de la muestra completa. Cuando se desea una medida
individual se utiliza el percentil. La tabla de percentiles consiste en hallar los
principales percentiles de la distribucin de una variable. Si la muestra en estudio

51

es representativa de la poblacin, se puede utilizar como patrn. Cuando


posteriormente se mida a sujetos de esa poblacin se sabr su situacin
aproximada acudiendo a la tabla de percentiles.

3.4.1 Percentiles

Los percentiles o percentilas son 99 y dividen al conjunto de 100 partes


iguales, cada una equivalente al 1%. El percentil k es un ndice que se aplica
para describir la situacin relativa de un sujeto en un grupo y k es el
porcentaje de sujetos que se encuentra por debajo de ese valor
(k = 1, 2, 3,,99). Por ejemplo si el percentil 30 es 46, quiere decir que el
30% de los sujetos tienen puntuacin menor o igual que 46.

Para datos agrupados en tablas de frecuencia se obtiene de la siguiente


manera:

nk
100 F(k 1) p Fr(k 1)
Pk LI K TIC Pp LI K TIC
fk frk

Donde:

k : intervalo que contiene a la mediana (primer intervalo donde Frk > 0.5).

F( k 1) , Fr( k 1) : Frecuencia acumulada (absoluta o relativa) del intervalo de

clase k-1

f k , frk : Frecuencia (absoluta o relativa) del intervalo de clase k.

p : 0.01, 0.02, 0.03, , 0.99 (0<p<1).

Ejemplo: Con los datos de la tabla de frecuencia del ejemplo del profesor
nk 60*70
Rulo, el valor del percentil P0.70 o P70 se ubica 42 en el
100 100
intervalo k=6 puesto su frecuencia absoluta acumulada es igual a 42 y por
tanto:

52

LIi-LSi Xi fi Fi
20 a 27 23,5 4 4
28 a 35 31,5 3 7
36 a 43 39,5 6 13
44 a 51 47,5 5 18
52 a 59 55,5 13 31 Intervalo donde se ubica la P(70)
60 a 67 63,5 11 42
68 a 75 71,5 9 51
76 a 83 79,5 7 58
84 a 91 87,5 2 60
suma 60
nk
100 F( k 1) 42 31
Pk LI K TIC 60 *7 67
fk 11

Interpretacin: El 70% de los alumnos del profesor Rulo tienen a lo sumo


un puntaje de 67 y el 30% restante tienen ms de 67 puntos.

3.4.2 Deciles

Son medidas de localizacin que se definen en forma similar a los


percentiles. Los deciles (Dk) son 9, dividen a un conjunto de datos en diez
partes iguales y corresponden a los percentiles 10, 20, 30, 40, 50, 60, 70, 80
y 90; esto es:

Decil 1 : Percentil 10 Decil 6 : Percentil 60


Decil 2 : Percentil 20 Decil 7 : Percentil 70
Decil 3 : Percentil 30 Decil 8 : Percentil 80
Decil 4 : Percentil 40 Decil 9 : Percentil 90
Decil 5 : Percentil 50

Los deciles indican que el (100)(k/10)% de ellos con valores inferiores a Dk


y el resto con valores superiores a Dk.

3.4.3 Cuartiles

Los cuartiles (Qk) son 3, dividen a un conjunto de datos en cuatro partes


iguales y corresponden a los percentiles 25, 50 y 75; esto es:

53

Cuartil 1 : Percentil 25
Cuartil 2 : Percentil 50
Cuartil 3 : Percentil 75

Los cuartiles indican que (100)(k/4)% de ellos con valores inferiores a Qk y


el resto con valores superiores a Qk . Numericamente se tiene que:

Un decil es equivalente a: Di = Pi/10 , para i = 1, 2, 3, , 9

Un cuartil es equivalente a: Qi = Pi/4 , para i = 1, 2, 3

De lo anterior puede deducirse que Me = P0.5 = Q2 = D5

A continuacin se ilustra la relacin o equivalencia entre algunas medidas de


localizacin:

Decil 1: Percentil 10: Vigentil 2


Decil 2: Percentil 20: Vigentil 4 : Quintil 1
Decil 3: Percentil 30: Vigentil 6
Decil 4: Percentil 40: Vigentil 8 : Quintil 2
Decil 5: Percentil 50: Vigentil 10 : Cuartil 2 : Mediana
Decil 6: Percentil 60: Vigentil 12 : Quintil 3
Decil 7: Percentil 70: Vigentil 14
Decil 8: Percentil 80: Vigentil 16 : Quintil 4
Decil 9: Percentil 90: Vigentil 18

54

Gua de Prctica N 3
12. La siguiente informacin corresponde al coeficiente de inteligencia de 36 personas
seleccionadas al azar encontrndose los siguientes resultados:
11.7 5.7 10.1 8.5 6.4 2.1 5.8 4.6 8.7
7.8 4.4 9.8 15.4 2.5 4.6 7.4 12.1 5.4
4.5 7.2 6.7 8.4 6.1 5.7 4.7 5.2 4.6
9.1 7.4 6.7 3.7 3.2 7.7 5.3 1.5 8.4

Calcular la media aritmtica, la mediana, los percentiles 20, 50 y 75. Interpretar en


forma adecuada los valores obtenidos.

13. A continuacin se dan las edades en aos de los automviles con que trabaj una
empresa transportista la ltima semana: 5, 6, 3, 6, 11, 7, 9, 10, 2, 4, 10, 6, 2, 1, 1, 5
Calcula los indicadores de posicin posibles e interpretarlos.

14. La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15


horas en 60 importantes locales de ventas de automviles de cierta ciudad:

0 2 5 0 1 4 1 0 2 1 5 0 1 3 0 0 2 1 3 1
1 4 0 2 4 1 2 4 0 4 3 5 0 1 3 6 4 2 0 2
0 2 3 0 4 2 5 1 1 2 2 1 6 5 0 3 3 0 0 4

Calcular (sin utilizar ningn software) todos los indicadores de posicin e interpretar
cada uno de ellos y obtener conclusiones.

A partir de los indicadores calculados responder las siguientes preguntas indicando


con qu indicador obtuvo la respuesta.

a) Cul es la cantidad promedio de clientes que entran?


b) En la mitad de los locales entran .....? clientes como mximo.
a) El 10% de los locales con mayor cantidad de clientes, tienen .....? como mnimo.
c) Cul es la cantidad de clientes que ms se repite?
d) El promedio de la cantidad de clientes por local es representativo del conjunto
de datos? Justificar.
e) Corroborar los clculos realizados con los obtenidos mediante el software SPSS.

55

15. El sueldo medio de los obreros de una fbrica es de $ 286.

a. Qu porcentaje de hombres y mujeres trabajan en la fbrica si sus sueldos


medios respectivos son $300 y $260
b. Si el 60% de los obreros tienen menos de 30 aos y percibe el 20% del total de
los sueldos, cunto es el sueldo medio de los obreros de al menos 30 aos?

16. A fin de decidir cuntos mostradores de servicio se necesitarn en tiendas que sern
construidas en el futuro, una cadena de supermercados quiso obtener informacin
acerca del tiempo (en minutos) requerido para atender a los clientes. Se registr la
duracin de 60 casos:

3,6 1,9 2,1 0,3 0,8 0,2 1,0 1,4 1,8 1,6
1,1 1,8 0,3 1,1 0,5 1,2 0,6 1,1 0,8 1,7
1,4 0,2 1,3 3,1 0,4 2,3 1,8 4,5 0,9 0,7
0,6 2,8 2,5 1,1 0,4 1,2 0,4 1,3 0,8 1,3
1,1 1,2 0,8 1,0 0,9 0,7 3,1 1,7 1,1 2,2
1,6 1,9 5,2 0,5 1,8 0,3 1,1 0,6 0,7 0,6

Calcula (utilizando el software SPSS) todos los indicadores de posicin y de dispersin


e interpreta cada uno de ellos. Los clculos deben realizarse para los datos sin
agrupar.

A partir de los indicadores calculados responder las siguientes preguntas indicando


con qu indicador obtuvo la respuesta.

a) Cul es el tiempo promedio de atencin al cliente?


b) El 50% de los casos con menores tiempos de atencin, requieren .......? minutos
como mximo para ser atendidos.
c) El 50% central de los casos son atendidos entre .......? minutos (como mnimo)
y .......? minutos (como mximo).
d) El 25% de los casos que requieren mayor tiempo de atencin, son atendidos en
un tiempo mayor o igual a .......? minutos.
e) El 40% de los casos con menores tiempos de atencin, son atendidos en un
tiempo mayor o igual a .......? minutos y menor o igual a .......? minutos.
f) El promedio es representativo del conjunto de datos?
g) Verificar grficamente (mediante una ojiva) los valores hallados en los incisos b),
c), d) y e).
h) En base a los grficos y a los indicadores calculados en los incisos anteriores,
brindar conclusiones generales sobre los datos.

56

i) Responder los incisos a), b) y teniendo en cuenta los datos agrupados. Existen
diferencias con los clculos realizados para los datos sin agrupar? Qu clculo es
el ms exacto? Justificar.

17. El director de la planta de Intel desea que usted compare los salarios promedio en su
planta de Palo Alto con las de la competencia que queda ubicada en las cercanas de
San Cristobal. De los 6 012 empleados que supervisa 1 212 ganan $12,30 la hora; a
650 se les paga $15,50; 3 098 ganan $23,50, y al resto se les paga $17,12. De los 5
634 empleados que hay en la otra planta 1 654 ganan $12,75; 815 reciben $17,80 y
los otros $20.10. escriba un breve informe para que el director obtenga
detalladamente la informacin que desea.

18. En una ciudad existen 3 grandes plantas de fabricacin de automviles: A, B y C,


cada una con 50 empleados. En cada una de estas plantas se registr el salario de
cada uno de los empleados. En la tabla siguiente, se muestran los valores de los
indicadores de posicin y dispersin calculados para cada conjunto de datos:

Valor Valor Desv.


Media Mediana Cuartil 1 Cuartil 3 N
mn. mx. estndar
A $ 550 $ 510 $ 505 $ 515 $ 500 $ 2500 $ 280 50
B $ 1200 $ 1000 $ 800 $ 1500 $ 500 $ 2500 $ 500 50
C $ 1300 $ 600 $ 550 $ 2400 $ 500 $ 2500 $ 900 50

a. Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te


aseguraran que vas a estar entre el 50% de los que menos cobran, en qu planta
elegiras trabajar y por qu?

b. Si recibieras una propuesta para trabajar en alguna de estas 3 plantas y te


aseguraran que vas a estar entre el 25% de los que ms cobran, en qu planta
elegiras trabajar y por qu?

c. En cul o cules de las 3 plantas de fabricacin de automviles el salario


promedio no es representativo de los salarios de los 50 empleados? En ese caso,
con qu indicadores resumiras la informacin? Justificar.

57

CAPITULO IV
MEDIDAS DE DISPERSIN

4.1 Medidas de dispersin

Cuando se dispone de informacin sobre una variable es necesario conocer si los


datos recopilados muestran una variabilidad significativa. Si los datos son
semejantes entre s, se observar que no se encuentran muy dispersos con respecto
a la media aritmtica y en estos casos se expresa que los datos no son muy
variables; sin embargo, cuando los datos presentan diferencias importantes entre
s, se apreciar que tienden a dispersarse y en estos casos se expresa que la
informacin es variable o heterognea.

El grado de variabilidad de la informacin disponible es muy importante en todo


anlisis estadstico pues de esto depende el grado de confiabilidad de las
estimaciones que se puedan establecer; de acuerdo a esto, para un tamao de
muestra determinado, un anlisis en una poblacin con datos homogneos ser ms
confiable que el realizado en una poblacin con datos heterogneos.

Los indicadores que se utilizan para analizar el grado de heterogeneidad o de


variabilidad de un conjunto de observaciones son llamados medidas de variabilidad
o medidas de dispersin. Las medidas de dispersin son el rango o amplitud, las
absolutas son la varianza, la desviacin estndar y la dispersin relativa es el
coeficiente de variacin.

4.1.1 Rango (R):

El rango o amplitud de un conjunto de datos constituye una medida de


dispersin que es la diferencia entre la observacin de mayor valor y la
observacin de menor valor. Se calcula con la siguiente frmula:

R = Xmax Xmin

Se trata de un ndice muy poco resistente y su uso queda limitado, por ser
muy sensible a los valores extremos de la distribucin, no considerando la
contribucin de los valores intermedios, lo que significa que en muchas
situaciones apenas tenga representatividad.

58

Ejemplo: Determinar el rango para los pesos corporales de trabajadores


jvenes de una comunidad expresados en kg: 32, 54, 21, 33, 45, 49, 61.

R = 61 21 = 40 kg.

El resultado nos indica que en la muestra hay un rango de 40 kg, esto nos
indica la diferencia que existe entre las observaciones de mayor y menor
valor, pero que no evala el grado de variabilidad de las observaciones
intermedias. Como se puede apreciar el rango es una medida muy simple y
su empleo se justifica cuando se precise rpidamente de una medida de
dispersin y no haya tiempo de calcular otras medidas ms eficientes.

4.1.2 Varianza o variancia:

La varianza es una medida de dispersin absoluta afectada por las unidades


de medida de la variable; un valor igual a cero indicara la ausencia de
variabilidad, que cuantifica el grado de dispersin o de variacin de los
valores de una variable cuantitativa con respecto a su media aritmtica. Si
los valores tienden a concentrarse alrededor de su media, la varianza ser
pequea y si los valores tienden a distribuirse lejos de la media la varianza
ser grande.

La varianza es la media aritmtica de los cuadrados de las diferencias de los


datos con respecto a su media aritmtica.

La varianza de un conjunto de observaciones se define de la siguiente


manera:

Varianza poblacional

1 N
2
N i 1
( X i )2

Varianza muestral

59

n
2 n
n
2

1 n
X i n
1 n 2 i 1
Xi Xi
2

i 1
S2 ( X i X )2
n 1 i 1
Xi n
n 1 i 1
i 1

n(n 1)

De las frmulas indicadas se deduce que la variancia de un conjunto de


observaciones esta expresada en unidades cuadrticas; por ejemplo, si las
unidades de las observaciones es kg, la variancia ser expresada en kg2. Esta
expresin dificulta la interpretacin de la variancia.

4.1.3 Desviacin estndar:

La desviacin estndar o desviacin tpica de un conjunto de observaciones


se define como la raz cuadrada de la variancia. Mide la dispersin absoluta
de los datos con respecto al promedio, constituyendo as un mejor descriptor
de la variabilidad de una distribucin que la variancia.

La desviacin estndar (S) se calcula con las frmulas siguientes:

Poblacional : 2

Muestral : S S2

Como se aprecia, la desviacin estndar de un conjunto de observaciones


est expresada en las mismas unidades de la variable en estudio. Por
ejemplo, si las unidades de las observaciones es kg la desviacin estndar
ser expresada en kg. Este hecho brinda una clara ventaja con respecto a la
varianza, en cuanto a su interpretacin.

Propiedades e interpretacin de la variancia y la desaviacin estndar.

1. La desviacin estndar y la variancia son valores positivos que


nicamente sealan cuantas unidades o unidades cuadrticas se desvan
las observaciones de la media.

2. Se trata de indicadores estadsticos muy poco resistyentes y sensibles a


la variacin de los datos.

60

3. La variancia y la desviacin estndar se mantienen invariables cuando a


los datos se les suma un valor constante (k)

Si: yi =xi +k s2y =s x2

4. Si: y=k-x, entonces sy =k-sx y s2y =k2 s x2

5. Cuando se conoce el tamao n j , las medias x j


y las variancias s j2

de diversos subgrupos obtenidos a partir del total, la variancia total del

grupo de observaciones s 2
j puede obtenerse sumando la media

(ponderada) de las variancias y la variancia (ponderada) de las medias.


Si x T es la media total del grupo:

k k
n j . x j
2
n j .s j2
j 1

j1
xT
sT2 = k
k


j
nj
1

j
nj
1

6. La variancia es directamente proporcional a la diferencia cuadrtica


media entre los pares de observaciones:

x
2
xj 4.n 2

i
s
i j
. n n 1

2

4.1.4 Coeficiente de variacin:

El coeficiente de variacin (C.V.) es una medida de dispersin relativa (en


proporcin o en %) de los datos con respecto al promedio. Sus resultados
son ms consistentes que la desviacin estndar y permite comparar la
variabilidad de dos o ms grupos.

Se define como el cociente entre la desviacin estndar y el valor absoluto


de la media aritmtica de un conjunto de observaciones.


C.V. poblacional : CV

61

s
C.V. muestral : CV
x

Para la valuacin del valor del CV, cuando se trabaja con muestras
biolgicas, se puede utilizar la siguiente escala:

Coeficiente de Grado de variabilidad


variacin
0 < cv < 30 Dispersin pequea o
datos homogneos (cv
bajo)
30 < cv < 60 Dispersin media (cv
medio)
cv > 60 Dispersin alta o datos
variable (cv alto)

Para la evaluacin del valor del coeficiente de variabilidad, cuando se trabaja


con datos econmicos se puede utilizar la siguiente escala:

Coeficiente de Grado de variabilidad


variacin
0 < cv < 10 Datos muy homogneos
10 < cv < 15 Datos regularmente homogneos
15 < cv < 20 Datos regularmente variables
20 < cv < 25 Datos variables
cv > 25 Datos muy variables

Para estudios de carcter social, se considera:

- Cuando la variacin es menor que 33% (CV<33%), se dice que el


conjunto de observaciones es homogneo (dispersin pequea).

- Cuando la variacin es mayor que 33% (CV>33%), se dice que el


conjunto de observaciones es heterogneo (dispersin grande).

Si bien estas escalas no son rgidas, se puede utilizar como referencia. Para
definir otra escala se debe tener en cuenta cunto de control se tiene sobre
otros factores que pueden influenciar en un conjunto de datos.

Las propiedades ms interesantes del coeficiente de variacin:

1. Si se suma una constante positiva a un conjunto de observaciones, el


coeficiente de variacin disminuye debido a que la desviacin estndar

62

se mantiene constante y la media incrementa su valor en esa cantidad.


Recprocamente, si se resta una cantidad positiva el coeficiente de
variacin aumenta.

2. Al multiplicar un conjunto de datos por una constante positiva, el


coeficiente de variacin se mantiene invariante dado que la media y la
desviacin estndar quedan multiplicadas por esa constante.
Consecuentemente, el coeficiente de variacin es invariante a cambios
de escala obtenidas mediante un producto.

Cuando se disponen de datos que representan distintas mediciones de una


misma variable, el coeficiente de variacin indica la magnitud del error
promedio de medicin como porcentaje de la cantidad medida;
frecuentemente, los valores del coeficiente de variacin se presentan
multiplicadas por 100.

s
CV *100
x

Ejemplo ilustrativo

Sean los calificativos de 7 alumnos en el curso de estadstica

11; 12; 13; 13; 13; 14; 15

Determina las siguientes medidas de variabilidad: rango, varianza,


desviacin estndar y el coeficiente de variabilidad.

Solucin:

Calculando el rango:

R = Xmax Xmin

R = 15 11 = 4

El resultado nos indica que en la muestra hay un rango de 4, esto nos indica
la diferencia que existe entre las observaciones de mayor y menor valor,

63

pero que no evala el grado de variabilidad de las observaciones


intermedias.

Calculando la varianza:

X i
11 12 13 13 13 14 15
X i 1
13
7 7
1 n
S2
n 1 i 1
( X i X )2

11 13 12 13 13 13 13 13 13 13 14 13 15 13
2 2 2 2 2 2 2

S 2

7 1
10
1,5
6
La dispersin de los cuadrados de las notas respecto a su media aritmtica
es 1,5 unidades cuadrticas.

Calculando la desviacin estndar:

S S2
10
S 1, 29
6

La dispersin de las notas respecto a su media aritmtica es 1,29 unidades


aprox.

Calculando el coeficiente de variabilidad:

s
CV *100
X
1, 29
CV *100 9,92
13

Ello significa que las notas de estos 7 alumnos son regularmente


homogneas.

4.2 Clculos de las medidas de variabilidad con datos agrupados:

Cuando se dispone de un conjunto de observaciones agrupadas en tablas de


frecuencias se debe tener en cuenta las siguientes expresiones:

64

Para la variancia:

Variancia poblacional:

1 K
1K 2
K
2
N

i 1
fi ( M i )2 i i
N i 1
f M 2
N fri M i

i 1
2 2

Variancia muestral:

1 K
S2
n 1 i 1
fi (M i X )2

K
2
fi Mi
1 K 1 K
s2 f i M i nX
2 2 f i M i2 i 1
n 1 i 1 n 1 i 1 n


Nota: cuando se tiene datos discretos organizados en tablas de frecuencia


considerar tambin ests frmulas, pero tomando Mi = Xi.

Ejemplo ilustrativo

Halla la varianza y la desviacin estndar de la siguiente distribucin de


frecuencias correspondientes a los salarios mensuales de los catedrticos de una
universidad.

65

Solucin

Se elabora una tabla de distribucin de frecuencias con la informacin siguiente:

Intervalos Xi fi X i . fi ( X i X )2 ( X i X )2 fi

219559,184
800;1000 900 25 22500
5488979,59

1000;1200 1100 50 55000


72130,6122 3606530,61

1200;1400 1300 30 39000


4702,04082 141061,224

1400;1600 1500 15 22500


17273,4694 259102,041

1600;1800 1700 20 34000


109844,898 2196897,96

9884571,43
1800;2000 1900 35 66500 282416,327

SUMA 175 239500 705926,531 21577142,86

X 1368,57
21577142,86
s2 124006,5681
175 1
s 124006,5681 352,1456632
352,1456632
C.V . *100 25,73089397
1368,57
Lo cual indica que los salarios de los docentes son muy variables.

4.3 MEDIDAS DE ASIMETRA Y CURTOSIS

Al analizar un conjunto de datos, adems del estudio de las medidas de tendencia y


de variabilidad, es conveniente evaluar la forma como estn concentradas las
observaciones. Con frecuencia se menciona que es deseable que las medidas de
tendencia sean representativas; es decir, que reflejen de manera apropiada el
comportamiento de un conjunto de observaciones.

Cuando se dispone de informacin sobre una variable adems de ser necesario


resumirla en indicadores que permitan conocer su tendencia para agruparse

66

alrededor de ciertos valores y su grado de dispersin, es necesario evaluar de qu


manera los datos estn dispersos alrededor de las medidas de tendencia. Este
anlisis permite evaluar cun representativos son los son los valores de tendencia y
su confiabilidad dentro de un estudio. En el presente captulo se estudian algunos
indicadores que pueden ser usados para determinar la forma como estn dispersos
un conjunto de observaciones.

4.3.1 Simetra de una distribucin de datos:

Cuando los datos de una poblacin se distribuyen con igual frecuencia y


alejamiento por debajo y por encima de la media aritmtica, se dice que la
distribucin es simtrica; pero, si los datos por debajo de la media son ms
frecuentes que aquellos por encima de la media, o viceversa, se dice que la
distribucin es asimtrica.

a. Coeficiente de una distribucin de Pearson

El coeficiente de asimetra de Pearson se define como:

Para una poblacional:

3( Me)
S kp

Para una muestra:
3( X me )
Skp
S

En base a este coeficiente se puede tener:

Me Mo Me Mo Me Mo

Distribucin con: Asimetra Distribucin Simtrica Distribucin con: Asimetra


negativa o asimetra a la Skp = 0 positiva o asimetra a la
izquierda derecha
Skp < 0 Skp > 0

67

4.3.2 Curtosis o estadgrafo de apuntamiento:

La curtosis mide el grado de agudeza o achatamiento de una distribucin


con relacin a la distribucin normal, es decir, mide cun puntiaguda es una
distribucin.

La curtosis determina el grado de concentracin que presentan los valores


en la regin central de la distribucin. As puede ser:

Leptocrtica.- Existe una gran concentracin.

Mesocrtica.- Existe una concentracin normal.

Platicrtica.- Existe una baja concentracin.

a. Coeficiente de curtosis

El coeficiente de curtosis se puede hallar mediante la medida de Fisher y


en base a cuartiles y percentiles.

a.1 Medida de Fisher

Para datos sin agrupar se emplea la siguiente frmula:

X X
4

ns 4

Para datos agrupados en tablas de frecuencias se emplea la


siguiente frmula:

f X X
4


i i

ns 4

Para datos agrupados en intervalos se emplea la siguiente frmula:

f m X
4


i i

ns 4

68

Donde:

X i = cada uno de los valores.


n = nmero de datos.
X = media aritmtica.
s 4 = Desviacin estndar a la potencia cuatro.
f i = frecuencia absoluta.
mi = marca de clase

Nota:

Si < 3, entonces la distribucin es platictica


Si = 3, entonces la distribucin es normal o mesocrtica
Si > 3, entonces la distribucin es leptocrtica

Distribucin platicrtica Distribucin mesocrtica Distribucin leptocrtica


Ku < 3 Ku = 3 Ku > 3

a.2 Medida basada en Cuartiles y Percentiles

letra griega minscula kappa Coeficiente percentil de curtosis


Nota:

Si 0, 263, la distribucin es platicrtica


Si 0, 263, la distribucin es normal o mesocrtica
Si 0, 263, la distribucin es leptocrtica

El coeficiente de curtosis se define como:

Distribucin Distribucin Distribucin


platicrtica mesocrtica leptocrtica
Ku < 0.263 Ku = 0.263 Ku >0.263

69

Ejemplo ilustrativo

Se han medido las pulsaciones de un equipo de trabajadores de una empresa despus de


una carrera. Los datos obtenidos son:

Pulsaciones 65;70 70;75 75;80 80;85 85;90 90;95 95;100


N 2 3 3 7 10 12 8
trabajadores

A partir de ello calcula:

a. Media, mediana y moda.

b. Coeficiente de asimetra de Pearson

c. Coeficiente de curtosis.

Solucin:

Se elabora la siguiente tabla

Pulsaciones
X X . fi X X . fi
2 4
X i mi fi X i fi Fi
i i

65;70 67,5 2 135 2 782,4968 306150,621

70;75 72,5 3 217,5 5 655,3452 143159,1104

75;80 77,5 3 232,5 8 286,9452 27445,84927

80;85 82,5 7 577,5 15 159,9388 3654,345678

85;90 87,5 10 875 25 0,484 0,0234256

90;95 92,5 12 1110 37 326,9808 8909,703631

95;100 97,5 8 780780 45 835,5872 87275,7461

Suma N=45 3927,5 3047.778 576595,3995

70

Clculos:
7

X f
i i
3927,5
X i 1
87, 28
N 45
d1 2
Mo LI K TIC 90 *5 91, 67
1
d d 2 2 4

n 45
2 F( k 1) 2 15
M e LI K TIC 85 *5 88, 75
f k 10

f .( X i i X ) 2
3047.778
S i 1
8,32
n 1 45 1

3( X me ) 3(87, 28 88, 75)


Skp 0,53
S 8,32

25 N
100 F( k 1) 11, 25 8
P25 Q1 LI K TIC 80 *5 82,32
fk 7

10 N
100 F( k 1) 4,5 2
P10 D1 LI K TIC 70 *5 74,17
fk 3

75 N
100 F( k 1) 33, 75 25
P75 Q3 LI K TIC 90 *5 93, 65
f k 12

90 N
100 F( k 1) 40,5 37
P90 D9 LI K TIC 95 *5 97,19
f k 8

1
(Q3 Q1 )
1 (93,65 82,32)
Ku 2 * 0, 246
( D9 D1 ) 2 (97,19 74,17)

71

f m X
4

i i

ns 4

X X * fI
4
576595,3995 576595,3995
2, 67
i
4
ns 45*(8.324 ) 215628,3298

Respuesta:
a. X 87, 28 pulsaciones ; M e 88, 75 pulsaciones ; Mo 91,67 pulsaciones

b. X Me Mo
S kp 0,53

La curva es asimtrica negativa (sesgo a la izquierda)


c. Ku 0, 246 y 2,67 , entonces la curva es platicrtica (apuntamiento bajo)

72

Gua de Prctica N 2
19. Si el jornal diario de los obreros de una industria tiene una media de S/. 10.00 y una
desviacin estndar de S/. 2.00. si se realiza un incremento del 20% en cada jornal
y una bonificacin adicional de S/. 3.00 en qu porcentaje cambio la variabilidad
de los jornales?

20. La siguiente tabla muestra distintas tasas de inters, en las ltimas 5 semanas, de
tres financieras diferentes (A, B y C). Si se busca aqulla en la cual la tasa de inters
flucte lo menos posible, qu financiera elegira?

Financiera
Semana
A B C
1 0,05 0,35 0,05
2 0,12 0,24 0,08
3 0,60 0,12 0,09
4 0,55 0,65 0,15
5 0,25 0,39 0,01

21. En una empresa donde trabajan hombres y mujeres la media general de los sueldos
es $250, si la media y la desviacin estndar de los sueldos en el grupo de varones
es $270 y $15 y en el grupo de las mujeres es $220 y $10, calcula :

a. E porcentaje de hombres y mujeres.

b. La desviacin estndar de los sueldos de todos los trabajadores de la empresa.

22. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la


nacin reportadas en la edicin de la revista Forbes de la edicin del 24 de mayo de
2007 aparecen en la siguiente tabla de frecuencias.
a. Calcula e interpreta la media, la mediana y la moda.
b. Calcula e interpreta la varianza y la desviacin estndar.

Edades Frecuencia
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1

73

23. La Global American Inc. ha perfeccionado un producto de consumo especialmente


apropiado para pases en desarrollo. A la luz de consideraciones jurdicas, econmicas
-y de responsabilidad social, la firma tiene por poltica fabricar su producto en los
pases que se han elegido como mercados Principales. Para 'hacer frente a los
criterios de inversin de la firma, el producto solamente se introducir en los pases
con 1 milln o ms de hogares con ingresos anuales de $4000 o ms. Un asistente de
investigacin de mercados recientemente contratado tiene por primer trabajo
recolectar datos iniciales en cinco pases para determinar cules de ellos, si los hay,
cumplen los requisitos mnimos antes enunciados. Los que satisfagan a estos
requisitos sern luego sometidos a un amplio anlisis para determinar si es factible
introducir en ellos el producto. La investigacin inicial revela los datos que se dan
luego. Qu pas o pases se debern recomendar para hacer un anlisis ms
detallado? Por qu?

Pas Media Mediana Moda Desviacin Nmero de


estndar hogares
A $5,000 $4,800 $4,125 $628 5,000,000
B 3,175 3,174 3,174 374 3,500,000
C 3,321 2,992 2,912 603 4,800,000
D 4,415 4,001 2,989 1,339 2,000,000
E 4,656 4,321 3,308 314 1,900,000

24. Carlos, Mara y Miguel venden seguros de vida para una compaa. El gerente
ascender a uno de sus vendedores a un cargo administrativo con base en su
desempeo en ventas. Se decisin depende de cul miembro de su equipo de ventas
tiene: a) el promedio ms alto de ventas y b) el registro de ventas ms consistente.
Dado los siguientes datos de muestra semanales de ventas. Cul vendedor obtendr
el ascenso?

Carlos Mara Miguel


$ 986 $645 $534
1337 645 534
2745 734 534
2645 822 534
3658 893 534
1265 230 534
734 415 534
245 723 534
5344
4867

74

25. Los precios de las acciones estn cotizados en octavos de dlar de manera que por
1 1 7
ejemplo, 5 es $5, 125; 5 es $5,25 y as sucesivamente hasta 5 que es $5.875.
8 4 8
a continuacin se dan una muestra de siete precios de cierre de las acciones tomadas
de las fuentes primarias de una compaa del mes de octubre de 2012.

Acciones A B C D E F G

Precios 3 5 7 1 7 5 1
27 42 69 39 69 38 29
8 8 8 2 8 8 4

a. Calcula la media, la mediana y la moda. Interprete cada estadstico. Qu le


dice cada una? Por qu son diferentes si todas son promedios?

b. Calcula e interpreta la varianza y la desviacin estndar.

c. Calcula e interpreta el rango o recorrido intercuartlico.

d. Calcula e interpreta el percentil cuarenta.

75

Вам также может понравиться