Вы находитесь на странице: 1из 90

Jess Reynaga Obregn

El Mtodo Estadstico
El mtodo estadstico consiste en una secuencia de procedimientos para el manejo de los datos
cualitativos y cuantitativos de la investigacin.
Dicho manejo de datos tiene por propsito la comprobacin, en una parte de la realidad, de una o
varias consecuencias verificables deducidas de la hiptesis general de la investigacin.
Las caractersticas que adoptan los procedimientos propios del mtodo estadstico dependen del
diseo de investigacin seleccionado para la comprobacin de la consecuencia verificable en
cuestin.
El mtodo estadstico tiene las siguientes etapas:
1. Recoleccin (medicin)
2. Recuento (cmputo)
3. Presentacin
4. Sntesis
5. Anlisis
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste, de manera
resumida, en lo siguiente:
1.

Recoleccin (medicin)
En esta etapa se recoge la informacin cualitativa y cuantitativa sealada en el diseo de
la investigacin. En vista de que los datos recogidos suelen tener diferentes magnitudes o
intensidades en cada elemento observado (por ejemplo el peso o la talla de un grupo de
personas), a dicha informacin o datos tambin se les conoce como variables.
Por lo anterior, puede decirse que esta etapa del mtodo estadstico consiste en la
medicin de las variables.
La recoleccin o medicin puede realizarse de diferentes maneras; a veces ocurre por
simple observacin y en otras ocasiones se requiere de complejos procedimientos de
medicin; en algunas ocasiones basta con una sola medicin y en otras se requiere una
serie de ellas a lo largo de amplios perodos de tiempo.
La calidad tcnica de esta etapa es fundamental ya que de ella depende que se disponga
de datos exactos y confiables en los cuales se fundamenten las conclusiones de toda la
investigacin.
Es tan grande la importancia de esta etapa que algunas clasificaciones de las
investigaciones se basan en la forma en que ocurre la medicin; por ejemplo si la
informacin es recogida en una sola ocasin suele decirse que la investigacin es
transversal; en cambio, si la informacin es recogida a lo largo del tiempo se denomina
longitudinal a la investigacin.
En ocasiones, la recoleccin de la informacin debe ocurrir en grupos tan grandes de
individuos que se hace imprctico tratar de abarcar a todos ellos; entonces es cuando se
ponen en prctica procedimientos de muestreo. Tales procedimientos de muestreo estn

17

Jess Reynaga Obregn

subordinados a la consecuencia verificable que se desea comprobar y al diseo de


investigacin seleccionado.
2.

Recuento (cmputo)
En esta etapa del mtodo estadstico la informacin recogida es sometida a revisin,
clasificacin y cmputo numrico.
A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o
palotes; en otras ocasiones se requiere el empleo de tarjetas con los datos y, en
investigaciones con mucha informacin y muchos casos, puede requerirse el empleo de
computadoras y programas especiales para el manejo de bases de datos.
En trminos generales puede decirse que el recuento consiste en la cuantificacin de la
frecuencia conque aparecen las diversas caractersticas medidas en los elementos en
estudio; por ejemplo: el nmero de personas de sexo femenino y el de personas de sexo
masculino o el nmero de nios con peso menor a 3 kilos y el nmero de nios con peso
igual o mayor a dicha cifra.

3.

Presentacin
En esta etapa del mtodo estadstico se elaboran los cuadros y los grficos que permiten
una inspeccin precisa y rpida de los datos.
La elaboracin de cuadros, que tambin suelen llamarse tablas, tiene por propsito
acomodar los datos de manera que se pueda efectuar una revisin numrica precisa de
los mismos.
La elaboracin de grficos tiene por propsito facilitar la inspeccin visual rpida de la
informacin.
Casi siempre a cada cuadro con datos le puede corresponder una grfica pertinente que
represente la misma informacin.
Presentar la misma informacin tanto en un cuadro como en su correspondiente grfico
permite obtener una clara idea de la distribucin de las frecuencias de las caractersticas
estudiadas.

4.

Sntesis
En esta etapa la informacin es resumida en forma de medidas que permiten expresar de
manera sinttica las principales propiedades numricas de grandes series o
agrupamientos de datos.
La condensacin de la informacin, en forma de medidas llamadas de resumen, tiene por
propsito facilitar la comprensin global de las caractersticas fundamentales de los
agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de
una misma manera la esencia de los datos; por ejemplo, cuando alguien informa que el
promedio de calificaciones de un grupo de alumnos es 9.6, en una escala que va del 0 al
10, la imagen que se transmite es la de un grupo con buen aprovechamiento escolar;
igualmente, cuando se dice que el porcentaje de defunciones con una cierta tcnica
quirrgica es de 80%, las personas que escuchan se imaginan que se trata de un
procedimiento peligroso.

18

Jess Reynaga Obregn

La informacin cualitativa, como el sexo, la ocupacin o los tipos de enfermedades,


requiere ser condensada a travs de medidas de resumen diferentes a la que se usan para
sintetizar la informacin cuantitativa o numrica como el peso, la talla o la concentracin
de glucosa.
Entre las principales medidas de resumen para sintetizar a los datos cualitativos se
encuentran las razones, las proporciones y las tasas.
Entre las principales medidas para sintetizar los datos cuantitativos se encuentra la moda y
la amplitud, la mediana y los percentiles y el promedio y la desviacin estndar.
5.

Anlisis
En esta etapa, mediante frmulas estadsticas apropiadas y el uso de tablas
especficamente diseadas, se efecta la comparacin de las medidas de resumen
previamente calculadas; por ejemplo, si antes se han calculado los promedios de peso de
dos grupos de personas sometidas a diferentes dietas, el anlisis estadstico de los datos
consiste en la comparacin de ambos promedios con el propsito de decidir si parece
haber diferencias significativas entre tales promedios.
Existen procedimientos bien establecidos para la comparacin de las medidas de resumen
que se hayan calculado en la etapa de descripcin. Tales procedimientos, conocidos como
pruebas de anlisis estadstico cuentan con sus frmulas y procedimientos propios.
Cada prueba de anlisis estadstico debe utilizarse siempre en funcin del tipo de diseo
de investigacin que se haya seleccionado para la comprobacin de cada consecuencia
verificable deducida a partir de la hiptesis general de investigacin.

En los primeros prrafos se mencion que el mtodo estadstico es una secuencia ordenada de
procedimientos para el manejo de los datos en las investigaciones. Luego de haber revisado las
caractersticas y propsitos de las diversas etapas del mtodo, parece quedar claro que tal
secuencia guarda siempre el orden descrito.
Es lgico efectuar el recuento de la informacin ( 2a. etapa, Recuento) solo hasta que
previamente fue recogida ( 1a. etapa, Recoleccin o Medicin). Antes de condensar la
informacin en la etapa de sntesis ( 4a. etapa) siempre conviene haberla comprendido a travs
de la elaboracin de cuadros y grficos ( 3a. etapa Presentacin).
Desde luego es impensable efectuar anlisis estadstico ( 5a. etapa, Anlisis) para comparar
medidas de resumen si antes estas no han sido calculadas ( 4a. etapa, Sntesis)
Por lo anterior, puede considerarse a la estadstica como una disciplina que posee su propio
mtodo. Tal disciplina emplea conocimientos de otras ciencias como la lgica y la matemtica y
por ello se dice que la estadstica es una forma razonable de emplear el sentido comn y la
aritmtica para el manejo de los datos en las investigaciones.

19

Jess Reynaga Obregn

En la siguiente ilustracin se esquematiza la relacin que existe entre la estadstica y las etapas de
la investigacin cientfica:

Conocimiento

Problema

Hiptesis
Deduccin de
consecuencias
verificables
Diseo de
investigacin

2.
3.
4.
5.
6.

Mtodo Estadstico
Recoleccin
Recuento
Presentacin
Sntesis
Anlisis

Realidad

20

Conocimiento

Jess Reynaga Obregn

Problema
La mortalidad de los mdicos por cncer pulmonar
en relacin con el hbito de fumar
A manera de recordatorio, en el siguiente esquema, con los nmeros 1. al 5. se muestran las etapas del
Mtodo Estadstico :

Conocimiento

Problema

Hiptesis

Conocimiento

Deduccin de
consecuencias
verificables
Diseo de
investigacin

1.
2.
3.
4.
5.

Mtodo Estadstico
Recoleccin
Recuento
Presentacin
Sntesis
Anlisis

Realidad
Con el mismo sistema de enumeracin empleado en el esquema anterior, identifique las etapas del
Mtodo Estadstico que se encuentren presentes en el siguiente relato y anote las letras
correspondientes en los recuadros de los prrafos (algunos recuadros pueden quedar vacios):

Al revisar las estadsticas de enfermedades y defunciones por enfermedades pulmonares se encontr


que casi todos los casos de enfisema pulmonar y varios de cncer pulmonar tenan en muchas ocasiones el
antecedente de tabaquismo crnico.

Sin saber el por qu de tal relacin, en un estudio de numerosos casos de cncer pulmonar se
observ que alrededor del 70% de los enfermos eran antiguos fumadores.

Esto hizo pensar que el consumo de tabaco pudiera ser un factor favorecedor o causal del cncer
pulmonar.

Si lo anterior fuera cierto, podra inferirse lo siguiente: a) Un grupo de fumadores de determinada


edad, sexo y nivel socioeconmico presentara un nmero mayor de muertes por cncer pulmonar que un
grupo de no fumadores de edad, sexo y nivel socioeconmico similares y b) La frecuencia de cncer
pulmonar sera mayor al aumentar el nmero de cigarrillos consumidos.

Luego de discutir si convena formar un grupo de mdicos fumadores y seguirlo a lo largo de varios
aos o formar un grupo de mdicos fumadores y uno de no fumadores, se resolvi hacer la investigacin
enviando un cuestionario a un nico pero numeroso grupo de mdicos del Reino Unido.

21

Jess Reynaga Obregn

De ellos, se solicitaron datos individuales sobre, edad y hbitos de fumar por medio del cuestionario
de referencia. Dicho cuestionario fue puesto a prueba para comprobar que meda con precisin las diversas
variables en estudio. Se establecieron adems conexiones con el Registro de Defunciones para asegurar la
informacin sobre la mortalidad por cncer pulmonar que fuera ocurriendo en los mdicos a quienes se incluy
en el estudio.

Aunque el nmero de datos preguntados a cada mdico era pequeo, la cantidad de


mdicos a quienes se envi el cuestionario sumaba varios miles. Por ello tuvo que hacerse uso de
las que en esa poca se consideraban modernas computadoras.

Los datos se mostraron solamente en forma de cuadros o tablas.

El resumen de la informacin obtenida se expres en tasas de mortalidad por cada mil mdicos.

Las tasas de mortalidad por cada mil mdicos fueron comparadas para averiguar si parecan existir

diferencias significativas, desde el punto de vista estadstico entre quienes murieron por cncer pulmonar
segn el antecedente de si fumaban o no.

Los resultados mostraron que el riesgo de morir fue 14 veces mayor en fumadores que en no
fumadores. Tambin se observ que en los fumadores la frecuencia de stas muertes aument cuando la
cantidad de tabaco que se consuma era mayor.

22

Jess Reynaga Obregn

La recoleccin como primera etapa del mtodo


estadstico
Introduccin:
La primera etapa del mtodo estadstico es la de recoleccin. El trmino recoleccin se refiere a un
conjunto de acciones que permiten disponer de la informacin cuantitativa y cualitativa
estrictamente necesaria para comprobar las consecuencias verificables que se hayan deducido de
una hiptesis.
El conjunto de acciones que permite poseer dicha informacin est orientado por el tipo de diseo
de investigacin que se haya seleccionado para comprobar a cada una de las consecuencias
verificables.
A lo largo de este documento se utilizar como trmino equivalente de recoleccin al de medicin,
ya que lo que realmente se hace al recoger informacin es una especie de medicin de la
magnitud, intensidad o tipo de variacin que tienen diversas caractersticas o atributos.
Como ejemplos de recoleccin de informacin cuantitativa se pueden mencionar: la medicin del
peso al nacer de un grupo de nios, la medicin de la duracin de las consultas mdicas otorgadas
por un grupo de mdicos, la medicin de la cantidad de glucosa sangunea de un grupo de
enfermos de diabetes, etc.
Como ejemplos de recoleccin de informacin cualitativa se pueden mencionar: la medicin del
grado de aceptacin del embarazo en un grupo de adolescentes, la medicin de la agilidad de un
grupo de atletas, la medicin del color de los ojos de un grupo de personas, etc.
Componentes de la recoleccin:
1. El observador o responsable de la medicin
En el caso de la investigacin cientfica, el observador o responsable de la medicin usualmente es
el mismo investigador. En ocasiones, cuando la investigacin es realizada por un grupo de
investigadores, suele designarse a alguno de los integrantes como encargado de efectuar la
medicin de las caractersticas o atributos que servirn para comprobar las consecuencias
verificables que se hayan deducido de la hiptesis de la investigacin.
Tanto si es el propio investigador el que realiza la medicin como si es alguno de los miembros de
un grupo, la observacin que realice debe buscar mediciones vlidas y confiables. La
impreparacin del observador o su falta de cuidado puede provocar que las mediciones efectuadas
no proporcionen informacin til para el proceso de investigacin.
Muchas de las investigaciones requieren que el observador tenga una alta preparacin en tcnicas
de medicin especficas para determinado tipo de investigaciones; por ejemplo, la medicin de
actitudes requiere de una preparacin que tal vez incluya estudios especializados en el campo de
la psicologa, la medicin de alteraciones anatmicas puede requerir de preparacin especializada
en tcnicas radiolgicas modernas o la medicin de caractersticas microscpicas puede requerir
de entrenamiento en tcnicas de microscopa electrnica.

23

Jess Reynaga Obregn

2. Las caractersticas medidas o variables


Para fines estadsticos las caractersticas o atributos a los que se mide su magnitud, intensidad o
valor se denominan variables. En algunos casos la caracterstica que se mide admite una
valoracin cuantitativa de tipo numrico, como la estatura o el nmero de aciertos en un examen;
en otras ocasiones la caracterstica que se mide solo admite valoraciones cualitativas en trminos
de palabras, como el color de ojos o los oficios a que se dedica un grupo de personas.
Tanto si las variables recogidas son de tipo cuantitativo como si son de tipo cualitativo, deben
haberse definido a la luz del diseo de investigacin y deben servir precisamente para comprobar
la consecuencia verificable que origin la seleccin de dicho diseo.
3. El procedimiento de medicin
Los procedimientos de medicin o recoleccin son tan variados que su enumeracin sera
vastsima. Algunos procedimientos consisten en la observacin visual y el registro de lo observado;
por ejemplo, si se deseara investigar la forma en que un grupo de amas de casa prepara los
alimentos en su hogar, una forma sera observarlas y efectuar las anotaciones pertinentes. Otros
procedimientos consisten en efectuar preguntas directas; por ejemplo si se deseara averiguar el
tiempo que emplean en transportarse a su escuela los estudiantes de alguna licenciatura, una
forma podra ser interrogar con precisin a una muestra de dichos estudiantes. En otras ocasiones
los procedimientos pueden consistir en pedir que sea contestado un cuestionario, ya sea con
preguntas abiertas o con preguntas con opciones.
En algunas disciplinas los procedimientos de recoleccin o medicin son efectuados a travs de
dispositivos y tcnicas que proporcionan valores de tipo numrico; por ejemplo, para recoger la
magnitud de las estaturas de un grupo de nios puede emplearse desde una cinta mtrica hasta
un preciso escalmetro. En algunos casos, los procedimientos de medicin llegan a adquirir
niveles extremados de precisin; por ejemplo, para medir la duracin de algunos fenmenos es
posible emplear relojes que miden hasta millonsimas de segundo. En otros casos los
procedimientos de recoleccin implican el empleo de sustancias que desencadenan reacciones
biolgicas o qumicas que ponen en evidencia alguna caracterstica o atributo que, al ser medida
reflejan su real magnitud o intensidad.
Problemas: caractersticas de la recoleccin
Problema 1. Un joven pasante de medicina fue contratado por una fbrica constructora de espejos
para que estableciera programas integrales de prevencin y control de enfermedades y accidentes
en el trabajo, pues los propietarios de la empresa estaban preocupados por la abundante cantidad
de heridos que ya se haban presentado en el curso de los cinco aos que tenia en funcionamiento
la fbrica. Aunque su consultorio estaba ubicado en la planta alta de la seccin de corte y
esmerilado de los espejos y tena acceso directo a ella a travs de un moderno elevador, el joven
pasante siempre procuraba llegar a su oficina por una escalera exterior del edificio, pues le
causaba molestia el intenso ruido producido por la maquinaria de corte y esmerilado.
Con el propsito de averiguar las razones de los numerosos accidentes, el pasante citaba
diariamente a dos trabajadores a su consultorio y los interrogaba acerca de su edad, horario de
entrada y salida, nivel educativo, sueldo y cursos de entrenamiento en el manejo de vidrio que
hubieran tomado.
Luego de haber entrevistado a los 189 trabajadores de la fbrica, el pasante propuso a los dueos
de la empresa que: a) solo contrataran a trabajadores mayores de 28 aos y menores de 45, b)

24

Jess Reynaga Obregn

establecieran dos jornadas de descanso en el curso del da, c) incrementaran los sueldos de los
trabajadores, y d) realizaran dos cursos anuales y obligatorios sobre prevencin de accidentes.
Preguntas:
a. Qu entrenamiento, adems de los estudios regulares de medicina, debiera tener el
responsable de un programa de prevencin y control de enfermedades y accidentes en una fbrica
de espejos?
b. Que procedimiento de recoleccin de informacin utiliz el pasante? Debi haber utilizado
otro procedimiento?
Problema 2. En contra de lo que se supona, un profesor de primaria pensaba que no era cierto
que los escolares aplicados siempre se sientan en las primeras filas de asientos. El opinaba que
esos lugares suelen ser ocupados por los nios que no oyen o ven bien.
Para comprobar lo anterior, compr una carta de optotipos como las que se usan en las pticas y
un viejo y ruidoso reloj de cuerda y clasific la visin y audicin tanto de los nios de las primeras
filas como de los de las ltimas.
Preguntas:
a. Cules fueron los instrumentos de medicin? El investigador debi haber utilizado otros
instrumentos? Cules seran?
b. Cules son los nombres de las tres caractersticas medidas por el investigador en los nios?
Problema 3. En nuestro pas se realizan censos de poblacin cada 10 aos ( el ltimo se realiz
apenas en 1990). Tales censos se aplican en la inmensa mayora de las casas y es raro que
existan familias que no recuerden tal evento, pues la cobertura de los censos se ha incrementado
dcada con dcada.
Interrogue a sus familiares acerca de las preguntas que se les hicieron en el ltimo censo y haga
una lista de ellas. Una vez que disponga de la lista, califique a cada pregunta segn si fue
respondida con exactitud o no. En el caso de las preguntas para las que se otorgaron respuestas
inexactas seale las posibles razones.
Problema 4. Identificndose como estudiante que realiza una prctica escolar acuda a la ptica
ms cercana a su domicilio y averige lo siguiente:

Tipo de preparacin del optometrista


Nombre de los instrumentos que emplea
Tipo de registros utilizados para hacer sus anotaciones
Nombre de las unidades en que se registran los resultados de los exmenes de agudeza
visual
Tipo de errores que pueden cometerse en la medicin de la agudeza visual atribuibles a:

el optometrista
el paciente
el equipo
el procedimiento de medicin
el registro de los resultados de la medicin

25

Jess Reynaga Obregn

Variables y sus escalas


Identificar y clasificar variables son las primeras habilidades que se deben
dominar para que despus se puedan seleccionar y aplicar adecuadamente
diversos procedimientos estadsticos.
1. Definicin
En todos los sujetos u objetos que se estudian se pueden medir caractersticas diversas; por
ejemplo su color, su peso o su longitud.
Las caractersticas, cualidades o atributos que se estudian en cada elemento pueden adoptar
diferentes valores, magnitudes o intensidades; por ejemplo, si se estudia a un grupo de personas y
se les mide su estatura se encontrar que unas son ms altas o ms bajas que otras; si se observa
su color de cabello se encontrar que unas lo tienen rubio, otras castao, otras de color negro y
otras de color blanco. Por el hecho de que la estatura adopta diversas magnitudes entre el grupo
de personas y que su color del cabello presenta diversos valores, a ambas caractersticas se les
denomina variables.
Es casi inimaginable la cantidad de variables cuyas magnitudes, valores o intensidades se
pueden estudiar en un grupo de personas; para mencionar solamente algunas, considrese que al
grupo de personas mencionadas tambin se les podra estudiar otras variables, por ejemplo los
diferentes colores que pueden tener sus ojos, su estado civil, su opinin con respecto a la atencin
que les presta el mdico, el nmero de ocasiones en que acuden a plticas de orientacin
nutricional, su concentracin de glucosa en sangre o la distancia entre sus pupilas.
En resumen, puede decirse que una variable es toda caracterstica, cualidad o atributo
susceptible de ser medida en los sujetos u objetos que se estudian.
2.0 Clasificacin de las variables
Cuando se mide una variable el resultado de la medicin a veces se expresa cualitativamente en
trminos de palabras o cuantitativamente en trminos numricos.
A las variables del primer tipo se les denomina cualitativas y a las del segundo tipo
cuantitativas.
Las variables cualitativas se clasifican en nominales y ordinales. Son nominales si el resultado
de su medicin constituye una escala en la que no se aprecia orden o jerarqua entre las diversas
modalidades de dicha escala; por ejemplo para la variable estado civil se puede formar la siguiente
escala en la que las modalidades no tienen jerarqua una sobre otra: solteros casados, viudos
divorciados, en unin libre. Son variables ordinales aquellas en las que las modalidades que
integran la escala implican una jerarqua u orden entre ellas; por ejemplo, la variable grado militar
es un claro ejemplo del tipo ordinal ya que su escala muestra orden o jerarqua entre sus
modalidades: generales, jefes, oficiales, tropa.
Las variables cuantitativas se clasifican en discretas y continuas. Las variables cuantitativas son
discretas si el resultado de haberlas medido se puede expresar solo en trminos de nmeros
enteros; por ejemplo: el nmero de hijos que tienen las familias se mide en cifras enteras: cero
hijos, un hijo, dos hijos, etc. Las variables cuantitativas son continuas si al medirlas el resultado se
puede expresar en trminos de cifras fraccionarias; por ejemplo, la temperatura en diversas
personas puede valer 36.7, 36.5, 36.8, etc.

26

Jess Reynaga Obregn

Con frecuencia tan solo con conocer el nombre de una variable resulta posible clasificarla; por
ejemplo: la variable nacionalidad debe ser cualitativa nominal pues al pensar en los resultados de
haberla medido en grupos de personas solo vienen a la mente trminos tales como nacional y
extranjero o trminos como mexicano, peruano, costarricense, etc. De ninguna manera se le
ocurre a uno pensar que en tales escalas existe jerarqua y por ello la variable no podra ser
cualitativa ordinal. La variable nacionalidad tampoco podra ser cuantitativa, pues la nacionalidad
no admite cuantificaciones de ningn tipo. En algunas ocasiones el nombre otorgado a algunas
variables es indicativo muy aproximado de su clasificacin; por ejemplo: la variable nmero de
embarazos es susceptible de ser clasificada como cuantitativa discreta y no como cuantitativa
continua pues no existe tal cosa como 2.5 3.75 embarazos.
En otras ocasiones el nombre de la variable no permite fcilmente su clasificacin; por ejemplo: la
variable disminucin de peso puede ser clasificada por algunos como cualitativa ordinal y por otros
como cuantitativa continua; en el primer caso la escala que se supuso pudo ser: excelente, buena,
regular, mala y nula; en el segundo caso la escala pudo haber sido supuesta como: menos de
3.000 kgrs, 3.000 a 5.999 kgrs, 6.000 a 8.999 kgrs., etc.
3.0 Otra clasificacin de las variables
La anterior clasificacin de las variables sirve a propsitos estadsticos y se basa en el nivel de
medicin al que ha podido llegarse al medir a la variable.
Otra clasificacin de utilidad es la que clasifica a las variables desde un punto de vista
metodolgico en independientes y dependientes.
Es independiente una variable que antecede u origina a otras. Por otro lado, una variable se
denomina dependiente si es consecuente a otras.
Esta clasificacin es muy conveniente para analizar el modo en que se relacionan diversas
variables entre s. A manera de ejemplo se presenta una hiptesis de investigacin que contiene
ambos tipos de variables: Es probable que la desnutricin infantil est ms intensamente
condicionada por el nivel de ingresos de las familias que por el nivel educativo de sus integrantes;
obsrvese el esquema que se ha elaborado para clasificar metodolgicamente a las variables:

Variables independientes

Variables dependientes

Nivel de ingresos de las familias


Desnutricin infantil
Nivel educativo de los integrantes
En el esquema se aprecia que a las variables Nivel de ingresos de las familias y Nivel educativo de
los integrantes no les antecede ninguna otra variable y por ello son clasificadas como
independientes; por otra parte se nota que la variable Desnutricin infantil es efecto o resultado de
las dos anteriores y por ello se clasifica como dependiente.
Tanto la clasificacin desde el punto de vista del nivel de medicin como la clasificacin desde el
punto de vista metodolgico coexisten y pueden aplicarse simultneamente a las variables. Por
ejemplo, la variable Desnutricin infantil desde el punto de vista metodolgico se clasifica como
dependiente y desde el punto de vista de su nivel de medicin se puede clasificar como cualitativa
ordinal en el supuesto de que su escala estuviera constituida por las modalidades desnutricin de
primer grado, desnutricin de segundo grado y desnutricin de tercer grado.

27

Jess Reynaga Obregn

4.0 Escalas de las variables


Como resultado del proceso de medicin de una variable surge una escala que muestran los
diversos valores o intensidades que puede adoptar tal caracterstica.
La escala, adems de facilitar la clasificacin de la variable, permite prepararse para contar la
frecuencia con que se presentaron sus diversos valores. A continuacin se muestran algunos
ejemplos.
Escala para una variable cualitativa nominal

Nombre de la variable

ESTADO CIVIL
Solteros
Casados

Su escala de modalidades

Viudos
Divorciados
En Unin Libre

Escala para una variable cualitativa ordinal

Nombre de la variable

Posicin en el empleo
Gerentes
Supervisores

Su escala de modalidades

Jefes de Departamento
Oficinistas
Auxiliares

Como se puede apreciar, la escala de las variables cualitativas, tanto nominales como ordinales,
estn constituidas por renglones denominados modalidades.

Escala para una variable cuantitativa discreta

Nombre de la variable

4a7

Su escala de intervalos
(Sinnimo de intervalos:

Pacientes atendidos
por jornada laboral
0a3

8 a 11
12 a 15

clases)

16 a 19

28

Jess Reynaga Obregn

Escala para una variable cuantitativa continua


Nombre de la variable

15.0 a 19.9 minutos

Su escala de intervalos
(Sinnimo de intervalos:

Duracin de
las consultas
10.0 a 14.9 minutos

20.0 a 24.9 minutos


25.0 a 29.9 minutos

clases)

30.0 a 34.9 minutos


Como se puede apreciar, la escala de las variables cuantitativas, tanto discretas como continuas,
estn constituidas por renglones denominados intervalos o clases.
5.0 Requisitos de las escalas de las variables
Las escalas para cualquier tipo de variable deben cumplir, entre otras, con las siguientes normas:
1. La escala debe ser exhaustiva; es decir, sus modalidades o clases deben abarcar a todo el tipo
posible de mediciones que se vayan a efectuar. En los siguientes ejemplos se aprecian escalas
que no son exhaustivas:
OPINION SOBRE LAS
CONDICIONES DE LAS
AULA
Muy buena

PESO DE UN GRUPO DE
ADOLESCENTES (KGRS.)
30 a 34

Regular

35 a 39

Mala

40 a 44

Muy mala

50 a 54
55 a 59

Falta la modalidad Buena

Falta la clase 45 a 49

2. La escala debe contener modalidades o clases mutuamente excluyentes. Lo anterior se refiere


al hecho de que cualquier medicin realizada pueda ser ubicada en una o en otra modalidad o
clase sin confusiones o ambigedades de ningn tipo. En los siguientes ejemplos se aprecian
escalas con modalidades o clases que no son mutuamente excluyentes:
AGILIDAD MOSTRADA EN
UN EVENTO ATLETICO
Estupenda

PESO DE UN GRUPO DE
ADOLESCENTES (KGRS.)
30 a 34

Excelente

33 a 39

Buena

40 a 44

Regular

45 a 49

Mala

50 a 54

29

Jess Reynaga Obregn

Las modalidades Estupenda


y Excelente se traslapan

La clase 33 a 39 se traslapa
con la de 30 a 34; porque un
individuo de 34 kgrs. podra
ubicarse tanto en una como en
otra clase.

3. La escala debe contener modalidades o clases pertenecientes a una nica variable. Lo anterior
significa que no deben mezclarse modalidades de o clases de una escala con las de otra, aunque
sean sumamente parecidas. En los siguientes ejemplos se aprecian modalidades o clases que no
pertenecen a una misma variable:

TIPO DE DIETA
Hipocalrica
Normocalrica
Hipercalrica
Equilibrada
Las tres modalidades relativas a caloras pueden pertenecer a la escala de una sola caracterstica
y la modalidad Equilibrada puede pertenecer a otra escala perteneciente a otra diferente
caracterstica. As, despejando la mezcla de escalas y modalidades, las escalas de dos diferentes
caractersticas o variables pueden quedar de la siguiente manera:

Tipo de dieta segn aporte


calrico
Hipocalrica

Tipo de dieta segn


equilibrio de nutrientes
Equilibrada

Normocalrica

Desequilibrada

Hipercalrica

Como puede observarse, aunque son muy parecidas, las caractersticas que se desea medir son
diferentes y a cada una de ellas le corresponde su propia escala de modalidades.

30

Jess Reynaga Obregn

6.0 Problemas
Problemas de clasificacin de variables
Clasifique a cada variable marcando con una cruz en la columna correspondiente

Nombre de la variable
y escala correspondiente
1

10

Cualitativa
nominal

Agilidad mostrada al saltar un charco:


Mnima
Regular
Buena
Sexo:
Masculino
Femenino
Disminucin de peso bajo un rgimen de
dieta (kgr. enteros):
01 - 05
06 - 10
11 - 15
16 20
Disminucin de peso bajo un rgimen de
dieta
deficiente
regular
buena
excelente
Grado militar:
Jefes
Oficiales
Tropa
Escolaridad:
Analfabeta
Sabe leer y/o escribir (sin haber
asistido a la escuela)
Primaria incompleta
Primaria completa
Educacin media incompleta
Educacin media o mayor
Escolaridad (aos completos):
0 aos
01-06 aos
07-09 aos
10-12 aos
13-18 aos
Convulsiones:
1-3
4-6
7-9
Convulsiones:
Tnico-clnicas
Tnicas

31

Cualitativa
ordinal

Cuantitativa
discreta

Cuantitativa
continua

Jess Reynaga Obregn

Problemas de identificacin de variables

1. Identifique a las variables contenidas en el siguiente relato y clasifquelas tanto desde el punto
de vista de su nivel de medicin como desde el punto de vista metodolgico.
Un investigador supona que la presencia o la ausencia de microcefalia poda
estar determinada porque la madre hubiera o no tenido rubola durante el
embarazo.

2. Identifique a las variables contenidas en el siguiente cuadro y clasifquelas tanto desde el punto
de vista de su nivel de medicin como desde el punto de vista metodolgico.
Obreros segn intensidad del esfuerzo fsico laboral desarrollado
y participacin en el equipo deportivo de la empresa
Intensidad del
esfuerzo fsico
laboral

Participacin en el equipo deportivo


Cotidiana

Ocasional

Nula
Totales

Ligero

47

12

56

115

Moderado

10

80

12

102

Intenso

74

14

106

194

411

32

Jess Reynaga Obregn

Problemas de construccin de escalas


Identifique y corrija los problemas de falta de mutua exclusividad, de falta de exhaustividad o de
duplicacin de variables que se encuentran en los siguientes cuadros:

Estado Civil

Grado Militar

Agilidad

Soltero

Jefes

Excelente

Casado

Oficiales

Buena

Viudo

Tropa

Regular

Divorciado

Capitanes

Mala

Unin Libre

Psima

Pareja

Torpe

Material de
construccin de
los techos de las
viviendas

Tipo de
dependencia
acadmica en la
UNAM

Opinin sobre las


marchas en va
pblica

Cemento

Escuelas

Autorizar

Madera

Facultades

Prohibir

Lmina metlica

Centros de
investigacin

Sin opinin
Permitir

Opinin sobre el
estado de salud
luego de una
ciruga
Mejor

Resultados de una
votacin

Resultado en un
examen

A favor

No se presentaron

En contra

Reprobaron

Peor

Abstencin

Sin opinin

De acuerdo

Aprobaron con
mencin honorfica

33

Jess Reynaga Obregn

10 Nmero de hijos

11

Habitantes de un
grupo de ciudades

12

Pesos de un grupo
de nios en
gramos

1a3

0 a 9,999

0 a 2,999

4a6

10,000 a 19,999

3,000 a 5,999

8a9

20,000 a 39,999

6,000 a 9,999

10 a 12

40,000 a 49,999

8,999 a 11,999
12,000 a 14,999

Convulsiones al
13 mes en un grupo
de epilpticos

Nmero de votos
14 obtenidos por el
jefe de grupo

15

Concentracin de
glucosa en sangre

0a2

Escasos

Menos de 60
mgrs/ml

3a5

Abundantes

60 a 89 mgrs/ml

6a8

Ms de 30

90 a 119 mgrs/ml

7 a 10

120 a 149 mgrs/ml

11 a 14

150 a 179 mgrs/ml


Ms de 180 mgrs/ml

16

Concentracin de
glucosa en sangre

Personas segn
17 edad (en salud
pblica)

18

Grupos de edad
(en salud pblica)

Menos de 60
mgrs/ml

0 a menos de 1 ao

Infantil

60 a 89 mgrs/ml

1 a menos de 5 aos

Preescolar

90 a 119 mgrs/ml

5 a menos de 15 aos

Escolar

120 a 149 mgrs/ml

15 a menos de 25
aos

Preproductiva

150 a 179 mgrs/ml

25 a menos de 45
aos

Productiva

Ms de 160 mgrs/ml

45 a menos de 65
aos

Posproductiva

65 y ms aos

Ancianidad

34

Jess Reynaga Obregn

Diseo de cuestionarios
Introduccin
La primera etapa del mtodo estadstico, denominada recoleccin, puede llevarse a cabo a travs de
diversos procedimientos de medicin. En algunas ocasiones las variables se miden con equipamiento
instrumental; por ejemplo: la estatura se mide con un escalmetro, el peso con una bscula, la
temperatura con un termmetro y la presin arterial con un baumanmetro. En otras ocasiones las
variables se miden con la simple observacin; por ejemplo: el tipo de actitud que adoptan los pacientes,
su manera de caminar o su color de piel solo requieren inspeccin visual. Algunas veces la medicin de
variables requiere del interrogatorio; por ejemplo: para saber si un paciente est orientado temporal y
espacialmente basta con hacerle una serie de preguntas.
En todos los anteriores casos la informacin obtenida debe ser registrada por escrito para luego proceder
a su recuento. Casi siempre, de la calidad del registro escrito depende la calidad de las conclusiones
obtenidas luego de aplicar procedimientos estadsticos a las variables medidas.
Por convencin a los registros escritos suele denominrseles genricamente cuestionarios. El diseo de
un cuestionario implica que, previamente, se ha realizado una correcta definicin de las variables en
estudio y que para cada una se ha construido su correspondiente escala en trminos de modalidades o
intervalos. Si la definicin de variables o la construccin de sus escalas son imperfectas, el diseo del
cuestionario dar lugar a un defectuoso instrumento de recoleccin.

1. Comprobacin de requisitos
Al inicio del diseo de un buen cuestionario conviene comprobar los siguientes aspectos:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

Se tienen a la vista los objetivos del estudio?


Est definida la poblacin a quien se aplicar el cuestionario?, Se utilizar una muestra?
Se dispone de una lista completa de las variables en estudio?
Las escalas que se han construido para cada variable renen las condiciones de tener
modalidades o intervalos exhaustivos y mutuamente excluyentes?
El cuestionario ser aplicado por personal entrenado o ser de tipo autoadministrado?
Se tiene prevista una base de datos para conservar y contar la informacin?
Se han anticipado los procedimientos estadsticos de presentacin tabular y grfica?
Se han preseleccionado las medidas de resumen que han de sintetizar a cada variable?
Se han previsto las pruebas de anlisis estadstico que permitirn identificar diferencias o
establecer asociaciones?
Se han definido los programas de cmputo para mantener la base de datos y para realizar
procedimientos estadsticos?

2. Como recoger las respuestas al cuestionario


Es necesario decidir si el cuestionario ser llenado directamente por el respondiente (autoadministrado) o
si ser aplicado por un entrevistador. En cualquiera de los dos casos debe quedar claro al respondiente
cul es el propsito de la bsqueda de la informacin y por qu se considera importante que l colabore.
Hacer lo anterior convincentemente puede ayudar a aumentar la tasa de respuesta.

35

Jess Reynaga Obregn

Cuestionarios para entrevistas estructuradas


Adems de contener preguntas, los cuestionarios para entrevistas cara a cara suelen tener textos que
ayudan al entrevistador en la conduccin de la entrevista. Tambin pueden agregarse instrucciones al
entrevistador o imgenes e ilustraciones que se deban mostrar al entrevistado.

Cuestionarios autoadministrados
Trasladar al respondiente la responsabilidad de completar el cuestionario tiene importantes implicaciones
en el diseo del cuestionario. El respondiente se har cargo de llenar cuidadosamente un cuestionario
que considere valioso, interesante, explcito, corto y estticamente bien presentado. En ocasiones habr
que considerar la conveniencia de ofrecer al respondiente un estmulo o recompensa por su esfuerzo; por
ejemplo: conviene ofrecerle un ejemplar del reporte del estudio. En lo posible hay que tratar de usar un
lenguaje muy personal, aunque la encuesta sea de tipo annimo; para lograr lo anterior hay que pensar
acerca de cmo le gustara a uno mismo que se dirigieran por escrito. Cuando sea posible hay que pedir
algunos datos personales no confidenciales como el sexo, la edad y la ocupacin, ya que se ha
observado que con ello se logra establecer un mejor nivel de confianza y un aumento en la tasa de
respuesta.

3. Determinacin de las variables a recoger


Aunque parezca que el diseo de un cuestionario podra iniciarse sin considerar los objetivos y variables
del estudio, nunca hay que adoptar esta va. Existe el riesgo de invertir recursos valiosos y abundante
tiempo para no lograr recoger los datos fundamentales de la investigacin. Para evitar ese riesgo
conviene tener a la mano y por escrito la lista de variables que se haya decidido medir. A continuacin se
muestran ejemplos de la relacin entre los asuntos que se desean explorar en un cuestionario y las
correspondientes variables con sus respectivas escalas:
Asunto

Cules son las principales


razones que manifiestan los
aspirantes para estudiar un
curso de posgrado en la
facultad de medicina?

Variable

Razn principal para estudiar


un curso de posgrado

Escala

La experiencia influye en la
decisin de estudiar un curso
de posgrado en
administracin?

Tiempo de actividad laboral


en reas administrativas

36

Inters cientfico por


un rea determinada
de la prctica mdica
Inters por
distinguirse
acadmicamente de
otros
Inters por obtener
mejores ingresos
Deseo de
perfeccionar
conocimientos y
habilidades en los
que existe cierta
experiencia

1 a 3 aos
4 a 6 aos
7 a 9 aos

Jess Reynaga Obregn

4. Disposicin y secuencia de preguntas en el cuestionario


Debe procurarse no sobresaturar o recargar el cuestionario con ttulos y subttulos innecesarios o con
una numeracin excesivamente ramificada. Es una buena prctica asegurarse de que el cuestionario
tiene un ttulo sencillo y claro y de que existe un nmero o fecha de la versin del documento; esto ayuda
cuando se est trabajando sobre sucesivas versiones de un borrador. Casi siempre resulta til redactar
una atractiva y muy breve introduccin que seale el nombre de la institucin que patrocina la aplicacin
del cuestionario y la importancia de disponer de la informacin que se solicita. Tambin es una buena
prctica numerar las preguntas para propsitos de referencia, particularmente durante las etapas de
captura y anlisis de las respuestas.
Hay que procurar distribuir las preguntas y sus opciones de respuesta de manera estticamente atractiva.
Hay que tratar de ser consistente en el empleo de los trminos y limitarse a plantear la menor variedad de
tipos de preguntas posible. Se debe procurar que el cuestionario tenga a todo lo largo una orientacin
semejante, ya sea horizontal o vertical. Si el cuestionario consiste en hojas engrapadas, hay que procurar
imprimir por un solo lado del papel para evitar que el respondiente salte inadvertidamente a preguntas
que parecieran no tener secuencia con las anteriores; en todo caso hay que pensar en la conveniencia de
imprimir el cuestionario en forma de libro. Cada pgina debe tener una cantidad semejante de preguntas
y debe evitarse la sobresaturacin de texto con el afn de ahorrar papel. Hay que reducir al mximo la
cantidad de lneas, bordes y recuadros y debe usarse un tamao de letra fcil de leer para cualquier
persona; deben preferirse los tipos de letras sin rasgos excesivos; por ejemplo: es mejor usar letra de tipo
Arial que letra de tipo Times New Roman. En caso de que deban imprimirse instrucciones de cada
cuando en cuando hay que usar consistentemente un tipo de letra tal como la de tipo cursiva; por ejemplo
cada vez que se indica: Marque con una cruz en el recuadro correspondiente a la opcin de su
preferencia.
Si el cuestionario ser de tipo autoadministrado, puede empezarse con las preguntas que despierten
mayor inters en el respondiente. En otros casos habr que comenzar con las preguntas ms sencillas
para pasar luego a las ms complejas. En algunas ocasiones habr que dejar que el respondiente
adquiera confianza en el cuestionario antes de empezar a pedirle respuestas de tipo ms personal. En
cualquier caso hay que agrupar las preguntas de manera lgica agrupando las preguntas de tipo similar
en secciones especficas.
Es muy conveniente mantener un flujo lgico y sencillo de las preguntas a lo largo del cuestionario
evitando, en todo lo posible, ramificaciones excesivas; por ejemplo: cuando se pide al respondiente que,
si es hombre pase a la pregunta Y o que si es mujer pase a la pregunta X; en casos como este ltimo es
preferible, si los recursos lo permiten, elaborar un cuestionario para los hombres y otro para las mujeres.

5. Tipos de preguntas
En el diseo de un cuestionario se pueden usar diversos tipos de preguntas: abiertas o cerradas, de
seleccin sencilla o de seleccin mltiple, de asignacin de orden o de asignacin de valor.

Preguntas abiertas y preguntas cerradas


Existen ocasiones en que, por falta de antecedentes o en situaciones inditas, no hay manera de
establecer a priori la escala de alguna variable que se desea medir o que resulta de importancia disponer
de respuestas libremente ideadas por el respondiente. En estos casos puede obtenerse valiosa
informacin al hacer preguntas abiertas tales como la siguiente:
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas?

37

Jess Reynaga Obregn

Plantear una pregunta como la anterior tiene desventajas y ventajas. Como principal desventaja se
encuentra que habr que destinar bastante tiempo para clasificar la amplia variedad de respuestas que
se les ocurran a los respondientes para construir, a posteriori, una escala para la variable involucrada a
fin de poder efectuar un recuento preciso. Como ventajas se encuentran que la gama de respuestas
puede ser ms rica que la que a uno se le pudiera haber ocurrido y que la variedad de respuesta refleja
mejor la opinin de los respondientes. En cuanto a la disposicin de las preguntas abiertas, conviene
reservar suficiente espacio para que se anote sin dificultad la respuesta manuscrita del respondiente y
prever un rea para su posterior clasificacin y codificacin. A continuacin se muestran dos ejemplos:
Mal
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? ______________________________
Bien
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas?

En el caso de que para una variable como la anterior solo interese que el respondiente ubique su opinin
en una escala preestablecida, podra redactarse la pregunta a modo de pregunta cerrada con opciones
mltiples de la siguiente manera:
Cul considera que es la principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? (marque con una X en un solo
recuadro)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades
En el caso de establecer una escala con opciones mltiples como la anterior, hay que asegurarse de que
es exhaustiva y de que las opciones son mutuamente excluyentes entre s.
Preguntas de seleccin sencilla y preguntas de seleccin mltiple
En la modalidad de pregunta cerrada es necesario decidir si se requiere que el respondiente marque una
sola opcin (seleccin sencilla) o si conviene que marque todas las que desee (seleccin mltiple).
Observe la diferencia entre una y otra forma:

38

Jess Reynaga Obregn

Seleccin sencilla
Cul considera que es las principal razn para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas? (marque con una X en un nico
recuadro)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades

Seleccin mltiple
Cules considera que son las principales razones para que los adolescentes
pinten con aerosol las fachadas de las casa ajenas? (marque con una X en los
recuadros que expresen su opinin)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades

Preguntas de asignacin de orden y de asignacin de valor


En algunas ocasiones se hace necesario conocer la importancia que el respondiente concede a algunas
opciones de respuesta; en estos casos puede buscarse su opinin pidindole que asigne un orden de
importancia a las opciones de respuesta o que se ubique en una escala numrica de valores que
representen su preferencia.
Asignacin de orden
De a las siguientes razones para que los adolescentes pinten con aerosol las
fachadas de las casa ajenas un orden de importancia (marque con nmeros del
1 al 4 en los recuadros. El nmero 1 representar la opcin que usted considera
ms importante. No repita nmeros)
Falta de valores cvicos en la familia
El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades

39

Jess Reynaga Obregn

Asignacin de valor
En este tipo de preguntas se utilizan escalas tipo Lickert de la siguiente forma:
Otorgue un valor a las siguientes razones para que los adolescentes pinten con
aerosol las fachadas de las casa ajenas (marque con una X los recuadros que
expresen su opinin)
Muy
importante

Importante

Poco
importante

Nada
importante

Falta de valores cvicos en la familia


El ejemplo de otros adolescentes
El ejemplo de programas de televisin
Debilidad de las autoridades

En la anterior escala de importancia puede apreciarse que no se ha incluido una columna que permita
asignar un valor neutro como por ejemplo Sin opinin debido a la tendencia que tienen muchos
respondientes para escoger opciones que no los comprometen.

6. Redaccin del cuestionario


Precisin
Se deben hacer preguntas lo ms breves y claras posible. Hay que evitar el uso de abreviaturas. Se debe
verificar que la pregunta no se presta a interpretaciones ambiguas; por ejemplo: es mejor preguntar Ha
tenido catarro en los ltimos tres meses? que Ha tenido catarro recientemente?

Preguntas dobles
Algunas preguntas implican dobles cuestiones que deben evitarse; por ejemplo:
Cree usted que los adolescentes debieran comer menos y hacer ms ejercicio?
Para evitar este tipo de preguntas conviene redactar dos preguntas separadas de la siguiente forma:
Marque con una cruz en el recuadro que exprese su opinin
Si
Cree usted que los adolescentes debieran comer menos?
Cree usted que los adolescentes debieran hacer ms ejercicio?

40

No

Jess Reynaga Obregn

Preguntas negativas
Evite preguntas con redaccin negativa que suelen causar confusiones como las siguientes:
Si

No

Si

No

No cree usted que los adolescentes debieran comer menos?


Esta usted en desacuerdo con que los adolescentes debieran hacer ms
ejercicio?
En este caso es mejor redactar as:

Cree usted que los adolescentes debieran comer menos?


Cree usted que los adolescentes debieran hacer ms ejercicio?

Exactitud
En caso de no existir restricciones, procure pedir respuestas precisas. Por ejemplo, en lugar de preguntar
as:
Su edad corresponde a:
18 a 24 aos
25 a 44 aos
45 a 64 aos
pregunte as:
Al 1. De noviembre de 2004 su edad era de _____ aos cumplidos
En el ejemplo anterior podra considerarse que era suficiente con obtener la edad en grupos; sin embargo
existen varias razones para obtener cifras exactas en lugar de cifras agrupadas:

Existe menor riesgo de equivocacin al anotar un nmero que al marcar con cruz en algn
recuadro

Las cifras exactas pueden agruparse a posteriori en intervalos del tamao deseado

Mantener las cifras exactas permite actualizar posteriormente la informacin, particularmente las
edades, con algn programa de cmputo

Ciertos clculos estadsticos y algunos paquetes de cmputo requieren la informacin sin agrupar

41

Jess Reynaga Obregn

Preguntas con respuestas sugeridas

Hay que evitar forzar al respondiente a contestar en contra de su voluntad con preguntas como la
siguiente:
Esta usted de acuerdo, al igual que la gran mayora de los buenos profesores, en que los estudiantes
destinan cada vez menos tiempo a la preparacin de sus exmenes?
Si No

Igualmente, hay que procurar ser cuidadoso al pedir opiniones situando al respondiente en situaciones
hipotticas sumamente irreales o pidindole que marque opciones extremadamente polarizadas
Por ejemplo, en vez de redactar as:
Si usted fuera el director de la facultad de medicina reducira la duracin de los estudios a solo 3 aos?
Si

No

Es mejor redactar as:


Seguramente
si
Si usted formara parte de una
comisin revisora del plan de estudios
de la facultad de medicina
propondra reducir la duracin de los
estudios a 3 aos?

42

Probablemente
si

Probablemente
no

Seguramente
no

Jess Reynaga Obregn

7. Aspectos complementarios al diseo


Aspectos ticos
Nunca deben hacerse preguntas ofensivas o embarazosas. Hay que evitar que el respondiente pierda
tiempo con preguntas innecesarias que no corresponden a ninguna variable del estudio. Las preguntas
delicadas deben hacerse una vez que el respondiente haya resuelto las preguntas generales; por
ejemplo:
Finalmente, para poner en contexto sus respuestas nos permitimos pedirle que sea
tan amable en contestar lo siguiente:
Cul es su estado civil? (marque con una cruz)
Soltero
Casado
Viudo
Divorciado
Unin libre
Al inicio del cuestionario conviene asegurar al respondiente la confidencialidad de sus respuestas
anotando un prrafo semejante al siguiente:
Le aseguramos que sus respuestas sern tratadas de manera respetuosa y sern utilizadas solo con
propsitos de investigacin. Sus datos no sern facilitados a ninguna otra institucin de cualquier
naturaleza de acuerdo a lo establecido por la actual legislacin de derechos humanos. Muchas gracias
por su participacin en este estudio.

Prueba piloto
Por ms que parezca perfecto un cuestionario siempre requiere probarse por anticipado, particularmente
en lo referente a los siguientes aspectos:

Legibilidad del documento, tamao y color del papel y de la letra, formato (hojas engrapadas o
cuadernillo). Identificacin del cuestionario (numeracin consecutiva, nmero o fecha de versin).

Tiempo para el llenado

Facilidades para el llenado (material de escritura, instructivos anexos, auxilio de un entrevistador,


etc.)

Forma de aplicacin (autoadministracin, entrevista)

Ambiente de aplicacin (individual o en grupos de respondientes)

Facilidad de captura de las respuestas (implica el diseo y prueba de la base de datos


correspondiente)

43

Jess Reynaga Obregn

El recuento como segunda etapa del mtodo estadstico


Introduccin:
En esta etapa del mtodo estadstico la informacin recogida es sometida a revisin, clasificacin y
cmputo numrico.
A veces el recuento puede realizarse de manera muy simple, por ejemplo con tarjetas en las que se
anotan datos en el centro de sus bordes y en sus esquinas; en otros casos puede requerirse el empleo
programas de cmputo para el manejo de bases de datos.
En trminos generales puede decirse que el recuento consiste en la cuantificacin de la frecuencia
conque aparecen las diversas caractersticas medidas en los elementos en estudio; por ejemplo: el
nmero de personas de sexo femenino y el de personas de sexo masculino o el nmero de nios con
peso menor a 3 kilos y el nmero de nios con peso igual o mayor a dicha cifra.

Recuento por medio de tarjetas simples:


Este sistema de recuento consiste en transcribir los valores y modalidades de las variables estudiadas
que se encuentran registradas en los formularios en tarjetas de cartulina (usualmente de 12.5 cms. X 7.5
cms.) y, a partir de stas, efectuar el cmputo.
Para esto se requiere que los valores o modalidades tengan asignado un cdigo, preferentemente desde
el asentamiento de los datos hecho en el instrumento en que se hayan recogido. Dichos cdigos sern
transcritos a la tarjeta de cartulina en los sitios establecidos para ello a partir de una tarjeta modelo o
matriz; por tanto, cada formulario da lugar a una tarjeta que contendr la misma informacin ya
codificada.
Ejemplo: Obsrvese el siguiente instrumento de recoleccin ya contestado y los cdigos asignados a los
valores de las diferentes modalidades o clases:
INSTRUMENTO DE RECOLECCION
1

Alumno No.

Preparatoria de origen

19
Privada
CCH UNAM
Bachilleres

Calificacin 1er. examen

Calificacin 2o. examen

Sexo

(B)
(U)

Vocacional IPN

(VI)

No presento

(NP)

No aprobado

(NA)

Suficiente

(S)
(MB)

No presento

(NP)

No aprobado

(NA)

Suficiente

(S)

(B)

Muy bien

(MB)

Femenino

(F)

Masculino

(M)

44

(B)

Muy bien

Bien

(C)

Prepa UNAM

Bien
4

(P)

Jess Reynaga Obregn

Edad

17 - 21 aos

Otras ocupaciones

22 - 26 aos

(2)

27 y ms

(3)

Otra carrera
Trabaja
Solo esta carrera

Hrs. de estudio en casa

Lugar de estudio

(C)

(T)
(S)

0 - 1 horas

(1)

2 - 3 horas

(2)

4 o ms horas
9

(1)

(3)

Biblioteca

(B)

Casa propia

(P)

Casa de amigos

(A)

Otros lugares

(O)

Obsrvese la tarjeta a que da lugar el anterior formulario:

19

Como puede verse, se han ocupado el centro, las esquinas y las partes medias de cada borde de la
tarjeta para anotar los cdigos contenidos en el formulario. Los sitios donde se anota cada cdigo se
determinan previamente mediante la elaboracin de una tarjeta modelo.
En el ejemplo citado, la tarjeta modelo fue elaborada con el siguiente formato:
TARJETA MODELO
Prepa de
origen

Calificacin
1er. examen

Lugar de
estudio

Nmero
del
alumno

Tiempo de
estudio

Otra
ocupacin

Calificacin
2o. examen

Sexo

Edad

Para proceder al cmputo, simplemente se separan las tarjetas en paquetes diferentes, de acuerdo a las
diversas modalidades o clases de una variable, y se cuentan las tarjetas resultantes.

45

Jess Reynaga Obregn

Por ejemplo, si se deseara contar a los individuos segn su escuela de origen se procedera A separar
las tarjetas formando paquetes de la siguiente manera:

C
P

C
C

B
C

B
B

B
B

VI
U

VI
U

VI
U
U
U
U

En caso necesario, cuando se desea realizar el cmputo de individuos clasificados bajo dos criterios, se
procede a una nueva separacin de los grupos de tarjetas resultantes de la primera clasificacin para
proceder a su cmputo.
Por ejemplo, para el caso que est sirviendo de ilustracin, si se deseara conocer cuntos de los
individuos que proceden del Colegio de Ciencias y Humanidades son hombres y cuntas son mujeres
(esto es: si se desear conocer a los individuos segn escuela de origen y sexo simultneamente) se
procedera segn el siguiente esquema:
C
C
C
C

C
C
C

F
M

El sistema de recuento por medio de tarjetas simples es til para contar con comodidad hasta 500 casos,
siempre y cuando cada caso contenga a lo sumo ocho variables.

46

Jess Reynaga Obregn

Recuento por medio de un programa de computadora (Excel):


El programa Excel de Microsoft permite contar y mantener archivados los datos correspondientes a un
mximo de 65,535 casos en quienes se hayan medido hasta 256 variables. Para utilizar este programa
como un sistema de recuento eficiente es indispensable que se respeten las siguientes normas:

la primera fila de una hoja de clculo debe destinarse a la anotacin de los nombres de las
variables medidas, preferentemente con no ms de ocho caracteres,

cada una de las siguientes filas deben corresponder a cada uno de los casos,

no debe dejarse ninguna fila en blanco,

las filas no deben contener ningn tipo de letrero o dibujo,

cada columna debe destinarse a la anotacin de los datos correspondientes a cada caso.

Una vez capturados todos los datos y salvado el archivo se procede de acuerdo a los siguientes pasos:
1. Definir el rea que contiene los datos y asignarle un nombre

Colquese en la celdilla que est en la esquina superior izquierda del rea de datos, oprima
con su mano izquierda la tecla de maysculas y, sin soltarla, oprima repetidas veces la
tecla del cursor derecho hasta que aparezcan sombreadas las celdillas A1, B1 y C1.
Estas celdillas contienen los encabezados de las columnas.

Todava sin soltar con su mano izquierda la tecla de maysculas, oprima una vez la tecla Fin
e inmediatamente la tecla del cursor inferior . Observe que aparece sombreada toda el

47

Jess Reynaga Obregn

rea que contiene a los datos. Ahora puede soltar la tecla de maysculas.

Asegrese de que est sombreada el rea de datos. Con el puntero del ratn oprima una vez
la flecha que est al lado derecho de la ventana Cuadro de nombres. Observe que el
letrero A1 de la ventana se sombrea con color azul. En este momento puede sobreescribir un
nombre. Por ejemplo escriba con minsculas la palabra misdatos. Oprima la tecla

2. Ordenar los datos segn el contenido de alguna columna

Asegrese de que est sombreada el rea de datos. Con el puntero del ratn despliegue el
men Datos y seleccione la opcin Ordenar. Al aparecer un cuadro denominado Ordenar,
que contiene tres ventanas y algunos botones, oprima la flecha que est al lado derecho de
la ventana superior y escoja el nombre de alguna de las columnas. En este caso escoja la
columna Sexo (columna B). Oprima el botn Aceptar. Observe que ahora la columna Sexo
muestra a los datos ordenados. Primero aparecen letras f y luego se muestran letras m.
Para ordenar los datos segn el contenido de alguna otra columna asegrese de que primero
est sombreada toda el rea de datos. Practique el ordenamiento de cada una de las otras
columnas

48

Jess Reynaga Obregn

3. Contar los subtotales de una columna (en este caso la columna sexo)

Asegrese de que tiene ordenados los casos segn la columna sexo. Vaya al men Datos y
escoja la opcin Subtotales. Observe que aparece un cuadro llamado Subtotales que
contiene tres ventanas y algunos botones. Oprima la flecha del lado derecho de la ventana
superior denominada Para cada cambio en: y escoja la columna sexo. En la ventana de en
medio, denominada Usar funcin: deje la opcin Contar. En la ventana inferior, denominada
Agregar subtotal a: marque la columna sexo; asegrese de que las dems columnas no
estn marcadas. Oprima el botn Aceptar.

En este momento, si usted recorre de arriba a abajo la columna sexo, notar que al terminar
las letras f se encuentra un subtotal y que al terminar las letras m se encuentra, tanto el
subtotal para la letras m, como el total de todos los casos.

49

Jess Reynaga Obregn

Antes de efectuar otro recuento de subtotales es necesario realizar lo siguiente: vaya al men Datos y
seleccione la opcin Subtotales. Al aparecer el cuadro Subtotales quite las marcas de cualquier columna
que estuviera marcada en la ventana inferior denominada Agregar subtotal a: y despus oprima el botn
Quitar todos.
4. Ordenar los datos segn dos columnas y contar los subtotales

Asegrese de que quit los subtotales anteriormente utilizados. En la ventana Cuadro de


nombres seleccione el nombre de toda el rea de datos para que quede sombreada en este
caso escogiendo el nombre antes asignado: misdatos). Enseguida vaya al men Datos y
escoja la opcin Ordenar. Al aparecer el cuadro denominado Ordenar escoja en la ventana
superior, llamada Ordenar por, la columna sexo y en la ventana de en medio, denominada
Luego por, la columna apgar. Oprima la tecla

Observe que en la columna sexo se han ordenado los datos y que hay un segmento de letras
f y luego uno de letras m.
Observe que tanto para el segmento de letras f como para el segmento de letras m se

50

Jess Reynaga Obregn

encuentran ordenados los datos de la columna apgar apareciendo primero los valores
menores de cada segmento de la columna sexo.

Ahora vaya al men Datos y escoja la opcin Subtotales. Al aparecer el cuadro Subtotales
realice lo siguiente:
Primero. En la ventana Por cada cambio en: seleccione la columna apgar.
Segundo. En la ventana Agregar subtotal a: marque la columna apgar
Tercero. Oprima la tecla
Recorra las columnas sexo y apgar y tome nota de los subtotales.

5. Concentrar los subtotales en una tabla de contingencia para dos variables


Elabore una tabla como la que se muestra a continuacin y anote los resultados del recuento. Discuta los
resultados observados en la tabla.

51

Jess Reynaga Obregn

Apgar
Sexo

Femenino

Masculino

Como puede observarse hubo ms mujeres que tuvieron valores de Apgar 9.

Ejercicios:
En las siguientes pginas encontrar un listado con los datos de 120 personas que asistieron a una
comida. En el evento se ofrecieron tres alimentos: sopa, arroz y mole. Los invitados pudieron o no haber
comido uno, dos o tres de los alimentos. El mismo da algunas personas presentaron diarrea.
Luego de efectuar el recuento de la informacin, tanto con el procedimiento de tarjetas simples como con
el uso del programa Excel llene los siguientes cuadros:

Ingestin
de sopa

Cuadro 1
Presentacin de diarrea
No
Si

Totales

Cuadro 2
Presentacin de diarrea
No
Si

Totales

Cuadro 3
Presentacin de diarrea
No
Si

Totales

No

Si

Ingestin
De arroz
No

Si

Ingestin
de mole
No

Si

52

Jess Reynaga Obregn

Caso
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39

Sopa
S
N
S
S
S
N
S
S
S
N
S
S
N
S
S
N
S
S
S
S
S
S
S
S
S
N
S
N
S
S
N
S
S
S
S
S
N
S
S

Arroz
N
S
N
N
N
S
S
S
N
S
S
S
S
S
N
N
S
S
N
N
N
N
N
N
S
N
N
S
S
S
S
N
N
N
S
S
N
N
N

53

Mole
N
N
N
S
N
S
N
S
S
S
N
N
N
N
S
S
N
N
S
S
N
N
S
S
S
N
S
N
N
S
N
S
S
S
N
N
N
N
S

Diarrea
S
N
N
S
S
N
S
S
N
S
S
S
N
S
S
N
S
S
S
S
S
S
S
S
S
S
S
N
S
S
N
S
S
S
S
S
N
N
N

Jess Reynaga Obregn

Caso
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79

Sopa
S
N
N
S
N
N
S
N
S
S
N
N
N
N
S
N
N
S
S
N
S
S
N
S
S
S
N
S
S
S
N
S
S
N
S
S
N
S
S
S

Arroz
S
N
S
S
N
N
N
S
N
S
S
N
S
N
S
N
N
S
N
N
S
N
S
N
N
N
S
S
S
N
S
S
S
S
N
N
N
S
S
N

54

Mole
N
S
N
N
N
N
S
N
S
N
N
N
N
S
N
S
N
S
S
N
S
N
N
N
S
N
S
N
S
S
S
N
N
N
N
S
S
N
N
S

Diarrea
S
N
N
S
N
N
N
N
S
N
N
N
N
N
S
N
N
N
S
N
N
S
S
N
S
S
N
S
S
N
N
S
S
N
S
S
N
S
S
S

Jess Reynaga Obregn

Caso
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120

Sopa
S
S
S
S
S
N
N
S
N
S
S
N
S
S
S
S
S
S
S
S
S
N
N
S
N
N
S
N
S
S
S
N
S
N
S
N
S
S
S
N
S

Arroz
N
N
S
N
N
S
N
N
S
S
S
S
N
N
N
S
S
N
N
N
S
N
S
S
N
N
S
S
N
S
S
N
N
N
S
N
N
S
N
N
S

55

Mole
S
N
N
S
S
S
N
S
N
N
S
N
S
S
S
N
N
N
N
S
N
S
S
N
S
N
S
N
S
S
N
N
S
S
N
S
S
S
S
N
S

Diarrea
S
S
S
S
S
N
S
S
N
S
S
N
S
S
S
S
S
N
N
N
S
N
N
S
N
N
N
S
S
S
N
N
S
N
S
N
S
N
S
N
N

Jess Reynaga Obregn

Soluciones a los ejercicios:


Tanto con el procedimiento de tarjetas simples como con el uso del programa Excel, sus resultados
deben ser como los siguientes:

Ingestin
de sopa

Cuadro 1
Presentacin de diarrea
No
Si

Totales

No

34

39

Si

17

64

81
120

Ingestin
De arroz

Cuadro 2
Presentacin de diarrea
No
Si

Totales

No

28

36

64

Si

23

33

56
120

Ingestin
de mole

Cuadro 3
Presentacin de diarrea
No
Si

Totales

No

27

36

63

Si

24

33

57
120

56

Jess Reynaga Obregn

La presentacin estadstica como tercera etapa del mtodo estadstico: cuadros y


grficos

Introduccin
En el mtodo estadstico, luego de las etapas de recoleccin y de recuento, se desarrolla la etapa
denominada presentacin. En ella se elaboran y describen los datos de los estudios o investigaciones a
travs de cuadros y grficos con el propsito de comprender su estructura, organizacin y tendencias.
A travs de los siguientes ejemplos se podr apreciar la importancia de esta etapa.
Supngase que se lee o se escucha la siguiente descripcin: De 120 trabajadores de una fbrica de
gabinetes metlicos que fueron seguidos a lo largo de la dcada 1981-1990, en la poblacin de San
Garabato, 81 estaban expuestos regularmente a ruido intenso; de estos, casi tres cuartas partes
presentaron diversos grados de sordera al cabo del perodo de observacin.
Por otra parte, de 39
trabajadores que solo se exponan espordicamente al ruido, la gran mayora casi no presentaban
manifestaciones de sordera al final del perodo de observacin..
Salvo pocas excepciones, la gran mayora de las personas no logra captar de primera intencin la
magnitud de las cifras y el modo en que se distribuyen las variables a las que se est haciendo
referencia. Es casi seguro que una importante proporcin de las personas tendr que releer la
descripcin dos o ms veces para emitir una opinin respecto a la informacin leda o escuchada.
En cambio, al disponer de un cuadro en el que se presenta dicha informacin, la comprensin de los
datos es casi automtica y las magnitudes numricas se comparan de manera sumamente gil.
Obsrvese el efecto que se logra con la presentacin tabular de la informacin:

Trabajadores de una fbrica de gabinetes metlicos


segn exposicin al ruido y presencia de sordera
San Garabato
1981-1990

Presencia

de sordera

SI

NO

Exposicin
al ruido
Regular

Espordica

Totales

60

(74%)

21 (26%)

81 (100%)

7 (18%)

32 (82%)

39 (100%)

Si bien los cuadros permiten efectuar comparaciones precisas de tipo numrico, tambin se hace
necesario disponer de una forma de presentacin que facilite la revisin visual rpida de las
caractersticas esenciales de los datos.
Obsrvese cmo el grfico que corresponde a la tabla anterior propicia una fcil comprensin de la
informacin con la sola inspeccin visual:

57

Jess Reynaga Obregn

Trabajadores de una fbrica de gabinetes metlicos segn exposicin al


ruido y presencia de sordera,San Garabato, 1981-1990
Sordera

Si
100
No
75
50
25

Regular

Espordica

Exposicin al ruido

Caractersticas bsicas de los cuadros


Como ya se dijo antes, el principal propsito de la etapa de presentacin es facilitar la comprensin
rpida y prctica de la informacin recin contada. Por lo anterior, tanto la elaboracin de cuadros como
la elaboracin de grficos debe cumplir con normas mnimas que promuevan la facilidad en la
descripcin de la informacin en ellos contenida.
En el caso de los cuadros pueden mencionarse como normas mnimas las siguientes:

Cada cuadro debe tener un ttulo completo que responda a las preguntas
Qu se est presentando?,
Cmo se est presentando?,
De donde provienen los datos? y
De cundo son los datos?

Las variables deben tener un nombre exacto que est acorde con la escala de clases o
modalidades que se hayan definido para dichas variables.
La escala de cada variable debe tener modalidades o clases que sean exhaustivas y
mutuamente excluyentes.
En vista de que los cuadros tienen por propsito presentar las caractersticas numricas de los
datos, los clculos deben ser exactos.

Alumnos del Doctorado en Ciencias Biomdicas segn sexo, UNAM,


Generaciones 1997-2 a 1999-2
Columna
con el
nombre
de la
variable y
su escala
de modalidades

Sexo

Nm.

Femenino

199

53.6

Masculino

172

46.4

Totales

371

100.0

Columna de frecuencias
absolutas
58

Columna de
frecuencias
relativas

Jess Reynaga Obregn

Caractersticas bsicas de los grficos


En el caso de los grficos pueden mencionarse como normas mnimas las siguientes:

Cada grfico debe tener un ttulo completo que responda a las preguntas
Qu se est presentando?,
Cmo se est presentando?,
De donde provienen los datos? y
De cundo son los datos?

Para no distorsionar la apreciacin visual de las variables que se estn presentando, la relacin
entre el eje vertical (ordenada) y el eje horizontal (abscisa) de los grficos debe ser de 1 a 1.5;
por ejemplo: si la ordenada mide 3 centmetros, la abscisa medir 4.5
La escala de cada variable debe tener modalidades o clases que sean exhaustivas y
mutuamente excluyentes.
En vista de que los grficos tienen por propsito agilizar la captacin visual de las caractersticas
esenciales de los datos sin distorsiones de ningn tipo, debe evitarse el uso de colores o de
efectos tridimensionales de volumen.
Escolares segn estado de higiene oral, Primaria
Republica de Bolivia, 1999

1600

1200

800

400

0
Muy bueno

Bueno
Regular
Malo
Estado de higiene oral

Muy malo

Se considera que el arsenal mnimo que se debe poseer en cuanto a capacidades para la elaboracin de
cuadros y grficos debe permitir la presentacin de:
1.
2.
3.
4.
5.

Una sola variable cualitativa nominal u ordinal


Una sola variable cuantitativa discreta
Una sola variable cuantitativa continua
Dos variables cualitativas simultneamente (nominales u ordinales)
Dos variables cuantitativas continuas simultneamente (discretas o
continuas)
6. Una variable cualitativa y una cuantitativa discreta simultneamente
7. Una variable cualitativa y una cuantitativa continua simultneamente
En las siguientes pginas se encuentran modelos para cada caso. En cada uno se aprecian las
caractersticas tcnicas que deben tomarse en cuenta para su construccin.

59

Jess Reynaga Obregn

Presentacin de una sola variable cualitativa (nominal u ordinal): Barras simples


Escolares
segn estado de higiene oral
Primaria Repblica del Salvador
1995
Nm.

700
600
500
400
300
200
100
0
Excelente

Bueno

Regular

Malo

Psimo

Estado de Higiene Oral

Presentacin de una sola variable cuantitativa discreta: Histograma

Pacientes epilpticos
segn nmero de convulsiones diarias
Hospital Francs
1992
Nm.

14
12
10
8
6
4
2
0
1a3

4a6

7a9

10 a 12

Nmero de convulsiones diarias

60

Jess Reynaga Obregn

Presentacin de una sola variable cuantitativa continua: Polgono de frecuencias


Alumnos
Segn porcentaje de aciertos
Examen final de anatoma
1992
No.
700

1er paso:
Trazado de histograma
provisional
Trazado de uniones entre
centros de clase

600
500
400
300
200
100
0

0 a 20

21 a 40

41 a 60

Porcentaje de Aciertos

61 a
80

81 a 100

Alumnos
Segn porcentaje de aciertos
Examen final de anatoma
1992
No.

2o. paso
Eliminacin de barras
subyacentes
(VERSION FINAL)

700
600
500
400
300
200
100
0

0 a 20

21 a 40

41 a 60

61 a 80

Porcentaje de Aciertos

61

81 a 100

Jess Reynaga Obregn

Presentacin simultnea de dos variables cualitativas: Barras segmentadas

Invitados a la boda
Segn ingestin de mole y presencia de diarrea
San Garabato
1991

%
100
80

Diarrea

60

No
Si

40
20
0
SI

NO

Ingestin de mole

Presentacin simultnea de dos variables cuantitativas cuantitativas: Diagrama


de correlacin
Recin nacidos segn peso y talla, Hospital Santa Mara,
53

52

51

Talla

50

49

48

47

46
2500

2700

2900

3100

3300

Peso

62

3500

3700

Jess Reynaga Obregn

Presentacin simultnea de una variable cualitativa y de una cuantitativa discreta:


Histogramas apareados
Poblacin segn sexo y edad en aos,
San Miguel, 2003
65 y ms
45 a 64
25 a 44
Mujeres
Hombres

15 a 24
5 a 14
1a4
menos de1
0

2000

4000

6000

8000

10000

12000

Presentacin simultnea de una variable cualitativa y de una cuantitativa


continua: Polgonos de frecuencias superpuestos

Recin nacidos segn sexo y peso,


Hospital DEF, 1990
180
160
140
120
100

Hombres
Mujeres

80
60
40
20
0
2499

2999

3499

63

3999

4499

Jess Reynaga Obregn

Ejercicios: identificacin de errores en la construccin de cuadros


Compare los cuadros con errores con los cuadros correctos
e identifique las diferencias

Estado
Civil
Solteros

Estado Civil
Hospital Francs
1992
Nmero

46

22.2

Casados

84

40.6

Viudos

25

12.1

Divorciados

16

7.7

Unin Libre

36

17.4

Pareja

14

6.8

Total

407

100.0

Trabajadores segn estado civil,


Hospital Francs,
1992
Estado
Civil

Nmero

Solteros

46

22.2

Casados

84

40.6

Viudos

25

12.1

Divorciados

16

7.7

Unin Libre

36

17.4

Total

207

100.0

64

Jess Reynaga Obregn

Pacientes atendidos en Urgencias


segn tipo de ciruga, Hospital Francs,
2002

Tipo de
Paciente

Nmero

Radical

226

23.3

Conservadora

452

66.7

Total

678

100.0

Pacientes atendidos en Urgencias


segn tipo de ciruga, Hospital Francs,
2002
Tipo de
ciruga

Nmero

Radical

226

33.3

Conservadora

452

66.7

Total

678

100.0

65

Jess Reynaga Obregn

Escolares segn estado de higiene oral


Estado de higiene
oral

Nmero

38

2.75

Bueno

124

8.96

Regular

246

17.77

Malo

356

25.72

Psimo

620

44.80

1,384

100.0

Excelente

Total

Escolares segn estado de higiene oral, primaria


Benito Jurez, 2002
Estado de higiene
oral

Nmero

Excelente

38

2.75

Bueno

124

8.96

Regular

246

17.77

Malo

356

25.72

Psimo

620

44.80

1,384

100.0

Total

66

Jess Reynaga Obregn

Alumnos segn calificacin en examen final,


Materia de Anatoma, 2002

Calificacin

Nmero

MB

12

13.3

32

35.6

14

15.6

NA

8.9

NP

2.2

Psimo

22

24.4

Alumnos segn resultado del curso, Materia de


Anatoma, 2002
Calificacin

Nmero

MB

12

17.6

32

47.1

14

20.6

NA

11.8

NP

2.9

Total

68

100.0

67

Jess Reynaga Obregn

Pacientes epilpticos segn nmero de convulsiones


diarias, Hospital Francs, 1998

Estado Civil

Nmero

1 a 3

21.4

4 a 6

14

50.0

6 a 10

17.9

10 a 12

10.7

Total

38

100.0

Pacientes epilpticos segn nmero de convulsiones


diarias, Hospital Francs, 1998

Convulsiones
diarias

Nmero

1 a 3

21.4

4 a 6

14

50.0

7 a 9

17.9

10 a 12

10.7

Total

28

100.0

68

Jess Reynaga Obregn

Viviendas segn nmero de habitaciones


Colonia Rosedal
Nmero de
hijos

Nmero
de
familias

1a2

232

29.5

3a4

452

57.5

4a6

78

9.9

7a8

24

13.1

Total

100.0

Familias segn nmero de hijos


Colonia Rosedal, 2002
Nmero de
hijos

Nmero
de
familias

1a2

232

29.5

3a4

452

57.5

5a6

78

9.9

7a8

24

3.1

Total

786

100.0

69

Jess Reynaga Obregn

Alumnos segn nmero de aciertos,


materia de anatoma

Sexo

Nmero
de
alumnos

0 a 10

38

2.75

11 a 20

124

8.96

21 a 30

246

17.77

31 a 40

356

25.72

41 a

620

50

Total

1,384

100.00

Alumnos segn nmero de aciertos,


materia de anatoma, 2003
Nmero de
aciertos

Nmero
de
alumnos

0 a 10

38

2.75

11 a 20

124

8.96

21 a 30

246

17.77

31 a 40

356

25.72

41 a

620

44.80

1,384

100.00

Total

50

70

Jess Reynaga Obregn

Alumnos segn porcentaje de aciertos,


2003
Nmero de
aciertos

Nmero
de
alumnos

0 a 20

38

42.75

21 a 40

124

8.96

41 a 60

246

17.77

61 a 80

356

25.72

81 a 100

620

44.80

1,384

100.00

Total

Alumnos segn porcentaje de aciertos,


materia de anatoma, 2003
Porcentaje
de aciertos

Nmero
de
alumnos

0 a 20

38

2.75

21 a 40

124

8.96

41 a 60

246

17.77

61 a 80

356

25.72

81 a 100

620

44.80

1,384

100.00

Total

71

Jess Reynaga Obregn

La sntesis estadstica como cuarta etapa del mtodo estadstico.


Medidas de resumen para variables cualitativas.
Razones, proporciones y tasas.
Introduccin
La cuarta etapa del mtodo estadstico se denomina sntesis; en ella se realizan procedimientos de
clculo numrico que producen cifras o medidas que condensan o resumen en s mismas una gran
cantidad de informacin.
La condensacin numrica de los datos da lugar a medidas que, debidamente analizadas y entendidas,
permiten evocar o imaginar las caractersticas fundamentales de toda la informacin que dio origen a
dichas medidas.
La ventaja principal del clculo de las medidas de resumen consiste en que a travs de ellas se facilita la
comunicacin de las peculiaridades esenciales de grandes volmenes de datos.
Por ejemplo: si una persona se quisiera informar acerca de las enfermedades que dieron origen a los
fallecimientos ocurridos en una ciudad podra efectuar una lectura de todos y cada uno de los
certificados de defuncin de las personas fallecidas; sin embargo, luego de la lectura de 40 o 50
certificados, ya habra perdido el inters por la informacin o quiz ya habra cado en una total confusin
al tratar de recordar la causa que condujo a la muerte a cada uno de los difuntos.
En cambio, si se hubieran calculado las medidas de resumen llamadas tasas para las cinco primeras
causas de muerte y esta informacin estuviera disponible, tales medidas de resumen permitiran imaginar
las caractersticas bsicas de la mortalidad en la ciudad de referencia.
En el caso de las variables de tipo cualitativo la condensacin de la informacin suele hacerse con
alguna de las siguientes tres medidas de resumen de uso frecuente:

Razones
Proporciones
Tasas

RAZONES
Definicin: Una razn es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre dos conjuntos.

Razn: comparacin a travs de cociente


entre dos conjuntos

Ejemplo: Se desea condensar la siguiente informacin: en un hospital rural existen 18 residentes que se
encargan de la atencin de 126 pacientes; por otra parte, en un hospital urbano existen 8 residentes que
se encargan de atender a 32 pacientes.

72

Jess Reynaga Obregn

Procedimiento: de acuerdo a la definicin de razn deben dividirse dos grupos de elementos. En este
caso, para el hospital rural se divide el nmero de pacientes entre el nmero de residentes:
Razn

pacientes
126
en hospital rural =
=7
residentes
18

En cuanto al hospital urbano, se divide tambin el nmero de pacientes entre el nmero de residentes de
dicho hospital:
Razn

pacientes
32
en hospital urbano =
=4
residentes
8

Interpretacin:
Para el caso del hospital rural: Existen siete pacientes a atender por cada residente.
Para el caso del hospital urbano: Existen cuatro pacientes a atender por cada residente.
En conclusin: parece haber mayor cantidad de trabajo para los residentes del hospital rural.

PROPORCIONES
Definicin: Una proporcin es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre un subconjunto y el conjunto al que pertenece.

Proporcin: comparacin a travs de cociente


entre un subconjunto y el conjunto al cual pertenece

Ejemplo: Se desea condensar la informacin siguiente: en un pas subdesarrollado ocurrieron 422,350


defunciones en total; de ellas 124,352 pertenecieron a nios que an no cumplan el ao de edad.
Por otra parte, en un pas industrializado ocurrieron un total de 1' 721,215 defunciones de las cuales
206,876 se presentaron en nios menores de un ao de edad.
Procedimiento: de acuerdo a la definicin de proporcin deben dividirse un subconjunto entre el
conjunto al que pertenece.
Asi, para el pas subdesarrollado:
proporcindemuertesdemenoresdeunaoenpas subdesarrollado =

124,352
422,350

73

= 0.29

Jess Reynaga Obregn

Por otra parte, para el pas industrializado:


proporcindemuertesdemenoresdeunaoenpasindustrializado =

206,876

= 0.12

1'721,215

Interpretacin:
Para el caso del pas subdesarrollado: La importancia del subconjunto de muertes de menores de un
ao, en relacin con el conjunto total de muertes en el pas es de 0.29, lo que equivale a casi la tercera
parte de todas las defunciones.
Para el caso del pas industrializado: La importancia del subconjunto de muertes de menores de un ao,
en relacin con el conjunto total de muertes en el pas es de 0.12, lo que equivale a aproximadamente
una octava parte de todas la defunciones.
En conclusin: la importancia de las defunciones de nios menores de un ao es mucho mayor en el pas
subdesarrollado que en el pas industrializado.
Nota: Conviene mencionar que, en ocasiones, las proporciones son multiplicadas por el nmero 100 y
con ello se habla de los porcentajes. As, para el ejemplo, podra haberse hablado de que los porcentajes
de defunciones de menores de un ao en el pas subdesarrollado y en el pas industrializado eran de
29% y de 12%, respectivamente.

TASAS
Definicin: Una tasa es una medida de resumen para variables cualitativas que consiste en la
comparacin, a travs de una divisin, entre el nmero de veces que ocurre un cierto tipo de eventos y la
poblacin en la que puede ocurrir dicho tipo de eventos. Usualmente el resultado de tal divisin consiste
en una cifra fraccionaria menor a uno; por ello, el resultado de la divisin suele ser multiplicado por
alguna constante que sea mltiplo del nmero 10.

Tasa: comparacin a travs de cociente entre


un conjunto de eventos y la poblacin en la que
pueden ocurrir tales eventos

Ejemplo: En una ciudad, a lo largo del ao 1991, ocurrieron 345 defunciones por cncer de prstata.
Dicha ciudad tena una poblacin total de 2' 453, 310 habitantes. De ellos, 1' 210, 425 eran del sexo
masculino. Se desea condensar la informacin de tal manera que los clculos produzcan una medida de
resumen que permita imaginar o evocar la magnitud del riesgo que existe para los habitantes de tal
ciudad de fallecer por cncer de prstata.
Procedimiento: de acuerdo a la definicin de tasa debe dividirse el evento entre la poblacin en la cual
dicho evento puede ocurrir. El resultado debe multiplicarse por un mltiplo del nmero 10.
tasa de defunciones por cncer de prstata=

345
X 100,000 = 28.50 29
1210
,
,425

74

Jess Reynaga Obregn

Interpretacin: En la ciudad estudiada, a lo largo del ao de referencia, fallecieron 29 de cada 100,000


habitantes del sexo masculino por cncer de prstata.
Notas: En primer lugar obsrvese que la divisin del nmero de eventos, en este caso las defunciones
por cncer de prstata, fue efectuada entre el nmero de habitantes del sexo masculino y no entre el total
de la poblacin, ya que solo los hombres pueden padecer tal patologa.
En segundo lugar ntese que la constante utilizada para multiplicar el resultado de la divisin anterior fue
el nmero 100,000. Tal cifra fue escogida porque con ella se obtiene un resultado final que incluye uno o
dos dgitos enteros (es usual que las tasas de mortalidad especfica tengan como constante para
multiplicar el resultado de la divisin al nmero 100,000)
En tercer lugar conviene destacar la importancia del uso de tasas para condensar informacin de tipo
cualitativo. Supngase que interesa comparar la mortalidad por enfermedades del corazn entre los
jvenes de 15 a 24 aos edad y los ancianos de 65 a 74 aos y que se utilizan los siguientes datos:
Grupo
poblacional

Defunciones por
enfermedades del
corazn

Total de
defunciones por
todas las causas

Jvenes
Ancianos

12, 763
11,425

48,999
306,025

Proporcin de
defunciones por
enfermedades del
corazn en relacin
con las defunciones
por todas las causas
.26
.04

Si se optara por comparar las proporciones de defunciones por enfermedades del corazn de ambos
grupos poblacionales podra quedar la impresin de que las enfermedades del corazn son un problema
mucho ms grave en el grupo de jvenes que en el de ancianos; esta falsa imagen se produce porque no
se est tomando en cuenta la cantidad de personas que componen a cada grupo poblacional; es decir,
no se est tomando en consideracin el volumen de las poblaciones en que pueden ocurrir ese tipo de
eventos.
En cambio obsrvese lo que ocurre cuando se usan los siguientes datos, necesarios para el clculo de
tasas:
Grupo
Poblacional

Nmero de habitantes que


forman el grupo poblacional

Tasa de defunciones por


enfermedades del corazn

Jvenes

Defunciones por
enfermedades del
corazn
12, 763

23' 900, 749

Ancianos

11,425

6' 368, 450

53.4 defunciones por cada 100,000


habitantes de ese grupo
179.4 defunciones por cada 100,000
habitantes de ese grupo

Con los ltimos resultados ya se puede efectuar una comparacin correcta al decir que por cada 100,000
jvenes solo fallecen 53.4 de ellos por enfermedades del corazn; en cambio por cada 100,000 ancianos
fallecen 179.4 por la misma causa. Lo anterior significa que tales padecimientos constituyen un riesgo
mucho ms importante como causa de mortalidad en el grupo de ancianos que en el grupo de jvenes.
En cuarto lugar, aunque las tasas son calculadas con datos que pertenecen a periodos ya concluidos, se
considera que tales tasas sirven para anticipar la probabilidad o el riesgo de ocurrencia de un evento en
una poblacin para periodos inmediatos a aquel para el que se efectuaron los clculos.

75

Jess Reynaga Obregn

PROBLEMAS
1. En un distrito escolar urbano se encontr que exista una poblacin escolar a nivel primaria de 123,456
nios. Para uso de tales nios se encontraron disponibles 1,380 sanitarios y 820 bebederos de agua.
Por otra parte, en un distrito escolar rural, se encontr una poblacin escolar de primaria de 34,244 nios. En las escuelas de dicho distrito se encontraron 179 sanitarios y 54 bebederos de agua.
Con la informacin anterior calcule e interprete las siguientes razones para los dos
distritos escolares:

razn nios por cada sanitario


razn nios por cada bebedero

2. En un pas en desarrollo ocurrieron 432,614 defunciones a lo largo de un ao. De tales defunciones las
correspondientes a nios menores de un ao fueron 125,315. Por otra parte, en un pas desarrollado,
ocurrieron 1' 347,915 defunciones en total. De tales defunciones 114,304 correspondieron a nios
menores de un ao.
Con la informacin anterior calcule e interprete la proporcin de las defunciones de menores de
un ao en relacin con el total de las defunciones. Compare la importancia de la mortalidad de
los nios menores de un ao en cada pas.
3. En un estudio sobre desercin escolar a nivel de licenciatura se encontr que de 894
estudiantes que ingresaron a la carrera de qumica 148 abandonaron los estudios
durante el primer ao de la carrera. Por otra parte, de 1,311 alumnos que ingresaron a la
carrera de medicina 118 abandonaron los estudios durante el primer ao de la carrera.
Calcule y compare las tasas de desercin en primer ao para ambas licenciaturas.
4. En un estudio efectuado en 1987 sobre el personal acadmico de instituciones pblicas y privadas de
educacin superior se encontr que haba 894 hombres y 1,814 mujeres en una universidad pblica
mientras que en una universidad privada de la misma regin haba 633 hombres y 274 mujeres.
En la universidad pblica se encontr que de los hombres 296 posean grados
acadmicos superiores al de licenciatura y de las mujeres 524 posean grados anlogos.
Con respecto a la universidad privada, se encontr que 92 hombres y 38 mujeres
posean grados acadmicos superiores al de licenciatura. Con la informacin anterior
calcule y describa para cada universidad lo siguiente:
razones hombres por cada mujeres

proporciones de acadmicos con estudios de posgrado

76

Jess Reynaga Obregn

La sntesis estadstica como cuarta etapa del mtodo estadstico.


Medidas de resumen para variables cuantitativas.
Mediana y percentiles en series simples de datos.
Cuando se desea sintetizar una serie de datos cuantitativos discretos, tales como el nmero de embarazos, el nmero de convulsiones o el nmero de habitaciones que tienen un grupo de viviendas, debe
utilizarse a la mediana y a los percentiles. Estas medidas de resumen, a diferencia del promedio y la desviacin estndar, son perfectamente apropiados para sintetizar a las variables cuantitativas discretas.
Con el siguiente ejemplo debe quedar claro que el promedio y la desviacin estndar no son medidas de
resumen propias para sintetizar a las variables cuantitativas discretas: qu significara que el promedio
de hijos de un grupo de madres fue de 2.75 hijos?, significara que en promedio cada una de las madres
tuvo dos hijos completos y otro ms al que le falt un brazo?
A diferencia del promedio y la desviacin estndar, que solo deben usarse para sintetizar a variables
cuantitativas continuas, la mediana y los percentiles pueden utilizarse para resumir tanto a variables
cuantitativas discretas como a variables cuantitativas continuas.
La siguiente serie simple de valores se utilizar como ejemplo para ilustrar el clculo e interpretacin de la mediana y algunos percentiles:
Peso en kilogramos de un grupo de 20 nios
de un ao de edad
9.1
9.3

9.4
8.8

8.9
9.5

9.6
9.7

10.5
9.2

8.8
9.4

9.4
9.6

9.2
9.0

9.0
9.4

8.1
9.8

MEDIANA (o Percentil 50) :


Definicin: En una serie de valores ordenados de menor a mayor, o viceversa, es aquel valor que divide en dos partes de igual tamao a toda la serie.
.
Procedimiento: Ordenar la serie y localizar el valor que la divida en dos partes de igual tamao, de tal
manera que en una parte quede el 50% de los datos y en la otra el 50% restante.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En vista de que la serie es par no existe un valor que se ubique exactamente en el centro de la serie y
que la divida en dos partes. Por lo anterior se considera que el promedio de los dos valores centrales que
estn colocados en las posiciones 10 y 11 corresponde al valor de la mediana; es decir: la mediana
equivale al valor promedio de 9.3 y 9.4 (9.35)
Interpretacin: "La mitad de los nios tuvieron un peso igual o menor que 9.35 kilogramos y la otra mitad
pesaron 9.35 o ms kilogramos"

77

Jess Reynaga Obregn

PERCENTILES ( Pp ) :
Definicin: En una serie de valores ordenados, de menor a mayor o viceversa, es aquel valor que divide
en dos partes porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a
la serie en una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en
otra parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil.
Procedimiento: Ordenar la serie y localizar el valor que la divida en los porcentajes complementarios
deseados.
Por ejemplo, para encontrar el valor del percentil 25 debe localizarse a aquel que deje a una cuarta parte
de los valores con menores o iguales magnitudes a l y a las tres cuartas partes restantes de los valores
con magnitudes ms grandes o iguales a l.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En esta serie, entre los valores 9.0 se debe encontrar un valor en una posicin tal que hasta l se encuentra el 25% de los casos y, simultneamente, desde l se encuentra el 75% restante de los casos.
Usualmente cualquier percentil se ubica en una posicin localizada mediante la siguiente frmula:
Lugar que ocupa el percentil buscado =

(p buscado ) (n + 1)
100

Para el caso del percentil 25, a la posicin

(p 25 ) (20 + 1)
(25) (21)
le corresponde el lugar
= 5.25
100
100
Lo anterior significa que el percentil 25 se encuentra entre el lugar 5 y el lugar 6. En estos casos, por
convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la quinta posicin est ocupada por un valor de 9.0 y la sexta por
un valor tambin de 9.0; por lo anterior, el promedio de ambos valores es igual a 9.0.
Interpretacin: (Vlida para el Percentil 25 o P25) :
" El 25% de los nios tuvo un peso de 9.0 kilogramos o menor y el 75% restante tuvo peso de 9.0 kilogramos mayor".
Como ejemplo adicional supongamos que se desea encontrar el valor del percentil 75. Para ello debe
localizarse a aquel que deje a tres cuartas partes de los valores con menores o iguales magnitudes a l y
a la cuarta parte restante de los valores con magnitudes ms grandes o iguales a l.
8.1

8.8

8.8

8.9

9.0

9.0

9.1

9.2

9.2

9.3

9.4

9.4

9.4

9.4

9.5

9.6

9.6

9.7

9.8

10.5

En esta serie, entre los valores 9.5 y 9.6 se debe encontrar un valor en una posicin tal que hasta l se
encuentra el 75% de los casos y, simultneamente, desde l se encuentra el 25% restante de los casos.

78

Jess Reynaga Obregn

Utilizando la frmula:
Lugar que ocupa el percentil buscado =

(p buscado ) (n + 1)
100

Se tiene que al percentil 75 le corresponde la posicin

(p 75 ) (20 + 1)
(75) (21)
que equivale a
= 15.75
100
100
Lo anterior significa que el percentil 75 se encuentra entre el lugar 15 y el lugar 16. Como ya se dijo, en
estos casos, y por convencin, se considera posible obtener un promedio de los valores que se encuentren en las posiciones adyacentes. Como ya se observ, la posicin 15 est ocupada por un valor de 9.5
y la posicin 16 por un valor tambin de 9.6; por lo anterior, el promedio de ambos valores es igual a
9.55.
" El 75% de los nios tuvo un peso de 9.55 kiloInterpretacin: (Vlida para el Percentil 75 o P75) :
gramos o menor y el 25% restante tuvo peso de 9.55 kilogramos mayor".

RANGO INTERCUARTLICO (RIC):


Se define al rango intercuartlico (RIC) como la diferencia entre los percentiles 75 y 25. El rango intercuartlico es una medida que abarca al 50% central de los valores de una serie ordenada de nmeros y viene
siendo una medida de sntesis que expresa el grado de homogeneidad o heterogeneidad de dicho porcentaje de datos.
Para el ejemplo que se ha venido siguiendo se tiene que la diferencia p75 p25 es igual a 9.55 9.0 =
0.55; lo anterior quiere decir que, especficamente refirindose al 50% central de los datos ya ordenados,
la diferencia entre el mayor y el menor de los datos de dicho 50% central de los valores es de 0.55 kilogramos.
El RIC es una medida que permite comparar con facilidad la homogeneidad o heterogeneidad de dos
series de datos semejantes; vease el siguiente ejemplo:
Peso al nacer de dos grupos de nios segn duracin de la gestacin
Nmero de
nios

Duracin de
la gestacin
en semanas

p25

p75

Diferencia
p75 p25

60

32

1,800

2,800

1,000

2,709

39

2,884

3,132

248

79

Comentario
El 50% central de la serie de
pesos de los 60 nios tiene
una diferencia entre el mayor
de los pesos y el menor de
ellos de 1,000 gramos. Puede hablarse de gran heterogeneidad
El 50% central de la serie de
pesos de los 2,709 nios
tiene una diferencia entre el
mayor de los pesos y el menor de ellos de 248 gramos.
Puede hablarse de gran
homogeneidad

Jess Reynaga Obregn

PROBLEMA RESUELTO

Luego de criar durante dos aos a un grupo de 20 cerdos en una granja modelo que funcionaba bajo el
rgimen de sociedad cooperativa, en condiciones de estricta higiene animal, se sacrificaron y observaron
sus cerebros en bsqueda de quistes de cisticercos. Los hallazgos se compararon con otro grupo de 20
cerdos criados en los patios de las casas de la misma localidad.
Cerdos provenientes de la granja modelo
Cerdo
No.
Quistes

10

11

12

13

14

1
5

1
6

1
7

18

19

20

Cerdos provenientes de patios de casas


Cerdo
No.
Quistes

10

11

12

13

14

1
5

1
6

1
7

18

19

20

Preguntas:
a) Para cada grupo identifique la mediana (o percentil 50) y emita una opinin con respecto a los resultados.
b) Para cada grupo identifique los valores mnimo y mximo, as como los percentiles 25 y 75 y llene la
siguiente tabla:
Valor mnimo

Percentil 25

Percentil 75

Valor mximo

Grupo "Granja"
Grupo "Patios"
c) Emita una opinin en relacin con los hallazgos en trminos de porcentajes de cada grupo considerando a los percentiles 25 y 75.
d) No olvide discutir los hallazgos para el 50% central de los animales de uno y otro grupo que se encontraron entre los percentiles 25 y 75 de cada uno de los grupos. Tambin, opine sobre la homogeneidad y
heterogeneidad de los grupos.

Para responder a las preguntas, primero se ordenan los datos y se localizan los percentiles buscados:
Cerdos provenientes de la granja modelo
Cerdo
No.

1
2

1
7

1
1

1
3

1
4

16

20

1
5

1
8

10

19

Quistes

P25 = (1+1) / 2 = 1

P50 = (1+1) / 2 = 1

80

P75 = (2+2) / 2 = 2

Jess Reynaga Obregn

Cerdos provenientes de patios de casas


Cerdo
No.

1
5

2
0

1
1

1
2

19

13

14

1
7

1
8

16

10

Quistes

P25 = (2+2) / 2 = 2

P50 = (3+4) / 2 = 3.5

P75 = (4+4) / 2 = 4

Respuestas:
a) La mediana del grupo granja fue 1 y la del grupo patios fue 3.5.
Se observ que la mitad de los cerdos del grupo granja tuvo 1 o menos quistes y la otra mitad de ellos
tuvieron 1 o ms quistes
Se observ que la mitad de los cerdos del grupo patios tuvo 3.5 o menos quistes y la otra mitad de ellos
tuvieron 3.5 o ms quistes
b)

Grupo "Granja"
Grupo "Patios"

Valor mnimo
0
0

Percentil 25
1
2

Percentil 75
2
4

Valor mximo
4
9

c)
En el grupo granja una cuarta parte de los cerdos tuvo hasta 1 quiste y las tres cuartas partes restantes
tuvieron desde 1 quiste en adelante.
En el grupo granja tres cuartas partes de los cerdos tuvieron hasta 2 quistes y la cuarta parte restante
tuvo desde 2 quistes en adelante.
En el grupo patios una cuarta parte de los cerdos tuvo hasta 2 quistes y las tres cuartas partes restantes
tuvieron desde 2 quistes en adelante.
En el grupo patios tres cuartas partes de los cerdos tuvieron hasta 4 quistes y la cuarta parte restante
tuvo desde 4 quistes en adelante.
d)
En el grupo granja el 50% central de los cerdos tuvieron entre 1 y 2 quistes, mientras que en el grupo
patios el 50% central de los cerdos tuvieron entre 2 y 4 quistes; por lo anterior puede decirse que los
cerdos del grupo granja fueron ms homogneos y los del grupo patios fueron ms heterogneos.

81

Jess Reynaga Obregn

La sntesis estadstica como cuarta etapa del mtodo estadstico.


Medidas de resumen para variables cuantitativas.
Promedio y desviacin estndar en series simples de datos.
La siguiente serie simple de valores se utilizar como ejemplo para ilustrar el clculo e interpretacin de
las medidas de resumen:
Peso en kilogramos de un grupo de 20 nios
de un ao de edad
9.1

9.4

8.9

9.6

10.5

8.8

9.4

9.2

9.0

8.1

9.3

8.8

9.5

9.7

9.2

9.4

9.6

9.0

9.4

9.8

PROMEDIO:
Definicin: Es el valor que tendran todos los datos de una serie numrica si ellos fueran de igual valor.

Frmula:

x=

x
n

Procedimiento: Sumar todos los valores y dividir tal suma entre el nmero de valores que componen a
la serie simple. En este caso la suma es: 185.7 y, entonces, el promedio vale:
185.7 / 20 = 9.285 Kilogramos
Interpretacin: "Si todos los nios tuvieran peso igual, ste sera de 9.285 kilogramos".

DESVIACION ESTANDAR 1

Definicin: Es la raz cuadrada de la varianza. A su vez, la varianza equivale al promedio de las desviaciones o diferencias cuadrticas de cada valor de una serie con respecto al promedio de dicha serie.

Frmula:

s=

(x x)

n -1

1 Junto con esta seccin se recomienda estudiar documentos y realizar ejercicios relacionados con la curva normal

82

Jess Reynaga Obregn

Procedimiento:

Paso 1. Obtener el promedio de la serie de valores. En este caso, por tratarse de una serie simple de vax
x=
lores se usa la frmula anteriormente revisada:
n

Paso 2. Calcular la desviacin o diferencia de cada valor en relacin con el promedio de la serie; es decir

obtener una serie de valores

(x x )

Paso 3. Elevar al cuadrado cada una de las anteriores desviaciones; es decir obtener una serie de valo-

res

( x x )2

Paso 4. Efectuar la suma de desviaciones cuadrticas; es decir obtener el valor

(x x )

Paso 5. Dividir la suma anterior entre el nmero de valores menos uno; es decir: obtener el promedio de

(x x )

desviaciones cuadrticas o varianza:

n -1

Paso 6. Obtener la raz cuadrada del anterior promedio; es decir obtener la desviacin estndar:

(x x )

s=

n -1

As, los clculos para los pesos de los 20 nios son los siguientes:

Para el paso 1: El promedio, ya calculado en prrafos anteriores vale: 9.285 kgrs.

Para los pasos 2, 3 y 4 se recomienda utilizar una tabla auxiliar como la siguiente para efectuar los clculos:

83

Jess Reynaga Obregn

Cada uno de los


valores
Xi

Desviacin de
cada valor con respecto al promedio
__
( Xi - X )
(paso 2)
-0.185
0.115
-0.385
.
.
0.515

9.1
9.4
8.9
.
.
9.8

Elevacin al cuadrado
de cada una de las
desviaciones
__ 2
( Xi - X )
(paso 3)
0.034
0.113
0.148
.
.
0.265.
4.446
(paso 4)

Para el paso 5: El promedio de desviaciones cuadrticas, o varianza, vale entonces:

4.446 / (20 - 1) = 0.234

Para el paso 6: Finalmente la desviacin estndar, que equivale a la raz cuadrada de la varianza equivale a la raz cuadrada de 0.234 o sea: 0.484 kgrs.

Interpretacin: La interpretacin est condicionada a la suposicin de que los valores tienen una distribucin semejante a la de la curva normal 2.

Dicha interpretacin puede ser realizada en mltiples sentidos ya que se sabe que el 68.27% de los valores de una serie que se distribuye como la curva normal estn agrupados alrededor del promedio si a
ste se le resta una vez y tambin se le suma una vez el valor calculado para la desviacin estndar.
Para el ejemplo, puede decirse entonces que el 68.27% de los nios tuvieron pesos que fluctuaron desde 8.801 kgrs (es decir: 9.285 kgrs menos 0.484 kgrs) hasta 9.769 kgrs. (es decir: 9.285 ms 0.484
kgrs.).
Por otra parte, como se sabe que la curva normal tiene una rea que equivale a un total de 100%, entonces tambin puede decirse que hubo un 31.73% (ya que si a 100% se le resta 68.27% quedan 31.73%)
de los nios que pesaron menos de 8.801 kgrs. o que pesaron ms de 9.769 kgrs.

2 Ver documentos relacionados con la curva normal


84

Jess Reynaga Obregn

Relacin entre el promedio y la desviacin estndar con la curva normal


Cuando se calcula la desviacin estndar para una serie de datos no siempre es evidente el
significado del resultado obtenido y menos lo es an si no se compara con la desviacin estndar
de otra serie diferente de datos.
Para muchas personas podra tener significado que le dijeran que el promedio de peso de un grupo
de 300 personas fue de 80 kilos pues, si se acuerda de la definicin del promedio, imaginara que
si todos los individuos tuvieran el mismo peso este sera de 80 kilos; sin embargo para quienes no
tienen conocimiento de las caractersticas bsicas del modelo de la curva normal podra carecer de
significado que le mencionaran que la desviacin estndar del peso de las mismas personas fue de
5 kilos.
Interpretar la desviacin estndar y comprender cabalmente lo que ella significa en relacin con los
datos que se estn manejando solo es posible a la luz del conocimiento del modelo de la curva
normal.

PROPIEDADES PRINCIPALES DE LA CURVA NORMAL

1. La curva normal es un polgono de frecuencias en forma de campana para el que estn


calculadas sus reas en funcin de los diversos valores del eje horizontal o abscisa.

2. En la abscisa se encuentran valores de tipo cuantitativo continuo, genricamente denominados


valores z, cuyas magnitudes tericamente pueden ir, de izquierda a derecha desde - hasta +
( desde menos infinito hasta mas infinito).

3. El promedio de todos los valores z de la abscisa equivale a cero, pues la mitad son negativos y
la mitad son positivos. En el sitio de la abscisa que corresponde al cero, es decir al promedio, se
encuentra la parte ms alta de la curva. En este sitio tambin se encuentra la mediana de todos los
valores z de la abscisa, pues el 50% de ellos est antes del cero y el 50% restante se encuentra
despus.

4. La curva es simtrica alrededor del promedio; esto es, hay una mitad izquierda que es reflejo de
la mitad derecha.

5. En la abscisa existen segmentos unitarios de igual longitud y de tamao 1. Los segmentos a la


izquierda del promedio tienen signo negativo y los segmentos a la derecha del promedio tienen

85

Jess Reynaga Obregn

signo positivo. Tales segmentos, denominados desviaciones estndar pueden dividirse en


fracciones infinitamente pequeas y continuas.

6. La curva es asinttica; es decir, sus extremos tericamente nunca tocan a la abscisa. Por ello, la
longitud de la abscisa podra ser infinitamente larga; sin embargo se acostumbra graficar solo
hasta la distancia de tres segmentos a la izquierda y a la derecha del promedio.

7. Toda el rea bajo la curva vale 1. Por lo anterior el rea a la izquierda del promedio vale .5 y el
rea a la derecha del promedio vale tambin .5
8. El rea que se encuentra sobre el segmento de la abscisa que va desde el promedio hasta el
valor z de +1 vale .3413; por simetra, el arrea que se encuentra sobre el segmento que va desde
el promedio hasta el valor z de -1 de la abscisa tambin vale .3413
Por lo anterior el rea que se encuentra por arriba del amplio segmento que va desde el valor z de
-1 hasta el valor z de +1 equivale a .6826; es decir a la suma de .3413 mas .3413

9. El rea que se encuentra sobre el segmento de la abscisa que van ms all del valor z de +1
vale .1587; por simetra, el arrea que se encuentra sobre el segmento que va ms all (hacia
menos infinito) del valor z de -1 de la abscisa tambin vale .1587

10. Para cualquier segmento de la abscisa, y an para fracciones de segmento, se encuentran


calculadas las reas correspondientes en tablas como la siguiente:

(A)
Valor z

(B)
Area entre el
promedio y el
valor z

(C)
Area ms all
del valor z

0.00

.0000

.5000

0.25
0.50
0.75

.0987
.1915
.2734

.4013
.3085
.2266

1.00

.3413

.1587

1.25
1.50
1.65
1.75

.3944
.4332
.4505
.4599

.1056
.0668
.0495
.0401

1.96

.4750

.0250

2.00

.4772

.0228

2.58

.4950

.0050

86

Jess Reynaga Obregn

APROVECHAMIENTO DE LAS PROPIEDADES DE LA CURVA NORMAL PARA LA


INTERPRETACION DE LA DESVIACION ESTANDAR

Al principio de este documento se coment que sin conocer las caractersticas bsicas del modelo
de la curva normal podra carecer de significado que se mencionara que el valor de la desviacin
estndar del peso de 300 personas fue de 5 kilos.
Una vez que se han comprendido las propiedades principales de la curva normal es posible
entender el significado del valor de la desviacin estndar del peso de las 300 personas si se
hacen suposiciones como las siguientes:
Suponiendo que al graficar el peso de los 300 individuos con un polgono de frecuencias, el grfico
resultante fuera muy parecido al modelo de la curva normal como se muestra en la siguiente
ilustracin:

entonces podra decirse que:

el rea bajo la curva de valores de peso que contiene a los individuos vale 300 de
manera semejante a la propiedad del modelo de la curva normal de que su rea vale 1;

a la izquierda del promedio existen 150 individuos y a la derecha del promedio existen
los otros 150;

87

Jess Reynaga Obregn

as como en la curva normal existe una rea de .3413 sobre el segmento que va desde
el valor z de 0 hasta el valor z de + 1 en la curva de valores x (es decir kilos de peso)
habr el .3413 de 300 o sea que habr 102 personas sobre el segmento que va desde
el valor x de 80 kilos hasta el valor x de 85 kilos;

de acuerdo al prrafo anterior, habr 204 personas con pesos que van desde 75 hasta
85 kilos;

al igual que en la curva normal existe simetra alrededor del promedio, se puede
considerar que en la curva de valores de peso habr 102 personas sobre el segmento
que va desde 80 kilos hasta 75 kilos de peso;

en la curva de valores peso habr un .1587 de las 300 personas; es decir 48 personas,
con pesos de 85 y ms kilos;

de manera semejante a la curva normal, por simetra habr un .1587 de las 300
personas; es decir 48 personas, con pesos de 75 y menos kilos.

Como puede apreciarse, una vez que se conocen las caractersticas del modelo de la curva
normal, la interpretacin del resultado de la desviacin estndar que se haya calculado para una
serie de datos es mucho ms fcil y brinda una gran cantidad de informacin sobre la manera en
que se distribuyen los valores.
Para confirmar que la comprensin del significado de la desviacin estndar brinda una importante
cantidad de informacin obsrvese el siguiente ejemplo:
Relato: Se aplic un mismo examen escrito a dos grupos de 90 alumnos cada uno. En un caso se
imprimi el examen en hojas de color amarillo paja y en otro caso en hojas de color marrn. Se
midi con cronmetro el tiempo, en minutos y fracciones, que tardaron los alumnos en entregar el
examen y se calcul el promedio y la desviacin estndar para ambos grupos obtenindose los
siguientes resultados:

Grupo
Color Paja
Color Marrn

Promedio
45'
45'

Desviacin
Estndar
5'
15'

Algunas interpretaciones a partir de los valores de la desviacin estndar:

Los alumnos a quienes se aplic el examen impreso en hojas color paja entregaron el
examen en tiempos ms homogneos, pues el .6826 de ellos (es decir 61 alumnos) lo
entregaron entre 40 y 50 minutos luego de haberlo iniciado.

Los alumnos a quienes se aplic el examen impreso en hojas color marrn entregaron el
examen en tiempos ms heterogneos, pues el .6826 de ellos (es decir 61 alumnos) lo
entregaron entre 30 y 60 minutos luego de haberlo iniciado.

En el grupo paja el .1587 ms lento de los alumnos (es decir: 14) entregaron su examen
luego de 50 minutos, mientras que en el grupo marrn la misma cantidad de alumnos lo
hizo luego de 60 minutos.

88

Jess Reynaga Obregn

TRANSFORMACIN DE VALORES x A VALORES z; USO DE LA TABLA DE AREAS BAJO


LA CURVA

En la seccin anterior se ha visto que hay correspondencia entre las reas de la curva normal y las
de la serie de datos cuantitativos continuos que se est manejando siempre y cuando se haya
comprobado que esta ltima, al ser graficada con un polgono de frecuencias, muestra un parecido
razonable con el perfil de la curva normal.
Tal correspondencia ha permitido solamente mencionar las reas que se encuentran sobre
segmentos completos de la abscisa; es decir, solamente se ha hecho mencin de reas por arriba
o ms all de desviaciones estndar enteras.
Sin embargo, cmo podra responderse a la pregunta cuantos alumnos de cada grupo tardaron
47 o ms minutos en entregar su examen?.
En este caso se aprecia que no hay coincidencia entre el valor z de + 1 y el valor x de 47 minutos y
por ello deja de ser til el mtodo de comparacin analgica de los grficos que se utiliz en
pginas anteriores.
La respuesta estriba en el uso de una frmula para transformar cualquier valor x en su
correspondiente valor z y en hacer uso de la tabla de reas bajo la curva normal.
Una vez que se han calculado tanto el promedio como la desviacin estndar para una serie de
datos cuantitativos continuos, el valor z que, en la abscisa de la curva normal corresponde a un
determinado valor x de la abscisa de los datos que se estn manejando, se encuentra con la
frmula:
x x
z=
s
Para responder a la pregunta recientemente planteada de cuantos alumnos de cada grupo
tardaron 47 o ms minutos en entregar su examen? se hacen las siguientes sustituciones:
Para el grupo al que se aplic el examen en hojas color paja se tiene que
x = 45' y s = 5' ;

el valor z que se desea conocer es el


correspondiente a un valor x de 47;
entonces:

z=

47 45
5

= .4

El valor z obtenido, en este caso .4 debe localizarse en la primera columna de la tabla de reas
Una vez localizado tal valor, se busca en la segunda columna cul es el rea
bajo la curva (1) .
que en la curva normal se encuentra ms all de dicho valor z; en este caso es de .3446.

Usar la tabla detallada de reas bajo la curva normal que se encuentra como anexo de
este documento. Dicha tabla tiene ligeras diferencias de formato con la de la pgina 2

89

Jess Reynaga Obregn

Como el rea encontrada (.3446) es una proporcin del rea total, entonces la misma proporcin
se aplica al total de alumnos del grupo para saber cuantos tardaron ms de 47 minutos en entregar
el examen.
As, luego de efectuar la operacin .3446 X 90 = 31, puede responderse a la pregunta con el
sealamiento de que hubo en este grupo 31 alumnos que tardaron 47 o ms minutos en entregar
su examen. Desde luego, al conocer las propiedades bsicas de la curva normal, tambin se
puede decir que hubo 59 alumnos que tardaron 47 o menos minutos en entregar su examen.
Por otra parte, para el grupo al que se aplic el examen en hojas color marrn se tiene que
x = 45' y s = 15' ;

el valor z que se desea conocer es el


correspondiente a un valor x de 47;
entonces:

z=

47 45
15

= .13

15

El valor z obtenido, en este caso .13 debe localizarse en la primera columna de la tabla de reas
Una vez localizado tal valor, se busca en la segunda columna cul es el rea
bajo la curva (2) .
que en la curva normal se encuentra ms all de dicho valor z; en este caso es de .3446.
Como el rea encontrada (.4483) es una proporcin del rea total, entonces la misma proporcin
se aplica al total de alumnos del grupo para saber cuantos tardaron ms de 47 minutos en entregar
el examen.
As, luego de efectuar la operacin .4483 X 90 = 40, puede responderse a la pregunta con el
sealamiento de que hubo en este grupo 40 alumnos que tardaron 47 o ms minutos en entregar
su examen. Desde luego, al conocer las propiedades bsicas de la curva normal, tambin se
puede decir que hubo 50 alumnos que tardaron 47 o menos minutos en entregar su examen.

Usar la tabla detallada de reas bajo la curva normal que se encuentra como anexo de
este documento. Dicha tabla tiene ligeras diferencias de formato con la de la pgina 2

90

Jess Reynaga Obregn

rea en el rea entre el


Valor Z rea desde el
extremo mismo extremo promedio y el
opuesto hasta
ms all del
valor Z
el valor Z
valor Z
(A)

(B)

(C)

xx
z=
s

91

(D)

Jess Reynaga Obregn

Valor Z

(A)

0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29
0.30
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.6915

0.5000
0.4960
0.4920
0.4880
0.4840
0.4801
0.4761
0.4721
0.4681
0.4641
0.4602
0.4562
0.4522
0.4483
0.4443
0.4404
0.4364
0.4325
0.4286
0.4247
0.4207
0.4168
0.4129
0.4090
0.4052
0.4013
0.3974
0.3936
0.3897
0.3859
0.3821
0.3783
0.3745
0.3707
0.3669
0.3632
0.3594
0.3557
0.3520
0.3483
0.3446
0.3409
0.3372
0.3336
0.3300
0.3264
0.3228
0.3192
0.3156
0.3121
0.3085

Valor Z

(A)

0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69
0.70
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1.00

0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.1915

92

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
0.8413

0.3085
0.3050
0.3015
0.2981
0.2946
0.2912
0.2877
0.2843
0.2810
0.2776
0.2743
0.2709
0.2676
0.2643
0.2611
0.2578
0.2546
0.2514
0.2483
0.2451
0.2420
0.2389
0.2358
0.2327
0.2296
0.2266
0.2236
0.2206
0.2177
0.2148
0.2119
0.2090
0.2061
0.2033
0.2005
0.1977
0.1949
0.1922
0.1894
0.1867
0.1841
0.1814
0.1788
0.1762
0.1736
0.1711
0.1685
0.1660
0.1635
0.1611
0.1587

0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
0.2881
0.2910
0.2939
0.2967
0.2995
0.3023
0.3051
0.3078
0.3106
0.3133
0.3159
0.3186
0.3212
0.3238
0.3264
0.3289
0.3315
0.3340
0.3365
0.3389
0.3413

Jess Reynaga Obregn

Valor Z

(A)

1.00
1.01
1.02
1.03
1.04
1.05
1.06
1.07
1.08
1.09
1.10
1.11
1.12
1.13
1.14
1.15
1.16
1.17
1.18
1.19
1.20
1.21
1.22
1.23
1.24
1.25
1.26
1.27
1.28
1.29
1.30
1.31
1.32
1.33
1.34
1.35
1.36
1.37
1.38
1.39
1.40
1.41
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.49
1.50

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
0.9332

0.1587
0.1562
0.1539
0.1515
0.1492
0.1469
0.1446
0.1423
0.1401
0.1379
0.1357
0.1335
0.1314
0.1292
0.1271
0.1251
0.1230
0.1210
0.1190
0.1170
0.1151
0.1131
0.1112
0.1093
0.1075
0.1056
0.1038
0.1020
0.1003
0.0985
0.0968
0.0951
0.0934
0.0918
0.0901
0.0885
0.0869
0.0853
0.0838
0.0823
0.0808
0.0793
0.0778
0.0764
0.0749
0.0735
0.0721
0.0708
0.0694
0.0681
0.0668

Valor Z

(A)

1.50
1.51
1.52
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.60
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.78
1.79
1.80
1.81
1.82
1.83
1.84
1.85
1.86
1.87
1.88
1.89
1.90
1.91
1.92
1.93
1.94
1.95
1.96
1.97
1.98
1.99
2.00

0.3413
0.3438
0.3461
0.3485
0.3508
0.3531
0.3554
0.3577
0.3599
0.3621
0.3643
0.3665
0.3686
0.3708
0.3729
0.3749
0.3770
0.3790
0.3810
0.3830
0.3849
0.3869
0.3888
0.3907
0.3925
0.3944
0.3962
0.3980
0.3997
0.4015
0.4032
0.4049
0.4066
0.4082
0.4099
0.4115
0.4131
0.4147
0.4162
0.4177
0.4192
0.4207
0.4222
0.4236
0.4251
0.4265
0.4279
0.4292
0.4306
0.4319
0.4332

93

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
0.9772

0.0668
0.0655
0.0643
0.0630
0.0618
0.0606
0.0594
0.0582
0.0571
0.0559
0.0548
0.0537
0.0526
0.0516
0.0505
0.0495
0.0485
0.0475
0.0465
0.0455
0.0446
0.0436
0.0427
0.0418
0.0409
0.0401
0.0392
0.0384
0.0375
0.0367
0.0359
0.0351
0.0344
0.0336
0.0329
0.0322
0.0314
0.0307
0.0301
0.0294
0.0287
0.0281
0.0274
0.0268
0.0262
0.0256
0.0250
0.0244
0.0239
0.0233
0.0228

0.4332
0.4345
0.4357
0.4370
0.4382
0.4394
0.4406
0.4418
0.4429
0.4441
0.4452
0.4463
0.4474
0.4484
0.4495
0.4505
0.4515
0.4525
0.4535
0.4545
0.4554
0.4564
0.4573
0.4582
0.4591
0.4599
0.4608
0.4616
0.4625
0.4633
0.4641
0.4649
0.4656
0.4664
0.4671
0.4678
0.4686
0.4693
0.4699
0.4706
0.4713
0.4719
0.4726
0.4732
0.4738
0.4744
0.4750
0.4756
0.4761
0.4767
0.4772

Jess Reynaga Obregn

Valor Z

(A)

2.00
2.01
2.02
2.03
2.04
2.05
2.06
2.07
2.08
2.09
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
2.24
2.25
2.26
2.27
2.28
2.29
2.30
2.31
2.32
2.33
2.34
2.35
2.36
2.37
2.38
2.39
2.40
2.41
2.42
2.43
2.44
2.45
2.46
2.47
2.48
2.49
2.50

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
0.9850
0.9854
0.9857
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
0.9938

0.0228
0.0222
0.0217
0.0212
0.0207
0.0202
0.0197
0.0192
0.0188
0.0183
0.0179
0.0174
0.0170
0.0166
0.0162
0.0158
0.0154
0.0150
0.0146
0.0143
0.0139
0.0136
0.0132
0.0129
0.0125
0.0122
0.0119
0.0116
0.0113
0.0110
0.0107
0.0104
0.0102
0.0099
0.0096
0.0094
0.0091
0.0089
0.0087
0.0084
0.0082
0.0080
0.0078
0.0075
0.0073
0.0071
0.0069
0.0068
0.0066
0.0064
0.0062

Valor Z

(A)

2.50
2.51
2.52
2.53
2.54
2.55
2.56
2.57
2.58
2.59
2.60
2.61
2.62
2.63
2.64
2.65
2.66
2.67
2.68
2.69
2.70
2.71
2.72
2.73
2.74
2.75
2.76
2.77
2.78
2.79
2.80
2.81
2.82
2.83
2.84
2.85
2.86
2.87
2.88
2.89
2.90
2.91
2.92
2.93
2.94
2.95
2.96
2.97
2.98
2.99
3.00

0.4772
0.4778
0.4783
0.4788
0.4793
0.4798
0.4803
0.4808
0.4812
0.4817
0.4821
0.4826
0.4830
0.4834
0.4838
0.4842
0.4846
0.4850
0.4854
0.4857
0.4861
0.4864
0.4868
0.4871
0.4875
0.4878
0.4881
0.4884
0.4887
0.4890
0.4893
0.4896
0.4898
0.4901
0.4904
0.4906
0.4909
0.4911
0.4913
0.4916
0.4918
0.4920
0.4922
0.4925
0.4927
0.4929
0.4931
0.4932
0.4934
0.4936
0.4938

94

rea desde el
rea en el
rea entre el
extremo
mismo
promedio y el
opuesto hasta extremo ms
valor Z
el valor Z
all del valor Z
(B)
(C)
(D)

0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
0.9987

0.0062
0.0060
0.0059
0.0057
0.0055
0.0054
0.0052
0.0051
0.0049
0.0048
0.0047
0.0045
0.0044
0.0043
0.0041
0.0040
0.0039
0.0038
0.0037
0.0036
0.0035
0.0034
0.0033
0.0032
0.0031
0.0030
0.0029
0.0028
0.0027
0.0026
0.0026
0.0025
0.0024
0.0023
0.0023
0.0022
0.0021
0.0021
0.0020
0.0019
0.0019
0.0018
0.0018
0.0017
0.0016
0.0016
0.0015
0.0015
0.0014
0.0014
0.0013

0.4938
0.4940
0.4941
0.4943
0.4945
0.4946
0.4948
0.4949
0.4951
0.4952
0.4953
0.4955
0.4956
0.4957
0.4959
0.4960
0.4961
0.4962
0.4963
0.4964
0.4965
0.4966
0.4967
0.4968
0.4969
0.4970
0.4971
0.4972
0.4973
0.4974
0.4974
0.4975
0.4976
0.4977
0.4977
0.4978
0.4979
0.4979
0.4980
0.4981
0.4981
0.4982
0.4982
0.4983
0.4984
0.4984
0.4985
0.4985
0.4986
0.4986
0.4987

Jess Reynaga Obregn

1 Se dice que una distribucin de valores cuantitativos continuos tiene semejanza a la curva
normal si su sesgo, calculado a travs del mtodo de momentos, vale entre - 0.5 y + 0.5 , lo cual
se simboliza de la siguiente forma :
- 0.5 < a3 < + 0.5
y su curtosis, tambin calculada a travs del mtodo de momentos, vale entre 2 y 4, lo cual se
simboliza de la siguiente forma :
2 < a4 < 4

2 Las frmulas para calcular el sesgo y la curtosis, a travs del mtodo de momentos, son las
siguientes:
a3 =

SESGO

m3
m2

CURTOSIS

a4 =

m4

(m2 ) 2

3 El clculo de momentos para series simples de datos cuantitativos continuos se hace con las
frmulas siguientes:
MOMENTOS EN SERIES SIMPLES

Momento 2

Momento 3

Momento 4


m2 =
n


m3 =
n


m4 =
n

95

Jess Reynaga Obregn

4 En el caso de las series simples de valores, conviene efectuar el clculo de los momentos a
travs de una tabla auxiliar de trabajo como la del siguiente ejemplo:
Ejemplo con una serie simple de valores:

PESO EN KILOGRAMOS DE UN GRUPO DE 20 NIOS


DE UN AO DE EDAD
9.1
9.3

9.4
8.8

8.9
9.5

9.6
9.7

10.5
9.2

8.8
9.4

9.4
9.6

9.2
9.0

9.0
9.4

8.1
9.8

El promedio vale: 9.285 kgrs.

Cada uno de los


valores

__
( Xi - X )

Xi
9.1
9.4
8.9
9.6
10.5
8.8
9.4
9.2
9
8.1
9.3
8.8
9.5
9.7
9.2
9.4
9.6
9
9.4
9.8
Sumas

Desviacin de
cada valor con
respecto al
promedio

Elevacin al
cuadrado de
cada una de las
desviaciones
__ 2

Elevacin al
cubo de cada
una de las
desviaciones
__ 3

Elevacin a la
cuarta de cada
una de las
desviaciones
__ 4

( Xi - X )

( Xi - X )

( Xi - X )

-0.185
0.115
-0.385
0.315
1.215
-0.485
0.115
-0.085
-0.285
-1.185
0.015
-0.485
0.215
0.415
-0.085
0.115
0.315
-0.285
0.115
0.515

0.034
0.013
0.148
0.099
1.476
0.235
0.013
0.007
0.081
1.404
0.000
0.235
0.046
0.172
0.007
0.013
0.099
0.081
0.013
0.265

-0.006
0.002
-0.057
0.031
1.794
-0.114
0.002
-0.001
-0.023
-1.664
0.000
-0.114
0.010
0.071
-0.001
0.002
0.031
-0.023
0.002
0.137

0.001
0.000
0.022
0.010
2.179
0.055
0.000
0.000
0.007
1.972
0.000
0.055
0.002
0.030
0.000
0.000
0.010
0.007
0.000
0.070

0.000

4.446

0.077

4.421

96

Jess Reynaga Obregn

Sustituyendo en las frmulas para el clculo de momentos en series simples se tiene:


_

x x
m2 =
n

x x
m3 =
n

x x
m4 =
n

m2 =

4.446
= 0.222
20

m3 =

0.077
= 0.004
20

m4 =

4.421
= 0.221
20

Finalmente, usando los valores calculados para los momentos y sustituyendo para las frmulas de
sesgo y curtosis en series simples, se tiene:

SESGO a 3 =

CURTOSIS

m3
m2

a4 =

a3 =

m4

(m2 )

a4 =

0.004
0.222

m4

(m2 )

0.004

(0.471)

0.221

(0.222)

0.004
= 0.038
0.105

0.221
= 4.484
0.049

Interpretacin de los resultados:

En vista de que el sesgo calculado se encuentra en el intervalo que va desde - 0.5 hasta + 0.5
puede decirse que la distribucin de los pesos de los 20 nios es semejante en simetra a la de la
curva normal.
Sin embargo, en vista de que la curtosis calculada est fuera del intervalo que va desde 2 hasta 4
no puede decirse que el grado de apuntamiento o aplanamiento de los pesos de los 20 nios sea
semejante a la de la curva normal.
En resumen, la serie es simtrica como la curva normal pero ms apuntada o elevada que ella
(leptocrtica).
Por lo anterior, a pesar de que la variable es cuantitativa continua, no deben utilizarse como
medidas de resumen para describir a esta serie ni al promedio ni a la desviacin estndar y, en su
lugar, se debieran utilizar la mediana y diversos percentiles.

97

Jess Reynaga Obregn


1993

TEXTO:

Medidas de Resumen para Variables Cuantitativas


en Series Agrupadas de Valores:
Moda y Amplitud, Mediana y Percentiles
La siguiente serie agrupada de valores se utilizar como ejemplo para
ilustrar el clculo e interpretacin de las medidas de resumen:

NIVELES DE COLESTEROL EN SUERO


EN 1,097 VARONES DE 40 - 59 AOS
(B)
(C)
(D)

(A)
COLESTEROL EN
SUERO (mg/100
ml.)
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL

(E)

FRECUENCIA

FRECUENCIA
ACUMULADA

%
ACUMULADO

31
134
358
326
143
43
30
21
11
1,097

3
12
32
30
13
4
3
2
1
100

31
165
523
849
992
1035
1065
1086
1097

3
15
47
77
90
94
97
99
100

MODA:
Definicin: Es el valor que en una serie se repite con mayor frecuencia.
Procedimiento: En primer lugar identificar la clase o intervalo con mayor frecuencia (Clase Modal) y
en segundo lugar utilizar la siguiente frmula:

d1
Mo =L.inf.+
W
d1 + d2
Donde:
L.Inf. = Lmite inferior de la clase modal
d1 = Diferencia entre la frecuencia de la
clase modal y la clase anterior
d2 = Diferencia entre la frecuencia de la
clase modal y la clase posterior
W = Amplitud de la clase modal
Para el caso de la tabla de valores de colesterol:
Clase modal: 199.5 - 239.5 (porque en esta clase est la mayor frecuencia: 358 personas)

Mo =199.5 +

224

40
224 + 32

Mo = 199.5 + { (0.875 ) 40}

Mo =199. 5 + 35
Mo = 234.5 mgrs/100 ml

txmerag1.doc

Pgina 1 de 5

Jess Reynaga Obregn


1993

Interpretacin: "El valor de colesterol ms frecuente en el grupo de 1,097 varones fue de 234.5
mgrs/100 ml".

AMPLITUD:
Definicin: Es la diferencia entre el mayor centro de clase y el menor centro de clase de una serie
agrupada. La amplitud suele simbolizarse por las siglas Am.
Procedimiento: Encontrar, por sustraccin o resta, la diferencia entre el centro de clase ms grande
de la serie ( X' max ) y el centro de clase ms pequeo ( X' min ).
En la serie agrupada de valores de colestrol el centro de clase ms grande es 459.5 (que resulta de
sumar los lmites superior e inferior de la ltima clase y dividir entre dos); por otra parte, el centro de
la primera clase vale ( 119.5 + 159.5) / 2 = 139.5
Por lo tanto, la amplitud vale Am = X' max - X' min = 459.5 - 139.5 = 320 mgrs de colesterol
Interpretacin: "La diferencia entre el mayor y el menor valor de colesterol fue de 320 mgrs/100 ml.".
MEDIANA ( O PERCENTIL 50 ) :
Definicin: En una serie de valores agrupados en clases o intervalos, es aquel valor que divide en
dos partes de igual tamao a toda la serie; dicho de otra manera, es el valor por detrs del cual queda
un 50% de los valores y por delante del cual queda el 50% restante.
.
Procedimiento: En primer lugar, analizando una columna con porcentajes acumulados (como la
columna E de la tabla de valores de colesterol que se muestra al principio de este documento),
identificar la clase en la que se acumula el 50% de las observaciones (identificacin de la clase que
contiene a la mediana).
Posteriormente, aplicar la siguiente frmula genrica vlida para cualquier percentil (recordar que la
mediana tambin se denomina percentil 50):

Pp = L.inf. +

n (p)

FA

100
W

fp

Donde:
Pp = Percentil a calcular
L.inf = Lmite inferior de la clase que contiene a la mediana
n
= nmero total de valores de la serie
p
= percentil buscado ( en este caso el 50)
FA = frecuencia acumulada ( columna D) hasta la
clase anterior a la que contiene a la mediana
fp
= frecuencia simple de la clase que contiene a la
mediana
W
= ancho de la clase que contiene a la mediana
Para el ejemplo de los 1,097 valores de colesterol, se tiene que la clase que contiene a la mediana es
la que tiene como lmite inferior a 239.5 y como lmite superior a 279.5, porque en la columna de
porcentajes acumulados ( E ) se observa que existe un 78% de los valores hasta tal clase. Por otra
parte, en la clase anterior (199.5 - 239.5) apenas se haba acumulado un 48% de todos los valores.

txmerag1.doc

Pgina 2 de 5

Jess Reynaga Obregn


1993

As pues, en la clase 239.5 - 279.5 necesariamente estar el valor que deja al 50% de los valores de
la serie por detrs de l.

Sustituyendo en la frmula, se tiene:

1,097 ( 50)

523

100

40

326

548.5 523

Md = P50 = 239.5 +
40

326

Md = P50 = 239.5 +

Md = P50 = 239.5 + { ( 0.078) 40

Md = P50 = 239 .5 + 3.12

Md = P50 = 242 . 62

Interpretacin: "La mitad de los 1,097 varones de 40 a 59 aos tuvieron valores de colesterol iguales
o menores que 242.62 mgrs/100 ml y el 50 % restante tuvo valores iguales o superiores a dicha cifra".
PERCENTILES ( Pp ) :
Definicin: En una serie agrupada de valores, es aquel valor que divide en dos partes
porcentualmente complementarias a toda la serie. Por ejemplo: el percentil 40 divide a la serie en
una parte que contiene al 40 % de los valores iguales o inferiores a l y, simultneamente, en otra
parte que contiene al 60% de los valores de la serie iguales o mayores a dicho percentil.
Procedimiento: En primer lugar, analizando una columna con porcentajes acumulados (como la
columna E de la tabla de valores de colesterol que se muestra al principio de este documento),
identificar la clase en la que se acumula el porcentaje de las observaciones correspondientes al
percentil que se desea calcular (identificacin de la clase que contiene al percentil).
Posteriormente, aplicar la siguiente frmula genrica vlida para cualquier percentil:

Pp = L.inf. +

n (p)

FA

100
W

fp

Donde:
Pp = Percentil a calcular
L.inf = Lmite inferior de la clase que contiene al percentil
n

= nmero total de valores de la serie

= percentil buscado

FA = frecuencia acumulada ( columna D) hasta la


clase anterior a la que contiene al percentil
fp

txmerag1.doc

= frecuencia simple de la clase que contiene al

Pgina 3 de 5

Jess Reynaga Obregn


1993

percentil
W

= ancho de la clase que contiene al percentil

Para el ejemplo de los 1,097 valores de colesterol, y suponiendo que se desea calcular el percentil 40
(P 40)se tiene que la clase que contiene al percentil 40 es la que tiene como lmite inferior a 199.5 y
como lmite superior a 239.5, porque en la columna de porcentajes acumulados ( E ) se observa que
existe un 48% de los valores hasta tal clase. Por otra parte, en la clase anterior (159.5 - 199.5)
apenas se haba acumulado un 15% de todos los valores. As pues, en la clase 199.5 - 239.5
necesariamente estar el valor que deja al 40% de los valores de la serie por detrs de l.

Sustituyendo en la frmula, se tiene:

1,097 ( 40)

165

100

40

358

438.8 165

Pp = 199.5 +
40

358

Pp = 199.5 +

P40 = 199.5 +

{ ( 0.764)

40}

P4 0 = 199 . 5 + 30 . 56

P4 0 = 230 . 06

Interpretacin: "El 40% de los 1,097 varones de 40 a 59 aos tuvieron valores de colesterol iguales
o menores que 230.06 mgrs/100 ml y el 60 % restante tuvo valores iguales o superiores a dicha cifra".

txmerag1.doc

Pgina 4 de 5

Jess Reynaga Obregn


1993

PROBLEMAS:
1. Calcule e interprete la moda, amplitud, mediana y percentiles 10, 25, 75 y 90 para la siguiente
serie agrupada de valores:
Peso (en grs) de un grupo de recin nacidos vivos
Pas industrializado
(A)

(B)

(C)

(D)

(E)

PESO

FRECUENCIA

FRECUENCIA
ACUMULADA

%
ACUMULADO

2100 2299
2300 2499
2500 2699
2700 2899
2900 3099
3100 3299
3300 3499
3500 3699
3700 3899
TOTAL

31
134
358
326
143
43
30
21
11
1,097

2.8
12.2
32.6
29.7

31
165
523
849

2.8
15.0
47.7
77.4

100.0

2. Calcule e interprete la moda, amplitud, mediana y percentiles 10, 25, 75 y 90 para la siguiente
serie agrupada de valores y compare los resultados con los del problema 1
Peso (en grs) de un grupo de recin nacidos vivos
Pas subdesarrollado

Pas

(A)

(B)

(C)

(D)

(E)

PESO

FRECUENCIA

FRECUENCIA
ACUMULADA

%
ACUMULADO

2100 2299
2300 2499
2500 2699
2700 2899
2900 3099
3100 3299
3300 3499
3500 3699
3700 3899
TOTAL

131
134
258
76
43
30
12
8
2
694

100.0

Mo

txmerag1.doc

Am

P50

100.0

P10

P90

P25

P75

RIC

Pgina 5 de 5

Jess Reynaga Obregn


1993

TEXTO:

Medidas de Resumen para Variables Cuantitativas


en Series Agrupadas de Valores:
Promedio y Desviacin Estndar
La siguiente serie agrupada de valores se utilizar como ejemplo para ilustrar
el clculo e interpretacin de las medidas de resumen:

NIVELES DE COLESTEROL EN SUERO


EN 1,097 VARONES DE 40 - 59 AOS
(A)

(B)

(C)

(D)

(E)

COLESTEROL
EN SUERO
(mg/100 ml.)
1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL

FRECUENCIA

FRECUENCIA
ACUMULADA

%
ACUMULADO

31
134
358
326
143
43
30
21
11
1,097

3
12
32
30
13
4
3
2
1
100

31
165
523
849
992
1035
1065
1086
1097

3
15
47
77
90
94
97
99
100

PROMEDIO :
Definicin: Es el valor que tendran todos los datos de una serie numrica, ya sea en una serie
simple o en una serie agrupada, si llos fueran de igual valor.
'
f x
Frmula para series agrupadas:
x=
n
Procedimiento: Sumar todos productos de la multiplicacin de cada frecuencia por su
correspondiente centro de clase y dividir tal suma entre el nmero de valores que componen a la
serie agrupada. Para efectuar con mayor facilidad el procedimiento es muy til el empleo de una
tabla auxiliar de trabajo como la que se ejemplifica a continuacin:

txmerag2.doc

Clases o
Intervalos
COLESTEROL
EN SUERO

frecuencia

Centros de cada
clase

Productos

(mg/100 ml.)

x'

f x'

1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL

31
134
358
326
143
43
30
21
11
1,097

139.5
179.5
219.5
259.5
299.5
339.5
379.5
419.5
459.5

4,324.5
24,053.0
78,581.0
84,597.0
42,828.5
14,598.5
11,385.0
8,809.5
5,054.5
274,231.5

Pgina 1 de 4

Jess Reynaga Obregn


1993

Sustituyendo en la frmula para el clculo del promedio en series agrupadas:

x=

f x'

x=

274,231.5
1,097

= 249.98

Interpretacin: "Si todos los individuos tuvieran la misma concentracin de colesterol esta sera de
249.98 mgrs/100 ml".

DESVIACION ESTANDAR
(en series agrupadas)
Definicin: Es la raz cuadrada de la varianza. A su vez, la varianza equivale a la divisin de una
suma de productos entre el nmero de valores de la serie; es decir equivale a un promedio.
Tal promedio resulta de dividir la suma de productos de las frecuencias de cada clase multiplicadas
por las desviaciones o diferencias cuadrticas de cada centro de clase con respecto al promedio de
la serie agrupada entre el nmero de valores de la serie.
Frmula para series agrupadas:
s=

f ( x x)

Procedimiento:
Paso 1. Obtener el promedio de la serie agrupada de valores (utilizando la frmula para el
clculo del promedio en series agrupadas),
Paso 2. Calcular la desviacin o diferencia de cada centro de clase en relacin con el
promedio de la serie,
Paso 3. Elevar al cuadrado cada una de las anteriores desviaciones; es decir, obtener
diferencias cuadrticas,
Paso 4. Multiplicar la frecuencia de cada clase por su correspondiente diferencia
cuadrtica; es decir, obtener productos
Paso 5. Efectuar la suma de los anteriores productos,
Paso 6. Dividir la suma de productos entre el nmero de valores; es decir, obtener el
promedio de desviaciones cuadrticas o varianza,

Paso 7. Obtener la raz cuadrada de la varianza..

txmerag2.doc

Pgina 2 de 4

Jess Reynaga Obregn


1993

Con el propsito de sistematizar los clculos, se recomienda utilizar una tabla auxiliar de trabajo
como la que se muestra a continuacin:

Clases o
Intervalos

Frecuencias

Centros de
cada clase

x'

Diferencias
de cada
centro en
relacin al
promedio
_
(x' - x)

Diferencias
cuadrticas

Productos

_ 2
(x' - x)

_ 2
f (x' - x)

TOTAL

As, para el caso de los 1,097 valores de colesterol se tienen los siguientes clculos:
Paso 1. El promedio, calculado en una seccin anterior de este documento, vale: 249.98

Clases o
Intervalos

Frecuencias

Centros de
cada clase

COLESTEROL
EN SUERO
(mg/100 ml.)

x'

1195 - 1595
1595 - 1995
1995 - 2395
2395 - 2795
2795 - 3195
3195 - 3595
3595 - 3995
3995 - 4395
4395 - 4795
TOTAL

31
134
358
326
143
43
30
21
11
1,097

139.5
179.5
219.5
259.5
299.5
339.5
379.5
419.5
459.5

Diferencias de
cada centro en
relacin al
promedio
_
(x' - x)

Diferencias
cuadrticas

(PASO 2)

(PASO 3)

(PASO 4)

-110.34
-70.34
-30.34
9.66
49.66
89.66
129.66
169.66
209.66

12,174.92
4,947.72
920.52
93.32
2,466.12
8,038.92
16,811.72
28,784.52
43,957.32

377,422.38
662,993.89
329,544.58
30,420.89
352,654.53
345,673.37
504,351.47
604,474.83
483,530.47
3,691,066.41

_ 2
(x' - x)

Productos

_ 2
f (x' - x)

(PASO 5)

Pasos 6 y 7

s=

f ( x x)
n

s=

3 , 691, 066 . 41
1,097

s = 3 , 364 . 69

s = 58 . 00 mgrs./100 ml.

Interpretacin: La interpretacin, que est condicionada a la suposicin de que los valores tienen
una distribucin semejante a la de la curva normal 1, puede ser realizada en mltiples sentidos ya
que se sabe que el 68.27% de los valores de una serie que se distribuye como la curva normal
1 Ver documentos relacionados con la curva normal

txmerag2.doc

Pgina 3 de 4

Jess Reynaga Obregn


1993

estn agrupados alrededor del promedio si a ste se le resta una vez y tambin se le suma una
vez el valor calculado para la desviacin estndar.
Para el ejemplo, puede decirse que el 68.27% de los 1,097 varones tuvieron concentraciones de
colesterol que fluctuaron desde 191.88 mgrs./100 ml (es decir: 249.88 mgrs./100 ml. menos 58.00
mgrs./100 ml.) hasta 307.88 mgrs./100 ml. (es decir: 249.88 mgrs./100 ml. ms 58.00 mgrs./100
ml.).
Por otra parte, como se sabe que la curva normal tiene una rea que equivale a un total de 100%,
entonces tambin puede decirse que hubo un 31.73% de los varones que tuvieron concentraciones
de colesterol menores o cuando mucho iguales a 191.88 mgrs./100 ml. o que tuvieron
concentraciones iguales o mayores a 307.88 mgrs./100 ml. (ya que si a 100% se le resta 68.27%
quedan 31.73%).

Problema:
A continuacin se muestran la ganacias de peso desde el nacimiento hasta el ao de edad de dos
grupos de nios. Sin importar que las distribuciones carezcan de semejanza con la curva normal,
calcule el promedio y la desviacin estndar para ambos grupos e interprete los resultados en el
supuesto de normalidad cumplida.
Grupo sin orientacin
nutricional continua

txmerag2.doc

Grupo con orientacin


nutricional continua

Ganancia de
peso

Nmero
de nios

Ganancia de
peso

Nmero
de nios

11 a 12

11 a 12

9 a 10

9 a 10

15

7a 8

12

7a 8

53

5 a 6

34

5 a 6

30

3a 4

49

3a 4

Total

107

Total

103

Pgina 4 de 4

Вам также может понравиться