Вы находитесь на странице: 1из 31

Todos nosotros tenemos algo de investigadores sociales.

Casi diariamente hacemos


"sabios pronsticos" relativos a los acontecimientos futuros de nuestra vida con el
fin de predecir lo que suceder ante nuevas situaciones o experiencias. A medida que
aparecen estas situaciones, con frecuencia apoyamos o confirmamos nuestras ideas;
otras veces, sin embargo, no somos tan afortunados y debemos experimentar desagra
dables consecuencias.
Tomemos en consideracin algunos ejemplos familiares: podramos invertir en
el mercado de valores, votar por un candidato poltico que promete resolver
problemas internos, apostar a los caballos, tomar medicinas para reducir las molestias
de una gripe, jugar a los dados en un casino, tratar de conocer psicolgicamente un
poco a nuestros maestros en relacin con un examen o aceptar una cita con un
desconocido, confiando en la palabra de un amigo.
Algunas veces ganamos; algunas veces perdemos. As, podramos hacer una
buena inversin en el mercado de valores, pero arrepentirnos de nuestra decisin
electoral; ganar dinero en los juegos de azar, pero descubrir que nos hemos equi
vocado al tomar el remedio para nuestra enfermedad; resolver bien el examen,
pero tener una desagradable sorpresa al asistir a la CIta con el desconocido, y as
sucesivamente. Desafortunadamente, es cierto que no todas nuestras predicciones
diarias estarn apoyadas por la experiencia.
LA NATURALEZA DE LA INVESTIGACION SOCIAL
De una manera un tanto semejante, el cientfico social tiene ideas acerca de la
naturaleza de la realidad social (a las cuales llama hiptesis), y, frecuentemente,
comprueba sus ideas por medio de la investigacin sistemtica. Por ejemplo, podra
presentar la hiptesis de que los nios socialmente aislados ven ms televisin que
..Iloo-....
2 Razones por las que el investigador social emplea la estadtstica
los nios que estn bien integrados con sus grupos afines; podra hacer una
encuesta en la cual se pregunte a ambos grupos de nios, los socialmente aislados y
los bien integrados, acerca del tiempo que dedican a ver televisin. Tambin podra
plantear la hiptesis de que las familias, en donde slo existe el padre y falta la madre o
existe la madre y falta el padre, generan ms delincuencia que las familias que
cuentan con la presencia del padre y de la madre; podra, por ltimo proceder a
entrevistar muestras de delincuentes y no delincuentes para determinar si uno o
ambos padres estuvieron presentes en su formacin familiar.
As, de un modo similar a su contraparte en las ciencias fsicas, el investigador
social con frecuencia investiga para comprender mejor los problemas y acontecimien
tos que se presentan en su especialidad. La investigacin social toma muchas formas
y puede ser empleada para investigar una amplia variedad de problemas. El inves
tigador puede participar en la observacin de una pandilla de delincuentes, en una
encuesta de muestras de simpatas y de antipatas polticas, en un anlisis de valores
de la prensa clandestina o en un experimento para determinar los efectos que se
producen al obligar a las familias a abandonar sus hogares y establecerlos en otros
sitios con el fin de ceder este su espacio a las autopistas recientemente construidas.
POR QUE PROBAR HIPOTESIS?
Generalmente es conveniente, cuando no necesario, comprobar sistemticamente
nuestras hiptesis acerca de la naturaleza de la realidad social, aun aqullas que
parezcan lgicas, verdaderas o evidentes por s mismas. Nuestras diarias "pruebas" de
sentido comn se basan generalmente en preconcepciones muy estrechas, cuando no
parcializadas, y en experiencias personales que pueden conducirnos a aceptar con
clusiones sin valor respecto a la naturaleza de los fenmenos sociales. Para demostrar
este punto examinemos las siguientes hiptesis que fueron comprobadas en un gran
nmero de soldados durante la Segunda Guerra Mundial. Podra usted "predecir"
estos resultados con base en sus experiencias cotidianas? Cree que era necesario
comprobarlos o parecen demasiado obvios y evidentes por s mismos para una
investigacin sistemtica?
1. Los hombres mejor educados mostraron ms sntomas neurticos que aqullos
con menos educacin.
2. Los hombres procedentes de un medio rural generalmente se mostraron con
mejor espritu durante su vida militar que los soldados procedentes de la
ciudad.
3. Los soldados del sur se aclimataron ms fcilmente, en las calientes islas del
Mar del Sur, que los soldados del Norte.
4. Mientras continuaba la guerra, los soldados estaban ms ansiosos de regresar
a los Estados Unidos de 10 que 10 estaban despus de la rendicin alemana.
Si usted cree que estas afirmaciones tienen suficiente sentido comn como para
Razones por las que el investigador social emplea lo estadtstica 3
someterlas a una prueba sistemtica, entonces tal vez le interesara saber que cada
afirmacin es directamente opuesta a 10 que se encontr en realidad. Los soldados
deficientemente educados se mostraron ms neurticos que aqullos con educacin
superior; a los del sur no se les not mayor habilidad que a los del Norte en
adaptarse a un clima tropical, y.as sucesivamente.' Depender slo del sentido comn
o de las experiencias cotidianas, obviamente tiene sus limitaciones.
LAS ETAPAS DE LA INVESTIGACION SOCIAL
El contrastar sistemticamente nuestras ideas acerca de la naturaleza de la realidad
social exige con frecuencia una investigacin cuidadosamente planeada y ejecutada,
en la cual:
1. Se reduce a una hiptesis contrastable, el problema que se va a estudiar,
(por ejemplo las "familias con uno slo de los padres, generan ms delin
cuencia que las familias con los dos padres");
2. Se desarrolla un conjunto de instrumentos apropiados (por ejemplo, elaborar
un cuestionario o un programa de entrevistas);
3. Se recogen los datos (esto es, el investigador puede ir al lugar del problema
y hacer un censo o encuesta);
4. Se analizan los datos para apoyar su hiptesis inicial; y
5. Los resultados del anlisis son interpretados y comunicados a un auditorio,
por ejemplo, por medio de una conferencia o de un artculo en una revista.
Como veremos en los captulos subsiguientes, el material presentado en este
libro est ms estrechamente relacionado con la etapa del anlisis de los datos de la
investigacin (ver 4), en el cual los datos recogidos o reunidos por el investigador se
analizan para apoyar su hiptesis inicial. Es en esta etapa de la investigacin cuando
los datos no procesados se tabulan, calculan, cuentan, resumen, reordenan, comparan
o, en una palabra, se organizan para que podamos comprobar la exactitud o validez
de nuestra hiptesis.
EL USO DE SERIES DENUMEROS EN LA INVESTIGACION SOCIAL
Cualquiera que haya participado en la investigacin social sabe que los problemas
que se presentan en el anlisis de los datos deben ser confrontados en las etapas de
planeacin de un proyecto de investigacin, puesto que stos (los datos) sustentan la
naturaleza de las decisiones que se tomen en todas las dems etapas. Tales
problemas afectan con frecuencia aspectos de diseo de la investigacin y aun el
1 Paul Lazarsfeld, ''The American Soldier-An Expository Review", Public Opinion Quarterly, otoo, 1949,
p. 380.
4 Razones por las que el investigador social emplea la estadtstica
tipo de instrumentos que se emplearn al recoger los datos. Por esta razn, buscamos
constantemente tcnicas o mtodos para mejorar la calidad del anlisis de los mismos.
Muchos investigadores creen que es esencial emplear mediciones, o una serie de
nmeros en el anlisis de los datos. Por consiguiente, los investigadores sociales han
desarrollado mediciones para aplicarlas a una gama muy amplia de fenmenos,
incluyendo prestigio ocupacional, actitudes polticas, autoritarismo, alienacin, ano
ma, delincuencia, clase social, prejuicio, dogmatismo, conformidad, realizacin, etno
centrismo, buena vecindad, religiosidad, armona matrimonial, movilidad ocupacio
nal, urbanizacin, estatus socioeconmico* y fertilidad.
Los nmeros tienen por 10 menos tres funciones importantes para el investi
gador social, dependiendo del nivel de medida que emplee. Especficamente, las
series de nmeros se pueden usar:
1. para categorizar el nivel nominal de la medicin
2. para determinar el rango o el orden al nivel ordinal de la medicin
3. para obtener montajes al nivel de intervalo de la medicin.
Antes de proceder a una discusin del papel de las estadsticas en la investigacin
social, detengmonos a examinar algunas de las principales caractersticas de estos
niveles de medicin, caractersticas que asumirn ms tarde un considerable signifi
cado cuando tratemos de aplicar las tcnicas estadsticas a situaciones particulares de
investigacin.
El nivel nominal
El nivel nominal de medicin simplemente involucra el proceso de denominar o
etiquetar; esto es, colocar los casos dentro de categoras y contar su frecuencia de
ocurrencia. Para dar un ejemplo, podramos usar una medida de nivel nominal para
indicar cuntas de las personas entrevistadas tienen prejuicios hacia los portorrique
os y cuntas no. Como se muestran en la Tabla 1.1, podramos interrogar a diez
estudiantes de una clase dada y determinar que 5 pueden ser considerados como (1)
con prejuicios y 5 pueden ser tomados como (2) sin prejuicios.
Otras medidas de nivel nominal en la investigacin social son el sexo (femenino
contra masculino), el estatus de bienestar social (los que 10 reciben contra los que no
10 reciben), los partidos polticos (conservador, liberal, independiente y socialista),
el carcter social (de direccin interna, de otra direccin y tradicional), el modo de
adaptacin (conformidad, innovacin, ritualismo, retiro, rebelin), la orientacin en
el tiempo (presente, pasado y futuro), y la urbanizacin (urbana, rural, suburbana),
para mencionar slo unas cuantas.
Al trabajar con los datos nominales debemos tener en cuenta que cada caso
debe colocarse en una sola categora. Esta exigencia indica que las categoras no
* N. del R. Tambin conocido corno estrato socioeconrnico.
Razones por las que el investigador social emplea la estad.tica
deben traslaparse ni excluirse mutuamente. As, la raza de un entrevistado clasificada
como "blanca" no puede clasificarse tambin como "negra"; al clasificarlo como
"hombre" no se lo puede clasificar tambin como "mujer". La exigencia tambin
indica que las categoras deben ser exhaustivas -debe haber un lugar para cada caso
que se presente. Como una ilustracin, imaginemos un estudio en el cual todas las
personas entrevistadas se categorizaron por raza y se consider solamente la blanca y
la negra. Dentro de qu grupo se categorizara a un chino si apareciera entre los
entrevistados? En este caso sera necesario aumentar el sistema original de categoras
para incluir "orientales" o, suponiendo que la mayora de los entrevistados fueran
blancos o negros, incluir una categora mixta en la cual se pudieran colocar tales
excepciones.
El lector deber notar que los datos nominales no se clasifican en un rango o
escala por cualidades tales como mejor o peor, ms alto o ms bajo, ms o menos.
Queda claro entonces, que una medida nominal de sexo no explica si los hombres
son "superiores" o "inferiores" a las mujeres. Los datos nominales nicamente se
rotulan, algunas veces por nombre (hombres contra mujeres o personas con prejui
cios contra las que no los tienen); otras veces por nmero (1 contra 2), pero siempre
con el fin de agrupar los casos en categoras separadas para indicar semejanza o dife
rencia respecto a una cualidad o caracterstica dada.
El nivel ordinal
Cuando el investigador va ms all de este nivel de medicin y busca ordenar sus
casos en trminos del grado en que poseen una determinada caracterstica, entonces
est trabajando al nivel ordinal de medicin. La naturaleza de la relacin que existe
entre categoras ordinales depende de la caracterstica que el investigador trata de
medir. Para dar un ejemplo conocido, el investigador podra clasificar a las personas
con respecto al estatus socioeconmico como "clase baja", "clase media" y "clase
alta". 0, en lugar de clasificar a los estudiantes de una clase dada como con
prejuicios o sin prejuicios, los podra clasificar de acuerdo con su grado de prejuicio
hacia los portorriqueos, como se indica en la Tabla 1.2.
El nivel ordinal de medicin nos da informacin acerca de la organizacin de
las categoras, pero no indica la magnitud de las diferencias entre los nmeros. Por
ejemplo, el investigador social que emplea una medida de nivel ordinal, para estudiar
el prejuicio contra los portorriqueos, no sabe qu tanto ms de prejuicios tiene una
persona que otra. En el ejemplo dado anteriormente, no es posible determinar hasta
TABLA1.1 Actitudes h ~ c i a Actitud hacia los portorriqueos
Frecuencia
los portorriqueos (de diez . ~ . _
estudiantes universitarios): 1 = con prejuicios
5
datos nominales 2 = sin prejuicios 5
10
Total
5
L
6 Razones por las que el investigador social emplea la estadtstica
TABLA 1.2 Actitudes hacia
los portorriqueos (de diez
estudiantes universitarios):
datos ordinales
Estudiante
Julia
Mara
Jaime
Jos
Laura
Juan
Fernando
Aldo
Patricia
Roberta
Rango
1. la que tiene ms prejuicio
2. segunda
3. tercero
4. cuarta
5. quinta
6. sexto
7. sptimo
8. octavo
9. novena
10. la que tiene menos prejuicio
qu punto Julia tiene ms prejuicios que Mara o hasta qu grado Roberta muestra
menos prejuicios que Patricia o Aldo. Esto se debe a que, en una escala ordinal, los
intervalos entre los puntos o rangos no son conocidos o significativos. Por consi
guiente, no es posible asignarle puntales a casos localizados en puntos de la escala.
Nivel por intervalos
En contraste, el nivel de medicin por intervalos nos indica tanto el orden de las
categoras como la distancia exacta entre ellas. Las medidas por intervalos emplean
unidades constantes de medicin (por ejemplo, pesos o centavos, grados centgrados
o Fahrenheit, metros o centmetros, minutos o segundos), las cuales proporcionan
intervalos iguales entre los puntos de la escala.
De esta manera, una medicin, por intervalos, del prejuicio hacia los portorriqueos
-tal como respuestas a una serie de preguntas sobre los portorriqueos, clasificadas
de O a 100 (donde 100 representa el ms alto grado de prejuicio)- podra dar los
datos que se observan en la Tabla 1.3 sobre los diez estudiantes de un determinado
saln de clase.
TABLA 1.3 Actitudes hacia
los portorriqueos (de diez
Estudiante Puntuacirfl
estudiantes universitarios):
datos por intervalos
Julia
Mara
98
96
Jaime
95
Jos
94
Laura
22
Juan
21
Fernando 20
Aldo 15
Patricia 11
Roberto 6
a La puntuacin ms alta indica ms prejuicio contra los portorriqueos
DescriDcil1
Razones por las que el investigador social emplea lo estadltica
Como indica la Tabla 1.3, podemos ordenar a los estudiantes en trminos de sus
prejuicios y adems indicar las distancas que los separan a unos de otros. Por
ejemplo, es posible afirmar que Roberto es el menos prejuicioso de la clase ya que
obtuvo el puntaje ms bajo. Tambin podemos decir que Roberto es ligeramente
menos prejuicioso que Patrica o Aldo, y aun menos que Julia, Mara, Jame o Jos,
todos los cuales obtuveron puntajes sumamente altos. Dependiendo del objetivo
para el cual el estudio est diseado, podra ser mportante determinar tal infor
macn, que no se encuentra disponible al nivel ordinal de medicin.
FUNOONES DE LA ESTADISTICA
El momento en el que el investigador socal emplea nmeros cuantifica sus datos a
los niveles de medicin nominal, ordnal o por ntervalos - cuando es probable que
emplee la estadstca como un nstrumento para (1) la descripcin y (2) la toma de
decisiones. Echemos ahora una mrada ms de cerca a estas importantes funcones de
la estadstca.
Descripcin
Para llegar a conclusiones o a obtener resultados, un investigador social con frecuen
cia estudia centenares, miles o aun cfras ms altas de personas o grupos. Como caso
extremo, la "Oficina de Censos" de los Estados Unidos lleva una Iista completa de la
poblacn de los Estados Unidos en la cual se pone en contacto con ms de 200
millones de personas. A pesar de la ayuda de numerosos procedimientos complejos
TABLA 1.4 Calificaciones
de un examen de 80
estudiantes
72 83 91 29
38 89 49 36
43 60 67 49
81 52 76 62
79 62 72 31
71 32 60 73
65 28 40 40
59 39 58 38
90 49 52 59
83 48 68 60
39 65 54 75
42 72 52 93
58 81 58 53
56 58 77 57
72 45 88 61
63 52 70 65
49 63 61 70
81 73 39 79
56 69 74 37
60 75 68 46
7
---------------------
8 Razones por las que el investigador social emplea la estadsstica
diseados para tal fin, constituye siempre una tarea descomunal describir y resumir
las enormes cantidades de datos que se generan de los proyectos de investigacin
social.
Para dar un ejemplo cotidiano, las calificaciones de un examen de un grupo de
slo 80 estudiantes han sido enlistadas en la Tabla 1.4. Ve algn sistema de
referencia en estas calificaciones? Puede describir estas calificaciones en pocas
palabras? En pocas frases? Son, en conjunto, particularmente altas o bajas?
Incluso usando los principios ms elementales de la estadstica descriptiva. como en
los captulos subsiguientes de este texto, es posible caracterizar la distribucin de las
calificaciones de exmenes de la Tabla 1.4 con bastante claridad y precisin, de
modo que las tendencias o caractersticas generales del grupo se puedan descubrir
ms rpidamente y comunicar con mayor facilidad a cualquier persona. Primero,
podramos arreglar nuevamente las calificaciones en orden consecutivo (del ms alto
al ms, bajo) para reunirlas dentro de un nmero ms pequeo de categoras. Como
se muestra en la Tabla 1.5, esta distribucin de frecuencia agrupada (la cual se
estudiar en detalle en el Captulo 2) presentara las calificaciones dentro de catego
ras ms amplias junto con el nmero o frecuencia (t') de estudiantes cuyas califica
ciones cayeron dentro de estas categoras. Se puede ver fcilmente, por ejemplo,
que 17 estudiantes recibieron calificaciones entre 60 y 69; solamente dos recibieron
calificaciones entre 20 y 29.
Otro procedimiento til (explicado en el Captulo 3) sera el reorganizar las
calificaciones grficamente. Como se muestra en la Figura 1.1, podramos colocar las
categoras de calificaciones (desde 20-29 hasta 9(}.99) en un eje de la grfica (esto
es, la lnea base horizontal) y sus nmeros o frecuencias a 10 largo de otra lnea
(esto es, el eje vertical).
Este arreglo nos da una representacin grfica bastante fcil de visualizar (por
ejemplo en la grfica de barras), en la cual podemos ver que la mayora de las
calificaciones caen entre 50 y 80 y que relativamente pocas notas son: o mucho ms
altas o mucho ms bajas.
Como 10 explicaremos en el Captulo 4, un mtodo estadstico particularmente
conveniente y til -con el cual ya estamos ms o menos familiarizados- es
preguntar cul es la calificacin de la persona promedio en este grupo de 80
estudiantes. El promedio aritmtico (o media) que se obtiene sumando la lista
TABLA 1.5 Calificaciones de examen
de 80 estudiantes: una distribucill Calificaciones f
de ftecuencia agmpada 90-99 3
80-89 7
70-79 16
60-69 17
50-59 15
40-49 11
30-39 9
20-29 2
l
Razones por las que el investigador social emplea la estadtstica
FIGURA 1.1 Calificaciones de examen
de 80 estudiantes, organizadas en
una grfica de barras
15
o:l
'
t:: 10
Q)
;:l
<.)
Q)
....
~
5
O' I I I I I I
20-29 30-39 40-49 50--59 60-69 70-79 8 0 ~ 9 90-99
Categora de calificaciones
completa de las calificaciones y dividiendo esta suma entre el nmero de estudiantes,
nos da una idea ms clara de la tendencia del grupo en conjunto. El promedio
aritmtico en la presente ilustracin es de 60,5 una calificacin bastante baja si se
compara con el promedio de clase con el que la mayora de los estudiantes ya
pueden estar familiarizados. Este grupo de 80 estudiantes dio en conjunto, un
rendimiento aparentemente muy bajo:
As, con la ayuda de recursos estadsticos, tales como las distribuciones de
frecuencia agrupada, las grficas y el promedio aritmtico, es posible detectar y
describir patrones o tendencias en las distribuciones de puntajes (por ejemplo en las
calificaciones de la Tabla 1.4), las cuales, de otra manera, no hubieran sido advertidas
por el observador casual. En el presente contexto, entonces, podemos definir la
estadstica como un conjunto de tcnicas para la reduccin de datos cuantitativos
(esto es, una serie de nmeros) a un nmero pequeo de trminos descriptivos ms
adecuados y de lectura ms simple.
La toma de decisiones
Con el fin de probar una hiptesis, es necesario, a menudo, ir ms all de la simple
descripcin; tambin es frecuentemente necesario hacer inferencias, esto es, tomar
decisiones basndose en los datos recogidos solamente de una pequea porcin o
muestra del grupo ms grande que pensamos estudiar. Factores tales como costo,
tiempo, y la necesidad de una supervisin adecuada, muchas veces impiden hacer
una completa enumeracin o lista del grupo completo (los investigadores sociales
llaman poblacin o universo a este grupo ms grande, del cual se ha sacado una
muestra).
9
10 Razones por las que el investigador social emplea la estadtstica
Ntese que los
TABLA 1.6 Uso de la mariguana,
Sexo de los entrevistados
se presentan en la
el sexo de los entrevistados: caso 1
formulada: 60 de ca
Uso de la mariguana Masculino Femenino
mientras solamente
Nmero de los que la han probado 60 40 mente, en esta peque
Nmero de los que no la han probado ~ 60
a fumar mariguana.
Totlli 100 100
tante es si estas dife
Como lo veremos en el Captulo 7, cada vez que el investigador social prueba su
hiptesis en una muestra, debe decidir si en verdad resulta correcto generalizar los
resultados obtenidos con respecto a la poblacin entera, de la cual se obtuvo la
muestra. Del muestreo resulta inevitablemente el error, aun del muestreo que ha sido
correctamente concebido y ejecutado. Este es el problema que se presenta al
generalizar o sacar inferencias de la muestra a la poblacin."
La Estadstica puede utilizarse con el fin de generalizar los resultados obtenidos
en la investigacin, con un alto grado de seguridad, de pequeas muestras a
poblaciones mayores. Para comprender mejor este objetivo de tomar decisiones en
estadstica y el concepto de generalizar de las muestras a las poblaciones, examine
mos los resultados de un estudio hipottico que se llev a cabo para probar la
siguiente hiptesis:
Hiptesis: Es ms probable que los universitarios hayan probado la mariguana, que
las universitarias.
Los investigadores de este estudio decidieron probar su hiptesis en una univer
sidad urbana en la cual haba unos 20 000 estudiantes matriculados (10 000 hombres
y 10000 mujeres). Debido a los factores de costo y de tiempo no pudieron
entrevistar a cada uno de los estudiantes de dicha universidad, pero obtuvieron, de la
oficina de matriculacin, una lista completa de los estudiantes. De esta lista escogie
ron uno de cada cien (mitad hombres y mitad mujeres) para la muestra y luego los
entrevistaron miembros del grupo de investigacin entrenados para este fin. Las
personas encargadas de las entrevistas preguntaron a cada uno de los 200 participan
tes en la muestra si l o ella haban probado la mariguana y luego procedieron a
registrar el sexo del estudiante como masculino o femenino. Los resultados de dicho
estudio fueron tabulados por sexo y presentados en la Tabla 1.6.
2 Al estudiante: El concepto de "error de muestreo" se estudiar con ms detalle en el Captulo 7. Sin embargo,
para comprender mejor la inevitabilidad del error, cuando se muestrea de un grupo muy grande es posible que el
estudiante desee hacer ahora la siguiente demostracin. Refirindose a la Tabla 1.4, que contiene las calificaciones
de una poblacin de 80 estudiantes, seleccione, al "azar" (por ejemplo, cerrando los ojos y sealando), una
muestra de una pocas calificaciones (por ejemplo 5) de la lista completa. Encuentre la calificacin promedio
sumando las cinco puntuaciones y dividiendo entre cinco el nmero total de calificaciones. Ya se ha indicado
que la nota promedio del grupo completo de los 80 estudiantes fue de 60,5 Hasta dnde difiere la muestra
promedio del promedio de la clase 60,5 ? Pruebe esto en varias muestras ms de algunas otras calificaciones
escogidas al azar del grupo ms grande. Con frecuencia se hallar que la muestra media diferir casi siempre, al
menos ligeramente, de la obtenida de la clase completa de 80 estudiantes. Esto es lo que para nosotros significa
"error de muestreo".
grandes como para f
estudiantes. Repres
'
O hemos obtenido
mente al error de m
pequeo entre un gn
Para ilustrar el
poblaciones ms grar
resultados que se r
todava en la direcci
mujeres haban prot
resultados a una P
diferencia de esta
por casualidad? O 1
pequeas, reflejan t
particular de esta un:
Ilustremos un I
obtenido los datos q
mujeres mostradas
ceidas a la direcci
fumado mariguana,
estaramos dispuesto
poblacin entre horr
del error de muestre
temente grande una
como significativa (
decisiones acerca de
grado de confiabilids
A manera de ih
TABLA 1.7 Usod
mariguana segn el sexc
los entrevistados: cas
l
-
I
---
Razones por las que el investigador social emplea la estadtstica 11
Ntese que los resultados obtenidos de esta muestra de 200 estudiantes, como
se presentan en la Tabla 1.6, estn de acuerdo con la direccin de hiptesis
formulada: 60 de cada 100 hombres informaron que haban probado la mariguana,
mientras solamente 40 de cada 100 mujeres afirmaron que 10 haban hecho. Clara
mente, en esta pequea muestra, los hombres tuvieron ms tendencia que las mujeres
a fumar mariguana. Para nuestros propsitos, sin embargo, la pregunta ms impor
tante es si estas diferencias de sexo en el uso de la mariguana son 10 suficientemente
grandes como para generalizarlas confiadamente a una poblacin de ms de 20000
estudiantes. Representan, estos resultados, diferencias verdaderas en la poblacin?
O hemos obtenido diferencias casuales entre hombres y mujeres debido estricta
mente al error de muestreo -el error que ocurre cada vez que escogemos un grupo
pequeo entre un grupo ms grande?
Para ilustrar el problema de generalizar los resultados obtenidos, de muestras a
poblaciones ms grandes, imaginemos que los investigadores obtuvieron ms bien los
resultados que se muestran en la Tabla 1.7. Ntese que estos resultados estn
todava en la direccin predicha por la hiptesis: 55 hombres en oposicin a slo 45
mujeres haban probado la mariguana. Pero an estamos deseando generalizar estos
resultados a una poblacin universitaria ms grande. No es probable que una
diferencia de esta magnitud (ms hombres que mujeres) ocurriera simplemente
por casualidad? O podemos confiadamente decir que tales diferencias, relativamente
pequeas, reflejan una diferencia real entre hombres y mujeres slo en el caso
particular de esta universidad?
Ilustremos un poco ms. Supongamos que los investigadores sociales hubiesen
obtenido los datos que se muestran en la Tabla 1.8. Las diferencias entre hombres y
mujeres mostradas en la tabla no podan haber sido ms pequeas y an estar
ceidas a la direccin de la hiptesis: 51 hombres en contraste con 49 mujeres han
fumado mariguana, slo dos hombres ms que mujeres. Cuntos de nosotros
estaramos dispuestos a considerar estos resultados como una verdadera diferencia de
poblacin entre hombr ~ s y mujeres, ms que como un producto de la casualidad o
del error de muestreo? Dnde trazaremos la lnea? En qu punto es 10 suficien
temente grande una diferencia de muestreo para que estemos dispuestos a tratarla
como significativa o real? Con la ayuda de la estadstica podemos tomar tales
decisiones acerca de la relacin entre muestras y poblaciones, con facilidad y un alto
grado de con fiabilidad.
A manera de ilustracin, si hubiramos empleado una de las pruebas estadsticas
TABLA 1.7 Uso de la
mariguana segn el sexo de
Sexo de los entrevis tados
los entrevistados: caso 11
Uso de la mariguana Masculino Femenino
Personas que la han probado
55 45
Personas que no la han probado 45 55
Total
100 100
12 Razones por las que el investigador social emplea la estadistica
TABLA 1.8 Uso de la
Sexo de los entrevistados
mariguana segn el sexo de
los entrevistados: caso III Uso de la' mariguana
Masculino Femenino
----------:-------------
Personas que la han probado
51 49
Personas que no la han probado 49 51
Total
100 100
de significado que se estudiarn ms adelante en este texto (por ejemplo la Ch
cuadrada; ver Captulo 10), ya sabramos que solamente los resultados de la Tabla 1.6
podran generalizarse a la poblacin de 20 000 universitarios - que 60 de cada 100
hombres, y solamente 40 de cada 100 mujeres, han probado la mariguana; este hecho
es un hallazgo lo suficientemente sustancial como para aplicarlo a la poblacin
entera con un alto grado de confiabilidad. Nuestra prueba estadstica nos dice que
hay slo un 5% de probabilidad de que estemos equivocados. Por contraste, los resul
tados presentados en las tablas 1.7 y 1.8 son estadsticamente no significativos,
siendo el producto de un error de muestreo ms que de las diferencias reales del
sexo en el uso de la mariguana. De nuevo, empleando un criterio estadstico,
concluimos que estos resultados no reflejan verdaderas diferencias de poblacin, sino
un mero error de muestreo.
Entonces, en el presente contexto, la Estadstica es un conjunto de tcnicas
para tomar decisiones que ayuden a los investigadores a hacer inferencias de las
muestras a las poblaciones y. en consecuencia, a comprobar hiptesis relativas a la
naturaleza de la realidad social.
RESUMEN
Este captulo relaciona nuestras predicciones diarias acerca de eventos futuros, con
las experiencias del investigador social que emplea la Estadstica como una ayuda
para comprobar sus hiptesis acerca de la realidad social. La medicin fue analizada
en trminos de datos nominales, ordinales y por intervalos. Se identificaron dos
funciones principales de la Estadstica con la etapa del anlisis de los datos de la
investigacin social, posteriormente se discutieron e ilustraron brevemente:
l. La descripcin (esto es, la reduccin de datos cuantitativos a un
menor de trminos descriptivos ms convenientes), y
2. La toma de decisiones (esto es, hacer inferencias de muestras a poblaciones).
"
o r a
V I
s v
s v :
o u
' o :
P
' s e
- n
o n
u ~
o l {
O C
9 "
~ l { ;
La recoleccin de datos implica un gran esfuerzo por parte del investigador social
que busca aumentar sus conocimientos sobre el comportamiento humano. Para
entrevistar o bien para sacar informacin a beneficiarios de la asistencia p blica, estu
diantes universitarios, drogadictos, residentes de viviendas pblicas, homosexuales,
personas de clase media, u otros, se requiere un grado de previsin, planificacin
cuidadosa y control o bien pasar algn tiempo en dicha situacin.
Sin embargo, completar la recoleccin de datos es slo el principio, en lo que
concierne al anlisis estadstico. La recoleccin de datos constituye la materia prima
con que debe trabajar el investigador social si ha de analizar sus datos, obtener
resultados y probar sus hiptesis sobre la naturaleza de la realidad social.
DISTRIBUCIONES DE FRECUENCIA DE DATOS NOMINALES
El carpintero transforma la madera en muebles; el cocinero convierte los alimentos
crudos en los platos ms apetitosos que se sirven a la mesa. Mediante un proceso
similar, el investigador social, auxiliado por "recetas" -llamadas frmulas y tcni
cas- intenta transformar sus datos crudos* en un conjunto de medidas significativas
y organizadas que puedan utilizarse para probar su hiptesis inicial.
Qu puede hacer el investigador social para organizar los nmeros desordena
dos que recoge de sus entrevistados? Cmo se las arregla para transformar esta
masa de datos en un resumen fcil de entender? El primer paso sera construir una
distribucin de frecuencia en forma de tabla.
TABLA 2. 1 Estudiantes
Sexo del estudiante
Frecuencia (f)
de ambos sexos concurrentes
,
a una manifestacin
Masculino 80
poltica de izquierda
Femenino
20
Total
100
L
* N. del E. crudo significa "no procesados".
15
16 Descripcin
Examinemos la distribucin de frecuencia en la Tabla 2.1. Ntese primero que
la Tabla est encabezada por un nmero (2.1) y un ttulo que da al lector una
idea sobre la naturaleza de los datos presentados - "Estudiantes de ambos sexos.
concurrentes a una manifestacin poltica de izquierda." Este es el arreglo estndar;
toda tabla debe estar claramente titulada y, cuando se presente dentro de una serie,
tambin debe estar marcada con un nmero.
Las distribuciones de frecuencia de los datos nominales consisten de dos
columnas. As, en la Tabla 2.1, la columna de la izquierda indica qu caracterstica
est siendo presentada (sexo del estudiante) y contiene las categoras de anlisis
(masculino y femenino). Una columna adyacente con el encabezado de "frecuencia"
o "[", indica el nmero de casos en cada categora (80 y 20 respectivamente), as
como el nmero total de casos (N:: 100).
Una rpida mirada a la distribucin de frecuencia, en dicha Tabla, revela
claramente que a la manifestacin de izquierda concurrieron muchos
que mujeres -80 de los 100 estudiantes que asistieron eran hombres.
COMPARACION DE LAS DISTRIBUCIONES
Supongamos, sin embargo, que deseamos comparar los asistentes a la manifestacin
izquierdista con estudiantes similares en una manifestacin derechista. La compara
cin entre distribuciones de frecuencia es un procedimiento que se utiliza a menudo
para aclarar resultados y agregar informacin. La comparacin particular que haga el
investigador est determinada por la pregunta que busca contestar.
Volviendo a nuestra hipottica manifestacin poltica, podramos preguntar: es
probable que participen ms estudiantes del sexo masculino, que del sexo femenino
en manifestaciones tanto izquierdistas como derechistas? Para encontrar una res
puesta podramos comparar los 100 estudiantes asistentes a la manifestacin izquier
dista con otros 100 estudiantes de la misma universidad asistentes a una manifesta
cin derechista. Imaginemos que obtenemos los datos mostrados en la Tabla 2.2.
Como se muestra en la tabla, 30 de 100 estudiantes en la manifestacin
derechista, pero slo 20 de 100 estudiantes en la manifestacin izquierdista, eran
mujeres. Esto nos da considerablemente ms informacin que la sola distrihucin de
frecuencia con que empezamos (ver Tabla 2.1). As, podemos afirmar ahora que los.
TABLA 2.2 Estudiantes de
ambos sexos asistentes
Asistencia a las manifestaciones
a manifestaciones polticas De izquierda De derecha
de derecha e izquierda
Sexo del estudiante
f f
---------_._-
Masculino
80 70
Femenino 20 30
Total 100 100
Organizacin de datos 17
hombres, en esta universidad, participaron ms que su contraparte femenina tanto en
las manifestaciones izquierdistas como derechistas. Podemos afirmar tambin que,
cuando las mujeres asistieron, tendieron a participar algo ms en las manifestaciones
derechistas que en las izq uierdistas.
Proporciones y porcentajes
Cuando el investigador estudia distribuciones de igual tamao total, los datos de
frecuencia pueden utilizarse para hacer comparaciones entre los grupos. As, el nmero
de hombres asistentes a manifestaciones, de derecha y de izquierda, puede ser
comparado directamente, ya que sabemos que haba exactamente 100 estudiantes en
cada manifestacin. Sin embargo, generalmente no es posible estudiar distribuciones
que tengan exactamente el mismo nmero de casos. Por ejemplo, cmo podemos
asegurarnos de que precisamente 100 estudiantes asistirn a ambas clases de manifes
taciones polticas? Para aclarar tales resultados, necesitamos un mtodo para estan
darizar distribuciones de frecuencia por tamao -una forma de comparar grupos a
pesar de las diferencias en las frecuencias totales. Dos de los mtodos ms populares
y tiles para estandarizar por tamao y comparar distribuciones son la proporcin y
el porcentaje. La proporcin compara el nmero de casos en una categora dada con
el tamao total de la distribucin. Podemos convertir cualquier frecuencia en una
proporcin P, dividiendo el nmero de casos en cualquier categora dada f por el
nmero total de casos en la distribucin N.
p=f
o sea,
N
Por consiguiente, 10 hombres entre 40 estudiantes asistentes a una manifesta
cin pueden expresarse en la proporcin P = ~ ~ = 0,25
A pesar de la utilidad de la proporcin, mucha gente prefiere indicar el tamao
relativo de una serie de nmero en trminos del porcentaje, la frecuencia de
ocurrencia de una categora por cada 100 casos. Para calcular un porcentaje, simple
mente multiplicamos cualquier proporcin dada por 100. Por frmula,
% = (100) L
N
Por consiguiente, 10 hombres de entre los 40 asistentes a una manifestacin
pueden expresarse en la proporcin P = ~ ~ = 0,25 o como un porcentaje
% = (100) lQ = 25 por ciento.
40
As, el 25 por ciento de este grupo de 40 estudiantes son del sexo masculino.
Para ilustrar la utilidad de los porcentajes al hacer comparaciones entre distribucio
l1lIIIII
J8 Descripcin
El investigador
nes, examinemos la participacin en manifestaciones polticas en una universidad
denominador) de
predominantemente izquierdista.
menudo empleada I
Supongamos, por ejemplo, que la manifestacin izquierdista atrajo a un gran
y mujeres en cuak
nmero de estudiantes, digamos 1 352 mientras que la manifestacin derechista
hombres por cada l'
atrajo a un nmero mucho ms pequeo, digamos 183.
La Tabla 2.3 nos indica tanto las frecuencias como los porcentajes de asistencia a
Para ilustrar, ~
estas manifestaciones. Ntese la dificultad que existe para determinar rpidamente
las diferencias de sexo en la asistencia slo con los datos de frecuencia. En contraste, hombres por cada
los porcentajes revelan claramente que las mujeres estuvieron igualmente representadas
obtener la terminok
en las manifestaciones tanto de derecha como de izquierda. Especficamente, el 20%
por 100. Entonces.
de los estudiantes asistentes a la manifestacin izquierdista eran mujeres; el 20% de
Razn de sexo = (1(
los estudiantes asistentes a la manifestacin derechista eran mujeres.
Resulta entonces q
mujeres.
TABLA 2.3 Estudiantes de
Asistencia a las manifestaciones Las razones ya
ambos sexos asistentes a
siguientes motivos:
manifestaciones polticas De izquierda De derecha
de derecha e izquierda
%
l. Se necesita
Sexo del estudiante f
{Ii
f
tienen muer
Masculino 1082 (80) 146
(80) 2. Puede ser di
Femenino 270
(20) 37
(20)
3. Algunos inv
(lOO) 183
(lOO)
Total 1352
generan las
Razones *
Un mtodo menos comn, utilizado para estandarizar por tamao, es la razn,
que compara directamente el nmero de casos que caen dentro de una categora
(por ejemplo, hombres) con el nmero de casos que caen dentro de otra categora (por
ejemplo, mujeres). As, puede obtenerse una razn de la siguiente manera, donde t.
es igual a la frecuencia
cualquier otra categora:
en cualquier categora y j ~ es igual a la frecuencia en
razn = tI
r,
Si estuviramos interesados en determinar la razn que haya de negros a
blancos, podramos comparar el nmero de negros entrevistados (f = 150) con el
nmero de blancos entrevistados (t = 100) como ~ g g Cancelando los tactores
comunes en el numerador y el denominador, es posible reducir la razn a su forma
ms simple, por ejemplo ~ 6 g = ~ (haba 3 entrevistados negros por cada 2 blancos).
* N. del E. Este trmino tambin se conoce como "cociente". El estudiante encontrar que en la prctica de
campo se utilizan indistintamente.
Tasas
Otra clase de raz
gadores sociales, se
poblaciones en cual
monio, y otros. ~
comparan el nmei
casos en cualquier e
nmero de casos
determinar la tasa d
el nmero de nar
(aquellos miembros
por lo tanto repres
de divorcios, podn
matrimonios que o
tasas suelen darse (
de nacimiento se <
tasas de divorcio p
1 000 matrimonios
en edad de conceb
edad de concebir.
iad
ran
ista
ia a
nte
ste,
.das
20%
de
Techa
%
(80)
(20)
(lOO)
m,
fa
ior
[1
en
a
el
'es
[la
s).
de
Organizacin de datos 19
El investigador podra aumentar la claridad de su razn dando la base (el
denominador) de alguna forma comprensible. Por ejemplo, la razn de sexo a
menudo empleada por los demgrafos, que buscan comparar el nmero de hombres
y mujeres en cualquier poblacin dada, se da generalmente como el nmero de
hombres por cada 100 mujeres.
Para ilustrar, si la razn de hombres a mujeres es l ~ ~ debera haber 150
hombres por cada 50 mujeres (o reduciendo, 3 hombres por cada mujer). Para
obtener la terminologa convencional de la razn de sexo, multiplicaramos la razn
por 100. Entonces.
' d (lOO)fhombres_(lOO) 150_
300
R
azon e sexo = f' - 50
mujeres
Resulta entonces que haba 300 hombres en la poblacin dada, por cada 100
mujeres.
Las razones ya no se usan extensamente en la investigacin social, quizs por los
siguientes motivos:
l. Se necesita un gran nmero de razones para describir distribuciones que
tienen muchas categoras de anlisis.
2. Puede ser difcil comparar razones basadas en nmeros muy grandes.
3. Algunos investigadores sociales prefieren evitar las fracciones o decimales que
generan las razones.
Tasas
Otra clase de razn, que tiende a ser utilizada ms ampliamente por los investi
gadores sociales, se conoce como tasa. Los socilogos analizan a menudo a las
poblaciones en cuanto a las tasas- de reproduccin, muerte, crimen, divorcio, matri
monio, y otros. Sin embargo, mientras que la mayora de las dems razones
comparan el nmero de casos en cualquier subgrupo (categora) con el nmero de
casos en cualquier otro subgrupo (categora), las tasas indican comparaciones entre el
nmero de casos reales y el nmero de casos potenciales. Por ejemplo, para
determinar la tasa de nacimientos para una determinada poblacin, podramos mostrar
el nmero de nacimientos vivos reales, entre las mujeres en edad de concebir
(aquellos miembros de la poblacin que estn expuestos al riesgo de concebir y que'
por lo tanto representan casos potenciales). De modo similar, para encontrar la tasa
de divorcios, podramos comparar el nmero real de divorcios con el nmero de
matrimonios que ocurren durante algn periodo de tiempo (por ejemplo 1 ao). Las
tasas suelen darse en trminos de una base de 1 000 casos potenciales. As, las tasas
de nacimiento se dan como el nmero de nacimientos por cada 1 000 mujeres; las
tasas de divorcio podran expresarse en trminos del nmero de divorcios por cada
1 000 matrimonios. De este modo, si ocurren 500 nacimientos entre 4 000 mujeres
en edad de concebir, resulta que hubo 125 nacimientos por cada 1 000 mujeres en
edad de concebir.
lO Descripcin
Tasa de nacimiento = (l 000) f casos reales
(l 000 )500 = 125
f casos potenciales 4000
Hasta ahora hemos discutido tasas que podran ser tiles para hacer compara
ciones entre diferentes poblaciones. Por ejemplo, podramos buscar comparar tasas
de nacimiento entre blancos y negros, entre mujeres de clase media y de clase baja,
entre grupos religiosos o sociedades enteras, etc. Otra clase de tasa, la tasa de
cambio, puede utilizarse para comparar la misma poblacin en dos puntos a un
tiempo. Al computar la tasa de cambio comparamos el cambio real entre el tiempo
1 y el tiempo 2, sirviendo como base el tamao del periodo del tiempo 1. As, una
poblacin que aumenta de 20000 a 30000 entre 1960 y 1970 experimentara una
tasa de cambio:
(lOO) tiempo 2f - tiempo 1f (100) 30000 - 20000 - 50%
tiempo 1f
20000
En otras palabras, hubo un aumento de poblacin del 50 por ciento en el periodo de
1960 a 1970.
Ntese que una tasa de cambio puede ser negativa si indica un crecimiento en
tamao en cualquier periodo dado. Por ejemplo, si una poblacin cambia de 15 000
a 5 000 en un periodo de tiempo, la tasa de cambio sera:
(100)5000 - 15000 _ -67%
15000
DISTRIBUCIONES DE FRECUENCIA SIMPLES
DE DATOS ORDINALES Y POR INTERVALOS
Dado que los datos nominales son colocados ms bien dentro de una clasificacin
que dentro de una escala, las categoras de las distribuciones de nivel nominal no
tienen que enlistarse en ningn orden en particular. As, los datos sobre preferencias
religiosas mostrados en la Tabla 2.4 se presentan de 3 formas diferentes, aunque
igualmente aceptables.
TABLA 2.4 Distribucin
de preferencias religiosas
Religin
f
Religin
f
Religin
f
mostrada de 3 maneras Protestante 3U Catlica 20 Juda 10
Catlica 20 iJuda 10 Protestante 30
Juda 10 Protestante 30 Catlica 20
Total 60 Total 60 Total 60
l
- -
Organizacin de datos 21
En contraste, las categoras o puntajes en las distribuciones ordinales representan
el grado en que est presente una caracterstica en -particular. El enlistado de tales
categoras o puntajes en las distribuciones de frecuencia simples debe hacerse de modo
que refleje ese orden.
Por este motivo, las categoras ordinales y por intervalos simpre se colocan en
mpara
orden desde sus valores ms altos hasta los ms bajos. Por ejemplo, podramos hacer
r tasas
e baja,
una lista de las categoras de las clases sociales desde la ms alta hasta la ms baja
(alta, media, baja) o podramos situar los resultados de un examen semestral de
; a un
asa de
biologa, en orden consecutivo, de la nota ms alta a la ms baja.
tiempo
La perturbacin del orden de las categoras ordinales y por intervalos reduce la
s, una
legibilidad de los hallazgos del investigador. Este efecto puede observarse en la Tabla
a una
2.5, donde se han presentado las versiones tanto "correcta" como "incorrecta" de
una distribucin de "Actitudes Hacia la Guerra" . Qu versin encuentra el lector
ms fcil de leer?
TABLA 2.5 Una
Actitud hacia la guerra f Actitud hacia la guerra f
distribucin de
do de I frecuencia de actitudes
ligeramente favorable 2 Fuertemente favorable O
hacia la guerra:
Algo desfavorable 10 Algo favorable 1
to en
Presentacin correcta e
Fuertemente favorable O ligeramente favorable 2
5000 .1 incorrecta
ligeramente desfavorable 4 Ligeramente desfavorable 4
Fuertemente desfavorable 21 Algo desfavorable 10
Algo favorable 1 Fuertemente desfavorable 21
Total 38 Total 38
Incorrecta
Correcta
DISTRIBUCIONES DE FRECUENCIA AGRUPADAS
DE DATOS POR INTERVALOS
acin
al no
Los puntajes a nivel de intervalos se extienden a veces sobre un amplio rango
ncias
(puntajes ms altos menos los ms bajos), haciendo que la distribucin de frecuencia
nque
simple que resulta, sea ms larga y difcil de leer. Cuando ocurren tales instancias,
pocos casos pueden caer en cada categora y el patrn del grupo se vuelve borroso.
Para ilustrar, la distribucin colocada en la Tabla 2.6 contiene valores que varan de
50 a 99 y tiene casi cuatro columnas de longitud.
Para aclarar nuestra presentacin, podramos construir una distribucin de
frecuencia agrupada, condensando los puntajes separados en un nmero de categoras
o grupos ms pequeos, donde cada uno contenga ms de un puntaje. Cada
categora o grupo, en una distribucin agrupada, es conocido como un intervalo de
clase, cuyo tamao est determinado por el nmero de puntaje que contenga.
22 Descripcin
Las calificaciones de exmenes de 71 estudiantes, presentadas originalmente en
la Tabla 2.6, se vuelven a ordenar en una distribucin de frecuencia agrupada,
mostrada en la Tabla 2.7. Aqu encontramos 10 intervalos de clase, cada uno de
tamao 5. As, el intervalo de clase ms alta (95-99) contiene los 5 puntajes 95, 96,
97, 98 y 99. De manera similar, el intervalo 70-74 es de tamao 5 y contiene los
puntajes 70, 71, 72, 73 y 74.
Lmites de clase
De acuerdo con su tamao, cada intervalo de clase tiene un lmite superior y un
lmite inferior. A primera vista, los puntajes ms alto y ms bajo, en cualqui
categora, parecen ser tales lmites. As, podramos razonablemente esperar que los
lmites superior e inferior del intervalo 60-64 sean 64 y 60 respectivamente. En este
caso, sin embargo, nos equivocaramos, ya que 60 y 64 no son en realidad los
lmites del intervalo 60-64.
Muchos lectores se estarn preguntando, "por qu no? 'l. Para encontrar una
respuesta examinemos un problema que podra surgir si furamos a definir lmites
de clase en trminos de los puntajes ms altos y ms bajos en cualquier intervalo.
Supongamos que tratramos de colocar nmeros que contienen valores fraccionarios
(fracciones decimales) en la distribucin de frecuencia mostrada en la Tabla 2.7.
Dnde podramos categorizar el puntaje 62,3? Muchos estaramos de acuerdo en
que pertenece al intervalo 60-64. Pero, qu hay con el puntaje 69,4? Y con el
nmero 54,2 o 94,6? El lector podra darse cuenta que los puntajes ms altos y ms
bajos en un intervalo dejarn separaciones entre grupos adyacentes, en tal forma que
algunos valores fraccionarios no pueden asignarse a ningn intervalo de clase en la
distribucin y deben excluirse del todo.
A diferencia de los puntajes ms altos y ms bajos en un intervalo, los lmites
de clase se localizan en el punto medio situado entre los intervalos de clase
adyacentes, y por tanto, sirven para cerrar las separaciones entre ellos (ver Fig. 2.1).
As, el lmite superior del intervalo 90-94 es 94,5 y el lmite inferior del intervalo
95-99 es tambin 94,5 Asimismo, 59,5 sirve como lmite superior del intervalo
55-59 y como lmite inferior del intervalo 60-64. El lector podra preguntar; qu
pasa con el valor 59,5 valor que cae exactamente a la mitad de las separaciones
entre intervalos de clase vecinos? Deberamos incluir este puntaje en el intervalo
55-59 o en el intervalo 60-64? Este problema se resuelve generalmente redondeando
al nmero par ms cercano. Por ejemplo, 59,5 estara situado en el intervalo 60-64;
84,5 estara incluido en el intervalo 80-84. Como veremos, debe determinarse la
posicin de los lmites de clase para trabajar con ciertos procedimientos estadsticos.
El punto medio
Otra caracterstica de cualquier intervalo de clase es su punto medio, que
definimos como elpuntaje medio en el intervalo de clase. Un mtodo simple y rpido
~
:e en
Jada,
J de
,96,
: los
y un
quier
e los
este
1 los
. una
nites
valo.
arios
2.7.
J en
In el
ms
que
n la
tites
.lase
1.1 ).
valo
valo
qu
mes
valo
ndo
-64;
: la
coso
ue
ido
Organizacin de datos 23
para encontrar el punto medio es buscar el punto donde cualquier intervalo dado
puede dividirse en dos partes iguales. Tomando algunos ejemplos, 50 es el punto
medio del intervalo 48-52; 3,5 es el punto medio del intervalo 2,5. El punto medio
puede ser calculado a partir de los puntajes ms altos a los ms bajos en cualquier
intervalo.
puntaje ms bajo + puntaje ms alto
48 + 52
= = 50
2
2
TABLA 2.6 Distribucin
de frecuencia de
Calificacin f Calificacin f Calificacin f Calificacin f
calificaciones de exmenes 99 O 85 2 71 4 57 O
finales para 71 estudiantes
98
97
1
O
84
83
1
O
70
69
9
3
56
55
1
O
96 1 82 3 68 5 54 1
95 1 81 1 67 1 53 O
94 O 80 2 66 3 52 1
93 O 79 8 65 O 51 1
92 1 78 1 64 1 50 1
91 1 77 O 63 2 Total 71
90 O 76 2 62 O
89 1 75 1 61 O
88 O 74 1 60 2
87 1 73 1 5l} 3
86 O 72 2 58 1
TABLA 2.7 Distribucin 1 d la f
. nterva o e e se
de frecuencia agrupada de
calificaciones de
exmenes finales para
71 estudiantes
_
95-99 3
90-94 2
85-89 4
80-84 7
75-79 12
70-74 17
65-69 12
60-64 5
55-59 5
50-54 4
Total 71
Determinacin del nmero de intervalos
Para presentar datos por intervalos en una distribucin de frecuencia agrupada, el
investigador social debe considerar el nmero de categoras que desea emplear. Los
24 Descripcin
FIGURA 2.1 Puntajes ms
alto y ms bajo contra
los lmites inferior y
superior del intervalo de
clase 90-94
95
Puntaje ms alto -- 94
93
94,5 _ Lmite superior
92
91
Puntaje ms bajo __
Se suele llamar marca de clase
90
89
89,5 Lmite inferior
textos generalmente aconsejan usar de 5 a 20 intervalos. A este respecto, sera
conveniente recortar que las distribuciones de frecuencia agrupadas se emplean para
revelar o enfatizar el patrn de un grupo. Muchos o muy pocos intervalos de clase
podran confundir ese patrn y por tanto trabajar en contra del investigador que
busca darle claridad a su anlisis. Adems, reducir los valores de los puntajes
individuales a un nmero innecesariamente pequeo de intervalos puede sacrificar
mucha de la precisin -precisin que se haba logrado originalmente conociendo la
identidad de puntajes individuales en la distribucin. En suma, entonces, el investiga
dor decide generalmente sobre el nmero de intervalos, basndose en su propio
conjunto de datos y en sus objetivos personales, factores que pueden variar conside
rablemente de una investigacin a otra.
DISTRIBUCIONES ACUMULADAS
A veces, es deseable presentar fsecuencias de una manera acumulada, especialmente
cuando buscamos localizar la posicin de un caso en relacin con la actuacin
total de un grupo. Las frecuencias acumuladas se definen como el nmero total de
casos que tengan cualquier puntaie dado o uno que sea ms bajo. As, la frecuencia
acumulada (fa) para cualquier categora (o intervalo de clase) se obtiene sumando la
frecuencia en esa categora a la frecuencia total para todas las categoras abajo de
ella. En el caso de los puntajes del consejo universitario en la Tabla 2.8, vemos que
la frecuencia (f) asociada con el intervalo de clase 301-350 es 12. Esta es tambin la
frecuencia acumulada para este intervalo, ya que ningn miembro del grupo obtuvo
menos de 301. La frecuencia en el pr ximo intervalo de clase 351-400 es 33,
mientras que la frecuencia acumulada para este intervalo es 45 (33 + 12). Por lo
tanto, encontramos que 33 estudiantes ganaron puntajes del consejo universitario
entre 351 y 400, pero que 45 recibieron puntajes de 400 o menos. Podramos
continuar con este procedimiento, obteniendo frecuencias acumuladas para todos los
intervalos de clase hasta llegar a la parte ms alta, 751-800, cuya frecuencia
acumulada (336)
grupo.logr puntaje
Adems de 1<
cin que indique
que tengan cualqu
modificamos la f
captulo, como sigi
c% = (lOO
donde
fa = la fre
N = el nr
Aplicando la
porcentaje de estu
c% = (100)
=(lOO)
= 3,57
El porcentaje que I
El porcentaje que
En la Tabla 2.9 se
datos de la Tabla ~
TABLA 2.8 Distril
de frecuencia acumul
puntajes del e
Universitario pa
estw
-
Organizacin de datos 25
acumulada (336) es igual al nmero total de casos, ya que ningn miembro del
grupo.logr puntajes sobre 800.
Adems de la frecuencia acumulada, tambin podemos construir una distribu
cin que indique porcentajes acumulados (c%), o sea el tanto por ciento de casos
que tengan cualquier puntaje o uno ms bajo. Para calcular el porcentaje acumulado,
modificamos la frmula para porcentaje (%) introducida anteriormente en este
captulo, como sigue:
c% = (lOO) ~
donde
fa = la frecuencia acumulada en cualquier categora
N = el nmero total de casos en la distribucin
Aplicando la frmula anterior, a los datos de la Tabla 2.8, encontramos que el
porcentaje de estudiantes que lograron puntajes de 350 o menos fue
12
c% = (100) 336
= (l00)0,0357
= 3,57
45
El porcentaje que recibi puntajes de 400 o menos fue c% = (100) 336
= (l 00)0, 1339
= 13,39
93
El porcentaje que alcanz puntajes de 450 o menos fue c% = (100) 336
= (l00)0,2768
= 27,68
En la Tabla 2.9 se muestra una distribucin de porcentajes acumulados basada en los
datos de la Tabla 2.8.
TABLA 2.8 Distribucin
de frecuencia acumulada de
Intervalo de clase f
fa
puntajes del Consejo
751-800 6 336
Universitario para 336
701-750 25 330
estudiantes
651-700 31 305
601-650 30 274
551-600 35 244
501-550 55 209
451-500 61 154
401-450 48 93
351-400 33 45
301-350 12 12
Total 336
26 Descripcin
TABLA 2.9 Distribucin
de porcentajes acumulados
de puntajes del Consejo
Universitario para 336
estudiantes (basado en los
datos de la Tabla 2.8)
Intervalo de clase fa
751-800
701-750
651-700
601-650
551-600
501-550
451-500
401-450
351-400
301-350
336
330
305
274
244
209
154
93
45
12
c%
100%
98.21
90.77
81.55
72.62
62.20
45.83
27.68
13.39
3.57
RANGO PERCENTIL
Supongamos que usted logr un puntaje de 80 en un examen de estadstica. Para
determinar exactamente qu tan bien lo ha hecho, podra ser de ayuda saber cmo
se compara con los puntajes de otros en la clase que hayan tomado el mismo
examen. Lograron, la mayora de los dems estudiantes, puntajes del orden de 80 y
90? Si fue as, su propia calificacin puede no ser muy alta. 0, la mayora de los
dems recibi puntajes del orden de 60 y 70? Si fue as, un puntaje de 80 puede
muy bien estar entre los ms altos de su clase.
Con la ayuda de la distribucin de porcentajes acumulados, podemos hacer
comparaciones precisas entre cualquier caso individual y el grupo donde ste ocurre.
Especficamente, podemos encontrar el rango percentil de un puntaje, un solo
nmero que indique el porcentaje de casos en una distribucin que cae por debajo
de un puntaje dado. Por ejemplo, si un puntaje de 80 tiene un rango percentil de
95, entonces el 95% de los estudiantes en este curso de estadstica recibieron
puntajes de examen ms bajo que 80 (slo un 5% sac puntajes arriba de 80). Sin
embargo, si un puntaje de 80 tiene un rango percentil de 45, entonces slo un 45%
recibi puntajes de examen abajo de 80 (55% logr puntajes arriba de 80). Por
frmula,
c% abajo del
lmite inferior del
Rango _ lmite inferior puntaje - intervalo crtico % en

Percentil - del intervalo (
[ cr tico
+ tamao del intervalo crtico
crtico
A fin de ilustrar el procedimiento para obtener el rango percentil, busquemos
el rango percentil para un puntaje de 620 en la distribucin en la Tabla 2.8. Antes
de aplicar la frmula debemos localizar primero el intervalo crtico, el intervalo de
clase en que aparece un puntaje de 620. Como se muestra ms abajo, el intervalo
crtico para el presente problema es 601-650:
ca. Para
er cmo
1mismo
de 80 y
la de los
Opuede
)s hacer
~ ocurre.
un solo
r debajo
:entil de
cibieron
80). Sin
un 45%
~ O ) . Por
quemas
i. Antes
~ a l o de
itervalo
Organizacin de datos 27
Intervalo de clase
751-800
701-750
651-700
601-650
<- Intervalo de clase en que
551-600
ocurre el puntaje 620
501-550
451-500
401-450
351-400
301-350
Hay varias caractersticas del intervalo crtico que debemos determinar antes de
aplicar la frmula para rango percentil:
l. El lmite inferior del intervalo crtico. Este es el punto que est a la mitad,
entre el intervalo crtico, 601-650, y el intervalo de clase inmediatamente
abajo de l, 551-600. El lmite inferior de 601-650 es es 600,5.
2. El tamao del intervalo crtico. Este est determinado por el nmero de
puntajes dentro del intervalo de clase 601-650. El tamao del intervalo
crtico es 50, ya que contiene valores desde 601 hasta 650.
3. El porcentaje dentro del intervalo crtico. Para determinar el porcentaje
dentro de cualquier intervalo de clase, dividimos el nmero de casos en ese
intervalo de clase (j) entre el nmero total de casos en la distribucin N y
multiplicamos por 100 nuestra respuesta. Por frmula.
% = (100) ~
30
= (100) 336
= (100)0,089
= 8,93
Por lo tanto, vemos que el 8,93 por ciento de estos puntajes del consejo
universitario cayeron dentro del intervalo de clase 601-650.
4. El porcentaje acumulado abajo del lmite inferior del intervalo crtico.
Podemos leer c% directamente de la distribucin de porcentaje acumulado
en la Tabla 2.9. Subiendo por la columna c% de la tabla, vemos que el 72,62
por ciento de los puntajes caen abajo del intervalo crtico. Este es el
porcentaje acumulado asoc.ado con el intervalo de clase que cae inmedia
tamente abajo del intervalo crtico.
Ahora estamos preparados para aplicar la frmula para rango percentil:
I
28 Descripcin
Rango percentil = 72,62 + [ 620
= 72,62 + [19
50

= 72,62 + (0,39) (8,93)
= 72,62 + 3,48
= 76,10
Resulta que ligeramente ms del 76% recibi un puntaje ms bajo de 620. Slo
el 23,90% logr puntajes por encima de esta cifra. Como una ilustracin ms
busquemos el rango percentil para un puntaje de 92 en la siguiente distribucin de
puntajes:
Intervalo de clase
f
fa c%
90-99 6 49 100%
80-89 8 43 87,76
70-79 12 35 71,43
60-69 10 23 46,94
50-59 7 13 26,53
40-49 6 6 12,24
N=49
Como se muestra ms adelante, el intervalo crtico para un puntaje de 92 es 90-99:
Intervalo de clase

00-89
70-79
60-69
50-59
40-49
Las siguientes son las caractersticas del intervalo crtico que debemos determinar:
1. El lmite inferior del intervalo crtico es 89,5.
2. El tamao del intervalo crtico es 10, ya que hay 10 valores de puntajes
dentro de l desde el 90 hasta el 99 (90, 91, 92, 94, 95, 96, 97, 98,99)
3. El porcentaje dentro del intervalo crtico es 12,24. Por frmula:
% = (100)1
IV
=(100) -
6
49
= (100)0,1224
= 12,24

4. El porcen
columna e'
valo crtic..
&7,76.
Ahora estamos listd
I
Rango percentil = S
=s


Casi el 9 1% recibi1
La escala de n
largo de la escala
rangos percentiles l
(rango percentil =
puntaje est en el s
caen abajo de l, l
conocen como cua
percentil = 25), sat
en el segundo cuart
un puntaje est en
abajo de l (ver Fig
FIGURA 2.2 Escala d
rangos percentile
dividida por decile
y cuartile
RESUMEN
En este captulo s
investigador social
-
le 620. Slo
tracin ms
tribucin de
es 90-99:
minar:

98,99)
I
I

1
I
Organizacin de datos 29
4. El porcentaje acumulado bajo el lmite inferior puede encontrarse desde la
columna c%, refirindose al intervalo de clase inmediatamente bajo el ir.ter
valo crtico. El porcentaje acumulado asociado al intervalo de clase 80-89 es
&7,76.
Ahora estamos listos para sustituir en la frmula para rango percentil:
. [ 92 - 895 J
Rango percentil = 87,76 + 10' (12,24)J
= 87,76+
= 87,76 + (0,25) (12,24)
= 87,76 + 3,06
= 90,82
Casi el 91% recibi un puntaje ms bajo de 92. Slo el 9,18% obtuvo un puntaje ms alto.
La escala de rangos percentiles consta de 100 unidades. Hay ciertos rangos a lo
largo de la escala que tienen nombres especficos. Los deciles dividen la escala de
rangos percentiles entre diez. As, si un puntaje est localizado en el primer decil
(rango percentil = 10), sabemos que el 10% de los casos caen abajo de l; si un
puntaje est en el segundo decil (rango percentil = 20), entonces el 20% de los casos
caen abajo de l, etc. Los rangos percentiles que dividen la escala en 4 partes se
conocen como cuartiles. Si un purrtaje est localizado en el primer cuartil (rango
percentil = 25), sabemos que el 25% de los casos caen abajo de l; si un puntaje est
en el segundo cuartil (rango porcentil = 50), el 50% de los casos caen abajo de l; y si
un puntaje est en el tercer cuartil (rango percentil = 75), el 75% de los casos caen
abajo de l (ver Figura 2.2)
FIGURA 2.2 Escala de
Rango Percentil Decil Cuartil
rangos percentiles 90 = 90.
dividida por deciles
85
80 = 80.
Ycuartiles 75 =
30.
70 = 70.
65
60 =
60.
55
50 = 50. 20.
45
40 =
40.
35
30 = 30.
25 =
10.
20 =
20.
15
10= 10.
RESUMEN
En este cap tulo se nos presentaron algunas de las tcnicas bsicas utilizadas por el
investigador social para organizar el conjunto de nmeros crudos que recoge de sus
30 Descripcin
entrevistados. Las distribuciones de frecuencia y los mtodos para comparar tales
distribuciones de datos nominales (proporciones, porcentajes, razones y tasas) fueron
discutidos y ejemplificados. Con respecto a los datos ordinales y por intervalos, se
examinaron las caractersticas de las distribuciones de frecuencia simples, agrupadas
y acumuladas. Finalmente, se present el procedimiento para obtener el rango
porcentil de un porcentaje no procesado.
PROBLEMAS
l. De la siguiente tabla, que representa.la agudeza visual de los televidentes y no
televidentes, encontrar (a) el porcentaje de no televidentes con alta agudeza
visual, (b) el porcentaje de televidentes con alta agudeza visual; la proporcin
de no televidentes con alta agudeza visual y (d) la proporcin de televidentes
con alta agudeza visual.
Agudeza visual en televidentes y no televidentes
Estatus visual
No televidentes Televidentes
Agudeza visual
f f
Alta 93 46
Baja 90 127
Total
183 173
2. De la siguiente tabla, que representa estructuras familiares para nios negros
y blancos, encontrar (a) el porcentaje de nios negros con familias de padre
y madre, (b) el porcentaje de nios blancos con familias de padre y madre,
(c) la proporcin de nios negros con familias de padre y madre y (d) la
proporcin de nios blancos con familias de padre y madre
Estructura familiar para nios negros y blancos
Raza del nio
Negra
Blanca
-
Estructura familiar f f
(Padre o Madre) 53 59
(Padre y Madre)
130 167
183 226
Total
Organizacin de datos 31
les
3. En un grupo de 4 televidentes con alta gudeza visual y 24 con baja agudeza
on
visual, ,cul es la razn de televidentes con agudeza visual alta y baja?
se
4. En un grupo de 125 hombres y 80 mujeres, cul es la razn de hombres a
las
mujeres?
19O
5. En un grupo de 15 nios negros y 20 nios blancos, cul es la razn de
negros a blancos?
6. Si ocurren 300 nacimientos, entre 3 500 mujeres en edad de concebir, .cul
es la tasa de nacimiento?
7. Cul es la tasa de cambio para un aumento de poblacin de 15 000 en
1950 a 25 000 en 1970?
10
8. Convertir la siguiente distribucin de porcentajes a una distribucin de
~ a
frecuencia que contenga cuatro intervalos de clase, y (a) determinar el
m
tamao de los intervalos de clase, (b) indicar los lmites superior e inferior de
s
cada intervalo de clase, (e) identificar el punto medio de cada intervalo de
clase, (d) encontrar la frecuencia acumulada por cada intervalo de clase, y (e)
encontrar el porcentaje acumulado para cada intervalo de clase.
Puntajes
f
12 3
11 4
10 4
9 5
8 6
7 5
6 4
5 3
4 2
s
I
3 1
2 1
1 2
e
N=40
9. En la siguiente distribucin de puntajes, encontrar el rango percentil para (a)
un puntaje de 75 y (b) un puntaje de 52.
Intervalo de clase f
fa
90-99 6 48
80-89 9 42
70-79 10 33
60-69 10 23
50-59 8 13
40-49 5 5
N=48
,
32 Descripcin
10. En la siguiente distribucin de puntajes, encontrar el rango percentil para
(a) un puntaje de 36 y (b) un puntaje de 18.
Intervalo de clase
f
40-44
5
35-39
5
30-34
8
25-29
9
20-24
10
15-19
8
10-14
6
5-9
5
N=56

Вам также может понравиться