Вы находитесь на странице: 1из 21

MTODO III

UNIDAD 1 : ANALISIS e INTERPRETACION de los DATOS


1.1 Anlisis e Interpretacin de los datos: ltima etapa del proceso lgico de investigacin social que busca responder
a las preguntas iniciales de un proyecto de investigacin. Que es analizar e interpretar datos !elacin del tipo
de anlisis a realizar con las otras etapas en un proceso de la investigacin. "bicacin y l#mites del anlisis
estad#stico de los datos.
UNIDAD 2 : El ANALISIS CUANTITATIVO de los DATOS
2.1. La Descripci! de las Varia"les# $Descripci! de la Po"laci! es%&diada'
2.1.1. Co!cep%o de Es%ad(s%ica: $stad#stica descriptiva e in%erencial. $l lugar de la estad#stica en la investigacin
social y su relacin con las etapas lgicas del dise&o de investigacin.
2.1.2. Dis%ri"&cio!es de )rec&e!cias. *or+a e! ,&e se dis%ri"&-e! los da%os
Ca%e.or(as - )rec&e!cias.
'a distribucin de %recuencias es la distribucin de los datos en clases o categor#as indicando el nmero de casos que
pertenece a cada categor#a. $ste nmero se llama %recuencia de clase.
I!%er/alos - l(+i%es de clases. $l intervalo de clase de%ine una clase o categor#a (e): de *1 a *+ a&os,. 'os l#mites de
clase son sus nmeros e-tremos: e): *1 es lmite in%erior y *+ es el l#mite superior. 'os l#mites reales ser#an *..+ y
*+.+ (l#mite real in%erior y l#mite real superior,
A+pli%&d del i!%er/alo de clase - p&!%o +edio. 'a amplitud del intervalo de clase es la di%erencia entre los l#mites
reales de cada categor#a. $l punto medio es igual al l#mite in%erior ms el l#mite superior dividido *.
Re.las .e!erales para )or+ar la dis%ri"&ci! de )rec&e!cias. Dis%ri"&ci! &!i/ariada: )rec&e!cias a"sol&%as -
rela%i/as# )rec&e!cias ac&+&ladas.
"na vez obtenidos los datos que estimamos relevantes para realizar el anlisis deseado es conveniente ordenarlos
segn algn criterio para obtener el m-imo de in%ormacin posible. $l marco terico en el que se inscriba el anlisis
cuantitativo debe ser el criterio bsico a seguir para agrupar los datos y realizar una comparacin signi%icativa.
/ay tres tipos de distribuciones:
1. Dis%ri"&ci! de )rec&e!cias
*. Dis%ri"&ci! porce!%&al: 0ara calcular el porcenta)e de cada categor#a se divide la %recuencia de casos para
determinada clase por 1 y se multiplica el resultado por 1...
2. Dis%ri"&ci! ac&+&lada: se %orma al indicar para cada categor#a el nmero de casos que quedan por deba)o
del l#mite real superior de esa categor#a. $ste tipo de distribucin es til en la comparacin3 cuando se desea
comparar la %orma en que los casos se distribuyen a lo largo de una escala. 'os porcenta)es acumulados
permiten en una sola medida o%recer los casos que se encuentran por deba)o o por encima de unos niveles
determinados.
2.1.0. Represe!%acio!es .r1)icas: o"2e%i/os. 3is%o.ra+a - pol(.o!o de )rec&e!cias.
'os resultados de las investigaciones se representan gr%icamente con el %in de tener un panorama ms intuitivo y
directo de los datos.
1. 3is%o.ra+as: representacin de una distribucin de %recuencias o porcentual. 'a %recuencia de casos en cada
categor#a se representa mediante un rectngulo que tiene su base sobre el e)e 4orizontal3 con centro en el
punto medio de la categor#a y cuya anc4ura es igual al tama&o del intervalo de dic4a categor#a. 'a altura del
rectngulo ser igual a la %recuencia de cases que se incluyen en la categor#a.
*. Pol(.o!os: el pol#gono de %recuencias es una %igura que se cierra al unir los puntos medios de cada intervalo3
a una altura proporcional a la %recuencia de dic4o intervalo. 'a unin de los puntos medios constituye un
segmento rectil#neo que3 al prolongarlo por los e-tremos 4asta cortar el e)e -3 constituye un pol#gono de
1
%recuencias.
2. O2i/as: son pol#gonos de %recuencias acumuladas.
5. L(!ea de .ra)os: muestra el valor de una variable dependiente para cada valor de las di%erentes categor#as de
otra variable independiente.
*.1.5. Medidas de las dis%ri"&cio!es: medidas de tendencia central3 dispersin y asimetr#a.
MEDIDAS DE TENDENCIA CENTRAL
'a posicin o tendencia central de una distribucin se re%iere al lugar donde se centra una distribucin particular en la
escala de valores.
1. Moda: es el valor que se presenta u ocurre con la mayor %recuencia. "na distribucin puede ser unimodal3
bimodal o multimodal. 6: es %cilmente reconocible. 7: no es necesariamente nica y no se puede calcular si
todos los valores num8ricos son di%erentes.
*. Media!a: $s el punto o valor num8rico que de)a por deba)o a la mitad de las puntuaciones de una
distribucin. 6: est poco in%luida por la e-istencia de valores e-tremos altos y errticos. 7: los valores de la
distribucin deben tener3 como m#nimo3 un nivel de medicin ordinal para que se pueda calcular.
2. Media: es la suma de todas las puntuaciones de una distribucin dividida por el nmero de casos. 7: se puede
decir que la media es atra#da porlos valores e-tremos altos de una distribucin. 6: utiliza ms in%ormacin3 ya
que todas las puntuaciones entran en el clculo3 adems suele di%erir menos que la mediana entre diversas
muestras de una misma poblacin.
VARIACI4N O DISPERSI4N DE UNA DISTRI5UCI4N
'os #ndices de variabilidad o dispersin indican si las puntuaciones son parecidas o distintas entre s#.
0ara datos de intervalo 4ay dos procedimientos segn se considere
1. $l recorrido o la amplitud de la escala en la que se distribuyen las puntuaciones: el recorrido o ra!.o es la
di%erencia entre el mayor y el menor de los nmeros. 'a desventa)a de esta medida es que slo depende de los
valores e-tremos de una distribucin y no tiene en cuenta los valores intermedios.
*. 9e describa la variacin por medio de las di%erencias que se producen entre todas las puntuaciones y un #ndice
de tendencia central (media,:
Des/iaci! +edia. :edida que viene dada por la media aritm8tica de los valores absolutos de las
desviaciones observadas a un determinado valor medio.
;uanto mayor sea el valor de la desviacin media3 mayor ser la variacin entre las di%erentes puntuaciones.
Des/iaci! %(pica - /aria!6a: al igual que la desviacin media3 se basan en las di%erencias e-istentes entre la
media aritm8tica y cada puntuacin.
A di%erencia de la desviacin media3 en lugar de tomar el valor absoluto de tales desviaciones3 se utiliza el
cuadrado de las mismas.
Varia!6a: el valor medio del cuadrado de las desviaciones de las puntuaciones a la media aritm8tica.
Des/iaci! %(pica: es la ra#z cuadrada de la varianza
<=!:A9 7$ 'A 7I9>!I?";I@1
$l rasgo de una distribucin es la %orma global de la misma. 'as caracter#sticas de la %orma de una distribucin:
asimetr#a y apuntalamiento.
1. N7+ero de picos o p&!%as 8+odas9 que tiene una distribucin: unimodal3 bimodal3 multimodal.
*. :rado de asi+e%r(a: cuando una curva es sim8trica3 la mediana coincide con la media3 y3 si es unimodal3 con la
moda. 9e dice que la asimetr#a es positiva si e-isten muc4as puntuaciones ba)as y pocas altas. 9e dice que es negativa
cuando sucede a la inversa.
2. :rado de apila+ie!%o de casos alrededor de &! p&!%o de la dis%ri"&ci!. ;urtosis: 4ace re%erencia al grado de
apuntamiento de una distribucin.
'eptocrtica: distribucin de %recuencias altamente concentrada
0laticrtica: distribucin de %recuencias ms uni%orme. (curva ms ac4atada,
*
:esocrtica: la distribucin de %recuencias presenta las puntuaciones ms normalmente distribuidas. 'a curva no est
apuntada ni ac4atada. <orma de campana y suavidad de curvas.
*.1.+. La dis%ri"&ci! !or+al: introduccin. <orma y caracter#sticas generales. 7istribucin normal estndar3
punta)e A. Areas ba)o la curva normal. "so de tabla y aplicaciones.
'a curva normal es til porque un gran nmero de distribuciones de %recuencias presentan %ormas apro-imadamente
normales. Adems3 la curva normal es muy signi%icativa tericamente en el campo de la estad#stica in%erencial.
'as distribuciones de %recuencias pueden ser %initas o in%initas. 'as distribuciones in%initas estn basadas en un
nmero in%inito de casos. !epresentadas gr%icamente3 son curvas cuyos e-tremos se van acercando suavemente al
e)e - pero no se cruzan con este.
'a distribucin normal es una distribucin in%inita.
;aracter#sticas principales:
9im8trica
1mero in%inito de casos
<orma acampanada
"nimodal
;oinciden la media3 la moda y la mediana
$n la composicin de la %rmula intervienen la media y la desviacin t#pica
$n t8rminos estad#sticos3 conviene considerar una curva normal cuyas puntuaciones se e-presen en puntuaciones
t#picas en lugar de sus unidades originales. A esto se llama curva normal tipi%icada. 'a variable - es e-presada en
t8rminos de desviacin.
<rmula:
'os valores num8ricos de cualquier curva normal pueden trans%ormarse de tal modo que una sola tabla puede ser
utilizada para evaluar la proporcin de casos que quedan dentro de un intervalo.
2.2. Nocio!es de Es%ad(s%ica I!)ere!cial# $Pode+os .e!erali6ar'
*.*.1. 7istribuciones muestrales: 7i%erencia entre distribucin de la muestra3 distribucin de la poblacin y
distribucin muestral.
$-isten tres tipos di%erentes de distribuciones de los datos:
1. Dis%ri"&ci! de la po"laci!: caracteriza la distribucin de los elementos de una poblacin
*. Dis%ri"&ci! de la +&es%ra: caracteriza la distribucin de los elementos de una muestra e-tra#da de la
poblacin
2. Dis%ri"&ci! +&es%ral: describe la conducta esperada de un gran nmero de muestras aleatorias e-tra#das de
una misma poblacin. 'as unidades que se distribuyen son medidas resumen de muestras completas de
valores3 en lugar de los valores individuales de caracter#sticas de casos nicos. "na distribucin muestral es
una distribucin probabil#stica terica de estadisticos pertenecientes a muestras. $s la distribucin que se
obtendr#a se e-tra)8semos aleatoriamente todas las muestras posibles3 del mismo tama&o3 de una poblacin.
9e obtiene una distribucin muestral cuando se toman todas las muestras aleatorias simples (cada una de ellas
con al menos un elemento di%erente, de tama&o 1 de una misma poblacin3 se calcula un estad#stico para cada
muestra la media, y se distribuyen los estad#sticos alrededor del parmetro que estiman.
Teore+a del l(+i%e ce!%ral - le- de los .ra!des !7+eros.
El %eore+a del l(+i%e ce!%ral establece que si se e-traen repetidas muestras aleatorias simples de tama&o 1 a partir
de una poblacin distribuida normalmente3 de media mu y desviacin t#pica o3 las medias de tales muestras se
distribuyen normalmente con media mu y desviacin t#pica o sobre ra#z de 1.
$s decir3 las medias de las muestras aleatorias simples e-tra#das de una poblacin que se distribuye normalmente
darn lugar a una distribucin que tambi8n es normal.
Le- de los .ra!des !7+eros
9i el tama&o 1 de cada muestra es su%icientemente grande3 con independencia de la %orma de la distribucin de la
2
poblacin3 las medias de las muestras tendern a distribuirse normalmente con media mu y desviacin t#pica o sobre
ra#z de 1.
;uanto mayor sea 13 con ms %acilidad se apro-imar a distribucin muestral a la curva normal.
I+por%a!cia de la le-:
Al ser la distribucin muestral (y no de la poblacin, la que se utiliza en las pruebas de signi%icacin3 cuando 1 es
su%icientemente grande ya no tenemos que preocuparnos por los supuestos re%erentes a la normalidad de la poblacin3
pudiendo emplear las propiedades de la curva normal en nuestras pruebas de decisin estad#stica3 ya que la
distribucin muestral tiende a apro-imarse a la normalidad.
Te!de!cia ce!%ral# /aria"ilidad - )or+a de &!a dis%ri"&ci! +&es%ral
7ado que una distribucin muestral es una distribucin univariable3 se puede caracterizar en t8rminos de su tendencia
central3 variabilidad y %orma.
'a distribucin muestral se caracteriza por una variacin del estad#stico de la muestra alrededor de su parmetro. $sta
variabilidad se puede medir por medio de t8cnicas tales como recorridos3 varianzas y desviaciones t#picas. $l valor
que mide tal variabilidad es el error t#pico.
Error %(pico: mide la variacin aleatoria de los estad#sticos alrededor de los parmetros que tratan de estimar.
9u tama&o depende3 en parte3 del tama&o de la muestra de la que se calcula el estad#stico. Al aumentar el tama&o de la
muestra disminuye el error t#pico.
*.*.*. $stimacin de parmetros. $stimacin puntual y por intervalos de con%ianza.
$stimacin de medias y proporciones.
/ay dos tipos bsicos de estimacin:
La es%i+aci! p&!%&al: el inter8s se centra en un valor nico que estime me)or un determinado parmetro
La es%i+aci! por i!%er/alo: deseamos conocer el grado de e-actitud con un determinado grado de
probabilidad de que el parmetro se encuentre dentro de un intervalo alrededor del porcenta)e o valor
estimado. $stimacin que consiste en un con)unto de valores que var#an entre dos l#mites3 en lugar de un solo
valor.
6enta)as: la amplitud del intervalo indica la bondad de la e%iciencia de la estimacin3 y se puede adscribir una
probabilidad determinada a la estimacin.
$l intervalo que se utiliza para estimar un parmetro se conoce con el nombre de intervalo de con%ianza3 y los
valores e-tremos del intervalo son los l#mites de con%ianza.
Es%i+aci! de proporcio!es. I!%er/alos de co!)ia!6a
$stimacin por intervalo de una proporcin (o %recuencia o porcenta)e,.
0ara realizar una estimacin por intervalo de una proporcin se necesita conocer:
'a tendencia central
'a variabilidad
'a %orma de la distribucin muestral de las proporciones
2.0. A!1lisis de Relacio!es "i/ariadas# $C+o se relacio!a! los )e!+e!os'
2.0.1. I!s%r&+e!%os para /aria"les c&ali%a%i/as: >abulacin simple y cruzada. 7istribuciones y %recuencias
marginales y condicionales.
"na tabla de contingencia es el cruce de dos o ms variables. 9e llaman tambi8n tablas bivariadas o tabulacin
cruzada. 9e vuelcan las %recuencias (nmeros de casos, correspondientes a cada combinacin de valores de varias
variables (espacios de propiedad,.
'as %recuencias marginales o de primer orden son las que quedan por a%uera del cuadro. 'as %recuencias
condicionales o de segundo orden son las que quedan en la interseccin entre dos variables.
$l primer paso de cualquier anlisis es veri%icar si la tabla BcierraC3 es decir3 si se cumplen las relaciones aritm8ticas
5
que debe satis%acer cada ci%ra. 9i no cierra3 es evidente que 4ubo algn error de tabulacin.
'os porcenta)es sirven para considerar el peso relativo de cada grupo sobre el total de la poblacin.
;uando se analizan tabulaciones bivariadas3 el inter8s debe %ocalizarse en determinar si e-iste alguna relacin entre
las dos variables. 0artimos siempre de una 4iptesis acerca de la e-istencia o no de una relacin entre las dos
variables.
$l cuadro como contrastacin de 4iptesis. !elaciones asim8tricas y sim8tricas.
:odos alternativos de anlisis:
:odo asim8trico: observar el e%ecto de una variable sobre la otra
:odo sim8trico: no se presupone que una variable acte como causa de la otra
"na tabla no es intr#nsecamente sim8trica o asim8trica3 depende de cmo el investigador decida encarar el anlisis en
%uncin de sus ob)etivos.
'gica de la construccin y lectura de cuadros. Anlisis de tablas: %uncin y utilizacin de porcenta)es y la di%erencia
porcentual BdDC.
El a!1lisis de &!a %a"la si+;%rica+e!%e
$n este caso3 se computan los porcenta)es correspondientes a todas las %recuencias condicionales y marginales sobre
la base del total de casos.
=ptamos por este tipo de anlisis cuando no se interesa indagar acerca del presunto Be%ectoC de una variable sobre la
otra.
A!1lisis de &!a %a"la asi+;%rica+e!%e
9e elige considerar una variable independiente y una dependiente.
1< RE:LA DE =IE:EL
9e aplica siempre que uno de los %actores del cuadro dimensional pueda considerarse como causa de la distribucin
del otro %actor.
'=9 0=!;$1>AE$9 7$?$1 ;=:0">A!9$ $1 $' 9$1>I7= 7$' <A;>=! ;A"9A' (6I, F 'A
;=:0A!A;I@1 7$?$ !$A'IAA!9$ $1 $' 9$1>I7= 7$ 'A 6A!IA?'$ 7$0$17I$1>$.
2< RE:LA DE =IE:EL
$s una limitacin al sentido en que se computan los porcenta)es cuando se traba)a con datos muestrales.
;"A17= "1 ;=1E"1>= 7$ :A!GI1A'$9 1= $9 !$0!$9$1>A>I6= 7$ 'A 0=?'A;I@13 '=9
0=!;$1>AE$9 7$?$1 ;=:0">A!9$ $1 'A 7I!$;;I@1 $1 Q"$ 'A :"$9>!A 1= $9
!$0!$9$1>A>I6A.
Co!cep%o de asociaci! de /aria"les:
7ecimos que dos variables estn asociadas cuando mediante el tratamiento asim8trico de una tabla observamos que
una de las variables aparece determinando o a%ectando a otra.
'a medida de asociacin ms %recuentemente utilizada es la di%erencia porcentual.
0or su simplicidad de clculo y por la claridad de su signi%icado es la lmedida de asociacin ms popular. ;onsiste en
una sistematizacin de la primera reglade Aiegel: 'A DI*ERENCIA PORCENTUAL 9$ ;A';"'A $1 'A
7I!$;;I@1 $1 Q"$ 9$ !$A'IAA 'A ;=:0A!A;I@1.
Ve!%a2as DP:
'a di%erencia porcentual nos brinda una medida general de asociacin en la tabla.
$n su prctica cotidiana3 el investigador la aplica casi instintivamente para tener una medida rpida de asociacin.
Des/e!%a2as DP:
$l uso de la di%erencia porcentual como indicador resumen de la asociacin en una tabla implica una gran p8rdida de
in%ormacin.
$sta medida no se puede aplicar a tablas de ms de *-*
Independencia estad#stica y asociacin per%ecta en los cuadros.
+
;aracter#sticas de una asociacin de dos variables: e-istencia3 %uerza3 direccin y naturaleza.
1. $HI9>$1;IA: $-iste una asociacin entre dos variables cuando la distribucin de una variable di%iere de
algn modo entre las diversas categor#as de la segunda variables. =tra %orma de decir si e-iste o no asociacin
entre dos variables consiste en comparar las %recuencias observadas en la tabla con las %recuencias que cabr#a
esperar si no e-istiera asociacin (%recuencias esperadas,. 9e calculan las %recuencias de cada celda a partir de
los datos totales3 de %orma que las distribuciones condicionales no o%rezcan asociacin alguna. $n general3 la
%recuencia esperada para una determinada celda se calcula multiplicando el total de la %ila correspondiente a la
celda por el total de la columna que corresponde a dic4a celda3 y diviediendo el producto obtenido por el
nmero global de casos (1,. "na vez calculados los valores esperados en cada casilla3 se pueden comparar los
valores observados %o3 o relaes3 con los valores esperados %e. 'a comparacin se realiza restando el valor
esperado de cada celda del valor observado. $ste valor se llama delta3 se calcula para cada celda. :ientras
algunos deltas sean di%erentes de cero3 se puede 4ablar de la e-istencia de algn tipo de asociacin entre las
dos variables. 9i todos los valores %ueran .3 4ay independencia estad#stica.
*. <"$!AA = G!A7= 7$ 'A A9=;IA;I@1. ;uando los valores epsilon o delta son elevados3 se puede
4ablar de un alto grado de asociacin. 9i son peque&os3 se trata de una d8bil asociacin. ;omo no 4ay un
valor estipulado para determinar el signi%icado de delta o $psilon3 e-isten otros #ndices estandarizados que
var#an de una %orma %i)a3 predeterminada e interpretable3 entre un valor m#nimo de asociacin y un valor
m-imo.
2. 7I!$;;I@1 7$ 'A A9=;IA;I@1: solo cabe 4ablar de ella cuando las variables se 4an medido3 como
m#nimo3 al nivel ordinal. ;uando en una tabla la tendencia de variacin con)unta de las dos variables a que los
valores altos de una variable se correspondan con los valores altos de la segunda variable3 se 4abla de
asociacin positiva. ;uando los valores altos de una variable se corresponden con los valores ba)os de la
segunda3 y los valores altos de 8sta se corresponden con los ba)os de aquella3 4ay asociacin negativa.
5. 1A>"!A'$AA 7$ 'A A9=;IA;I@1. $s la %orma general en que se distribuyen los datos en la tabla.
;uando al pasar de una categor#a a otra de variables el nmero de casos tiende a incrementarse o disminuir de
una %orma relativamente 4omog8nea entre las categor#as de la otra variable se produce una relacin lineal.
Coe)icie!%es de asociaci!.
:edidas de asociacin estandarizadas o tipi%icadas3 que en un solo #ndice indican la e-istencia3 el grado y la direccin
de la asociacin
'os valores pueden variar a lo largo de una escala desde un valor m#nimo3 que indica relacin negativa (I1,3 4asta un
valor m-imo (J1, que indica asociacin positiva3 pasando por .3 que indica ausencia de relacin.
'a medida ms sencilla que se puede crear a partir de los valores delta es la propia suma de todos los delta que se
pueden calcular al comparar las di%erentes columnas y categor#as que componen una tabla.
0ero este #ndice es muy de%iciente y depende del tama&o de los valores esperados. 'os valores deltas3 adems3 se
pueden neutralizar entre s# al sumar cantidades de signo contrario.
$sta limitacin se supera si se suman3 en lugar de los deltas3 sus cuadrados3 y se divide cada delta al cuadrado por el
valor esperado de cada celda3 con lo que se controlas los e%ectos resultantes al considerar di%erentes nmeros de
casos. 'a medida resultante es el c4i cuadrado.
$ste coe%iciente es siempre positivo. $l l#mite superior del coe%iciente c4i cuadrado vale 1 (KI1,3 donde 1 es el
tama&o de la muestra y K es el nmero de %ilas o columnas en la tabla.

=tros coe%icientes que se basan en el c4i cuadrado tratan de superar sus limitaciones.
$leccin del coe%iciente segn la relacin postulada por la 4iptesis y el nivel de medicin de las variables.
Interpretacin de los coe%icientes
*i c&adrado
<i: de . a J1 para *-K
Inconveniente: en tablas que contengan ms de dos categor#as en cada variable el valor m-imo de %i sobrepasa la
unidad.
C de Pearso!
L
1o puede ser superior a la unidad3 con independencia del tama&o de la tabla3 ya que el coe%iciente c4i cuadrado
aparece tanto en el numerador como en el denominador.
$l problema es que nunca alcanza la unidad3 aunque 4aya asociacin per%ecta.
T de Tsc>r&pro?
9e trata de introducir el concepto de grados de libertad en la %rmula del coe%iciente de asociacin: gl: (nI1,(mI1,
$l l#mite superior de > vale la unidad3 pero con la condicin de que tenga la misma cantidad de %ilas que de columnas.
$n tablas que no sean cuadradas3 > no puede alcanzar la unidad.
V de Cra+er
$l coe%iciente 6 de ;ramer puede alcanzar la unidad3 con independencia del tama&o de la tabla3 y vale cero cuando
no e-iste asociacin alguna.
Asociacin completa y Q de Fule
Asociaci! co+ple%a: distribucin tal que3 por lo que se re%iere a una tabla *-*3 slo sea cero la %recuencia de una de
las celdas3 mientras que las otras celdas tienen una %recuencia di%erente de cero.
Q de Fule se basa en este tipo de asociacin per%ecta. 9e calcula a partir de los productos cruzados de las celdas de
una de las diagonales ad y de las celdas de la segunda diagonal
;uando la %recuencia de una de las celdas es cero3 Q J1 o I13 segn la direccin de la asociacin.
9e puede usar con variables nominales y ordinales.
Medidas de asociaci! para /aria"les !o+i!ales - ordi!ales
:edidas de asociacin basadas en el criterio de red&cci! proporcio!al del error.
'as medidas !0$ consisten en coe%icientes de la cantidad de error cometido al predecir la variable dependiente en
dos situaciones:
1. 'a prediccin se realiza3 en primer lugar3 cuando no se conoce ms que la distribucin de la propia variable
dependiente.
*. $n segundo lugar3 la prediccin se realiza cuando se dispone del conocimiento adicional de una variable
independiente y de la %orma en que la variable dependiente se distribuye dentro de las categor#as de dic4a
variable independiente.
'o que realizan las medidas !0$ es simplemente %ormular la proporcin en que se puede reducir el error cometido en
la primera de las situaciones descriptas3 al utilizar la in%ormacin que proporciona la segunda de las situaciones.
!0$: !educcin del error con ms in%ormacin
;antidad original de error
Coe)icie!%e La+"da
?asado en el criterio de reduccin proporcional del error
$s una medida asim8trica de asociacin especialmente creada para analizar distribuciones bivariables en las que
ambas variables son de tipo nominal
$l primer t8rmino del numerador e-presa el nmero de errores cometidos mediante la prediccin I y el segundo
t8rmino es el nmero de errores que se cometen al utilizar la prediccin II.
1 es el tama&o total de la muestra.
:y es la %recuencia modal global de la variable dependiente F y my es la suma de las %recuencias modales de la
variable dependiente F dentro de cada categor#a.
Si+pli)icada:
$l numerador es el nmero de noIerrores cometidos ba)o la prediccin II3 menos el nmero de errores cometidos ba)o
la prediccin I 3 siendo el denominador el nmero de errores cometidos ba)o la prediccin I.
'imitacin del coe%iciente 'ambda:
Aunque o%rece in%ormacin sobre la %uerza de la asociacin3 no o%rece in%ormacin sobre la naturaleza de la misma.
0ara naturaleza3 se debern analizar las di%erencias porcentuales.
M
2.0.2. Nocio!es de Es%adis%ica I!)ere!cial Relacio!al: $l uso de las pruebas de signi%icacin estad#stica en la
investigacin social. Introduccin y conceptos bsicos de las pruebas. 9igni%icacin estad#stica y signi%icacin
terica.
Tes% de c>i c&adrado
$s una medida de signi%icacin estad#stica.
9e basa en una medida de cunto se apartan las %recuencias condicionales observadas en la muestra de los que ser#an
las %recuencias esperables si no e-istiera ninguna relacin entre las variables.
$l test de c4i cuadrado consiste en medir cunto se desv#an las %recuencias observadas respecto de las esperadas3
debiendo entenderse que el con)unto de las %recuencias esperadas con%igura un mdulo posible de noIasociacin3
basado en la idea de independencia estad#stica
$l valor obtenido solo cobra sentido cuando se lo compara con el valor cr#tico correspondiente a la tabla de c4i
cuadrado.
$l valor cr#tico depende del nivel de signi%icacin con el que deseamos traba)ar y del nmero de grados de libertad de
nuestra tabla.
1. El !i/el de si.!i)icaci!
0robabilidad de equivocarnos que estemos dispuestos a aceptar. 9i3 por e)emplo3 elegimos un nivel de
signi%icacin de ..+3 ello equivale a considerar aceptable un riesgo del +D. !iesgo: 0robabilidad de que dos
variables que no estn asociadas en la poblacin aparezcan relacionadas en la muestra.
$l nivel de signi%icacin depende de la %uerza de la relacin entre las variables y del tama&o de la muestra
*. El !7+ero de .rados de li"er%ad para una contingencia de 4 4ileras por c columnas: glN (4I1, (cI1,
7ado un con)unto de marginales3 los grados de libertad representan el nmero de celdas que es su%iciente
llenar para que queden determinadas todas las %recuencias condicionales restantes.
$l c4i cuadrado emp#rico debe ser mayor al valor cr#tico para considerar a la relacin estad#sticamente signi%icativa.
$C&1!do se p&ede &sar el c>i c&adrado'
'os datos deben consistir en mediciones independientes de casos seleccionados al azar
$l nmero de casos debe ser su%icientemente grande. $sto se e-presa en una relacin determinada entre el
tama&o de las %recuencias esperadas y el nmero de celdas de la tabla
U%ilidades del c>i c&adrado
Ve!%a2as
$s de utilidad para determinar si una relacin entre dos variables es estad#sticamente signi%icativa
:ientras que la di%erencia porcentual slo puede ser utilizada para variables dicotmicas y var#a de acuerdo al
orden de las categor#as3 c4i puede ser utilizado sin importar cuntas categor#as tengan las variables3 y sin
importar el orden de las mismas.
Adems3 es indi%erente a cual de las dos categor#as es la variable independiente (sim8trico,.
$s apto para variables nominales3 por eso3 es una prueba de distribucin libre.
Des/e!%a2as
$n muestras muy grandes el c4i puede producir un valor estad#sticamente signi%icativo aunque la relacin
entre las variables sea muy d8bil.
;4i cuadrado no puede a%irmar nada acerca de la %uerza de una relacin porque su valor var#a en %uncin de n
Pr&e"as de si.!i)icaci! para dos +&es%ras i!depe!die!%es: La pr&e"a c>i@c&adrado - los coe)icie!%es de
asociaci! deri/ados.
O
=tras pruebas de signi%icacin para relaciones de dos variables dicotmicas.
7i%erencia de medias
;uando tengo una variable independiente dicotmica y una variable dependiente intervalar
9i traba)o con muestras peque&as3 uso t en vez de z
>ambi8n se puede utilizar para variable independiente y dependiente dicotmicas
'as pruebas de signi%icacin3 a di%erencia de los coe%icientes3 no estn estandarizadas: var#an entre . e in%inito.
'a dis%ri"&ci! % de S%&de!%.
;uando se desconoce el valor de la desviacin t#pica poblacional3 4ay distintas alternativas:
;uando el tama&o 1 de la muestra es su%icientemente grande3 se puede sustituir la desviacin t#pica de la
poblacin por la desviacin t#pica de la muestra.
0ara tama&os peque&os de 13 se puede utilizar una prueba estad#stica alternativa3 que tiene una distribucin
muestral conocida: la distribucin t de 9tudent:
;omparndola con la %rmula de z se puede decir que los numeradores son id8nticos3 pero los denominadores
di%ieren en dos aspectos: o 4a sido reemplazado por s y ra#z de 1 4a sido sustituida por ra#z de 1 P 1.
'a variabilidad de t est relacionada con el tama&o de 13 siendo mayor para los valores ms peque&os de 1.
'as distribuciones t son sim8tricas3 pero son ms aplastadas que la curva normal. 9u colas se acercan al e)e de
abscisas con una menor pendiente3 sobre todo para los valores peque&os de 1.
A medida que se incrementa el valor de 13 la distribucin t se va apro-imando a la curva normal.
;uando 1 es mayor que 1.. se puede sustituir la distribucin t de 9tudent por la curva normal.
A!1lisis de /aria!6a: I!%rod&cci!. Variaci! %o%al# i!%ra.r&pos - e!%re.r&pos. El coe)icie!%e AE2B de
Correlaci! !o li!eal.
$s una t8cnica estad#stica dise&ada para comparar varias medias observadas.
Generalmente se utiliza cuando se est sometiendo a prueba una relacin entre una variable nominal u ordinal y una
variable de intervalo.
>iene una lgica similar a la di%erencia de medias3 pero a di%erencia de 8sta3 el anlisis de varianza puede utilizarse
para 6I que no son dicotmicas.
!ecibe este nombre porque la prueba de comparacin de las diversas medias se basa en el clculo de la varianza entre
esas medias.
'os supuestos estad#sticos que deben cumplirse son los mismos que se requieren para una prueba de di%erencia de
medias:
:uestras aleatorias simples
1ormalidad en la distribucin de los datos
'as varianzas de la poblacin deben ser iguales
9e generan grupos a partir de las categor#as de la 6I. 'os grupos contienen los punta)es de cada unidad de anlisis.
9e calculan las medias dentro de cada grupo y la media global para el con)unto de la poblacin de la muestra.
6A!IA;I@1: suma de los cuadrados de las desviaciones3 sin ser dividida por el nmero de casos (como en la
varianza,
DESVIACI4N INTRA :RUPO. SCD. Variaci! i!eCplicada.
9uma de los cuadrados de las desviaciones entre cada individuo y la media de su grupo.
Q
DESVIACI4N ENTRE :RUPOS. SCE. Variaci! eCplicada por el e)ec%o de la VI.
'a suma de los cuadrados de las desviaciones entre cada media de grupo y la media global
6A!IA;I@1 >=>A'
9i 4ay muc4a variacin dentro y poca entre3 la relacin es d8bil.
9i 4ay muc4a variacin entre y poca dentro3 la relacin es ms %uerte.
9e utiliza la desviacin intra grupo para obtener la primera estimacin de la varianza comn (varianza residual,. 'a
varianza residual indica la variabilidad de los individuos dentro de un determinado grupo. $sta variabilidad no es
debida a la in%luencia de la variable independiente3 sino que es debida a la propia variabilidad de los individuos (por
eso residual,.
'a desviacin entre grupos se utiliza para realizar la segunda estimacin de la varianza (varianza e-plicada,.
0ara la estimacin de la varianza basta con dividir por los grados de libertad apropiados las dos sumas de cuadrados
por las dos sumas de cuadrados por separado.
'os grados de libertad asociados con la suma total de cuadrados es 1 P 13 mientras que los grados de libertad
asociados con la suma total de los cuadrados es K P 13 siendo 1 P K los grados de libertad asociados con la variacin
intraIgrupos.
'as dos estimaciones de varianza ser#an
/o: 'as medias de cada subpoblacin son iguales.
/a: 'as medias de las subpoblaciones son di%erentes.
ETA: qu8 tan intensa es la relacin entre 6I y 67.
;unto de la variacin total es e-plicada.
9i 9;$ es .3 4ay independencia estad#stica.
9i 9;$ N 9;>3 $>A es igual a 13 y 4ay asociacin per%ecta.
ETA2: COE*ICIENTE DE DETERMINACI4N
$n qu8 medida la variacin de la 6I determina la variacin de la 67.
0ermite 4ablar de e-plicacin. $s ms e-igente que $>A.
El COE*ICIENTE DE INDETERMINACI4N es el complemento de $>A*
K*N 1 P $>A*
PRUE5A DE SI:NI*ICACI4N
'a varianza entra en )uego en el test de signi%icacin.
'a prueba estad#stica que se utiliza para contrastar la 4iptesis nula consiste en calcular el cociente entre la segunda
estimacin de la varianza y la primera (prueba < de 91$7$;=! de comparacin entre ambas estimaciones,.
;uando la 4iptesis nula sea cierta3 tendern a coincidir ambas estimaciones3 y el cociente se apro-imar al valor de
la unidad.
;uando las medias de las subpoblaciones di%ieran entre s#3 la segunda estimacin de la varianza ser mayor que la
primera3 y el cociente < ser mayor que la unidad.
'a ley de 9nedecor nos o%rece los valores de la distribucin muestral de <3 podemos saber para cada valor de <
obtenido3 el riesgo que corremos al rec4azar la 4iptesis nula.
2.0.0. I!s%r&+e!%os para /aria"les c&a!%i%a%i/as:
Correlaci!: Introduccin. 9upuestos del modelo de correlacin. $l coe%iciente de correlacin lineal r de 0earson.
Interpretacin del coe%iciente. $l coe%iciente de determinacin y el coe%iciente de indeterminacin. ;orrelacin y
causalidad.
1.
Correlaci!
Analizar el grado de correlacin de dos variables: variacin3 intensidad y direccin.
S&p&es%o de )or+a: tiene que ser lineal3 o tender a la linealidad. 0ara ello 4ay que realizar un diagrama de
dispersin.
9e representan los valores de las dos variables en un gr%ico.
La rec%a de +(!i+os c&adrados.
$s una de las in%initas rectas que se podr#an representar. $s la que en promedio se apro-ima me)or a todos los puntos
en el plano.
'as distancias de cada uno de los puntos se elevan al cuadrado y se suman. $l nmero absoluto obtenido a partir de
esta suma es el m#nimo valor en comparacin con las otras rectas posibles.
9iempre se puede trazar la !:;3 pero la prediccin va a estar relacionada a la distribucin de los datos observados.
9i trazamos las l#neas verticales que unen a cada uno de los puntos con la l#nea de m#nimos cuadrados3 y se elevan al
cuadrado tales distancias3 la suma resultante ser la menor posible de todas las sumas de cuadrados que se puedan
calcular en relacin a cualquier otra recta.
'a !:; es una simpli%icacin de una curva de regresin (una curva que pase por todos los puntos,3 pero es ms
generalizable.
9iempre tienen que estar presentes las medias de las dos variables. $l punto de coincidencia entre las dos variables
tiene que estar s# o s# en la recta.

Coe)icie!%e de correlaci! R de Pearso!
$s el coe%iciente de correlacin ms ampliamente di%undido para el anlisis de la asociacin entre dos variables. :ide
la asociacin lineal entre las variables.
$ste coe%iciente mide la cantidad de dispersin en relacin a la ecuacin lineal de m#nimos cuadrados.
9u recorrido oscila entre I1 (asociacin per%ecta negativa, 4asta 1 (asociacin per%ecta positiva,.
Al tratarse de una medida de relacin lineal3 que mide el grado de a)uste a la recta de m#nimos cuadrados3 no se puede
interpretar rN. como ausencia total de relacin3 ya que las variables - e y pueden estar %uertemente asociadas en
%orma curvil#nea y tener3 sin embargo3 un valor r igual a ..
0or eso3 antes de calcular r conviene representar en un sistema de coordenadas cartesiano los valores de - e y para
observar si su distribucin apro-imada es lineal o curvilineal.
;uando la distribucin de los puntos se apro-ima a la l#nea recta3 el valor de r se encontrar pr-imo a la unidad.
<rmula: $l coe%iciente de correlacin de 0earson es el cociente entre la covariacin de H e F y la ra#z cuadrada del
producto de la variacin en H de la variacin de F.
Re.resi!
!egresin: Introduccin. !epresentacin gr%ica de la nube de puntos: !elaciones lineales y curvilineales. 'a
ecuacin de regresin de la muestra y su a)uste por el m8todo de m#nimos cuadrados. $valuacin de la ecuacin de
regresin: el coe%iciente de determinacin y su interpretacin. "tilizacin de la ecuacin de regresin: $stimacin o
prediccin. $rrores de estimacin.
!egresin: prediccin de los resultados de una de las dos variables3 conocidos los resultados en la otra.
$sto est relacionado con los ob)etivos de m-ima de las ciencias: descubrir3 decribir3 e-plicar y predecir %enmenos.
$l modelo de regresin se usa para estimar y predecir valores.
9i 4ay ms correlacin3 ser ms precisa la regresin3 porque la linealidad de la relacin es mayor.
0ara realizar este tipo de prediccin3 4ay que tener en cuenta la %orma en que las puntuaciones de la variable
independiente in%luyen en la distribucin de las puntuaciones de la variable dependiente.
11
;mo averiguar la recta.
'a %orma ms simple y clara de e-presar una relacin entre variables es una ecuacin matemtica.
'a ecuacin con t8rmino constante responde a la %orma ms general de ecuacin de una recta.
yN a J b-
;ualquier relacin lineal entre dos variables se puede e-presar con esta %rmula
A: ordenada de origen
?: cuant#a en que var#a F cuando H var#a una unidad. 0endiente de la recta. ;uando es positivo3 pendiente positiva.
;uando es negativo3 recta decreciente.
;onocida la e-presin matemtica que describe la %orma y la direccin de la l#nea o curva de las medias se pueden
realizar predicciones muy e-actas.
$n 9ociolog#a usualmente no se conoce con precisin la curva o l#nea que relaciona ambas variables.
Al no disponer de mediciones precisas para sus variables3 el socilogo suele conceder cierta variabilidad a la
ecuacin de regresin y pre%iere pensar en t8rminos de medias y varianzas de la distribucin de F para cada H3 en
lugar de considerar la distribucin precisa de los valores de F a partir de H.
$l modelo de regresin estudiado es asim8trico.
/ay distintas maneras de calcular los parmetros de a y b.
'a ms sencilla3 incluye las medias de H e F3 las varianzas y la covarianza (variacin con)unta,
Para co!siderar el +odelo se pres&po!e:
'inealidad de la ecuacin de regresin
7istribucin de los valores y en cada valor H se distribuyen en %orma normal
'as varianzas de las distribuciones de F son las mismas para cada valor de H.
:ediante la ecuacin de regresin por m#nimos cuadrados3 se pueden predecir las puntuaciones en la variable
dependiente F con mayor precisin que la que se lograr#a con la utilizacin de la media global de F.
'a recta de regresin nos ayuda a Be-plicarC parte de la variacin en la variable dependiente3 quedando sin e-plicar el
resto de la variacin de F.
'a variacin total de F en relacin a la media ser igual a la suma de la variacin e-plicada J la variacin no
e-plicada.
Coe)icie!%e R2 DE DETERMINACI4N
$l cuadrado del coe%iciente r de 0earson e-presa el grado en que la variacin de una variables es e-plicada por la
otra3 y viceversa3 ya que el modelo es sim8trico.
>est de signi%icacin
< de 9nedecor
;omo para este caso siempre 4ay una variable independiente porque es correlacin lineal simple3 y no mltiple3 la
%rmula es: !elacin entre el anlisis de varianza y correlacin lineal a partir del coe%iciente de determinacin
$>A* es mayor o igual a !*
0uede ser igual cuando 4ay 1 en !*
0uede ser igual cuando es . en $>A*3 porque no 4ay ningn tipo de relacin y no necesariamente lineal como en !*
$>A* P !* indica la parte de la relacin que no es lineal
1*
2.D. A!1lisis de Relacio!es M&l%i/ariadas# $Por ,&; s&cede! los )e!+e!os'
*.5.1. I!s%r&+e!%os para /aria"les c&ali%a%i/as: $l anlisis multivariado como apro-imacin a la lgica del dise&o
e-perimental. Anlisis multivariado y e-plicacin en ciencias sociales. ;lasi%icacin de los diversos instrumentos:
m8todos de interdependencia y dependencia.
'a lgica e-perimental controla variables. 9e %orman dos grupos: uno e-perimental y otro de control. 9e aplica un
est#mulo al grupo e-perimental y se miden nuevamente los grupos3 cote)ando sus di%erencias.
0ero en ;s 9ociales la e-perimentacin pone en )uego cuestiones 8ticas3 no 4ay una capacidad de controlar la variable
independiente3 y adems no es posible 4omogeneizar a los grupos.
9in embargo3 se puede tener un control estad#stico de la variable introduciendo una tercera variable de control.
:ientras ms variables podamos incluir y separarlas para ver su in%luencia3 me)or vamos a poder e-plicar.
Relaci! e!%re %res o +1s /aria"les !o+i!ales & ordi!ales: El +odelo La6ars)eld. ;onte-to 4istrico de su
desarrollo. $l papel de los %actores de prueba. $squema general para la relacin entre tres dicotom#as. $l papel del
orden temporal. 'os principales tipos de elaboracin.
'azar%eld
0rocedimiento multivariado de control por parciales. $s un modelo pensado para variables no num8ricas3 que trata de
reproducir la lgica e-perimental.
0ermite discriminar los di%erentes papeles lgicos de cada variable3 4asta donde ello es posible estad#sticamente3
cualquiera sea la naturaleza de las variables y las relaciones.
$ntrega observaciones desagregadas y estas3 a partir de ciertas asunciones tericas3 posibilitan las in%erencias
e-plicativas que procura el investigador.
"na relacin entre dos variables se puede descomponer en relaciones parciales (tantas como la cantidad de categor#as
que tenga la variable de control,. 7e este modo3 testeo en qu8 medida la relacin se altera cuando la observo en los
parciales determinados por las 6;.
'a ecuacin de 'azar%eld.
$-presin ecuacional de la suma ponderada en que 'azar%eld descompone la relacin originaria cuando ella es
controlada por t.
'a relacin original como la suma de las relaciones parciales el producto de las relaciones marginales.
'os parciales matriciales deben ser ponderados por la proporcin de n que corresponde al n total.
7e este modo3 revelo lo que estaba oculto (rel parciales y marginales, y puedo reconocer cmo se llega a la relacin3
y evaluar cmo actan los distintos elementos.
'a 4iptesis nula ser#a la a)enidad: la 6; no in%luye en la !=.
1o deber#amos encontrar modi%icaciones en la != en cada uno de los parciales.
0ero la 6; puede tener algn peso: cuando los valores parciales cambian3 4ay una alteracin en la !=.
P&ede! darse dos %ipos de ela"oracio!es: por parciales - por +ar.i!ales
0or parciales: la relacin disminuye en los marginales y aparece con ms %uerza en los parciales.
0or marginales: la relacin disminuye en los parciales y aparece con ms %uerza en los marginales
>ambi8n 4ay que tener en cuenta la posicin de la variable de control.
Antecedente: anterior en el tiempo a la 6I
Interviniente: la variable de control se ubica en el medio de la relacin
'os modos de elaboracin
12
0arcial :arginal
>
antecedente 0A
$speci%icacin
:A
$-plicacin
>
interviniente 0I
condicin3
contingencia
:I
Interpretacin3
Intermediacin
'as 6; permiten ver si necesito replantear mi relacin3 porque puede ser que est8 actuando una tercera variable de
manera oculta3 de manera que la relacin original es slo aparente.
0rimero3 elaboro las relaciones parciales de acuerdo a las categor#as de la 6; (los totales de cada cuadro son
parciales3 se reparten en las categor#as de la 6;,.
$ntonces3 observo que pasa con esas relaciones3 para lo que utilizo los coe%icientes de asociacin (siempre tengo que
usar los mismos,.
9i se mantienen iguales3 4ay a)enidad3 y no es necesaria la elaboracin por marginales. 0uedo mantener mi 4iptesis.
$ntonces puedo tomar otras 6; y ver qu8 sucede.
9i una casi desaparece y la otra sube muc4o3 se trata de una especi%icacin. ;uando es muy determinista se 4abla de
condicin (si est esta condicin se da3 sino no,.
$n este caso tambi8n la relacin desaparece en los marginales.
9i la relacin ba)a en ambos parciales3 es una elaboracin por marginales.
'a 6; puede ser entonces antecedente (e-plicacin, o interviniente (intermediacin,.
"na relacin de tipo :A (e-plicacin, desenmascara una aparente relacin entre dos variables.
$s un caso de relacin esprea3 la != se invalida porque lo que daba por sentado al principio3 cuando 4ago actuar a la
6;3 desaparece. 'a variable de control actuaba oculta.
Erra!do!ea
Los papeles l.icos posi"les de la /aria"le de co!%rol
'a variable t puede resultar la verdadera variable determinante o independiente. 0uede atribuirse al e%ecto o
%enmeno estudiado aquella a partir de la cual es previsible.
> puede participar en la relacin especi%icndola o condicionndola3 pero no produciendo por si sola el e%ecto
en que consiste la variable dependiente (I1>$!6I1I$1>$,
> es conte-tual cuando los di%erentes valores de la variable de control cambian el sentido de la relacin
original
> es intermediaria cuando se constituye en trasmisora de la relacin principal
La co!%ri"&ci! de las +a.!i%&des de las relacio!es para i!%erpre%ar el papel l.ico de la /aria"le de co!%rol
'a interpretacin del papel a atribuir a la variable de control en el )uego total de las tres variables constituye una tarea
conceptual que implica responsabilidad terica.
'as magnitudes obtenidas en las medidas de las di%erentes relaciones bivariadas simples y controladas involucradas
en este tipo de anlisis3 consideradas en sus comparaciones mutuas3 constituyen poderosos indicios instrumentales
para la tarea interpretativa.
'a relacin originaria es realmente la relacin principal si las mayores magnitudes se mantienen a nivel de los
parciales3 especialmente en relacin con el producto de los marginales.
$ste tipo de anlisis tiene cierto grado de inspiracin en el dise&o e-perimental.
;uando en un grupo e-perimental aparecen di%erencias en relacin con el correspondiente grupo testigo en lo que
15
tiene que ver con un determinado e%ecto3 luego de que el primero 4a sido sometido a un cierto est#mulo no e-puesto
al otro3 se dice que la variable que representa dic4o est#mulo no tiene nada que ver con el e%ecto indagado3 es a)ena a
8l.
'os parciales son asimilables al grupo e-perimental y al grupo testigo en la e-posicin al est#mulo.
;uando los parciales se mantienen iguales entre si e iguales a la relacin originaria3 debe concluirse que la
variable de control (t, es totalmente a)ena a la relacin original.
0or el contrario3 cualquiera sea lo que ocurra a nivel de los marginales3 cuando al interior de las matrices
parciales resultantes del desagregado por la variable de control3 entre todas o algunas de ellas se mani%iesten
di%erentes magnitudes de relacin entre las variables de la relacin originaria3 deber concluirse que la
variable de control est inter%iriendo a la relacin originaria (interviniente,
;uando alguno o algunos de los parciales elevan su di%erenciacin para con otro u otros al grado de
desaparecer3 ser trata de una Bespeci%icacinC que realiza la variable t3 se convierte en condicin.
An manteni8ndose iguales las magnitudes de los parciales entre s#3 puede ocurrir que la variable de control t
est8 )ugando un papel importante en la relacin entre las variables originales.
'a similitud de la magnitud de los parciales3 sin embargo3 resulta colocarse claramente por deba)o de la de la
relacin originaria. 9er necesario que el producto de los marginales sea di%erente de cero: e-actamente igual
a la di%erencia entre los equiparados parciales y la relacin originaria. $n este caso3 debe in%erirse que t no est
interviniendo para alterar la relacin entre - e y.
$-isten dos v#as de determinacin complementarias:
7irecta (-y, cuya cantidad se e-presa en la suma ponderada de los parciales
Indirecta (a trav8s de t, que se e-presa en el producto de los marginales
6ariable conte-tual: se mani%iesta en el desagregado de los parciales. 'a relacin originaria es cero o pr-ima
y cada parcial tiene signos contrarios3 que se compensan. $sto implica inversin del e%ecto3 es decir3 cambio
del sentido de la != e-presado en una alteracin de su signo
7esaparicin de la relacin original en los parciales
$sto puede deberse a que la != se deb#a a que - e y son e%ectos de t (!= esprea,
= a que toda la != pase a trav8s de > (intermediaria,
UNIDAD 0 : El ANALISIS CUALITATIVO de los DATOS
2.1. $l traba)o con los datos3 distintas etapas: del registro a la codi%icacin. Identi%icacin y construccin de
categor#as3 proceso inductivoIdeductivo.
2.*. 0rocedimientos en el anlisis de entrevistas3 observacin3 t8cnicas grupales3 estudios biogr%icos y el anlisis de
contenido cualitativo.
Los da%os c&ali%a%i/os
;onsideramos un dato como una elaboracin3 de mayor o menor nivel3 realizada por el investigador o por cualquier
otro su)eto presente en el campo de estudio3 en la que se recoge in%ormacin acerca de la realidad interna o e-terna a
los su)etos y que es utilizada con propsitos indagativos. $l dato soporta una in%ormacin sobre la realidad3 implica
una elaboracin conceptual de esa in%ormacin y un modo de e-presarla que 4ace posible su conservacin y
comunicacin.
A!1lisis de da%os
;on)unto de manipulaciones3 trans%ormaciones3 operaciones3 re%le-iones3 comprobaciones que realizamos sobre los
datos con el %in de e-traer signi%icado relevante en relacin a un problema de investigacin.
Analizar datos supone e-aminar sistemticamente un con)unto de elementos in%ormativos para delimitar partes y
descubrir las relaciones entre las mismas y las relaciones con el todo. >odo anlisis persigue alcanzar un mayor
conocimiento de la realidad estudiada y3 en la medida de lo posible3 avanzar mediante su descripcin y comprensin
4acia la elaboracin de modelos conceptuales e-plicativos.
$l anlisis de los datos cualitativos consiste en tratamientos de los datos que se llevan a cabo generalmente
preservando su naturaleza te-tual3 poniendo en prctica tareas de categorizacin y sin recurrir a las t8cnicas
estad#sticas.
1+
Di)ic&l%ades para el a!1lisis
$l carcter polis8mico de los datos3 su naturaleza predominantemente verbal3 su irrepetibilidad o el gran volumen de
datos que suelen recogerse en el curso de la investigacin3 4acen que el anlisis posea di%icultades y comple)idades3
;uando se mane)an datos cualitativos3 no se cuenta con convenciones claras que orienten el modo de llevar a cabo el
anlisis3 'os modos utilizados se 4an venido caracterizando por su gran variedad y por su singularidad3 que los 4an
4ec4o dependientes del estilo y la e-periencia de cada investigador.
$l anlisis de datos cualitativos representa una di%icultad para el investigador debido a que no es posible localizarlo
en una %ase precisa del proceso de investigacin.
7esde posiciones positivistas podr#a apreciarse una linealidad temporal en el proceso de investigacin: planteamiento
del problema3 %ormulacin de una 4iptesis3 recogida de datos3 anlisis3 interpretacin y redaccin de in%orme.
$l carcter lineal se rompe en la investigacin cualitativa3 en la que los distintos momentos del proceso indagativo se
superponen3 se entrelazan3 se reiteran a lo largo de la investigacin.
$l anlisis de datos se ve determinado y determina el problema de investigacin3 y se realiza de manera simultnea a
otras tareas3 tales como la recogida de datos o la redaccin del in%orme.
0odemos ver a la recogida de datos como una %orma primitiva de anlisis3 puesto que representa algn tipo de
elaboracin sobre la realidad.
'a intercone-in de los procesos de recogida y anlisis en la investigacin se 4a concretado metodolgicamente3
dentro de la tradicin cualitativa:
$strategias de seleccin secuencial (Geotz y 'e ;ompte, en las que la progresiva construccin terica
determina la recogida de datos. $ntre las %ormas de seleccin secuencial se encuentran la seleccin de casos
negativos3 que re%utan o contradicen un concepto y la seleccin de casos discrepantes que permiten
modi%icarlos
$l muestreo terico3 decidiendo qu8 datos recoger y dnde recogerlos de cara a desarrollar la teor#a emergente
'a seleccin de implicantes3 que posibilita la comprobacin de teor#as a partir de casos seleccionados en
%uncin de las implicaciones de esas teor#as (;ampbell,
El proceso .e!eral de a!1lisis
1. Red&cci! de da%os
$n el transcurso de un estudio cualitativo3 el investigador recoge abundante in%ormacin acerca de la realidad sobre la
que centra su traba)o. 'a reduccin de datos es la simpli%icacin3 el resumen3 la seleccin de la in%ormacin para
4acerla abarcable y mane)able.
A9 Separaci! e! &!idades.
'os criterios para dividir la in%ormacin en unidades pueden ser muy diversos. ;onsiderando que los datos aparecen
en %orma de te-tos3 el criterio aplicable para la segmentacin podr#a encontrarse dentro de alguno de los siguientes
tipos:
$spaciales
>emporales
>emticos
Gramaticales
;onversacionales
9ociales
:s de un tipo de criterios podr#an combinarse a la 4ora de separar las unidades en un te-to. $l criterio temtico es el
ms e-tendido3 y resulta ms valioso en el anlisis de los datos cualitativos.
59 Ide!%i)icaci! - clasi)icaci! de &!idades
;ategorizamos y codi%icamos un con)unto de datos. $-aminamos las unidades de datos para identi%icar en ellas
determinados componentes temticos que nos permitan clasi%icarlas en una y otra categor#a de contenido.
'a categorizacin 4ace posible clasi%icar conceptualmente las unidades que son cubiertas por un mismo tpico. 'as
categor#as pueden re%erirse a situaciones y conte-tos3 actividades3 relaciones entre personas3 comportamientos3
opiniones3 sentimientos3 perspectivas de un problema3 m8todos3 procesos. $s una tarea simultnea a la separacin en
unidades cuando esta est8 atendiendo a criterios temticos.
1L
'a codi%icacin no es ms que la operacin concreta por la que se asigna a cada unidad un indicativo (cdigo, propio
de la categor#a en la que la consideramos incluida. $s el proceso %#sico3 manipulativo mediante el cual de)amos
constancia de la categor#a realizada.
'os cdigos que representan a las categor#as son marcas que a&adimos a las unidades de datos3 para indicar la
categor#a a la que pertenecen.
'as categor#as pueden estar prede%inidas por el analista3 o por el contrario3 pueden surgir a medida que se analizan los
datos.
$n la prctica3 es 4abitual que la codi%icacin se 4aga recurriendo a procedimientos inductivoIdeductivos. 9e parte de
categor#as amplias de%inidas a priori3 a partir de las cuales se van introduciendo modi%icaciones y ampliaciones que
permiten la adaptacin al con)unto de datos al que estn siendo aplicadas. 7urante la codi%icacin es posible constatar
que determinados cdigos podr#an 4aber sido agrupados en uno solo3 o por el contrario que cabr#a dividir uno de ellos
esotros diversos3 que ciertas categor#as podr#an 4aber sido denominadas de otro modo3 o que se podr#an suprimir.
;aracter#sticas de categor#as (cuali,
=b)etividad: deben resultar inteligibles para distintos codi%icadores
0ertinenciaR deben ser relevantes en relacin a los ob)etivos del estudio y adecuadas al propio contenido
analizado.
C9 S(!%esis - a.r&pa+ie!%o
'a identi%icacin y clasi%icacin de elementos estn estrec4amente unidos a la s#ntesis3
;uando categorizados estamos ubicando di%erentes unidades de datos ba)o un mismo tpico o concepto terico. $n el
anlisis de datos3 la s#ntesis conceptual va acompa&ada por un agrupamiento %#sico de las unidades que %orman parte
de una misma categor#a.
;uando sintetizamos en una metacategor#a la in%ormacin contenida en varias categor#as que tienen algo en comn3 o
cuando de%inimos metacdigos que agrupan a un con)unto de cdigos.
2. Disposici! - %ra!s)or+aci! de da%os
0ara llegar a e-traer conclusiones a partir de los datos3 es preciso presentarlos o disponerlos de algn modo ordenado.
"na disposicin es un con)unto organizado de in%ormacin3 presentada en alguna %orma espacial ordenada3 abarcable
y operativa de cara a resolver las cuestiones de investigacin.
;uando la disposicin de datos conlleva adems un cambio en el lengua)e utilizado para e-presarlos3 4ablamos de
una trans%ormacin de los datos.
Gr%icos o diagramas3 de%inidos como representaciones gr%icas de las relaciones entre conceptos
:atrices: tablas de doble entrada en cuyas celdas se alo)a una breve in%ormacin verbal3 de acuerdo con los
aspectos especi%icados por %ilas y columnas
9istema de redesR clari%icar y presentar las distinciones que delimitan a las diversas categor#as consideradas en
el anlisis del material cualitativo3 las cuales a su vez pueden estar subdivididas.
0. O"%e!ci! de res&l%ados - co!cl&sio!es
$nsamblar de nuevo los elementos di%erenciados en el proceso anal#tico para costituir un todo estructurado y
signi%icativo. 'as conclusiones son los resultados3 los productos de la investigacin y la interpretacin que 4acemos
de los mismos.
"na de las principales 4erramientas intelectuales en el proceso de obtencin de conclusiones es la comparacin.
0ermite destacar las seme)anzas y di%erencias entre las unidades incluidas en una categor#a3 y 4ace posible la
%ormulacin de sus propiedades %undamentales3 a partir de las cuales puede llegarse a una de%inicin3 ilustracin y
veri%icacin de esa categor#a.
Algunas estrategias para la interpretacin de los resultados y su integracin con marcos ms amplios ser#an:
;onsolidacin terica: con%rontar los resultados obtenidos con los marcos tericos desarrollados
originalmente3 modi%icando estos para intentar que se a)usten ms a los datos
Aplicacin de otras teor#as: bsqueda de marcos ms generales en los que integrar los datos3 4aciendo posible
la generalizacin de los resultados
"so de met%oras y analog#as: medios tiles para establecer cone-iones entre temas aparentemente no
1M
relacionados3 o conectar los resultados a la teor#a
9#ntesis de los resultados con los obtenidos por otros investigadores.
"na vez alcanzadas las conclusiones3 es necesario veri%icar esas conclusiones3 es decir3 con%irmar que los resultados
corresponden a los signi%icados e interpretaciones que los participantes atribuyen a la realidad.
$l concepto de validez 4a sido usado en una variedad de %ormas en la literatura sobre metodolog#a.
6alidez interna: indicador de la apro-imacin de las conclusiones de un estudio a la realidad.
6alidez e-terna: posibilidades de generalizar los resultados a otras poblaciones o conte-tos.
6eri%icar las conclusiones de un estudio signi%ica comprobar el valor de verdad de los descubrimientos realizados3
comprobar su validez.
$n los estudios cualitativos3 la estimacin de la validez es menos precisa que en la investigacin cuantitativa3
basndose en )uicios sobre la correspondencia entre los 4allazgos y la realidad.
Ta-lor - 5o.da!
El %ra"a2o co! los da%os. A!1lisis de los da%os e! la i!/es%i.aci! c&ali%a%i/a
Es%&dios descrip%i/os - %ericos.
Es%&dios descrip%i/os: se caracterizan por un m#nimo de interpretacin y conceptualizacin. $stn redactados de
modo tal que permiten a los lectores e-traer sus propias conclusiones y generalizaciones a partir de los datos.
$studios clsicos de la $scuela de ;4icago.
/istorias de vida: el protagonista narra su 4istoria en sus propias palabras.
Es%&dios %ericos: se orientan 4acia el desarrollo o veri%icacin de la teor#a sociolgica. $l propsito de los estudios
tericos consiste en comprender o e-plicar rasgos de la vida social que van ms all de las personas y escenarios
estudiados en particular. 'os investigadores se&alan activamente lo que es importante. "tilizan los datos descriptivos
para ilustrar sus teor#as y conceptos y para convencer a los lectores de que lo que ellos dicen es verdad.
Glaser y 9trauss distinguen dos tipos de teor#as:
Las s&s%a!ciales: se relacionan con un rea sustancial o concreta de indagacin (e): escuelas3 prisiones3
delincuencia )uvenil,
Las )or+ales: se re%ieren a reas conceptuales de indagacin3 tales como los estigmas3 las organizaciones
%ormales3 la socializacin3 la desviacin.
Desarrollo - /eri)icaci! de &!a %eor(a
0ara Glaser y 9trauss3 la investigacin cualitativa3 lo mismo3 que los estudios cuantitativos3 puede y debe ser utilizada
con el %in de desarrollar y veri%icar o poner a prueba proposiciones sobre la naturaleza de la vida social. $l
procedimiento de la induccin anal#tica 4a sido el principal empleado con tal ob)eto. Aunque la mayor parte de los
investigadores adoptan en sus estudios elementos de ambos en%oques3 al considerar el anlisis de los datos
cualitativos resulta til di%erenciar la generacin de la teor#a de la veri%icacin de la teor#a3 con los respectivos
recursos de la teor#a %undamentada y la induccin anal#tica.
Teor(a )&!da+e!%ada
$s un m8todo para descubrir teor#as3 conceptos3 4iptesis y proposiciones partiendo directamente de los datos3 y no
de supuestos a priori3 de otras investigaciones o de marcos tericos e-istentes.
G y 9 proponen dos estrategias principales para desarrollar teor#a %undamentada:
El +;%odo co+para%i/o co!s%a!%e3 por el cual el investigador simultneamente codi%ica y analiza datos para
desarrollar conceptos. :ediante la comparacin continua de incidentes espec#%icos de los datos3 el
investigador re%ina esos conceptos3 identi%ica sus propiedades3 e-plora sus interrelaciones y los integra en una
teor#a co4erente
M&es%reo %erico3 en el que el investigador selecciona nuevos casos a estudiar segn su potencial para ayudar
1O
a re%inar o e-pandir los conceptos y teor#as ya desarrollados.
Al generar teor#a %undamentada3 los investigadores no tratan de probar sus ideas3 sino slo de demostrar que son
plausibles. Aducen que el criterio clave para evaluar las teor#as consiste en e-aminar si se a)ustan y %uncionan.
0or a)uste entendemos que las categor#as deben ser %cilmente aplicables a los datos que se estudian y surgir de ellos.
$l %uncionamiento supone que deben ser signi%icativamente apropiadas y capaces de e-plicar la conducta en estudio.
La i!d&cci! a!al(%ica
$s el procedimiento para veri%icar teor#as y proposiciones basadas en datos cualitativos. 9u %inalidad consiste en
identi%icar proposiciones universales y leyes causales.
0asos:
1. 7esarrollar una de%inicin apro-imada del %enmeno a e-plicar
*. <ormular una 4iptesis para e-plicar dic4o %enmeno
2. $studiar un caso para ver si la 4iptesis se a)usta
5. si la 4iptesis no e-plica el caso3 re%ormularla o rede%inir el %enmeno
+. ?uscar activamente casos negativos que re%uten la 4iptesis
L. ;uando se encuentren casos negativos3 re%ormular la 4iptesis o rede%inir el %enmeno
M. ;ontinuar 4asta que se 4a puesto a prueba adecuadamente el %enmeno3 e-aminando una amplia gama de
casos.
Al dirigir la atencin 4acia los casos negativos3 la induccin anal#tica obliga al investigador a re%inar y matizar las
teor#as y proposiciones.
$n contraste con el en%oque de la teor#a %undamentada3 la induccin anal#tica tambi8n ayuda a los investigadores a
plantear la cuestin del potencial de generalizacin de sus resultados. 9i los investigadores pueden demostrar que 4an
e-aminado una su%icientemente amplia gama de casos de un %enmenos3 y buscado espec#%icamente casos negativos3
estn en condiciones de de%ender me)or la naturaleza general de lo que 4ayan 4allado.
Eor!"li%
'as 4istorias de vida son un rastreo detallado de la trayectoria vital de una persona. 9e elige una o varias personas
protot#picas del tema que se pretende abordar.
$l relato de vida son narraciones biogr%icas acotadas al ob)eto de estudio de un investigador. 9e centran en un
aspecto particular.
Modalidades de a!1lisis de los rela%os de /ida:
?ertau- se&ala dos %ormas bsicas que pueden adoptarse en la realizacin del anlisis:
'a modalidad 4ermen8utica3 que consiste en el descubrimiento de los signi%icados que transmiten las personas
que relatan sus vidas
:odalidad etnosociolgica3 que consiste en acceder a trav8s de los relatos a los re%erentes contenidos en ellos3
que dan cuenta de relaciones3 normas y procesos que estructuran la vida social.
$n relacin con esto mismo3 9antamarina y :arinas a%irman que e-isten tres modalidades anal#ticas:
1. 'a perspectiva estructuralista3 realizacin de un recorrido lo ms e-4austivo posible de la pluralidad de
situaciones e in%ormantes pertinentes para mapear el campo de estudio.
*. $l modelo 4ermen8utico3 que consiste en el anlisis en pro%undidad de uno o varios te-tos3 centrndose en el
te-to mismo con el propsito de descubrir los sentidos que estn ocultos en 8l.
2. 'a comprensin esc8nica. $n todo relato se actualizan tres tipos de escenas: las vividas en el pasado (conte-to
sociobiogr%ico,3 en el presente (relaciones actuales, y en la entrevista (conte-to de interaccin,
Di+e!sio!es ide!%i)ica"les e! los rela%os de /ida
1Q
!ealidad 4istrico emp#rica que constituye el tras%ondo en el que se desarrolla el relato de vida
!ealidad ps#quica: los contenidos semnticos con que el su)eto describe su itinerario biogr%ico
!ealidad discursiva del relato tal como se produce en la entrevista
E!)o,&es e! el a!1lisis de los rela%os de /ida
1. El e!)o,&e de la >is%oria !a%&ral: reproducir los 4ec4os ob)etivos que constituyen la vida de las personas.
'as vidas de las personas son planteadas como construcciones racionales que se e-tienden a lo largo del
tiempo3 por lo cual lo que se busca es desentra&ar las razones que las ordenan.
*. El a!1lisis co+pre!si/o de 5er%o&C: identi%icacin de los indices: aspectos que son reconocidos por los
autores de los relatos ySo el investigador como 4ec4os que 4an marcado la e-periencia de vida3 con respecto a
los cuales se plantean en el anlisis interrogantes relativos a su signi%icacin sociolgica. B0unto de vira)eC3
momentos vitales identi%icados como una encruci)ada a partir de la cual el itinerario biogTra%ico tom un
rumbo distinto o inici una nueva etapa.
$l anlisis comprensivo pone especial 8n%asis en la consideracin del conte-to socio4istrico en el que se
desenvuelven las vidas de las personas. $sto implica tomar en cuenta la dimensin temporal como aspecto
clave en la interpretacin de los datos. 'a conte-tualizacin socio4istrica de los escenarios microsociales en
los que se desenvuelven las vidas personales es uno de los ob)etivos centrales del anlisis comprensivo.
0. El a!1lisis %e+1%ico
'a identi%icacin de los temas presentes en las 4istorias de vida es uno de los procedimientos ms usuales.
'ectura de los relatos identi%icacin de ncleos temticos3 organizacin de los datos segn la relacin que se
puede establecer entre los ncleos.
5. El a!1lisis i!%erpre%a%i/o: los relatos construidos por los su)etos son interpretados por el cient#%ico social3
quien 4ace de cada caso de estudio singular pero a la vez general3 en la medida en que se apoya en 8l para
crear nuevos desarrollos tericos.
F. El a!1lisis de la ide!%idad de De+ar6iere - D&"ar
'a %ragmentacin de lo social en mltiples e-periencias posibles y la %ragmentacin de la identidad individual
tambi8n en mltiples aspectos3 no siempre englobados co4erentemente en un yo. /acen que los relatos de los
individuos deban ser interpretados. Analizar los mecanismos de produccin de sentido3 comparar las palabras
di%erentes3 desnudar las oposiciones y las correlaciones ms estructurantes.
>odo relato puede ser analizado en tres niveles di%erentes3 que se articulan necesariamente entre s#:
$l nivel de las secuencias en las que se despliegan los episodios del relato
$l nivel de los actuantes3 los persona)es que )uegan un rol en el relato
$l nivel de los argumentos proporcionados por los entrevistados para de%ender sus puntos de vista
$l ob)etivo de este tipo de anlisis es clasi%icar en un modo comprensivo las estructuras de relatos para poner
en evidencia sus seme)anzas y sus di%erencias. $l anlisis estructural se propone poner en evidencia las
relaciones entre ciertas dimensiones y las tensiones entre ellas3 y as# poder evidenciar los contenidos
impl#citos3 las grandes oposiciones3 las estructuraciones %undamentales que organizan la relacin de la persona
con el mundo y aclarar la organizacin de su estructura socioa%ectiva.
Marradi
$l anlisis de contenido es una t8cnica de interpretacin de te-tos que se basa en procedimientos de descomposicin
y clasi%icacin de estos.
$n la actualidad se suele distinguir entre el anlisis de contenido clasico3 %iel a la cuanti%icacin de los aspectos
mani%iestos del te-to3 y el anlisis de contenido cualitativo3 desarrollado a partir de los a&os oc4enta3 que se basa en
un con)unto de t8cnicas destinadas a interpretar su sentido latente u oculto.
$l anlisis de contenido se presenta a4ora a trav8s de tres tipos:
Te+1%ico se centra en la presencia de t8rminos3 con independencia de las relaciones que sur)an entre ellos.
'as t8cnicas ms utilizadas son las listas de %recuencias3 la identi%icacin y clasi%icacin temtica3 y la
bsqueda de palabras en conte-to.
Se+1!%ico: pretende ante todo estudiar las relaciones entre los temas tratados en un te-to3 para esto se de%ine
cierta estructura signi%icativa de relacin y se consideran todas las ocurrencias que concuerdan con ella
A!1lisis de redes: se centra en la ubicacin relativa de ciertos componentes en el te-to3 asumiendo que la red
*.
l8-ica ideolgicamente signi%icativa que impregna el discurso se identi%ica sobre la base de la reiteracin y da
como resultado un esquema de organizacin semntica de este discurso en %orma de red.
$l anlisis de contenido cualitativo no niega las venta)as del cuantitativo3 al que suele tomar como una etapa inicial3
slo que busca enriquecerlo a trav8s de procedimientos interpretativos3 tratando de ir ms all de los aspectos
mani%iestos a trav8s de la consideracin del contenido latente y del conte-to en el que se inscribe un determinado
te-to.
"na vez de%inido el con)unto de te-tos3. 'a cuestin es construir un esquema de codi%icacin. $sto se puede 4acer a
priori3 cuando las categor#as que orientarn el anlisis se de%inen de antemano3 a partir de una opcin terica3 o
siguiendo un recorrido emergente. $sta ltima modalidad se encuentra muc4o ms di%undida3 y consiste en la
construccin de una suerte de cuestionario estandarizado e- post a partir de una e-ploracin preliminar de los te-tos.
9e trata de identi%icar las respuestas impl#citas en el te-to a un cuestionario imaginario al cual no responde3 pero que
podr#a 4aber respondido. $l esquema de codi%icacin incluir todas estas preguntas imaginarias y las distintas rutas q
aparecen en los te-tos.
*1