Вы находитесь на странице: 1из 103

APUNTES DE

METODOLOGA Y TCNICAS DE INVESTIGACIN


Carmen Lafuente
Carlos Poza

NDICE:

MDULO 1: METODOLOGA Y DISEO DE UNA INVESTIGACIN CIENTFICA


Captulo 1. Mtodo cientfico y tipologa
Captulo 2. Diseo de una investigacin cientfica
MDULO 2: INVESTIGACIN CUALITATIVA
Captulo 3. Introduccin a la metodologa y tcnicas cualitativas
Captulo 4. Entrevistas en profundidad
Captulo 5. Grupos de discusin
Captulo 6. Mtodo Delphi

MDULO 3: INVESTIGACIN CUANTITATIVA


Captulo 7. Introduccin a la metodologa y tcnicas cuantitativas
Captulo 8. Encuesta por muestreo
Captulo 9. Tratamiento bsico de datos
Captulo 10. Inferencia estadstica y contrastes de de hiptesis
Captulo 11. ANOVA y regresin lineal mltiple
Captulo 12. Anlisis discriminante y regresin logstica
Captulo 13. Anlisis factorial
Captulo 14. Anlisis cluster
Captulo 15. Modelos de ecuaciones estructurales

MDULO 1:
METODOLOGA Y DISEO
DE UNA INVESTIGACIN CIENTFICA

CAPTULO 1
Mtodo cientfico y tipologa

1.

Introduccin

Las ciencias sociales son disciplinas que analizan el comportamiento y actividades de


los seres humanos, describen y explican cientficamente la conducta, la evolucin y la
relacin entre los individuos de una sociedad.
El estudio del comportamiento humano se remonta a la poca greco-romana, y
aunque no se puede hablar de un conocimiento cientfico organizado, los estudios de
Platn y Aristteles seran las primeras aportaciones a las ciencias sociales en el
mundo antiguo. Desde sus inicios los cientficos han realizado una investigacin tanto
pura o terica (su propsito fundamental es el de desarrollar teora mediante el
descubrimiento de amplias generalizaciones o principios) como aplicada o prctica
(depende de los descubrimiento y aporte tericos de la pura y busca contrastar la
teora con la realidad) sobre el funcionamiento cotidiano de la sociedad, han
investigado sobre el comportamiento de los grupos sociales, sobre el poder y las
relaciones entre el gobierno y los ciudadanos, sobre la produccin y el intercambio de
bienes y servicios entre los agentes sociales,... En los siglos XVIII-XX es cuando se
produce el autntico desarrollo de las ciencias sociales, entre ellas la Economa.
Las Ciencias Econmicas, desde no hace mucho, han comenzado a desarrollar
mtodos propios para generar conocimiento. La investigacin econmica utiliza en su
anlisis la induccin, la deduccin, la sntesis,... de forma conjunta como una tcnica
de investigacin.
En este captulo se realiza una breve exposicin de las estrategias investigadoras ms
utilizadas en Economa para generar conocimiento cientfico.

2.

Metodologa de la investigacin

La metodologa es la teora que ofrece tcnicas y mtodos generales de investigacin.


La metodologa de la investigacin hace referencia a los pasos y procedimientos que
se deben seguir para llevar a cabo una investigacin en una determinada rea o
especialidad. En este sentido, la metodologa representa la manera de organizar el

proceso de investigar, de controlar los resultados y de presentar soluciones a


problemas. Propone el mtodo y las tcnicas, esto es, la manera de utilizar el mtodo
de forma efectiva para generar conocimiento.
Cuando hablamos de investigar nos referimos a averiguar o descubrir alguna cosa.
Cuando investigamos intentamos responder a una pregunta o hiptesis para aumentar
el conocimiento o la informacin de algo desconocido. En este proceso se pueden
generar dos tipos de conocimiento en funcin de si la investigacin es o no cientfica.
Cuando la investigacin no es cientfica se genera conocimiento emprico, para
algunos autores o vulgar para otros. Este tipo de conocimiento se obtiene por el azar,
por la experiencia, por instinto, por los sentidos. Es un conocimiento ametdico y
asistemtico que no se somete a prueba.
Si la investigacin es cientfica se genera conocimiento cientfico. El conocimiento
cientfico o ciencia es el resultado de una investigacin cientfica realizada de acuerdo
con el mtodo de investigacin cientfico (Sierra, 1986). El conocimiento cientfico da
a conocer las causas que generan el fenmeno. Proporciona cul es la causa que lo
produce y el motivo por el cual no puede ser de otro modo, esto es, sabemos porque
demostramos. Un conocimiento para que sea cientfico debe cumplir una serie de
requisitos: que sea racional, sistemtico, exacto, verificable y fiable (Bunge, 1981). Por
su parte, Daz y Heler (1985) apuntan las siguientes caractersticas:
-

Crtico. Debe justificar sus conocimientos y dar pruebas de su verdad. En


ningn caso, el conocimiento cientfico se considera que sea definitivo,
siempre est sujeto a revisin.

Sistemtico. Es ordenado, es un conjunto de ideas conectadas entre s.

Explicativo. La ciencia formula teoras que dan lugar a leyes generales que
explican

hechos

particulares

predicen

comportamientos.

Son

conocimientos tiles.
-

Verificable. Se centra en fenmenos susceptibles de ser comprobados


experimentalmente o al menos contrastados experiencialmente (de manera
que demuestren su adecuacin, su utilidad).

Metdico. Los conocimientos cientficos no se adquieran al azar, sino que


son

fruto

de

rigurosos

procedimientos

contrastacin, experimentacin, etc.).

(observacin,

reflexin,

Objetivo. No depende del sujeto que realiza la observacin, el experimento


o propone el modelo. Aunque actualmente, se cuestiona la objetividad
absoluta.

Comunicable. Debe utilizar un lenguaje cientfico, unvoco en trminos y


proposiciones, y que evite las ambigedades.

Provisorio. El saber cientfico debe estar en permanente revisin para que


as pueda evolucionar.

La metodologa de la investigacin propone el mtodo y las tcnicas para llevar a cabo


una investigacin cientfica, es decir, proporciona el procedimiento general (mtodo) y
los procedimientos de actuacin concretos (tcnicas), para llevar a efecto las distintas
etapas del mtodo.

3.

El mtodo cientfico

El mtodo cientfico es una estrategia, es una forma, es un camino para generar


conocimiento cientfico o ciencia. A grandes rasgos, el mtodo cientfico es un
conjunto de procedimientos para conceptualizar un problema, plantear hiptesis y
seleccionar tcnicas y herramientas para generar conocimiento.
Segn Fontela (1990) al intentar clasificar los enfoques de la metodologa cientfica, se
identifican frecuentemente tres procesos o mtodos:
1)

el enfoque inductivo y emprico, basado sobre la observacin y apoyado en


el consenso de los observadores;

2)

el enfoque deductivo, basado sobre la aplicacin de instrumentos de lgica


racional a un conjunto de presupuestos fundamentales, y

3)

el enfoque sinttico, caracterizado por una interaccin permanente entre


deduccin e induccin, entre teora y realidad observada.

El mtodo inductivo fue introducido por Francis Bacon a comienzos del siglo XVII. En
trminos generales consiste en establecer enunciados universales ciertos a partir de la
experiencia. Este enfoque recibi un importante impulso a finales del siglo XIX y
mediados del siglo XX con el desarrollo de la Estadstica.

Las primeras consideraciones del mtodo deductivo se derivan de la obra de


Descartes en 1675, El discurso del mtodo. Descartes utilizaba la deduccin y las
matemticas como punto de referencia para desarrollar una teora. El mtodo
deductivo

genera

conocimiento

formulando

hiptesis

bsicas

deduciendo

posteriormente sus consecuencias con la ayuda de las subyacentes teoras formales.


Ambos mtodos, el inductivo y el deductivo, utilizan la lgica y llegan a una conclusin.
Ambos son susceptibles de contrastacin emprica. Aunque el mtodo deductivo es
ms propio de las ciencias formales (matemticas, fsica, etc.) y el inductivo de las
experimentales (ciencias naturales y ciencias sociales), nada impide la aplicacin
indistinta de un mtodo cientfico a una u otra teora.
La diferencia fundamental entre el deductivo y el inductivo es que, el primero aspira a
demostrar, utilizando la lgica pura, la conclusin en su totalidad a partir de unas
premisas, de manera que se garantiza la veracidad de las conclusiones, si no se
invalida la lgica aplicada. El mtodo inductivo crea leyes a partir de la observacin de
los hechos, mediante la generalizacin del comportamiento observado.
En la prctica, generalmente, cuando investigamos en ciencias sociales, no puede
hablarse de una estrategia investigadora inductiva o deductiva en estado puro. En este
sentido, Sierra Bravo (2006) seala que el mtodo cientfico es a la vez, inductivo y
deductivo. Es inductivo cuando realiza una clasificacin sistemtica de los datos
obtenidos de la observacin de la realidad y es deductivo cuando establece conceptos
e ideas derivados de otros conceptos e ideas enunciados anteriormente.
En trminos generales podemos decir que el mtodo en la investigacin social es una
estrategia que utiliza la induccin, deduccin y la sntesis para adquirir conocimiento
de la realidad social.

4.

Tipos de investigacin: cualitativa y cuantitativa

A lo largo del tiempo, se ha debatido desde distintas corrientes filosficas (empirismo,


positivismo, fenomenologa, estructuralismo,..) sobre los mtodos existentes de
investigacin y sobre la idoneidad de unos u otros para investigar en las ciencias
sociales.
Como se coment en el epgrafe 3, el mtodo puede presentar distintas modalidades,
pero, si entendemos que el mtodo en la investigacin social es una estrategia que se

emplea para adquirir conocimiento de la realidad, entonces debemos buscar aquellas


estrategias investigadoras en las que exista rigor y conexin entre la teora y las
tcnicas. En este sentido, es posible desarrollar dos estrategias o enfoques, el
cualitativo y el cuantitativo.
Ambos enfoques comparten estrategias generales comunes como observar y evaluar
fenmenos, aunque cada una presenta sus propias caractersticas.
El enfoque cualitativo trata de explorar e identificar la naturaleza y caractersticas de la
realidad que se estudia y evita la cuantificacin de los hechos. Utiliza tcnicas como la
entrevista y los grupos de discusin. No se suelen plantear hiptesis. El proceso de
investigacin no presenta una secuencia establecida.
El enfoque cuantitativo trata de recopilar datos de las variables que definen el
fenmeno, cuantifica los hechos. Utiliza tcnicas y herramientas de la estadstica para
la recopilacin y tratamiento de datos. Se suelen plantear hiptesis. El proceso de
investigacin es secuencial.
Es bastante habitual utilizar ambas estrategias para desarrollar una misma
investigacin.
En el epgrafe siguiente se expone un tipo de diseo de un proceso de investigacin
por etapas, propio de una investigacin cuantitativa. Sin embargo, en el mdulo 3 de
este mismo documento tambin se exponen tcnicas propiamente cualitativas que,
junto con la investigacin cuantitativa, ofrecera un carcter mixto a la investigacin.

CAPTULO 2
Diseo de una investigacin cientfica

1.

Introduccin

El diseo (plan o programa) de la investigacin se puede definir como el plan global de


investigacin que intenta dar de una manera clara respuestas a las preguntas
planteadas en la misma.
El plan de investigacin que aqu se presenta recoge ocho etapas, ordenadas de
forma secuencial, para dar respuesta a cada una de las preguntas formuladas en el
proyecto de investigacin:
1.

Planteamiento del problema de investigacin: qu fenmeno vamos a


investigar?

2.

Objetivos de la investigacin: qu meta perseguimos con el desarrollo de


nuestra investigacin?

3.

Justificacin de la investigacin: por qu investigamos en este tema y


cul es el alcance de nuestros resultados?

4.

Marco terico y conceptual (estado del arte): qu y quienes han


investigado sobre el tema objeto de estudio?

5.

Variables

hiptesis:

qu variables

definen

el fenmeno que

investigamos y qu relacin existente entre ellas queremos validar?


6.

Metodologa: cmo y qu medios vamos a utilizar para llevar a cabo


nuestra investigacin?

7.

Conclusiones: hemos conseguido los objetivos propuestos? qu nuevo


conocimiento o metodologa aporta nuestra investigacin?

8.

Bibliografa: qu documentacin hemos utilizado para el desarrollo de


nuestra investigacin?

2.

Planteamiento del problema de investigacin

El punto de partida de una investigacin es la eleccin del tema y la definicin del


problema a investigar. El tema es el origen de la investigacin y nace de la intuicin,
de la experiencia y/o de la observacin de la realidad. El tema se expresa mediante
una frase y normalmente relaciona dos o ms reas o conceptos. No existen reglas
fijas para encontrar el tema de investigacin, Ramrez (2006) plantea algunos criterios
para seleccionar el tema de estudio:

Escoger algn tema sobre el que ya se posee informacin.

Seleccionar un tema concreto y accesible, un tema sobre el que exista


suficiente bibliografa y del que se puedan obtener datos fcilmente.

Buscar un problema de investigacin que resulte de inters.

Otros autores plantean otros criterios como son la experiencia en el tema y tener
conocimientos para su manejo.
Una vez que hemos elegido el tema de nuestro proyecto debemos realizar un
planteamiento del problema de investigacin, es decir, debemos enunciar, describir y
delimitar el problema en el que queremos investigar.
El problema se puede formular de manera declarativa o interrogativa. En el primer
caso se expresa a forma de propsito (Ej. La investigacin pretende mostrar la
importancia del papel del fundador en el crecimiento de una empresa familiar). En el
segundo caso se expresa formulando una pregunta (Ej. Es importante el papel del
fundador en la fase de crecimiento de una empresa familiar?).
Es conveniente formular, junto con la pregunta que recoge el tema general de la
investigacin, una serie de preguntas que ayuden a transformar el tema general en
problemas ms concretos y ms fciles de tratar. De esta forma, surgirn problemas
especficos de investigacin, de entre los cuales podremos seleccionar aquellos que
sean viables y sean de nuestro inters.
Ejemplo:
Pregunta general: Cules son los elementos clave que generan valor agregado en una empresa?
Preguntas especficas: Son los mismos para todos los tipos de empresa? Cmo podemos identificarlos
y medirlos? Se pueden medir de manera aislada o dentro de un contexto interrelacionado? Se pude
probar el impacto de los elementos intangibles en el desempeo y el xito de una organizacin? Es

posible establecer un marco de trabajo prctico con el cual se puedan gestionar los intangibles
estratgicos?
(Torres, 2008)

La descripcin del problema permite conocer todos los hechos relacionados con el
problema

de investigacin.

Cuando

lo

describimos

debemos

presentar

los

antecedentes tericos y/o empricos, las teoras y los supuestos bsicos en los que se
apoya el enunciado del problema.
El problema debe enunciarse de forma clara y concisa, es decir, debe ser delimitado.
La delimitacin supone establecer el tiempo de realizacin, fijar los espacios fsicos y/o
geogrficos dnde se va a centrar la investigacin y determinar los conceptos y
recursos disponibles para su realizacin. Una delimitacin adecuada del tema es una
garanta de la viabilidad de la investigacin.
El planteamiento de un problema de investigacin exige una concepcin previa de la
naturaleza de la realidad que queremos estudiar. Una revisin bibliogrfica en el rea
de estudio y la consulta a expertos en la materia pueden resultar de gran ayuda en
esta primera etapa del proceso de investigacin.

3.

Objetivos de la investigacin

Una reflexin y estudio sobre el origen, naturaleza y caractersticas del tema de


investigacin revelar aspectos importantes para perfilar la idea inicial del problema
objeto de estudio y ser de utilidad para formular los objetivos perseguidos en el
trabajo.
Un objetivo es un fin, un resultado al que van dirigidas todas las actividades a llevar a
cabo en nuestra investigacin. Se pueden distinguir dos tipos de objetivos, el objetivo
general

y los objetivos especficos o instrumentales. El objetivo general debe

responder al tema de investigacin. Se recomienda que en la investigacin haya un


solo objetivo general que defina el propsito del trabajo. Dos o ms objetivos
generales podran indicar que se van a realizar dos o ms investigaciones. Los
objetivos especficos o instrumentales son las acciones, los pasos intermedios para la
consecucin del objetivo general. Son un desglose del objetivo general e indican las
partes en las que se va a dividir la investigacin.

10

Los objetivos deben ser formulados con claridad utilizando verbos fuertes expresados
en infinitivo. Deben ser concretos, medibles y seguir un orden lgico.
Ejemplo:
Objetivo general: Desarrollar un modelo integrador de elementos intangibles que sirva, por un lado, como
base terica para futuras investigaciones y por otro lado, como marco de trabajo para la gestin de
recursos y capacidades claves en el desempeo empresarial.
Objetivos especficos:

Identificar con base a la literatura relevante, un conjunto de elementos genricos que son
considerados como los elementos intangibles claves en la creacin de valor

en las

empresas de la economa actual.

Desarrollar un modelo conceptual que integre los elementos intangibles identificados,


estableciendo una estructura causal que, en ltima instancias, los vincule con el
desempeo.

Probar el modelo conceptual a travs de una muestra de empresas en Mxico utilizando


tcnicas y herramientas estadsticas que permitan explorar posibles relaciones entre
elementos intangibles e identificar diferencias en las acumulaciones y desempeo entre
empresas familiares y no familiares, as como identificar elementos distintivos con base en
el tamao, edad o sector en el que operan.
(Torres, 2008)

4.

Justificacin de la investigacin

Justificar una investigacin consiste en expresar las razones por las que se lleva a
cabo el estudio. Debemos explicar por qu es conveniente y cules son los beneficios
que se esperan con el conocimiento obtenido, es decir, debemos demostrar por qu la
investigacin es necesaria e importante en el rea en la que se centra nuestro estudio.
Una investigacin se inicia con algn propsito en un rea de conocimiento
determinada, por lo tanto, su realizacin debe ser de utilidad por diferentes motivos.
Hernndez et al. (2006) indican algunos criterios, formulados como preguntas, para
evaluar la utilidad de una investigacin:

Conveniencia: para qu sirve la investigacin?

Relevancia social: qu alcance o proyeccin social tiene?

11

Implicaciones prcticas: ayudar a resolver algn problema real?

Valor terico: Con la investigacin se llenar algn vaco del


conocimiento? la informacin que se obtenga servir para revisar,
desarrollar o apoyar una teora? se podr conocer en mayor medida el
comportamiento de una o de diversas variables o la relacin entre ellas?
se pueden sugerir ideas, recomendaciones o hiptesis para futuros
estudios?

Utilidad metodolgica: la investigacin puede ayudar a crear un nuevo


instrumento para recopilar o analizar datos? sugiere cmo estudiar mejor
una poblacin?

5.

Marco terico y conceptual

Siguiendo a Hernndez et al.:


El marco terico es un compendio escrito de artculos, libros y otros documentos que describen el
estado pasado y actual del conocimiento sobre el problema de estudio. Nos ayuda a documentar
cmo nuestra investigacin agrega valor a la literatura existente (Hernandez et al., 2006).

Estos mismos autores destacan las siguientes funciones del marco terico:
1.

Ayuda a prevenir errores que se han cometido en otros estudios.

2.

Orienta sobre cmo habr de realizarse el estudio. Al acudir a los


antecedentes nos podemos dar cuenta de cmo se ha tratado un problema
especfico de investigacin: qu clases de estudios se han efectuado, con
qu tipo de participantes, cmo se han recolectado los datos, en qu
lugares se han llevado a cabo, qu diseos se han utilizado. Aun en el
caso de que desechemos los estudios previos, stos nos orientarn sobre
lo que queremos y lo que no queremos para nuestra investigacin.

3.

Ampla el horizonte del estudio o gua al investigador para que se centre en


su problema, para evitar desviaciones del planteamiento general.

4.

Documenta la necesidad de realizar el estudio.

5.

Conduce al establecimiento de hiptesis o afirmaciones que ms tarde


habrn de someterse a prueba en la realidad, o bien, nos ayuda a no
establecerlas por razones bien fundamentadas.

6.

Inspira nuevas lneas y reas de investigacin.

12

7.

Provee de un marco de referencia para interpretar los resultados del


estudio. Aunque podemos no estar de acuerdo con dicho marco o no
utilizarlo para interpretar nuevos resultados, es un punto de referencia.

Para elaborar el marco terico y conceptual comenzamos con la revisin bibliogrfica


que consiste en recopilar y consultar aquella informacin local, nacional y/o mundial
que est relacionada con nuestro tema de investigacin.
De

todos

los

artculos,

libros

documentos

recopilados

consultados,

seleccionaremos aquellos que puedan proporcionarnos datos e ideas que sean de


utilidad para el desarrollo de nuestro marco de referencia.
La bibliografa consultada debe ser debidamente referenciada a lo largo de toda la
investigacin. Es importante diferenciar la aportacin del investigador del resto de
ideas, conceptos y teoras extrados de las fuentes consultadas. En la tabla 1 se
muestra cmo citar dentro del texto siguiendo las normas Harvard.
Tabla 1. Cmo citar dentro del texto?
Si el nombre del autor ocurre de forma

Ej. De acuerdo con Becker (1975), el capital humano es la

natural en la frase

acumulacin (stock) de conocimiento, competencias,...

Si el nombre del autor no ocurre de forma

Ej. El capital humano representa el conocimiento y

natural en la frase

habilidades de una persona, las cuales le permiten realizar


acciones nicas y novedosas (Coleman, 1988)

Cuando se citan varias obras del mismo

Ej. En materia de gerencia social es imprescindible

autor publicadas en el mismo ao

mencionar las contribuciones de Klisberg (1993b).

Si hay dos autores

Ej. Segn Mill y Morrison (1985), las necesidades son una


combinacin de anhelos de los que el consumidor puede
ser o no consciente

Si hay ms de dos autores

Ej. Cals et al. (1993) proponen

Si se desconoce el nombre del autor o no

Ej. Un artculo reciente (Anon 1993) afirmaba que

figura
Si se cita una fuente citada en otra obra

Ej. Un estudio de Smith (1960 citado por Jones 1994 p. 24)


demostraba que

Las citas literales de menos de tres lneas

Ej. La ciencia es una empresa dedicada a averiguar

(dentro del texto entre comillas)

(Babbie, 1999, p. 71)

Las citas literales de ms de tres lneas

Ej. En el proceso seguido para la determinacin de

(prrafo aparte y sangrado)

hiptesis se pueden distinguir dos pasos principales: a)


hallar el aspecto, relacin o factor que pueda dar solucin a
la cuestin investigada, y b) expresar dicho aspecto,
relacin o factor en forma adecuada susceptible de
verificacin.

Fuente: Normas Harvard

13

La documentacin recopilada proporciona una sntesis del contexto general de nuestro


tema de estudio. A partir de este contexto desarrollamos el estado del arte
exponiendo, explicando y contrastando las teoras y estudios empricos que existen
sobre el fenmeno objeto de estudio.
Las teoras y las comprobaciones empricas aplicables a nuestra investigacin nos
permiten detectar qu conocimiento existe sobre el tema en el que estamos trabajando
y tambin nos ayuda a descubrir qu vacos queremos llenar con nuestro proyecto.
No siempre existen teoras y/o estudios empricos en los que nos podamos basar para
el desarrollo del marco terico. En estos casos nos limitaremos a extraer aspectos
relevantes de estudios previos que estn relativamente relacionados con nuestro
tema.
La literatura consultada tambin debe proporcionarnos informacin suficiente para
elaborar el contexto conceptual en el que se considera el problema de investigacin.
Debemos desarrollar los conceptos operativos, explicativos e implcitos del problema
(Ej. Conceptualizar el trmino de innovacin. Concepto de empresa familiar.)

6.

Variables y Formulacin de hiptesis

Las variables son cualidades, propiedades o rasgos observables de los elementos del
estudio cientfico. Las variables son de gran importancia
porque las clasificamos y agrupamos, las relacionamos y,

en el mtodo cientfico
las estudiamos y las

interpretamos. Las variables participan en todas las fases del proceso, por esto,
debemos definirlas con un alto grado de especificacin (Lafuente y Marn, 2008).
Se pueden considerar distintos tipos de variables si atendemos a los siguientes
criterios de clasificacin:

Segn la naturaleza: de acuerdo este criterio, las variables pueden ser


cualitativas o cuantitativas. Las primeras se refieren a caractersticas cuya
observacin proporciona un dato no numrico (Ej. Las formas de
constitucin

de

una

empresa).

Las

variables

cuantitativas

son

caractersticas cuya observacin proporciona un dato numrico (Ej. La


propensin exportadora de las PYMES espaolas; El tamao de las
empresas segn volumen de ventas)

14

Segn la posicin que relaciona a las variables: se distingue entre


variables

dependientes

variables

independientes.

Las

variables

dependientes son aquellas cuyo comportamiento viene determinado por el


comportamiento de otra u otras variables. Las variables independientes
son las variables que se proponen en la investigacin para explicar la
razn de ser de la variable dependiente. Intentamos descubrir que tipo de
asociacin o influencias ejercen las variables independientes sobre la
variable dependiente (Ej. Queremos explicar cmo influye la innovacin,
variable independiente, en los beneficios de las empresas, variable
dependiente).
Las hiptesis de investigacin o hiptesis de trabajo son explicaciones tentativas del
fenmeno investigado que se formulan como proposiciones (Hernndez et al., 2006).
Una hiptesis, por lo tanto, es una afirmacin tentativa. No es un hecho. Son
afirmaciones de una variable o sobre la relacin existente entre dos o ms variables
que deben ser sometidas a prueba. En este sentido, la hiptesis debe ser formulada
de tal forma que pueda ser potencialmente aceptada o rechazada, es decir debe estar
sujeta a una comprobacin emprica.
En una investigacin se pueden formular dos o ms hiptesis, aunque en algunas
ocasiones no se incluyen hiptesis de trabajo, es el caso de investigaciones
exploratorias y el de investigaciones cualitativas.
Las hiptesis surgen del planteamiento del problema, de la intuicin y de la revisin de
la literatura realizada. El marco terico y conceptual dan fundamento y justificacin a
las hiptesis de trabajo, a priori validan las relaciones entre variables recogidas en la
afirmacin, aunque estas relaciones slo sern aceptadas o rechazadas cuando se
realice el adecuado anlisis de datos, es decir, cuando hayan sido objeto de
comprobacin emprica.
Existen distintas clasificaciones de hiptesis segn los criterios establecidos.
Hernandez et al. (2006) distinguen cuatro tipos de hiptesis segn el alcance de la
investigacin: descriptivas, correlacionales, de diferencia de grupos y causales.
En las hiptesis descriptivas se formula un pronstico sobre el comportamiento de una
variable.
Hi: Las exportaciones de las PYMES espaolas crecern un 5% el prximo ao

15

En las hiptesis correlacionales se establecen relaciones entre dos o ms variables y


se indica en qu direccin estn asociadas sin estableces una relacin causa-efecto
entre ellas.
Hi: Existe una relacin positiva entre innovacin y competitividad.

En las hiptesis de diferencia entre grupos se comparan grupos. En este tipo de


hiptesis, el investigador se limita a indicar que existen diferencias entre dos o ms
grupos de inters. Si dispone de bases, de informacin suficiente, adems puede
indicar la direccin de las diferencias entre grupos.
Hi: Las empresas familiares siguen un proceso de internacionalizacin distinto a de las no familiares (slo
se establece que hay diferencias).
Hi: Las empresas no familiares se inician antes en el proceso de internacionalizacin que las empresas
familiares (se establece la direccin de la diferencia).

Por ltimo, en las hiptesis causales se establece una relacin causa-efecto entre las
variables. Se realiza una afirmacin sobre el efecto que provoca sobre una variable
(variable dependiente), el comportamiento de otra u otras variables (variables
independientes).
Hi: La innovacin tecnolgica aumenta la productividad de las empresas (una variable independiente).
Hi: La innovacin tecnolgica y la motivacin aumentan la productividad (dos variables independientes).

7.

Metodologa

En este apartado de metodologa especificaremos la forma y el procedimiento


ordenado que seguiremos para conseguir los objetivos propuestos.
La metodologa presenta los mtodos y tcnicas para la investigacin. Toda
investigacin nace con un propsito, por tanto, es necesario indicar que tipo de
investigacin vamos a realizar ya que cada tipo de investigacin exige un
procedimiento metodolgico distinto.
Los tipos ms comunes y tiles de investigacin segn su propsito son la
exploracin, descripcin y explicacin.
Una investigacin es exploratoria cuando se realiza para descubrir aspectos
fundamentales de un problema determinado, del cual se tienen dudas o no se ha

16

abordado antes. Suelen ser investigaciones sobre temas de los que existe poca
informacin. Segn Babbie (1999), los estudios exploratorios se hacen con tres
objetivos:
1.

Satisfacer la curiosidad del investigador y su deseo de un mayor


conocimiento,

2.

Probar la viabilidad de un estudio ms extenso y

3.

Desarrollar los mtodos que se aplicarn en un estudio posterior.

Una investigacin es descriptiva cuando tiene como propsito contar, detallar las
propiedades y caractersticas de una realidad concreta. El investigador observa la
realidad y luego la describe.
Las investigaciones exploratoria y descriptiva suelen ser la base para desarrollar otras
investigaciones ms profundas.
Por ltimo, una investigacin es explicativa cuando su propsito va ms all de la
mera descripcin del fenmeno objeto de estudio. En este tipo de investigacin se
explica el por qu del fenmeno y se indica cmo se relacionan las variables que lo
definen.
Normalmente, las investigaciones suelen presentar los tres tipos de propsitos,
exploracin, descripcin y explicacin.
Una vez que hemos sealado qu tipo de investigacin estamos realizando, estamos
en disposicin de indicar la fuente y los medios utilizados para obtener los documentos
y los datos en los que nos hemos apoyado para desarrollar nuestra investigacin.
Tambin debemos mostrar las tcnicas y herramientas aplicadas y su idoneidad en el
tratamiento de datos.
Los documentos y los datos se pueden obtener de fuentes primarias o de fuentes
secundarias.
Las fuentes primarias son fuentes de informacin de primera mano. Las tesis, los
libros, artculos de revista, monografas y manuscritos se consideran fuentes primarias
para obtener documentos. Cuando nos referimos a datos obtenidos en fuentes
primarias nos referimos al uso de medios como la entrevista, los grupos de discusin y

17

la encuesta. Es decir, medios que nos permiten obtener datos especficos para nuestra
investigacin.
Hablamos de fuentes secundarias para la obtencin de documentos cuando nos
apoyamos en resmenes o documentos que compilan la informacin recogida en las
fuentes primarias. Hablamos de datos obtenidos en una fuente secundaria cuando
utilizamos cuadros estadsticos que ya han sido elaborados por instituciones para el
desarrollo de estudios distintos a nuestra investigacin.
Recopilados los datos debemos indicar qu tcnicas hemos utilizado para su
tratamiento. La estadstica y la econometra nos proporcionan abundantes tcnicas y
herramientas para el anlisis descriptivo y explicativo de una o ms variables.

8.

Conclusiones y futuras lneas de investigacin

El apartado de conclusiones no debe ser un resumen de la investigacin realizada.


Debemos sealar qu logros hemos conseguido y cmo los hemos conseguido.
Explicaremos qu significado tienen los resultados respecto a los objetivos propuestos
y, si en la investigacin hemos planteado hiptesis, indicaremos cules se han
validado y cules se han rechazado al ser contrastadas con la realidad observada.
Debemos, adems, indicar las limitaciones de nuestra investigacin y sugerir lneas de
accin de acuerdo a los resultados obtenidos.
En este apartado tambin se incluyen las limitaciones de nuestra investigacin y se
sugieren nuevas propuestas de investigacin. Una tesis doctoral, adems, de llenar
un pequeo vaco en el rea de estudio elegida, permite descubrir nuevos problemas
susceptibles de investigar que deben proponerse como futuras lneas de investigacin.

9.

Bibliografa

Este apartado recoge toda la documentacin utilizada para el desarrollo de la


investigacin.
En la tabla 2 se hace una propuesta, siguiendo las normas Harvard, de cmo
referenciar la documentacin consultada.

18

Tabla 2. Cmo preparar las Referencias Bibliogrficas?


Libros

Ej. BABBIE, E (1999). Metodologa de la investigacin. Mxico,


Thomson

Colaboracin captulo en un libro

Ej. Goodall, B. 1992. Environmental Auditing for Tourism. En: C.


Cooper y A. Lockwood, eds. Progress in Tourism, Recreation and
Hospitality Management. London: Belhaven Press, 60-74.

Artculo en una revista

Ej. Nelson, R. y Winter, G. (1982). The Shumpeterian Tradeoff


Revisited. The American Economic Review. Vol. 72, Iss.1, p 114132.

Conferencia

Ej. Witt, C. y, Wright, P. 1990. Tourist Motivation: Life after Maslow.


En: P. Johnson y B. Thomas, eds. Proceedings of Tourism Research
into the 1990s, Durham University, 10-12 Diciembre 1990. Durham:
Durham University, 1-16.

Publicacin de una institucin

Ej. OCDE. (1992). The key Relationships. Paris.

Tesis

Ej. Torres Padilla, A.(2008). Un Modelo Integrador para el Manejo


de Elementos Intangibles y Creacin de Valor en la Empresa: el
caso de Empresas Familiares y no Familiares en Mxico. Tesis
doctoral (PhD). Universidad Antonio de Nebrija, Facultad de
Ciencias Sociales.
Fuentes electrnicas

Trabajos individuales

e.g Holland, M. (1996). Harvard System [en linea]. Poole,


Bournemouth University. Disponible en:
http://www.bournemouth.ac.uk/servicedepts/lis/LIS_Pub/harvardsyst.html [Fecha de consulta 15 Apr 1996].

Revistas electrnicas

e.g.Korb, K.B. (1995). Persons and Things: Book Review of


Bringsjord on Robot-Consciousness. Psycoloquy [en linea], 6 (15).
Disponible en:
gopher://wachau.ai.univie.ac.at:70/00/archives/Psycoloquy/95.V6
/0162 [Fecha consulta 17 Jun 1996].

Foros de discusin y listas de

e.g. Brack, E.V. (2 May 1995). Re: Computing Short Courses. Lis-

correo

link [en linea]. Disponible en: mailbase@mailbase.ac.uk [Fecha


consulta 17 Apr 1996].

Correos electrnicos personales

e.g.Lowman, D. (deborah_lowman@pbsinc.com). (4 Apr 1996).

(E-mail)

RE>> ProCite and Internet Refere. E-mail to P. Cross


(pcross@bournemouth.ac.uk).

Fuente: Normas Harvard

19

MDULO 2:
INVESTIGACIN CUALITATIVA

20

CAPTULO 3
Introduccin a la metodologa y tcnicas cualitativas

1.

Introduccin

La metodologa cualitativa es un mtodo de investigacin que tiene como principal


objetivo explorar las relaciones sociales y describir la realidad tal y como la
experimentan los individuos. Est muy orientada a las ciencias sociales.
La diferencia entre el anlisis cuantitativo y el cualitativo tiene su origen en la distincin
entre positivismo y hermenutica. El positivismo se basa en el anlisis estadstico de
los datos recogidos por medio de estudios y experimentos descriptivos y comparativos.
Asume que solo el conocimiento obtenido a travs de medidas y de identificaciones
objetivas puede presumir de poseer la verdad. La hermenutica, por su parte,
representa una reaccin contra esa rigidez del positivismo respecto a ciertos tipos de
problemas sociales. En lugar de explicar las relaciones causales por medio de hechos
objetivos y anlisis estadsticos, utiliza un proceso interpretativo ms personal en
orden a comprender la realidad. Este contraste queda claramente descrito en el
esquema de Plummer (1983):
Tabla 3. Metodologa cualitativa vs metodologa cuantitativa
Dos planteamientos
Humanista
Focos de estudio

Epistemologa

Tarea

Estilo

Teora

Valores

Positivista

nicos, ideogrficos

Generales y nomotticos

Centrados en lo humano

Centrados en la estructura

Lo interior, subjetivo

Lo exterior, objetivo

Significado, sentimiento

Cosas, sucesos

Fenomenologa

Realista

Relativista

Absolutista esencialista

Perspectivista

Lgico positivista

Interpretar, comprender

Explanacin causal

Describir, observar

Medir

Suave, clido

Duro, fro

Imaginativo

Sistemtico

Vlido, real, rico

Fiable, replicable

Inductiva, concreta

Deductiva y abstracta

Cuenta historias

Operacionalismo

Comprometida tica y

Neutral tica y polticamente

polticamente

Pericia y Elites

21

Igualitarismo
Fuente: Plummer (1983) en Ruiz Olabunaga (2007)

2.

Caractersticas de los mtodos cualitativos

Su objetivo es la captacin y reconstruccin de significado. Si una investigacin


pretende captar el significado de las cosas (comportamientos, actos) ms bien
que describir los hechos sociales, se puede decir que entra en el mbito de la
investigacin cualitativa.

Su lenguaje es bsicamente conceptual y metafrico. Si una investigacin utiliza


los conceptos, las metforas, las vietas, las narraciones en lugar de los
nmeros, los test estadsticos, los algoritmos, las tablas y las frmulas
estadsticas, es investigacin cualitativa.

Su modo de captar la informacin no es estructurado sino flexible y


desestructurado. Si en una investigacin se prefiere recoger informacin a travs
de la observacin o de la entrevista en profundidad ms bien que mediante
experimentos o encuestas estructuradas masivas, entra en el mbito de la
metodologa cualitativa.

Su procedimiento es ms inductivo que deductivo. Si en lugar de partir de una


teora y unas hiptesis perfectamente elaboradas y precisas prefiere partir de los
datos para intentar reconstruir un mundo cuya sistematizacin y teorizacin
resulta difcil, entra en el mbito de la metodologa cualitativa.

La

orientacin

no

es

particularista

generalizadora

sino

holstica

concretizadora. Si en vez de intentar generalizar de una muestra pequea a un


colectivo grande cualquier elemento particular de la sociedad, la investigacin
pretende captar todo el contenido de experiencias y significados que se dan en
un solo caso, sta entra en la esfera de la metodologa cualitativa.

22

3.

El diseo cualitativo

La investigacin con tcnicas cualitativas est sometida a un proceso de desarrollo


similar al de la investigacin de naturaleza cuantitativa. Las fases de la investigacin
seran1:
-

Definicin del problema

La definicin del problema se orienta a encontrar lo que constituye el foco central de


todo anlisis cualitativo: la bsqueda de significado. Y esa definicin de significado
debe ser abierta en muchos sentidos. Es abierta en cuanto a su contenido, puesto que
el investigador desconoce de entrada su naturaleza precisa; en cuanto a su
comprensin, porque es susceptible de inesperadas ramificaciones; y en cuanto a la
profundidad, densidad y extensin.
A diferencia del modo como las tcnicas cuantitativas definen su problema, creando
una condicin de pureza situacional cuyo ideal es el laboratorio o control estadstico,
las cualitativas lo hacen introducindolo lo ms posible en la situacin. Ms an, la
definicin del problema siempre es provisional, porque la tarea central del anlisis
cualitativo es averiguar si la definicin est bien definida.
Por tanto, definir no es delimitar, rodear, circunscribir con precisin un problema, sino
situarse, orientarse, sumergirse, acercarse, contactar con el ncleo, el foco, el centro
del mismo.
-

Diseo de trabajo

Tras la definicin del problema es preciso elaborar un diseo o proyecto de trabajo. Un


diseo que, a diferencia del trabajo cuantitativo, es solamente provisional y sometido a
probables cambios. Digamos que el diseo en la investigacin cualitativa se relaciona
con las siguientes caractersticas: flexibilidad (la toma de decisiones probablemente se
altere durante la investigacin), provisionalidad (las decisiones pueden ser temporales
pero siempre han de ir guiadas por los conocimientos de la experiencia anterior, y de
la bibliografa consultada), totalidad (visin holstica y global del fenmeno a estudiar),
y proximidad (no se debe perder el contacto directo con la realidad inmediata).

Ntese que el objetivo de estas fases no es redundar la informacin que se ofrece en el captulo 2 de
estos apuntes, sino servir de hilo conductor para comprender mejor cmo se estructura una investigacin
cualitativa, con sus peculiaridades.

23

El diseo abarca y comprende todos los pasos de los que consta una investigacin. Se
podra resumir en los siguientes elementos:
a) Esquema terico: fijacin de la estrategia que se va a seguir a lo largo de la
investigacin. La estrategia de una investigacin cualitativa va orientada a
descubrir, captar y comprender una teora, una explicacin, un significado, del
mismo modo que la de una cuantitativa va ms orientada a contrastar,
comprobar, demostrar la existencia de una teora previamente formulada. La
primera impone un contexto de descubrimiento y de exploracin al paso que la
segunda de comprobacin y de contraste.
b) Diseo muestral: la tendencia del anlisis cuantitativo a generalizar y
universalizar sus descubrimientos le obliga a estudiar, en principio, a todos los
casos o a seleccionar unos cuantos casos representativos (muestra) del
colectivo general. Por el contrario, los anlisis cualitativos, habitualmente,
estudian un individuo o una situacin, unos pocos individuos o unas reducidas
situaciones, con el propsito no de generalizar algn aspecto concreto sino de
profundizar en ese mismo aspecto.
c) Codificacin del lenguaje: toda observacin realizada por un investigador ha de
ser traducida a smbolos de modo que pueda ser conservada e intercambiada.
Existen dos formas de codificacin: a travs del concepto y a travs del
nmero. En la investigacin cualitativa prima el concepto (descripciones y
vietas literarias) y en la cuantitativa el nmero (tablas y test estadsticos).
d) Control de elementos espurios: las tcnicas cualitativas no pueden ser puestas
en prctica sin que sean previstas tcnicas de veracidad, de autenticidad y, en
general, de control de calidad.
Lofland (1984) afirma que la metodologa cualitativa, al primar la comprensin
directa del mundo social, afronta menos problemas de validez que la
metodologa cuantitativa, sin embargo, al margen de la interpretacin subjetiva,
toda informacin cualitativa debe afrontar el problema de su verdad objetiva y
de si constituye una descripcin acertada de un hecho, actitud o creencia de la
vida real. Este mismo autor propone el siguiente test de garanta de calidad
para reforzar la fiabilidad de una investigacin cualitativa:

24

Tabla 4. Test de garanta de calidad


Inmediatez de la informacin

El relato est basado en percepcin directa o


procede de informacin de segunda mano?
Sugiere esto alguna preocupacin especial?

Situacin espacial del informante

Aunque sea de primera mano, la informacin


puede estar sesgada por la defectuosa
accesibilidad del informante

Situacin social del informante

Sesgadora de su capacidad de juicio, propensin a


falsificar, distorsionar o limitar la informacin

Error y sesgo en provecho propio

Grado en el que los propios valores e intereses


pueden viciar el relato del informante

Errores previstos manifiestos del informante

De acuerdo a la experiencia propia, hasta qu


punto mis observaciones o las del informante son
fiar? l o yo hemos cometido en el pasado algn
error notable en la apreciacin de los datos?

Consistencia interna del reportaje

Existen contradicciones internas en cuanto al


desarrollo espacial temporal, o en la participacin
de unos u otros protagonistas?

Consistencia externa

Acuerdo o desacuerdo entre diferentes


informantes. Existen suficientes informantes
neutrales para poder fiarse de ellos? Si hay
desacuerdo, se ha establecido algn sistema de
cotejo?

Fuente: Lofland (1984)

e) Comprobacin: antes de iniciar la recogida de datos es necesario comprobar


que: se cuenta con que se ha localizado el ncleo del fenmeno que se quiere
estudiar, se dispone de un conocimiento terico de situaciones o experiencias
similares que sirvan de orientacin, se haya formulado una seleccin
condicionada de focos temticos, informantes y situaciones por su valor
estratgico para conferir informacin, y se hayan adoptado medidas de
precaucin para garantizar la calidad de la informacin recogida.
-

Recogida de datos

Las tres tcnicas ms importantes de recogida de datos en los estudios cualitativos


son: la entrevista, la observacin y la lectura. Son los tipos de investigacin ms
relevantes.
La entrevista es la herramienta metodolgica preferida por los investigadores
cualitativos. Esta suele ser practicada en su modalidad abierta y no estructurada,

25

entendida como una conversacin controlada por el arte de saber formular preguntas y
de saber escucharlas.
La entrevista no es una herramienta mecnica sino que est fundamentalmente
influenciada por el entrevistador y por sus caractersticas, as como por el entrevistado
y su contexto.
La observacin es la segunda herramienta favorita para la recogida de informacin. Es
entendida y practicada como la entrada a una situacin social, unas veces como parte
de la misma y otras, como simple espectador, y la inspeccin sistemtica de lo que en
ella ocurre.
La lectura de documentos que conservan un fenmeno social pasado, es el tercer
modo de recoger informacin. Todo escrito puede ser ledo e interpretado como una
interaccin social pasada, sin olvidar, que esta lectura es una construccin social y
poltica ella misma, en la que interviene, no slo el creador original del documento,
sino el investigador que lo lee posteriormente e interpreta.
En resumen, las tcnicas de recogida de informacin ms usualmente utilizadas son:
Tabla 5. Formas ms difundidas de recoger informacin
Entrevista
En profundidad

Observacin
Etnogrfica

Lectura
Anlisis de contenidos
(escritos, audiovisuales)

De grupo

Etnometodolgica

Biografas (auto y asistida)

Delphi (en ocasiones se

Participativa-No participativa

Circept (lenguaje metafrico)

incluye dentro de De grupo)


Fuente: Ruiz Olabunaga (2007)

Anlisis de los datos

En este apartado se dan las mayores diferencias entre los mtodos cuantitativos y los
cualitativos. Los primeros analizan datos fundamentalmente mediante la constatacin
de parmetros y asociaciones. Utilizan algoritmos tales como medias, desviaciones,
ratios, coeficientes as como test de correlacin, de regresin, de diferencia
significativa, etc. Por el contrario, los segundos analizan los datos mediante
narraciones, vietas y relatos cuyo ideal es la interpretacin de las interpretaciones de
los sujetos que toman parte en una accin social. Y si bien es cierto que la
investigacin cualitativa no se somete a ningn esquema rgido de procedimientos y

26

normas, tambin lo es que diferentes autores han ido presentando mtodos de anlisis
al mismo tiempo que llevaban sus estudios concretos (como por ejemplo, el Mtodo
Delphi).
-

Conclusiones

Siguiendo las instrucciones de Saravia (2006), las conclusiones resumen todo el


trabajo de investigacin realizado y presentan la estructura completa del proceso. Esto
es:
1. Introduccin: descripcin razonada de todo el documento. Sirve de visin
panormica. Se presenta una descripcin de la estructura del informe.
2. Justificacin: es retomada del proyecto pero revisada estticamente.
3. Planteamiento del problema: dem que en el punto anterior.
4. Objeto de estudio: dem.
5. Cuestiones a responder mediante la investigacin: se derivan de las preguntas
de investigacin presentadas en el proyecto y sirven de base para los
objetivos.
6. Objetivos: no es necesario sealar exactamente el texto de la investigacin,
puesto que los objetivos han podido ser ajustados a lo largo del proceso
respecto de los objetivos presentados al inicio, aunque no modificados en su
intencin original.
7. Marco terico: contiene los captulos que resumen la revisin documental
realizada.

Igualmente

aporta

los

antecedentes

terico-conceptuales

empricos que sostienen la investigacin. En los estudios cualitativos el marco


terico es referencial sobre la realidad analizada y no ejerce como base de
operacionalizacin de variables.
8. Metodologa de la investigacin: describe el tipo de investigacin elegida (en
este caso, cualitativa), su fundamentacin, el mtodo de estudio, poblacin y
muestra, estrategias de recogida de informacin y tcnicas de anlisis de datos
en su caso.
9. Presentacin y discusin de resultados: sintetiza los principales hallazgos
dndole una interpretacin terica.

27

10. Conclusiones: incluye lo esencial de todo el proyecto, haciendo hincapi en las


aportaciones realizadas.
11. Referencias bibliogrficas: citacin de las fuentes utilizadas siguiendo la
normativa internacional2.
Antes de adentrarnos en las tcnicas cualitativas ms utilizadas en las ciencias
sociales, sobre todo, en el campo de la economa y de la empresa, es necesario, para
tener una visin ms amplia de los mtodos cualitativos existentes, realizar una breve
descripcin de las tcnicas que se encuentran dentro de la observacin y de la lectura.
Para ello nos vamos a apoyar en el cuadro anterior Formas ms difundidas de
recoger informacin, que fue elaborado por Ruiz Olabunaga (2007):
OBSERVACIN:
1. Etnogrfica: es el estudio directo de personas o grupos durante un cierto
perodo para conocer su comportamiento social y revelar las explicaciones que
sustentan dicho comportamiento, utilizando la observacin directa, cuando el
investigador participa directamente, o indirecta, cuando no participa en el
fenmeno que se observa.
2. Etnometodolgica: se refiere a la investigacin emprica de los mtodos que
utiliza la gente para dar sentido y producir la actividad social cotidiana. Estudia
los procesos de constitucin de la realidad a travs de la observacin. Es
utilizada principalmente en sociologa.
3. Participativa No participativa: la observacin participativa es una tcnica
utilizada en las ciencias sociales en donde el investigador comparte con los
investigados su contexto, experiencia y vida cotidiana. En el caso de la no
participativa, el investigador no forma parte del grupo a estudiar y, adems, en
ocasiones, su presencia es desconocida por los investigados.
LECTURA:
1. Anlisis de contenidos: es el modo de recoger informacin, ms amplio,
universalizado y rico. Incluye textos escritos, grabados, pintados, filmados;
propios o ajenos; espontneos o preparados previamente; documentos
2

El mtodo ms utilizado en el campo de las ciencias sociales y, especialmente, en el rea de las


ciencias econmicas y empresariales es el Mtodo Harvard, tratado en pginas previas.

28

personales; fichas de contenidos. No se puede hablar directamente con el


texto, pero puede ser interpretado. Parte del principio de que examinando
textos es posible conocer no slo su significado, sino informacin sobre su
modo de produccin.
2. Biografas: es la historia de la vida de una persona desde su nacimiento hasta
su muerte, expone los acontecimientos significativos y logros ms importantes.
3. Circept: consiste en que todas las analogas despertadas por un concepto, una
idea o un instrumento, se ordenan de forma circular, de tal forma que aquellas
que se encuentran prximas entre s, guardan mucha ms relacin que las que
se encuentran alejadas.
A continuacin se procede a desarrollar el mtodo preferido por los investigadores
cualitativos: la ENTREVISTA. Dentro de la cual, como se sabe, se pueden diferenciar:
las entrevistas en profundidad, las entrevistas en grupo y el mtodo Delphi.

29

CAPTULO 4
Entrevistas en profundidad

1.

Concepto

Es una tcnica de obtener informacin, mediante una conversacin profesional con


una o varias personas para un estudio analtico de investigacin o para contribuir en
los diagnsticos o tratamientos sociales.
La entrevista en profundidad implica un proceso de comunicacin, en el transcurso del
cual, entrevistador y entrevistado, pueden influirse mutuamente. Como se coment en
el captulo 3, es fundamentalmente una conversacin en la que y durante la que, se
ejercita el arte de formular preguntas y escuchar respuestas.
Lejos de ser un intercambio espontneo comprende un proceso un tanto artificial a
travs del cual el entrevistador genera una situacin concreta la entrevista- que
implica una situacin nica.
Existen diferentes tipos de entrevista, desde la ms comn, la entrevista individual
hablada, hasta la entrevista de grupo, o las desarrolladas por correo o telefnico, de
forma estructurada y controlada o libre. Tres caractersticas pueden diferencias las
entrevistas:
a) Las entrevistas sostenidas con un solo individuo (individual) o con un grupo de
ellas (de grupo).
b) Las entrevistas que cubren un amplio espectro de temas (biogrficas) o las
monotemticas.
c) Las entrevistas dirigidas (estructurada) en las que el actor lleva la iniciativa de
la conversacin o aquellas en la que el entrevistador sigue un esquema general
y flexible de preguntas, en cuanto a orden, contenido y formulacin de las
mismas (no estructurada).

30

Tabla 6. Diferencias entre las entrevistas estructurada y no estructurada


La entrevista estructurada

La entrevista no estructurada
La entrevista

- Pretende explicar ms que comprender

- Pretende comprender ms que explicar

- Busca minimizar los errores

- Busca maximizar el significado

- Adopta

estmulo/respuesta,

- Adopta el formato de estmulo/respuesta sin

suponiendo que a una respuesta correcta el

esperar la respuesta objetivamente verdadera,

entrevistado contesta la verdad

sino subjetivamente sincera

el

formato

- Obtiene con frecuencia respuestas racionales,

- Obtiene

pero pasa por alto la dimensin emocional

con

frecuencia

respuestas

emocionales, pasando por alto la racionalidad


El entrevistador

- Formula una serie de preguntas con una serie

- Formula

de respuestas prefijadas entre las que elegir


- Controla el ritmo de la entrevista siguiendo un

preguntas

sin

esquema

fijo

de

categoras de respuesta
- Controla el ritmo de la entrevista en funcin de

patrn estandarizado y directo

las respuestas del entrevistado

- No da explicaciones largas del trabajo

- Explica el objetivo y motivacin del estudio

- No altera el orden ni la formulacin de

- Altera con frecuencia el orden y forma de las

preguntas

preguntas, aadiendo nuevas si es preciso

- No permite interrupciones ni intervencin de

- Permite

otras personas en las respuestas

intervencin

de

terceros si es conveniente

- No expresa su opinin personal a favor o en

- Si es requerido no oculta sus sentimientos ni

contra. Su papel es neutral

juicios de valor

- No interpreta el sentido de las preguntas, slo

- Explica cuanto haga falta del sentido de las

da las explicaciones previstas

preguntas

- Nunca improvisa el contenido o forma de las

- Con frecuencia improvisa el contenido y la

preguntas

forma de las preguntas

- Establece una relacin equilibrada que implica


familiaridad

interrupciones

al

mismo

tiempo

- Establece

que

impersonalidad

una

relacin

equilibrada

entre

familiaridad y profesionalidad
- Adopta el estilo del oyente interesado pero no

- Adopta el estilo de oyente interesado pero no

evala las respuestas

evala las respuestas odas.


El entrevistado
- Todos los entrevistados reciben el mismo

- Cada entrevistado recibe su propio conjunto de

paquete de preguntas

preguntas

- Las escuchan en el mismo orden y formato

- El orden y formato puede diferir de uno a otro

Las respuestas
- Son

cerradas

al

cuadro

de

categoras

- Son abiertas por definicin, sin categoras de

preestablecido
- Grabadas conforme al sistema de codificacin

respuestas preestablecidas
- Grabadas

previamente establecido

conforme

un

sistema

de

codificacin flexible y abierto a cambio en todo


momento

Fuente: Ruiz Olabunaga (2007)

31

La entrevista en profundidad ms habitual es la de carcter individual, holstico y no


directivo. Individual porque se entiende que la conversacin se desarrolla entre
entrevistador-entrevistado nicamente (aunque repita su entrevista con otro sujeto);
holstico porque no slo se ajusta al tema central sino que hace una panormica hacia
otros aspectos; y no directivo porque, aunque la entrevista en profundidad siempre se
desarrolla bajo control y direccin del entrevistador, permite cierta flexibilidad en
cuanto al contenido y forma de desarrollar la entrevista. Pero no equivale a una
conversacin exclusivamente abierta, ni a prescindir de un guin orientador.
Por ltimo, se presentan las principales ventajas e inconvenientes de las entrevistas
en profundidad:
Tabla 7. Ventajas e inconvenientes de las entrevistas en profundidad
Ventajas
- Riqueza

informativa:

Inconvenientes

intensiva,

holstica,

contextualizada y personalizada

- Factor tiempo (con matices)


- Problemas

- Posibilidad de indagacin por derroteros no


previstos incluso

cualitativo

de

reactividad,

fiabilidad y validez
- Falta de observacin directa o participada

- Flexibilidad, diligencia y economa


- Contrapunto

potenciales

de

- Carencia de las ventajas de la interaccin


resultados

grupal

cuantitativos
- Accesibilidad a informacin difcil de observar
- Preferible por su intimidad y comodidad
Fuente: Valls (1997)

2.

Fases

1.

Preparacin.

La preparacin de las entrevistas en profundidad tiene en cuenta al guin de


entrevista, la seleccin de entrevistados y otros preparativos.
-

El guin de la entrevista: contiene los temas que deben cubrirse, de acuerdo


con los objetivos informativos de la investigacin. Se trata de un esquema con
los puntos a tratar, pero que no se considera cerrado y cuyo orden no tiene que
seguirse necesariamente.

La seleccin de entrevistados: a quines?, a cuntos? y cuntas veces?,


no son preguntas fciles de contestar. Valles (1997) ofrece un conjunto de

32

ideas y criterios para resolver los casos prcticos de estudio que se puedan
plantear.
a) Aproximacin al universo de entrevistados potenciales a travs de las
fuentes

disponibles

(estadsticas

censales,

estudios

previos

experiencia del investigador).


b) En ocasiones se opta por la realizacin de entrevistas en profundidad a
slo algunos tipos o perfiles sociolgicos, basando la seleccin de
entrevistados en criterios de marginalidad, de normalidad o de
excelencia.
c) La seleccin de entrevistados puede tambin apoyarse en la
clasificacin de stos en tres tipos generales: claves, especiales y
representativos.
d) Tambin a travs de criterios de naturales prctica. Las preguntas
criterio podran ser: Quines tienen la informacin relevante?,
quines son ms accesibles fsica y socialmente?, quines estn
ms dispuestos a informar? y quines son ms capaces de comunicar
la informacin con precisin?
e) Y respecto al problema de a cuntos, se propone acudir al principio de
saturacin, que es cuando no se encuentran datos adicionales donde el
entrevistador pueda desarrollar propiedades de la categora. Conforme
va viendo casos similares una y otra vez el investigador adquiere
confianza emprica de que una categora est saturada.
-

Otros preparativos: aqu se incluyen aspectos como la seleccin del


entrevistador apropiado (caractersticas externas y de personalidad), las
condiciones materiales (tiempo, lugar y registro) de la entrevista as como las
labores de contacto y presentacin (preparar el terreno para la entrevista).

2.

Realizacin

Existen diferentes tcticas para la realizacin de las entrevistas:


a) Tcticas que pueden avanzarse en el guin de entrevista: consiste en trazar un
esquema que anticipen los modos de abordar el tema central y las cuestiones

33

secundarias. Supone tener listas preguntas de amplio espectro, para motivar al


entrevistado, etc.
b) Tcticas del entrevistador en la situacin de entrevista: forman parte del oficio y
pericia del entrevistador, que las improvisa durante la realizacin de la
entrevista. Se pueden distinguir:
-

Tctica del silencio. Muy til si se sabe emplear en el momento adecuado.

Tcticas de animacin y elaboracin. Conjunto de observaciones, ruidos y


gestos para lanzar un mensaje determinado.

Tctica de reafirmar y repetir. Repeticin de expresiones manifestadas por


el entrevistado para invitarle a que prosiga.

Tcticas de recapitulacin. Invitar al entrevistado a relatar de nuevo alguna


trayectoria de su vida.

Tcticas de aclaracin. Pedir ms detalle al entrevistado.

Tctica de cambiar de tema. Cuando se quiere tratar algn asunto


pendiente o para introducir un asunto delicado.

Tctica de la post-entrevista. Una vez concluida la entrevista formal, se


puede hablar amigablemente con el entrevistado para que guarde un buen
recuerdo o para detectar algn tipo de informacin que el entrevistado se
ha guardado durante la entrevista.

3.

Tratamiento

Este ltimo paso se relaciona con el anlisis y presentacin de la informacin


obtenida. Se propone la elaboracin de un ndice as como una sntesis del trabajo
realizado. En el manual de Valles (1997) se utilizan algunos ejemplos prcticos de
cmo se puede estructurar la informacin extrada de una entrevista en profundidad.

34

3.

Aplicabilidad

Suele ser de especial utilidad en determinadas circunstancias, como por ejemplo:


-

Temas confidenciales o enojosos.

Situaciones de normativa social rgida.

Comportamientos complejos.

Entrevistas a profesionales o directivos.

Temas que afectan a competidores de un mismo sector.

35

CAPTULO 5
Grupos de discusin

1.

Concepto

Antes de adentrarnos especficamente en esta tcnica conviene conocer la estructura


de los mtodos de entrevista grupal, que es donde se encuentran los grupos de
discusin y otras tcnicas afines.
Frey y Fontana (1993) clasificaron las entrevistas grupales de la siguiente manera:
a) Grupos de discusin: tcnica muy utilizada en el campo de la investigacin de
mercados. Tiene carcter exploratorio puesto que se busca la familiarizacin
con el tema, se prueban cuestionarios, se valoran las reacciones a un
producto, etc. El lugar habitual de realizacin es en escenarios formales de
entrevista. Y el estilo de moderacin es semidirigido o dirigido, siendo el
formato de la entrevista algo estructurado.
b) Tormenta de ideas o brainstorming: tcnica que pone su acento en la
creatividad y generacin de nuevas ideas, a partir de un tema o cuestin que el
entrevistador o moderador plantea a un grupo de personas. Tiene carcter
exploratorio. El lugar de realizacin puede ser tanto en escenarios formales
como naturales, el moderador adopta una posicin pasiva y no existe una
estructuracin de preguntas.
c) Mtodo Delphi3: tcnica dirigida a expertos donde las entrevistas suelen
realizarse sin que se vean fsicamente los miembros del grupo. Generalmente,
el investigador hace una primera ronda de entrevistas individuales con cada
miembro. Luego, en sucesivas rondas de entrevista individual, ofrece a cada
entrevistado un resumen de las respuestas dadas por los otros miembros del
grupo, por si quieren ajustar sus respuestas y hacerlas converger al consenso
del grupo.
Este mtodo es utilizado con propsitos de desarrollar pronsticos de sucesos
y tendencias futuros basados en la opinin de expertos. Tambin para disear
estrategias y toma de decisiones.
3

Por su importancia en el campo de las ciencias econmicas y empresariales se ha desarrollado un


captulo especfico de este mtodo grupal.

36

Se caracteriza por la formalidad y por el estilo dirigido y estructurado.


d) Grupos de discusin sin moderador: tcnica de entrevista grupal que suele
surgir espontneamente. Estas conversaciones informales suelen darse
cuando el investigador va buscando, sobre el terreno, a entrevistados
potenciales y los encuentra agrupados, en su ambiente, en mayor o menor
nmero. Esa conversacin en grupo, informal e in situ constituye la entrevista
grupal natural o sin moderador.
Los grupos de discusin han sufrido a lo largo de los aos variaciones y
combinaciones con otras tcnicas que han mejorado su capacidad de extraer
informacin. Por ejemplo, la tcnica ha sido utilizada de manera tradicional pero
tambin ha evolucionado hacia una serie de nuevos usos basados en la devolucin de
la informacin al grupo. O su utilizacin autosuficiente, donde la propia tcnica de
forma casi autnoma extrae informacin del grupo, son proyectos que dependen
solamente de grupos de discusin; o su utilizacin combinada, donde pueden
interactuar con otras tcnicas cualitativas (entrevistas en profundidad, anlisis
documental, observacin directa, etc.) o con tcnicas cuantitativas (encuestas, muy
tpico del marketing).
En cualquiera de sus formas se presentan las principales ventajas e inconvenientes de
los grupos de discusin:
Tabla 8. Principales ventajas e inconvenientes de los grupos de discusin
Ventajas
- Economa

de

tiempo

Inconvenientes
dinero:

ventajas

- Artificialidad en relacin con las tcnicas de

tradicionales revisadas
- Flexibilidad:
diversidad

utilizable
de

temas,

observacin participada
en

el

con

estudio
personas

de

- Inconvenientes (clsicos) de la interaccin

grupal: problemas de generalizacin, sesgo,

ambientes diversos (pero precisa de mayor


espacio y coordinacin que las entrevistas en

comparabilidad, deseabilidad
- Inconvenientes

profundidad)

ortodoxa

- Las bazas de la interaccin grupal: efectos de

de

la

tradicional:

interaccin
lmites

investigacin-accin-participativa;

sinergia, bola de nieve, efecto audiencia,

del

estimulacin, seguridad y espontaneidad en

alternativas o afines

grupo
Fuente: Valls (1997)

37

complemento

de

tcnicas

grupal

para

la

necesidad
grupales

2.

Fases

1.

Preparacin.

La preparacin de los grupos de discusin tiene en cuenta las decisiones muestrales


sobre la composicin de los grupos y otros preparativos.
-

Decisiones muestrales: cuntos grupos se forman? y cmo se componen?


Son decisiones muestrales que, en parte, se toman al proyectar el estudio y, en
parte, se completan durante el trabajo de campo.
Como en las entrevistas en profundidad, en los grupos de discusin no se
persigue la representacin estadstica, sino la representacin tipolgica y
social, de acuerdo con los objetivos de la investigacin y las limitaciones de
medios y tiempo (se recomienda entre 6 y 10 participantes). Por tanto, el
nmero de grupos y su composicin depender de dos criterios bsicos:
a) Heterogeneidad entre grupos: orienta la seleccin de participantes y su
distribucin

en

grupos,

tratando

de

reproducir

conversaciones

relevantes, segn los propsitos del estudio. Para hacerlo operativo, se


precisa de la nocin de saturacin.
b) Economa: introduce las constricciones de tiempo y dinero.
-

Otros preparativos: aqu se incluyen aspectos como, cmo se va a contactar


con los participantes (surge la figura del contactador para aliviar al
investigador de esta tarea tan ardua. El mayor problema surge en el proceso
de captacin o convocatoria de los participantes de los grupos, para ellos se
propone utilizar las redes personales y sociales, evitar revelar informacin al
participante que pudiera influir en sus respuestas posteriores y evitar la
participacin de amigos con el fin de rodear los riesgos de la preexistencia del
grupo) y cul va a ser el lugar de reunin (en principio, el lugar debera ser
neutral con respecto al tema a tratar y con las caractersticas de las personas
convocadas. Se habla de evitar espacios cuya imagen pueda llevar a
reacciones

esteriotipadas

que

afecten

al

discurso

del

grupo,

evitar

disposiciones de sillas y mesas que dificulten la conversacin del grupo. En


general, el lugar debe equilibrar las necesidades de los participantes y del
investigador: accesibilidad y condiciones para la grabacin).

38

2.

Realizacin

En este apartado se presta especial atencin al papel del moderador, haciendo alusin
a las actuaciones de los participantes en la reunin.
Sirva el siguiente esquema para resaltar los puntos principales de la realizacin de los
grupos de discusin:
-

Provocacin inicial y puesta en marcha de la discusin grupal. No basta con


poner el tema sobre la mesa, es necesario generar inters en discutirlo.
Adems, se debe trascender de la dinmica pregunta-respuesta hacia la
interaccin grupal caracterstica de esta tcnica. El moderador no debe dar su
opinin sino insistir en que el grupo tome la palabra.

Provocacin continuada. Aunque el moderador no interviene en la discusin, s


interviene en su catalizacin, deshaciendo bloqueos y controlando en cierto
modo su desarrollo. Supone tareas de animacin y mantenimiento de la
discusin, el moderador es el motor del grupo. Tiene la funcin de pedir
aclaraciones y reformulaciones, realizar interpretaciones, cambiar de tema y
extraer conclusiones.

3.

Tratamiento

Este ltimo apartado se relaciona con el anlisis y presentacin de la informacin


obtenida. Y dado el propsito exploratorio de la mayora de los estudios con grupos de
discusin, suele resultar apropiado, una simple descripcin narrativa, esto es,
organizar la informacin dndole sentido.
Por ltimo, Krueguer (1991) ofrece una clasificacin de tipos de informe relacionados
con los grupos de discusin:
-

Modelo de datos directos: consiste en introducir el tema central y a


continuacin presentar todos los comentarios de los participantes clasificados
por temas o subtemas.

Modelo descriptivo: consiste en una descripcin resumida seguida de citas


ilustrativas. Supone mayor grado de elaboracin.

39

Modelo interpretativo: en este caso, el analista ofrece citas ilustrativas seguidas


de las interpretaciones correspondientes. Sobre la base de sntesis del modelo
descriptivo se aade un esfuerzo interpretativo de mayor calado.

En el manual de Valles (1997) se utilizan algunos ejemplos prcticos de cmo se


puede estructurar la informacin extrada de los grupos de discusin.

3.

Aplicabilidad
-

Tcnica muy utilizada en el marketing y en los estudios de mercado.

Los grupos de discusin pueden dar buenas ideas acerca de las preferencias y
actitudes de los consumidores sobre un producto o servicio determinado,
aunque no sera concluyente dado su carcter exploratorio.

Es especialmente til cuando se desconocen las variables que definen el


fenmeno de estudio.

En muchas ocasiones, tambin, se emplea como prueba piloto o pretest, antes


del diseo de un cuestionario.

40

CAPTULO 6
Mtodo Delphi

1.

Concepto

Linstone y Turoff (1975) definen la tcnica Delphi como un mtodo de estructuracin


de un proceso de comunicacin grupal que es efectivo a la hora de permitir a un grupo
de individuos, como un todo, tratar un problema complejo.
Un Delphi consiste en la seleccin de un grupo de expertos a los que se les pregunta
su opinin sobre las cuestiones referidas a acontecimientos del futuro. Las
estimaciones de los expertos se realizan en sucesivas rondas, annimas, al objeto de
tratar de conseguir consenso, pero con la mxima autonoma por parte de los
participantes. Por tanto, la capacidad de prediccin de esta tcnica se basa en el juicio
intuitivo emitido por un grupo de expertos.
El mtodo Delphi procede por medio de la interrogacin a expertos con la ayuda de
cuestionarios sucesivos, a fin de poner de manifiesto convergencias de opiniones y
deducir eventuales consensos. La encuesta se lleva a cabo de una manera annima
(actualmente es habitual realizarlo va correo-e o cuestionarios web) para evitar los
efectos de los lderes. El objetivo de los cuestionarios sucesivos es disminuir el
espacio intercuartil precisando la mediana (bsqueda de consenso: baja dispersin).
Las preguntas se refieren a las probabilidades de realizacin de hiptesis o de
acontecimientos. La calidad de los resultados depende en gran medida del
cuestionario y de la eleccin de los expertos.
En su conjunto, el Delphi permitir prever las transformaciones ms importantes que
puedan producirse en el fenmeno analizado en el transcurso de los aos.

2.

Fases

1.

Formulacin del problema

Es trascendental definir con precisin el campo de investigacin puesto que la eleccin


de los expertos est supeditada al hecho de que todos posean la misma nocin de
este campo.

41

Sobre la elaboracin del cuestionario, las preguntas deben ser precisas, cuantificables
e independientes.
2.

Eleccin de expertos

El experto ser elegido por su capacidad de encarar el futuro y posea conocimientos


sobre el tema consultado.
Los expertos son aislados y sus opiniones recogidas por va postal o electrnica y de
forma annima, as se obtendr una opinin real, no influenciada por el resto del
grupo.
3.

Elaboracin y lanzamiento de los cuestionarios

Los cuestionarios se elaborarn de manera que faciliten la respuesta de los


consultados. Preferentemente las respuestas habrn de poder ser cuantificadas y
ponderadas. Con frecuencia se recurre a respuestas categorizadas (S/No; Muy de
cuerdo/De acuerdo/Indiferente/En desacuerdo/Muy en desacuerdo) y, despus, se
tratan en trminos porcentuales tratando de ubicar a la mayora de los consultados en
una categora.
Se formularn preguntas relativas al grado de ocurrencia (probabilidad) y, de
importancia (prioridad).
4.

Desarrollo prctico y explotacin de resultados

El cuestionario es enviado a un nmero determinado de expertos (el grupo final4 ha de


ser entre 25 y 30). Y va acompaado por una nota de presentacin con las finalidades,
el espritu del Delphi, as como las condiciones del desarrollo de la encuesta (plazo de
respuesta, garanta de anonimato). En ocasiones, en cada cuestin, puede
plantearse que el experto evale su propio nivel de competencia (til para las
ponderaciones).

Hay que tener en cuenta las no respuestas y abandonos que se producen en el proceso.

42

El objetivo de los cuestionarios sucesivos5 es reducir la dispersin de las opiniones y


precisar la opinin media consensuada. En la segunda ronda, los expertos son
informados de los resultados de la primera consulta de preguntas y deben dar una
nueva respuesta y sobre todo deben justificarla en el caso de que sea notablemente
distinta con respecto al grupo. Si fuera necesario, en el curso de la tercera ronda se
pide a cada experto comentar los argumentos de los que disienten de la mayora. Y un
cuarto turno de preguntas, permite la respuesta definitiva: el consenso y la dispersin
de opiniones (intervalos intercuartiles y desviacin tpica).

Algunas recomendaciones
-

Grabacin de los resultados en una base de datos, para operar con ellos y
realizar grficos y tablas.

Obtencin de los principales resultados. Los principales estadsticos que se


calcularn sern medidas de tendencia central y dispersin: media, mediana,
moda, mximo, mnimo, cuartiles y desviacin tpica. La desviacin seala el
grado de discrepancia o consenso de las respuestas.

Lanzamiento de dos rondas. En la formulacin ms terica del mtodo Delphi,


se requiere realizar tres o ms rondas a los expertos a fin de reducir el espacio
intercuartlico; sin embargo, en Astigarraga (2003) se hace alusin a la
suficiencia de un Delphi con dos rondas pero siguiendo algunos criterios:
Objetivo del lanzamiento y tratamiento de la segunda ronda.
a) Remitir y hacer partcipes de la informacin obtenida a todos aquellos
que han colaborado en el estudio con la aportacin de su conocimiento
y opiniones.

Aunque la formulacin terica del mtodo Delphi comprende varias etapas sucesivas de envos de
cuestionarios, en buena parte de los casos puede limitarse a dos rondas, lo que segn la experiencia no
afecta a la calidad de los resultados.
Como es sabido, el objetivo de los cuestionarios sucesivos es disminuir el espacio intercuartil, esto es
cunto se desva la opinin del experto de la opinin del conjunto, precisando la mediana, de las
respuestas obtenidas. La finalidad de la primera ronda (primer cuestionario) es calcular el espacio
intercuartil. La segunda suministra a cada experto las opiniones de sus colegas, y abre un debate para
obtener un consenso en los resultados y una generacin de conocimiento sobre el tema. Cada experto
argumentar los pros y los contras de las opiniones de los dems y de la suya propia. Con la tercera se
espera un mayor acercamiento a un consenso.

43

b) Confirmar los resultados obtenidos en la consulta inicial. De hecho, la


experiencia indica que las variaciones respecto a los resultados iniciales
son mnimas en ste tipo de estudios.
Metodologa para el lanzamiento y tratamiento de la segunda ronda.
a) Se selecciona la media o la mediana de las respuestas a las preguntas
de la primera ronda.
b) Se solicita a los expertos que indiquen su acuerdo o desacuerdo con
dicha media.
c) Se pide a los expertos que no se hallan de acuerdo con la media que
argumenten sus razones.
d) Se calcula la nueva media o mediana, y a los expertos que se muestren
de acuerdo se les fijar el valor de la media anterior.
Los valores propuestos por los expertos que siguen manteniendo
valores diferentes de la media, sirven para elaborar escenarios
alternativos o formular hiptesis de futuro alternativas.
Elaboracin de informe.
a) Los resultados ms destacados de la encuesta, las tablas estadsticas y
las incidencias del trabajo de campo se recogen en un informe
especfico.

3.

Aplicabilidad

La utilizacin del mtodo Delphi ofrece casi la certeza de obtener un consenso en el


desarrollo de los cuestionarios sucesivos. Adems, la informacin recogida en el curso
de la consulta acerca de acontecimientos, tendencias, rupturas determinantes en la
evolucin futura del problema estudiado es normalmente abundante.
Finalmente, esta tcnica puede utilizarse indistintamente tanto en el campo de la
tecnologa como en el de las ciencias sociales (economa y empresa, gestin,
estrategia, etc.).

44

No obstante, conviene ser consciente de algunas de las posibles limitaciones con las
que el investigador se puede enfrentar al utilizar este mtodo. En ocasiones se revela
largo, costoso, fastidioso e intuitivo ms que racional. Tambin, la posicin presionante
del investigador es discutible puesto que slo los expertos que se salen de la norma
deben justificar su posicin. Cuando muchas veces, precisamente, esa posicin
divergente es ms interesante que la del consenso. Por ltimo, no se toman en
consideracin las posibles interacciones entre las hiptesis consideradas, esto es lo
que conduce en ocasiones a implementar los mtodos de impactos cruzados.

45

MDULO 3:
INVESTIGACIN CUANTITATIVA

46

CAPTULO 7
Introduccin a la metodologa y tcnicas cuantitativas

1.

Introduccin

La metodologa cuantitativa es aquella que permite la obtencin de informacin a partir


de la cuantificacin de los datos sobre variables. Este tipo de investigacin logra sus
conclusiones a travs de la relacin numrica entre variables, y as poder realizar
generalizaciones y producir datos objetivos.
Dicho de otro modo, la investigacin cuantitativa es la que analiza diversos elementos
que pueden ser medidos y cuantificados. Toda la informacin se obtiene a base de
muestras de la poblacin, y sus resultados son extrapolables a todo el universo, con
un determinado nivel de error y nivel de confianza.
Su racionalidad est fundamentada en el positivismo. Tiene un profundo apego a la
tradicionalidad de la Ciencia y utilizacin de la neutralidad valorativa como criterio de
objetividad, por lo que el conocimiento esta fundamentado en los hechos.
De este modo, dado que la investigacin cuantitativa se relaciona con el tratamiento
de variables mtricas, segn el nmero de variables que escojamos, el anlisis podr
ser de un tipo u otro. Si el anlisis emplea una nica variable, el anlisis se denomina
univariante (distribuciones de una variable, media, mediana, moda, etc.); si el anlisis
utiliza dos variables, el anlisis se denomina bivariante (correlaciones, anlisis de la
varianza, regresiones simples, etc.); y si se analizan simultneamente ms de dos
variables, el anlisis puede ser considerado como un anlisis multivariante (anlisis
factorial, anlisis cluster, regresin mltiple, etc.).
En este tipo de anlisis es donde nos vamos a detener a lo largo de este mdulo. Las
tcnicas del anlisis multivariante estn siendo ampliamente aplicadas a la industria,
administracin y centros de investigacin de mbito universitario. Este inters
creciente en el rea de las ciencias sociales no se da por casualidad, ya desde hace
tiempo los estadsticos Hardyck y Petrinovich indicaron que:
El anlisis de los mtodos multivariantes predominar en el futuro y dar por resultado cambios
drsticos en el modo en que los investigadores piensan sobre los problemas y en cmo disean
sus investigaciones. Esos mtodos hacen posible plantear preguntas especficas y precisas de
considerable complejidadSe pueden preservar las correlaciones naturales entre las mltiples

47

influencias sobre el comportamiento y se pueden estudiar estadsticamente los efectos aislados


de esas influencias sin provocar el tpico aislamiento de esos individuos o variables (Hardyck y
Petrinovich, 1976).

Para realizar anlisis multivariante, los investigadores utilizan diversos programas de


estadstica, tales como el SPSS, GRETL, SAS o AMOS, entre otros. Este tipo de
software ha puesto a disposicin de cualquier investigador interesado el acceso a
todos los recursos necesarios para resolver un problema multivariante de casi
cualquier dimensin.

2.

Caractersticas de los mtodos cuantitativos


-

Su objetivo es la inferencia ms all de sus datos. A partir de una muestra


representativa trata de elevar las conclusiones al universo, respetando siempre
unos niveles mnimos de error.

Su lenguaje es numrico. Si una investigacin se apoya en los nmeros, los


test estadsticos, los algoritmos, las tablas y las frmulas estadsticas, es
investigacin cuantitativa.

Su modo de captar la informacin es estructurado, penetrante y controlado. Si


en una investigacin se prefiere recoger informacin mediante experimentos o
encuestas estructuradas masivas, entra en el mbito de la metodologa
cuantitativa.

Su procedimiento es deductivo. Si una investigacin parte de una teora y unas


hiptesis perfectamente elaboradas y precisas para conseguir sus objetivos,
entrara en el mbito de la metodologa cuantitativa. Como ya se indic en el
primer mdulo de este documento, se pasa de lo general a lo particular.

La orientacin es generalizadora. Ligado al primer punto, la investigacin


cuantitativa intenta generalizar de una muestra pequea a un colectivo grande
cualquier elemento particular de la sociedad.

48

3.

Algunos conceptos importantes del anlisis cuantitativo

Valor terico.
Es

una

combinacin

lineal

de

variables

con

ponderaciones

determinadas

empricamente. Digamos que es el elemento a estudiar (ha de estar muy claro). El


investigador selecciona las variables, mientras que las ponderaciones se obtienen a
travs de la tcnica multivariante. Matemticamente podra expresarse as:
Y (valor terico) = 0 + 1 X1 + + 2 X2 + 3 X3 ++ n Xn
Donde Xn es la variable observada y es la ponderacin determinada por la tcnica
multivariante.
El resultado es un valor nico que representa una combinacin de todo el conjunto de
variables que mejor se adaptan al objeto del anlisis multivariante especfico. En cada
caso, el valor terico capta el carcter multivariante del anlisis.
Escalas de medida.
La medida de una variable es importante para representar con precisin el concepto
de nuestro inters y es crucial en la seleccin del mtodo de anlisis multivariante
apropiado. Se distinguen:
-

Datos no mtricos (cualitativos): son atributos, caractersticas o propiedades


categricas que identifican o describen a un sujeto. Por tanto, los nmeros
asignados a los objetos no tienen ms significado cuantitativo que indicar la
presencia o ausencia del atributo o caracterstica bajo investigacin. Dentro de
este tipo de datos se diferencia a su vez:
a. Escalas nominales: asigna nmeros que se usan para etiquetar o
identificar sujetos u objetos. Ejemplos: sexo (hombre-mujer), estado civil
(soltero-casado) o raza (Caucasoide-Mongoloide-Negroide).
b. Escalas ordinales: son denominadas tambin cuasi-cuantitativas. Las
variables pueden ser ordenadas o clasificadas en relacin a la cantidad
del atributo posedo. Ejemplos: clase social (alta-media-baja), nivel de
estudios (doctorado-master-grado) o hacerse una herida (levemoderada-grave).

49

Datos mtricos (cuantitativos): los sujetos pueden ser identificados por


diferencias entre grado o cantidad. Las medidas mtricas (escala de intervalo y
escala de la razn) son las ms apropiadas para casos que involucran cantidad
o magnitud. Se distingue entre:
a. Variable discreta: presenta separaciones o saltos en los valores que
puede tomar. Ejemplo: nmero de hijos (1-2-3-4-5-6)
b. Variable continua: puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Ejemplo: altura (cm.) o masa (kg.)

Referencia temporal.
Para fines del anlisis estadstico es importante tener en cuenta la referencia temporal
de los datos. Segn este criterio se pueden distinguir tres tipos de datos:

Series temporales. Son observaciones numricas de las variables durante un


nmero de periodos de tiempo. Por ejemplo, se podr medir el gasto en consumo
de un determinado bien en el perodo 1990-2010.

Seccin cruzada o corte transversal. Se trata de las observaciones de las variables


medidas en un momento determinado del tiempo correspondiente a una clase,
bien puede ser una Comunidad Autnoma, o una provincia, o una familia, etc.;
dependiendo del estudio que se est realizando. Por ejemplo, se puede medir el
gasto en consumo de un determinado bien en las distintas CCAA en el ao 2010.

Panel de datos. Otro tipo de datos lo constituye la informacin acerca de un


conjunto de individuos, o provincias, etc., a travs del tiempo. En este caso, por
ejemplo, se pueden obtener observaciones de gasto en consumo de un bien para
un grupo de familias en el periodo 1990-2010.

Error de medida.
Es el grado en que los valores observados no son representativos de los valores
verdaderos. El error de medida puede generarse por varias razones: errores de
entrada de datos, imprecisin en la medicin de la variable o incapacidad de los
encuestados a proporcionar informacin precisa.
Por tanto, el objetivo del investigador debe ser reducir el error de medida. Segn Hair
et al. (2007) el analista debe enfrentarse tanto con la validez como con la fiabilidad de

50

la medida. La validez es el grado en que la medida representa con precisin lo que se


supone que representa. Es imprescindible, por tanto, que exista un conocimiento
profundo de lo que se va a medir. Y la fiabilidad es el grado en que la variable
observada mide el valor verdadero y est libre de error, es lo contrario al error de
medida. En ocasiones se acude a la elaboracin de indicadores para agregar escalas
y as emplear una medida compuesta que evite usar solo una nica variable para
representar un concepto. Digamos que no se deja la fiabilidad plena a una nica
respuesta sino en la de un conjunto de respuestas relacionadas. Ejemplo: al medir la
satisfaccin podemos preguntarlo directamente o bien desagregar por tipos de
satisfaccin.
Por ltimo, debemos aclarar que los malos resultados de una investigacin no siempre
se deben al error de medida, pero la presencia del error de medida es garanta de
distorsin en las relaciones observadas y hace menos potentes las tcnicas
estadsticas.
Por ello, se recomienda evaluar la confiabilidad de los datos de los que se dispone,
sobre todo si no son oficiales sino generados mediante cuestionarios. Una forma de
hacerlo es calculando el Alfa de Cronbach, que determina la consistencia interna de
una escala analizando la correlacin media de una variable con todas las dems que
integran dicha escala. Ofrece informacin aproximada sobre si los encuestados han
entendido las preguntas de un cuestionario. Cuanto ms se acerque a uno su valor,
mejor, porque mayor consistencia tendr los datos. Por encima de 0,7 podra
considerarse un nivel aceptable (George y Mallery, 1995).
Asimismo, tambin es recomendable evaluar la validez de los datos, es decir,
identificar si el proceso mide lo que se desea medir. Para ello, se puede utilizar el
coeficiente de Aiken, que toma valores entre 0 y 1. Es prctica general dar como
vlidos los datos cuando dicho coeficiente supera el valor 0,6 o 0,7, pero es
aconsejable trabajar con niveles superiores (Aiken, 1996).

51

Grfico 1. Validez y confiabilidad

Fuente: Fundacin Polar

Significacin estadstica.
La inmensa mayora de las tcnicas multivariantes se basan en la inferencia
estadstica de los valores de una poblacin o la relacin entre variables de una
muestra escogida aleatoriamente de esa poblacin.
Para interpretar las inferencias estadsticas, el investigador debe fijar los niveles de
aceptacin de error estadstico. El modo ms comn es determinar el nivel de
significacin (), que se define como la probabilidad de rechazar la hiptesis nula
cuando es cierta, es decir, la posibilidad de que la prueba muestra significacin
estadstica cuando en realidad no est presente (el conocido caso de un positivo
falso). Especificando un nivel alfa, el investigador fija los mrgenes admisibles de
error. Normalmente se utiliza el 5%.

4.

Tipos de tcnicas estadsticas

La Estadstica proporciona tcnicas y herramientas para la recopilacin y anlisis de


datos del fenmeno en estudio. El anlisis puede centrarse en el estudio de un slo
factor o variable, en este caso se habla de anlisis univariante. Las principales
tcnicas de anlisis univariante, son las medidas de tendencia o de posicin (media,
mediana, moda y cuartiles), las medidas de dispersin (rango o recorrido, desviacin
tpica y coeficiente de variacin de Pearson) y las medidas de inferencia (prueba t,
entre otras).
Cuando se realiza el anlisis conjunto de dos o ms factores del problema en estudio,
hacemos referencia al anlisis multivariante. A continuacin se exponen algunas de
las tcnicas multivariantes ms utilizadas en el campo de las ciencias sociales. La
mayor parte de ellas sern desarrolladas posteriormente en profundidad.

52

Tabla 9. Esquema de las principales tcnicas multivariantes


- Regresin lineal mltiple
Dependencia
Tcnicas

- Anlisis discriminante
- Modelos de probabilidad lineal (regresin logstica y probit)
- Modelos de ecuaciones estructurales

estadsticas
multivariantes

- Anlisis factorial
Interdependencia

- Anlisis cluster
- Anlisis de correspondencias mltiple

Fuente: Hair et al. (2007)

Regresin lineal mltiple


Tcnica para explicar o predecir variables. Una variable dependiente mtrica
relacionada con variables independientes mtricas (muy habitual el uso de variables
ficticias6).
Anlisis discriminante
Tcnica para predecir variables cualitativas y distinguir entre grupos. Una variable
dependiente no mtrica y variables independientes mtricas (muy habitual el uso de
variables ficticias).
Modelos de probabilidad lineal (regresin logstica y probit)
Tcnica para predecir variables cualitativas y distinguir entre grupos. Una variable
dependiente no mtrica y variables independientes mtricas (muy habitual el uso de
variables ficticias).
Modelo de ecuaciones estructurales
Tcnica de relaciones de causalidad simultnea. Varias variables dependientes
mtricas, en ecuaciones distintas, relacionadas con variables independientes de
cualquier tipo. Es habitual el uso de variables latentes.

La codificacin de una variable ficticia es una manera de transformar datos no mtricos en mtricos. Se
asignan unos y ceros al sujeto, dependiendo de si cuenta o no con cierta caracterstica. Por ejemplo, si un
sujeto es hombre se le asigna 0 y si es mujer se le asigna 1, o al contrario.

53

Anlisis factorial
Tcnica de reduccin de datos, enfocado a variables mtricas. Variables originales se
aglutinan en factores. til para la construccin de indicadores.
Anlisis cluster
Tcnica para clasificar individuos en grupos no conocidos a priori. Se forman grupos
homogneos dentro de s y heterogneos entre s.
Anlisis de correspondencias mltiple
Tcnica de reduccin de datos, parecida al anlisis factorial pero orientada a variables
no mtricas. til para elaborar indicadores.

54

CAPTULO 8
Encuesta por muestreo

1.

Introduccin

La investigacin cuantitativa en ciencias sociales necesita como materia prima


informacin estadstica. En este sentido, la estadstica es una ciencia que proporciona
instrumentos para recopilar la informacin numrica que se obtiene de observar los
fenmenos de un colectivo o poblacin y analizar la regularidad con la que ocurren.
Entendemos como poblacin estadstica o colectivo al conjunto de entes (personas,
animales o cosas) sobre las que se va a llevar a cabo la investigacin estadstica. Se
entiende que el estudio de una poblacin, en la mayora de los casos, no se pueda
realizar observando todos los elementos de la poblacin por lo que ser necesario
examinar slo una parte de la misma. A este subconjunto de la poblacin se le
denomina muestra.
Dentro de la estadstica podemos distinguir dos ramas de inters: la estadstica
descriptiva y la inferencia estadstica. La estadstica descriptiva tiene como objeto la
recogida, recopilacin y reduccin de los datos de una muestra o poblacin a unas
pocas medidas descriptivas que permiten conocer las caractersticas existentes en ese
conjunto de datos. La Inferencia estadstica tiene por objeto generalizar la informacin
proporcionada por una muestra a la poblacin de donde ha sido extrada.
En una investigacin estadstica se pueden distinguir las siguientes etapas:

Recopilacin de datos: Definida la poblacin y la/s caracterstica/s a estudiar,


se debe proceder a la observacin de la misma en los elementos
poblacionales. Los datos pueden obtenerse utilizando fuentes de datos
publicadas, a travs de un experimento o a travs de una encuesta por
muestreo.

Depuracin y exploracin de datos: Recogidos los datos deben ser depurados


ya que de nada servira aplicar procedimientos y tcnicas cientficas si la
informacin base es errnea.

Tabulacin y representacin grfica de datos: Su objeto es reducir el volumen


de la informacin de manera que sea manejable.

55

Tratamiento de datos: Se trata de reducir la informacin contenida en las tablas


mediante el clculo de las diferentes medidas de posicin, dispersin,de la
estadstica descriptiva. Los resultados obtenidos del conjunto de datos
analizados se generalizarn a la poblacin utilizando las tcnicas y
herramientas que la inferencia estadstica pone a nuestra disposicin.

2.

Recopilacin de datos. Encuesta por muestreo

1.

Concepto

En todas las investigaciones los datos se obtienen, por lo general, a partir de una
muestra de elementos y no sobre toda la poblacin respecto a la cual se pretenden
aplicar los resultados. La muestra debe ser representativa de la poblacin de dnde ha
sido extrada para poder generalizar los resultados obtenidos.
La encuesta por muestreo es una tcnica estadstica para recopilar datos, mediante la
consulta a una muestra de individuos que representa a la poblacin o colectivo que
queremos investigar.
2.

Fases

Podemos distinguir las siguientes fases:

Definicin de objetivos: los objetivos del anlisis estadstico vendrn


determinados

por los objetivos de la tesis doctoral. La consulta previa de

fuentes realizada y el desarrollo del marco terico en las primeras etapas de la


investigacin, nos permiten llegar a esta fase con un conocimiento de las
variables y de la poblacin que queremos investigar.

Diseo del plan de muestreo: los planes de muestreo deben resolver


preguntas tales como qu tipo de muestreo utilizar? cul es el tamao
muestral idneo?, qu mtodo debe emplearse para obtener la informacin
en campo? , qu periodo de tiempo se emplea como referencia de la
informacin?, etc. (Santos Pea, 1999).
En concreto, un plan de muestreo debe incluir:
Diseo del cuestionario: se pueden utilizar cuestionarios ya existentes y/o
elaborar uno especfico para nuestra investigacin. Antes de aplicar el

56

cuestionario debemos probar su validez y confiabilidad. En este sentido existen


pruebas de hiptesis como la prueba de Aiken para evaluar la validez y el alfa
de Cronbach para evaluar la confiabilidad. El cuestionario puede administrarse
de forma directa y personalmente por el entrevistador, telefnicamente, por
correo postal o utilizando procedimientos mixtos.
mbito temporal y demogrfico: debemos indicar a que momento/s irn
referidos los resultados de nuestra investigacin y a que mbito sectorial y
espacial van dirigidos.
Tipo de muestreo: El tipo de muestreo a implementar puede definirse como el
conjunto de reglas que hay que tener en cuenta para seleccionar los elementos
muestrales; unos tipos de muestreo pueden ser mejores que otros desde el
punto de vista de la precisin en las estimaciones, pero pueden tener un alto
coste de ejecucin de los trabajos de recogida de la informacin, debiendo
optarse por la opcin ms eficiente (Santos Pea, 1999). La muestra puede
obtenerse de forma aleatoria o de una forma dirigida. Dejando de un lado los
muestreos

no

probabilsticos,

los

principales

mtodos

de

muestreo

probabilstico son el muestreo aleatorio simple con o sin reemplazamiento, el


muestreo estratificado y el muestreo por conglomerados.
Determinacin del tamao de la muestra: el tamao de la muestra viene
determinado por el tipo de muestreo seleccionado, por el error de muestreo y
por el nivel de confianza prefijado.
Seleccin de las unidades muestrales.

Trabajo de campo: para recopilar la informacin, el entrevistador debe conocer


perfectamente el cuestionario y ser capaz de responder preguntas y
situaciones imprevistas.

3.

Depuracin y codificacin de datos

Una vez que hemos recopilado los datos debemos codificarlos y grabarlos. Existen
diferentes programas estadsticos fciles de utilizar para la grabacin y tratamiento de
datos (Excel, SPSS, Statgraphics, etc.).
Antes de llevar a cabo el anlisis de los datos es necesario garantizar que la
informacin proporcionada por los encuestados es correcta. Se trata de detectar y

57

corregir datos errneos o irrelevantes para mejorar la calidad de los mismos antes de
ser codificados y tratados.
La codificacin consiste en proporcionar cdigos numricos o alfanumricos a las
preguntas del cuestionario para llevar un mejor seguimiento y control sobre las
variables.

58

CAPTULO 9
Tratamiento descriptivo de datos

1.

Introduccin

En este captulo se muestran algunos de los procedimientos que proporciona la


estadstica para medir, clasificar, analizar y resumir los datos recopilados en nuestra
investigacin.
Un primer anlisis estadstico consiste en resumir los datos recopilados en unas pocas
medidas, tablas y grficos que describan el fenmeno que estamos investigando. Se
trata de organizar los datos y aplicar sencillas herramientas estadsticas para obtener
una visin resumida del problema en estudio. En captulos posteriores se exponen
tcnicas de inferencia y tcnicas multivariantes para llevar a cabo un tratamiento ms
avanzado de los datos, con el propsito de validar o rechazar las hiptesis de
investigacin realizadas.

2.

Tabulacin y representaciones grficas

Las tablas estadsticas y las representaciones grficas son herramientas que facilitan
una interpretacin rpida, desde un punto de vista cuantitativo, del fenmeno que
estamos investigando.
La tabulacin consiste en agrupar y ordenar los datos mediante el uso de tablas. Las
tablas estadsticas se denominan distribuciones de frecuencias ya que recogen los
valores o categoras de las variables analizadas y el nmero de veces que se repite
cada valor o categora de la variable (frecuencia absoluta). En las tablas tambin se
incluye la importancia que dicho valor o categora tiene sobre el total de la muestra,
expresada en tanto por uno o en porcentaje (frecuencia relativa). La tabulacin de una
sola variable proporciona informacin valiosa, pero suele resultar ms interesante la
tabulacin conjunta de dos o ms variables, en este caso realizaremos una tabulacin
cruzada que es una herramienta muy efectiva para detectar si existe o no alguna
relacin entre dos o ms factores.
La tabulacin se puede aplicar a todo tipo de variable independientemente de la escala
de medicin utilizada (escala nominal, ordinal, por intervalos y de la razn).

59

La representacin grfica de una variable es una representacin visual de los datos


recogidos en las tablas. Existen mltiples formas de representacin. El uso de unas
u otras depender de a) la escala de medicin de la variable, b) los objetivos y
aspectos relevantes del estudio y c) el pblico a quien se dirigen (Ritchey, 2006).
Algunas formas de representar las distribuciones de frecuencias son:
Diagramas de barras: muestran de las frecuencias absolutas y los valores o
categoras de la variable sobre un sistema de ejes cartesianos. Estos diagramas se
utilizan para representar variables medidas en cualquier escala pero son variables
que presentan pocos valores (variables discretas).
Grficos de sectores: circulares o de tarta, dividen un crculo en porciones
proporcionales segn el valor de las frecuencias relativas. Puede utilizarse en
cualquier tipo de variable, pero normalmente se utiliza para variables nominales y
ordinales.
Pictogramas: o representaciones visuales figurativas. Son diagramas de barras en
los que las barras se sustituyen por dibujos alusivos a la variable de tamao
proporcional a la frecuencia seleccionada.
Histogramas: es una representacin especfica para variables que toman muchos
valores (continuas) y con escala de medicin de intervalos o de la razn.
Polgonos de frecuencias o de lneas: esta forma de presentacin se utiliza para
variables en escala de intervalo y en escala de la razn. La representacin se lleva
a cabo uniendo mediante lneas rectas los puntos de un diagrama cartesiano
correspondientes a cada valor o categora de la variable y su frecuencia. El polgono
de frecuencias describe el movimiento de la variable.
Las tablas y grficos son de gran apoyo para determinar la forma de la distribucin y
para detectar la existencia de valores atpicos.

3.

Medidas descriptivas en el anlisis univariante

La tabulacin y representacin grfica de datos que vimos anteriormente son


importantes para mostrar las propiedades esenciales del conjunto de observaciones,
representando un punto de partida en el proceso de toma de decisiones. Adems, es

60

necesario conocer las medidas descriptivas que permiten resumir la extensa


informacin proporcionada por la tabla estadstica en una serie de expresiones.
Buscamos, por tanto, una serie de valores que nos fijen el comportamiento global del
fenmeno a partir de los datos individuales recogidos en la informacin disponible.
Estos nmeros, que reciben el nombre de caractersticas nos indican los rasgos ms
importantes de las distribuciones de frecuencias, y se suelen clasificar en los
siguientes grupos: medidas de posicin o promedios, medidas de dispersin y
medidas de forma.

Medidas de posicin
Las medidas de posicin o promedios pueden ser de tendencia central o no. Estas
medidas son unos valores alrededor de los cuales, con mayor o menor rigor, se
agrupan los valores de la variable. Para que un valor pueda ser considerado como
promedio se le exige, como nica condicin, que est comprendido entre el menor y
el mayor valor de la variable. Los promedios vienen expresados en la misma unidad
de medida que la variable objeto de estudio.
Las principales medidas de tendencia central son la media, la mediana y la moda.
La media es el promedio ms utilizado y se obtiene como la suma de todos los
valores dividida entre el nmero total de casos.
La mediana es el valor de la variable que divide a la distribucin en dos partes
iguales. Cuando la dispersin del conjunto de datos o distribucin es muy grande,
la informacin que proporciona la mediana es ms fiable que la que proporciona la
media.
La moda es el valor de la variable que presenta mayor frecuencia.
Dentro de las medidas de tendencia no central, las ms utilizadas son los cuartiles.
Los cuartiles son una generalizacin de la mediana y dividen a la distribucin en
cuatro partes iguales. Existen tres cuartiles y el segundo coincide con la mediana.

61

Medidas de dispersin
Una vez que hemos estudiado los promedios, necesitamos saber con que fidelidad
llevan a cabo la representacin de la distribucin, esto depende de la relacin que
exista entre los valores de la variable y el promedio, esto es, de la dispersin de la
distribucin. Si todos los valores fueran iguales, la media, por ejemplo, coincidira con
todos y cada uno de ellos, por lo que representara fielmente a la distribucin. A
medida que los valores individuales de la variable difieran del promedio, la
representatividad de ste ser cada vez menor.
Resulta necesario para completar la informacin que pueda deducirse de un promedio,
acompaar a ste de uno o varios coeficientes que midan el grado de dispersin de la
distribucin de la variable. Estos coeficientes son las medidas de dispersin. Las ms
utilizadas son el recorrido y la desviacin tpica.
El recorrido es la diferencia entre el mximo valor de la variable y el menor. Viene
expresado en la misma unidad de medida que la variable.
La desviacin tpica es un indicador de la dispersin de los valores de la variable
respecto a la media. Esta medida, tambin se expresa en la unidad de medida de la
variable. El mnimo valor de la desviacin tpica es cero e indica que la distribucin no
presenta dispersin (todos los valores son iguales). Cuanto mayor sea la desviacin
tpica, mayor es la dispersin y por lo tanto la media es menos representativa.
La escala de medicin de la variable condiciona el uso de las medidas de posicin y
de dispersin.
En la tabla 10 se recogen las medidas bsicas para el anlisis estadstico de una
variable de acuerdo a la escala de medicin utilizada:
Tabla 10. Escalas de medicin y estadsticos bsicos
Promedios y
medidas de

Variable cualitativa
Escala nominal

Variable cuantitativa

Escala ordinal

dispersin

Escala de

Escala de la razn

intervalo

Moda

SI

SI

SI

SI

Mediana

NO

SI

SI

SI

Media

NO

NO

SI

SI

Rango

NO

SI

SI

SI

Desviacin tpica

NO

NO

SI

SI

Fuente: elaboracin propia

62

Medidas de forma
Con este tipo de medidas se trata de conocer la forma de la distribucin. Los polgonos
de frecuencias son curvas que nos muestran la forma de la distribucin y la
concentracin de los valores, la asimetra y la curtosis, respectivamente. Las medidas
de forma son valores que nos indican el grado de asimetra y la curtosis sin necesidad
de tener que hacer su representacin grfica. Con esta informacin podremos
determinar, entre otras cosas, cunto se parece nuestra distribucin a la distribucin
terica normal o campana de Gauss.

4.

Anlisis bivariante

Despus de realizar un anlisis por separado de cada una de las variables que
describen el fenmeno en estudio, se procede a llevar a cabo una serie de cruces
entre variables con el fin de observar la relacin entre ellas.
Con el anlisis bivariante se pretende determinar si existe relacin entre dos variables
y en cuantificar el grado de asociacin entre las mismas. Las tcnicas bivariantes ms
utilizadas en investigacin social son:
1) Tabulacin cruzada o tablas de contingencia
2) Diagramas de dispersin
3) Correlacin y regresin

Tabulacin cruzada
La distribucin de frecuencias de la variable bidimensional se presenta en una tabla
de doble entrada que recoge los valores de las variables (en cualquier escala de
medicin) y el nmero de veces que se repite cada par de valores. Adems, este tipo
de tablas proporcionan toda la informacin necesaria para poder realizar un anlisis de
los datos de cada una de las variables por separado, estableciendo o no alguna
condicin.

63

Tabla 11: Distribucin de frecuencias de la variable bidimensional (X,Y)


yj

y1

y2

yh

ni.

x1

n11

n12

n1h

n1.

x2

n21

n22

n2h

n2.

xk

nk1

nk2

nkh

nk.

n.j

n.1

n.2

n.h

xi

Fuente: elaboracin propia

La interpretacin de esta tabla es muy sencilla. As pues, el valor correspondiente a la


frecuencia nkh indicar el nmero de veces que simultneamente se repite el valor k
en la caracterstica X con el valor h en la caracterstica Y. La frecuencia nk. indicar
las veces que se repite la caracterstica k de la variable X independientemente de los
valores que tome la caracterstica Y, y por tanto la frecuencia n.h se interpretar como
el nmero de veces que se repite el valor h de la caracterstica Y independientemente
de los valores que tome la otra caracterstica X. Por ltimo, n ser el tamao muestral.

Diagramas de dispersin
Es un sistema de ejes cartesianos donde se representan los valores de dos
variables mtricas (escala de intervalos y de la razn) con el objeto de visualizar si
existe o no asociacin entre dichas variables. El diagrama de dispersin se
construye fcilmente y proporciona una buena descripcin de la relacin entre dos
variables.

Correlacin y regresin
El anlisis de correlacin (la regresin se explica con detalle en el captulo 11) se
utiliza para medir el grado de asociacin entre dos variables. Si las variables son
mtricas se utiliza el coeficiente de correlacin lineal de Pearson. Para determinar el
grado de asociacin entre variables expresadas en escalas de medicin inferiores
(ordinales) se utiliza generalmente el coeficiente de Spearman o la Tau-b de
Kendall.

64

CAPTULO 10
Inferencia estadstica. Contraste de hiptesis

1.

Introduccin

La inferencia estadstica es una rama de la estadstica que utiliza tcnicas estadsticas


para extraer conclusiones respecto a una poblacin a partir de los resultados
obtenidos mediante muestras. La inferencia estadstica supone la generalizacin de
los resultados de la muestra a la poblacin que representa. Esta extensin ser vlida
en la medida en que la muestra sea representativa de la poblacin. Se trata de, a partir
de los resultados de una muestra, sacar conclusiones acerca de las caractersticas
de una poblacin.
Estas caractersticas pueden ser parmetros en cuyo caso se hablar de inferencia
paramtrica. En otros casos se puede tener inters no sobre los parmetros de la
poblacin si no sobre su distribucin, en este caso se hablar de inferencia no
paramtrica.
Las inferencias sobre el valor de un parmetro poblacional desconocido (inferencia
paramtrica) se pueden obtener bsicamente de dos maneras: a partir de estimacin
(estimacin puntual e intervalos de confianza) o bien a partir de contrastacin de
hiptesis.
La estimacin puntual consiste en obtener un nico nmero calculado a partir del
estadstico o estimador obtenido como funcin de las observaciones muestrales, y que
se utiliza como estimacin del parmetro poblacional desconocido.
La estimacin por intervalos de confianza consiste en determinar dos extremos que
definen un intervalo sobre la recta real, el cual contendr con una confianza prefijada
al verdadero valor del parmetro poblacional desconocido.
En la contrastacin de hiptesis se formula una hiptesis sobre el verdadero valor del
parmetro poblacional desconocido, para a partir de la informacin proporcionada por
la muestra y con un nivel de confianza prefijado, rechazar o aceptar la hiptesis
formulada. La contrastacin de hiptesis es una tcnica que tambin se utiliza para
hacer inferencia no paramtrica.

65

En este captulo, por su gran aplicabilidad en la investigacin en ciencias sociales, se


va a desarrollar la contrastacin de hiptesis como tcnica de inferencia estadstica.

2.

Contrastacin de hiptesis

Se entiende por hiptesis a la conjetura que se realiza sobre el acontecimiento de un


suceso y se designar como contraste o test de una hiptesis a la regla que permita
determinar la validez de dicha hiptesis.
Con esta tcnica podemos realizar dos tipos de inferencia: la paramtrica (inferencia
sobre las caractersticas de la variable) y la no paramtrica (inferencia sobre la
distribucin de las variables, sobre relacin entre variables, etc.). La aplicacin de la
primera

exige

el

cumplimiento

de

una

serie

de

condiciones

(normalidad,

homocedasticidad e independencia) que muchas veces no se cumplen cuando se


investiga en ciencias sociales. La inferencia no parmetrica es un procedimiento que
puede resolver problemas estadsticos que no se han podido resolver con
procedimientos paramtricos.
Los pasos que se siguen para la prueba de hiptesis son:
1)

Se establece una hiptesis nula H0 (es la suposicin sobre la poblacin que


se pone a prueba usando la evidencia muestral) y una hiptesis alternativa H1
(es la afirmacin sobre la poblacin que debe ser cierta si la H0 es falsa).

2)

Determinar el estadstico de prueba apropiado.

3)

Seleccionar el nivel de significacin (error que se puede aceptar).

4)

Determinar la regin crtica o regin de rechazo. El conocimiento de la regin


crtica

permitir decidir si se acepta o rechaza la hiptesis nula H0, en

funcin del estadstico de prueba elegido y del valor de significacin fijado.


5)

Seleccionar aleatoriamente la muestra y calcular el valor del estadstico de


prueba o test estadstico.

6)

Dar la regla de decisin. Si el valor calculado del estadstico cae dentro de la


regin crtica, entonces se rechazar H0 y si el valor calculado cae dentro de
la regin de aceptacin, entonces no se puede rechazar o se acepta H0.

66

En los epgrafes siguientes se exponen de forma breve algunas de las pruebas ms


utilizadas en una investigacin social.

3.

Pruebas paramtricas

Coeficiente de correlacin de Pearson


Concepto
El coeficiente de correlacin de Pearson es un indicador del grado de asociacin lineal
entre dos variables (X e Y). Se simboliza con la letra r y toma valores entre 1 y -1. El
grado de dependencia lineal entre las variables es ms fuerte cuando el coeficiente
est prximo a 1 a -1, de tal forma que cuando toma el valor 1 indica que la relacin
entre las variables es positiva (ambas variables se mueven en la misma direccin). Si
el coeficiente de Pearson toma valor -1, la relacin tambin es perfecta pero las
variables se relacionan de forma inversa (si una variable crece, la otra variable
decrece). Cuando el coeficiente es nulo, decimos que no existe correlacin entre las
variables.
Hiptesis
H0: Las variables no estn correlacionadas (r=0)
H1: Las variables estn correlacionadas (r distinto de cero)
Distribucin muestral
Chi-cuadrado de Pearson (2)
Supuestos
El coeficiente de correlacin de Pearson se aplica a variables con escala de intervalos
y escala de la razn. Si las variables objeto de estudio son de escala ordinal se utiliza
el coeficiente de correlacin de rangos de Spearman que sigue las mismas reglas que
el coeficiente de correlacin de Pearson.

67

Prueba t de student
Concepto
La prueba t se utiliza para comparar si existe diferencia entre los valores medios de
dos grupos con relacin a una variable de escala de intervalos y escala de la razn.
Hiptesis
H0: No existen diferencias significativas entre las medias de los dos grupos
considerados (las medias son iguales).
H1: Existen diferencias significativas entre las medias de los dos grupos considerados
(las medias son diferentes).
Distribucin muestral
t de student
Supuestos
La prueba proporciona resultados fiables cuando garantizamos que se cumplen los
siguientes supuestos antes de su aplicacin.
1.

Los grupos son independientes entre s, es decir, estn formados por


elementos o individuos distintos.

2.

La variable en cada grupo debe seguir una distribucin normal (la


normalidad se puede contrastar utilizando la prueba de KolmogorovSmirnov).

3.

La escala de medicin de la variable es de intervalos o de la razn.

4.

Las varianzas de los grupos deben ser iguales. En la prctica podemos


asumir que las varianzas poblacionales son iguales si la varianza de la
muestra de un grupo no es superior al doble del tamao de la del otro
grupo (Ritchey, 2006)

5.

El tamao de los grupos puede ser distinto

68

Contraste de hiptesis para la diferencia de proporciones


Concepto
Es una prueba estadstica para analizar si dos proporciones o porcentajes de dos
grupos difieren significativamente entre s. Tiene aplicaciones muy similares a la
diferencia de medias.
Hiptesis
HO: No existen diferencias significativas entre las proporciones de dos grupos
(las proporciones son iguales).
H1: Existen diferencias significativas entre las proporciones de los dos grupos
considerados (las proporciones son diferentes).
Distribucin muestral:
Distribucin normal, N (0,1).
Supuestos:
1.

Los grupos son independientes entre s, es decir, estn formados por


elementos o individuos distintos.

4.

2.

La variable en cada grupo debe seguir una distribucin binomial

3.

Se puede aplicar a variables expresadas en cualquier escala de medicin.

Pruebas no paramtricas

La caracterstica esencial de los contrastes no paramtricos es que para su


planteamiento no se requiere el conocimiento de la distribucin de partida y por tanto
los estadsticos que se utilicen seguirn una distribucin independiente de la
distribucin de la poblacin de partida.

69

Test de independencia (tablas de contingencia) (Ruiz-Maya, 2000).


Concepto
El test de independencia, cuando se analizan conjuntamente dos variables, tiene por
objeto

probar la ausencia de asociacin entre ellas, es decir, probar que el

comportamiento de una variable no informa sobre el de la otra.


Hiptesis
H0: Las variables son independientes, no estn asociadas.
H1: Las variables son dependientes, estn asociadas.
Distribucin muestral:
Chi-cuadrado de Pearson (2)
Supuestos
1. Las variables pueden venir expresadas en cualquier escala de medicin.
2. Los valores o formas de expresin de las variables deben poder ser
clasificados en grupos mutuamente excluyentes.
3. Segn el criterio de Cochran (1959) el 80% de las clases deben tener un valor
terico superior o igual a 5.

Test de Kolmogorov-Smirnov (Ruiz-Maya, 2000).


Concepto
El test de Kolmogorov-Smirnov permite contrasta si una muestra procede de una
poblacin con un determinado modelo de distribucin (normal, binomial, etc)
Hiptesis
H0: la muestra aleatoria procede de una poblacin con una distribucin de probabilidad
determinada.
H1: la muestra no procede de una poblacin con ese tipo de distribucin

70

Distribucin muestral
Kolmogorov-Smirnov
Supuestos
1. Las variables deben expresarse, al menos, en escala ordinal.
2. De la poblacin se toma una muestra aleatoria simple.
3. La funcin de distribucin es continua.

71

CAPTULO 11
ANOVA y regresin lineal mltiple

Anlisis de la varianza (ANOVA)


Concepto
El anlisis de la varianza es una prueba de hiptesis que sirve para comparar varios
grupos respecto a una variable cuantitativa. Es un mtodo que puede considerarse
una generalizacin de la prueba t para la diferencia de medias de dos grupos
independientes, es decir el ANOVA contrasta si existen diferencias o no entre las
medias de los diferentes grupos. El ANOVA puede considerarse como la base del
anlisis multivariante. En el anlisis de la varianza se distinguen dos variables, una
variable dependiente Y (cuantitativa) y una variable independiente o factor X (discreta)
y se trata de comparar las medias de Y asociadas a cada grupo del factor X.
Hiptesis
H0: Las medias de todos los grupos son iguales
H1: Las medias de todos los grupos no son iguales
Distribucin muestral
F de Fisher-Snedecor
Supuestos
1. La variable de comparacin (variable dependiente) debe venir
expresada en escala de intervalos o de la razn.
2. Cada grupo de datos debe ser independiente del resto.
3. Los datos de cada grupo establecido deben seguir una distribucin
normal.
4. No deben diferir significativamente las varianzas de los distintos grupos.

72

Regresin lineal mltiple


Concepto
La regresin lineal mltiple es una tcnica cuantitativa de dependencia que se utiliza
para investigar la relacin estadstica que existe entre una variable dependiente y dos
o ms variables independientes (cuando slo se considera una variable independiente
se habla de regresin lineal simple).
El objetivo de la teora de la regresin lineal mltiple es analizar un modelo que
pretende explicar el comportamiento de la variable dependiente a partir del
comportamiento de dos o ms variables explicativas o independientes. Desarrollar un
modelo de regresin lineal consiste en establecer una relacin funcional de tipo lineal
entre la variable dependiente y dos o ms variables explicativas, considerando que
existe una relacin de causalidad entre las mismas.
Un modelo de regresin lineal mltiple con k variables explicativas responde a la
siguiente ecuacin:

Yi = 1 + 2 xi 2 + 3 xi 3 + 4 xi 4 + ...... + k xik + u i
Yi : Variable endgena o dependiente

1 : Trmino independiente
i : Pendientes parciales con i = 2,3..., k, parmetros que indican la influencia que cada variable
explicativa ejerce sobre la variable dependiente
xik : Variables explicativas o independientes.
u i : Error.

El modelo lineal se formula bajo los siguientes supuestos:




Las variables, dependiente e independientes son

mtricas (escala de

intervalos y escala de la razn. Tambin se pueden utilizar cuando las


variables independientes presentan escala ordinal o nominal, en este caso
debemos convertirlas en variables ficticias (toman valor uno cuando poseen
una caracterstica y cero cuando no la poseen).


Las variables X1, X2,... Xk son fijas (no son variables aleatorias) ya que sus
valores vienen de la muestra tomada.

Los parmetros del modelo son constantes.

73

Se supone que en el modelo se incluyen todas las variables independientes


necesarias para explicar el comportamiento de la variable dependiente y que
ninguna de ellas se considera irrelevante.

Las variables X1, X2,...X k son linealmente independientes (no se puede poner a
una de ellas como combinacin lineal de las otras). Cuando no se cumple este
supuesto, el modelo presenta multicolinealidad.

Linealidad de las relaciones: la variable dependiente presenta una relacin


lineal con cada una de las independientes.

Los errores siguen una distribucin normal con media cero y no presentan ni
autocorrelacin ni heterocedasticidad.

Fases
La elaboracin de un modelo de regresin lineal sigue una metodologa de trabajo que
supone la ejecucin de una serie de fases. Estas fases son: Especificacin,
Estimacin, Verificacin y Prediccin.
1) Especificacin: Se entiende por especificacin de un modelo la determinacin
de la variable dependiente (Y), las variables explicativas (X1, X2,...,Xk), el error
(U) y la funcin matemtica que las relaciona.

Yi = 1 + 2 xi 2 + 3 xi 3 + 4 xi 4 + ...... + k xik + u i

En un modelo de regresin lineal, como su propio nombre indica, la funcin que


relaciona a las variables es de tipo lineal, tambin pueden utilizarse funciones
no lineales pero linealizables, es decir funciones no lineales que sometidas a
determinadas transformaciones algebraicas puede convertirse en funciones
lineales. Para identificar que nuestras variables se relacionan linealmente es de
gran ayuda realizar el diagrama de dispersin de la variable dependiente con
cada una de las variables explicativas y la revisin de modelos tericos que
tienen relacin con nuestro tema de investigacin.

74

Una de las principales dificultades con la que nos encontramos cuando se


especifica un modelo est en la seleccin de las variables independientes. La
especificacin puede llevarse a cabo de dos formas:

Regresin paso a paso: en este caso las variables independientes se


incluyen una a una en el modelo. Normalmente, las primeras variables
que se incluyen en el modelo son

aquellas

que individualmente

presentan una mayor correlacin con la variable dependiente (diagrama


de dispersin y clculo del coeficiente de correlacin de Pearson).
Posteriormente, se van incluyendo una a una atendiendo a la que
mayor coeficiente de correlacin parcial presente y que, adems, su
incorporacin suponga una reduccin en los errores. Con el resto de
variables se opera de forma similar hasta que no se admita ni se
rechace ninguna variable ms.

Regresin con todas las variables independientes: en este caso se


parte de un modelo general y se van excluyendo aquellas variables que
no cumplen los criterios de seleccin establecidos.

En la seleccin de variables, hay un conjunto de reglas que deben respetarse


(Martn et al., 1997):
-

Las variables elegidas deben ser coherentes con la teora econmica


que oriente el modelo.

Los signos de los parmetros estimados deben responder al


conocimiento terico a priori.

El modelo debe estar bien ajustado, es decir debe presentar un alto


coeficiente de determinacin.

Los parmetros deben ser significativos individual y conjuntamente. No


obstante, pueden darse ciertos casos en los que siendo significativos
conjuntamente, no lo sean individualmente. An as, el modelo puede
utilizarse, por ejemplo, para realizar predicciones.

El comportamiento de los residuos debe ser aleatorio.

75

2) Estimacin: En esta fase, a partir de la informacin que proporciona la muestra


se estiman los parmetros (1, 2,..y k ) de la ecuacin de regresin,

Yi = 1 + 2 xi 2 + 3 xi 3 + 4 xi 4 + ...... + k xik + ui

Los coeficientes 2,y k estimados miden el cambio en la variable dependiente


(Y) producido por el cambio unitario en cada una de las variables
independientes (manteniendo constante el resto de las variables).
3) Verificacin: En la fase de estimacin utilizando el mtodo de los mnimos
cuadrados ordinarios y suponiendo que los supuestos bajo los que se formula
el modelo (citados en el epgrafe Concepto) son ciertos, se obtienen
estimadores que cumplen determinadas propiedades deseables desde el punto
de vista estadstico. En esta fase debemos verificar si dichos supuestos son
ciertos, investigar qu sucede cuando no se cumplen y qu implicaciones
tienen sobre las propiedades de los estimadores.
De ah, que sea necesario establecer una serie de controles o contrastes que
permitan establecer la bondad del modelo o su validez.
Los tipos de contraste que se pueden llevar a cabo son los siguientes:
-

Contrastes individuales de parmetros (es habitual contrastar la


hiptesis de que los parmetros individualmente son igual a cero,
usando el estadstico t-student)

Contrastes conjuntos de parmetros o significacin del modelo


(estadstico F de Senedecor para contrastar la significatividad conjunta,
todos los parmetros son igual a cero a excepcin del trmino
independiente). Coeficiente de determinacin o medida de bondad del
ajuste.

Contrastes de hiptesis bsicas. Contrastes sobre multicolinealidad (se


analiza la coherencia de los signos de los parmetros estimados, se
utilizan matrices de correlaciones entre las variables, el ndice de
tolerancia, el factor de inflacin de la varianza, etc.), sobre cambio
estructural (test de Chow, variables ficticias, etc.), sobre autocorrelacin

76

(el

estadstico

ms

utilizado

el

de

Durbin-Watson)

sobre

heterocedasticidad (test de Goldfeld y Quandt, contraste de White, etc.)


4) Prediccin
Una vez que el modelo se ha aceptado estadstica y econmicamente, se
podrn hacer predicciones sobre el valor de la variable dependiente (Y), si este
era uno de los objetivos del ajuste realizado.
Aplicaciones:
1. Cuantificar la asociacin existente entre dos o ms variables mtricas.
2. Determinar la estructura o forma de relacin entre las variables.
3. Determinar qu factores influyen en la aparicin o no de un suceso.
4. Predecir.

77

CAPTULO 12
Anlisis discriminante y regresin logstica

Anlisis discriminante
Concepto
El anlisis discriminante es una tcnica multivariante de dependencia y de clasificacin
que, junto con la regresin logstica, son apropiadas para relacionar una variable
dependiente nominal o no mtrica con variables dependientes generalmente mtricas.
Con la tcnica del anlisis discriminante se trata de clasificar individuos, empresas o
cosas en grupos previamente determinados (fijados por la variable dependiente) de
acuerdo a un conjunto de

caractersticas (variables independientes). Se pretende

encontrar relaciones lineales entre las variables independientes que mejor discriminen
en los grupos establecidos.
Fases
1)

Seleccin de la variable dependiente y de las variables independientes.

La primera etapa en el anlisis discriminante es la seleccin de la variable dependiente


que debe ser nominal (si la variable es ordinal o en intervalos se puede transformar en
una variable categrica) y en la determinacin de las variables independientes de
naturaleza mtrica.
2)

Seleccin del tamao muestral y divisin de la muestra.

La validez de los resultados del anlisis discriminante depende del tamao y


representatividad de la muestra. El tamao de la muestra exige un mnimo de 5
observaciones por cada una de las variables independientes del modelo. En cuanto a
los grupos, deben tener al menos 20 observaciones y se recomienda que no haya
mucha diferencia de tamao entre ellos. Para determinar el tamao muestral debe
tenerse en cuenta que, en ocasiones, la muestra se divide en dos submuestras, una
para obtener la funcin discriminante y la otra con fines de validacin.
3)

Contraste de las hiptesis de partida.

La correcta aplicacin del anlisis multivariante exige que se cumplan tres hiptesis:

78

El conjunto de variables independientes debe distribuirse como una


normal multivariante. Si alguna de las variables no se distribuye
normalmente, entonces tampoco se distribuirn normalmente en
conjunto. Para comprobar la hiptesis de normalidad se puede utilizar
el test de Shapiro-Wilks o el test de Kolmogorov-Smirnov.

Igualdad entre las matrices de covarianzas entre los grupos. Para


comprobar esta hiptesis se puede utilizar la prueba M de Box cuyo
valor se aproxima a una F de Snedecor.

Ausencia de multicolinealidad (correlacin lineal) entre las variables


independientes. Para determinar si las variables estn correlacionadas
se utiliza el Factor de Inflacin de la Varianza (VIF) y el ndice de
Tolerancia.

4)

Estimacin del modelo

Como se coment en la introduccin, la idea del anlisis discriminante es construir


funciones lineales con las variables independientes que discriminen entre los distintos
grupos. No todas las variables tienen el mismo poder discriminante, por esta razn las
relaciones lineales o funciones discriminantes se construirn a partir de aquellas
variables que cumplan un determinado criterio de seleccin. Como criterio general se
utiliza la Lambda de Wilks (cociente entre la varianza dentro de los grupos y la
varianza total). Cuanto menor es este estadstico mayor es el poder discriminante de la
variable, es decir la variabilidad del fenmeno en estudio se debe a la diferencia entre
grupos, no a la diferencia dentro del grupo. De modo equivalente se utiliza la F de
Snedecor asociada a la Lambda de Wilks. Este estadstico compara para cada
variable, las desviaciones de las medias de cada uno de los grupos a la media total. Si
F es grande entonces existen diferencias entre las medias de los grupos y decimos
que la variable discrimina.
Existen dos mtodos de seleccin de variables para el clculo de la funcin
discriminante: el mtodo directo o simultneo y el mtodo por etapas.
Cuando el mtodo es por etapas, se recomienda utilizar la medida D2 de Mahalanobis.
Este procedimiento por etapas est diseado para obtener el mejor modelo de una
variable, seguido por el mejor modelo de dos variables y as sucesivamente hasta que
ninguna otra variable cumpla la regla de seleccin deseada (Hair el al., 2007). La regla

79

de seleccin en este procedimiento es maximizar la distancia D2 de Mahanalobis entre


grupos (Hair el al., 2007).
El anlisis discriminante estima una funcin menos que el nmero de grupos
existentes. Si establecemos dos grupos, estimaremos una sola funcin discriminante.
5)

Clculo de las puntuaciones Z discriminantes

Definidas las funciones discriminantes, las puntuaciones para cada elemento (persona,
empresa o cosa) se pueden obtener a partir de la siguiente expresin:

Z jk = a + W1 X 1k + W2 X 2 k + .... + Wn X nk
Donde:
Zjk= puntuacin Z discriminante de la funcin discriminante j para el elemento k
a= constante
Wi= ponderacin discriminante para la variable independiente i
Xik= variable independiente i para el elemento k
Obtenidas las funciones discriminantes se calcula la puntuacin de corte para
determinar a qu grupo pertenece cada elemento. La puntuacin de corte se obtiene
utilizando una media aritmtica ponderada de las centroides de los grupos:

ZC =

N1 Z1 + N 2 Z 2
N1 + N 2

Donde:
ZC= puntuacin de corte
Z1 y Z2= centroide del grupo 1 y del grupo 2, respectivamente
N1 y N2= tamao del grupo 1 y del grupo 2, respectivamente
6)

Valoracin del ajuste global

La valoracin del ajuste global exige evaluar las diferencias entre grupos sobre las
puntuaciones obtenidas y valorar la precisin en la prediccin de pertenencia al grupo.

80

Diferencias entre grupos: para valorar la diferencia entre grupos se


suele utilizar la D2 de Mahalanobis aplicada a las centroides de los
grupos.

Precisin en la prediccin: se realiza examinando las matrices de


clasificacin.

7)

Validacin de los resultados: la validacin de resultados se realiza ampliando la


muestra y valorando su precisin predictiva.

Aplicaciones
El anlisis discriminante puede tratar cualquiera de los siguientes objetivos de
investigacin (Hair el al., 2007):
1. Determinar si existen diferencias estadsticamente significativas entre los
perfiles de las puntuaciones medias sobre un conjunto de dos (o ms) grupos
definidos a priori.
2. Determinar cul de las variables independientes cuantifica mejor las diferencias
en los perfiles de las puntuaciones medias de dos o ms grupos.
3. Establecer los procedimientos para clasificar objetos (individuos, empresas,
productos, etc.) dentro de los grupos, en base a sus puntuaciones sobre un
conjunto de variables independientes.
4. Establecer el nmero y la composicin de las dimensiones de la discriminacin
entre los grupos formados a partir del conjunto de variables independientes.

Regresin logstica
Concepto
Un modelo de regresin logstica es un modelo que permite estudiar si una variable (Y)
dicotmica depende, o no, de otras variables expresadas en cualquier escala de
medicin (X1, X2,..Xk). En este caso, al ser la variable Y dicotmica, tambin puede ser
politmica, slo puede tomar dos valores el valor 0cuando no ocurre el suceso o el
valor 1 cuando el hecho ocurre. Se trata de un proceso binomial donde la

81

probabilidad de que la variable tome valor 1 (suceso xito) es p y la probabilidad de


que tome el valor 0 (suceso fracaso) es q. La regresin logstica es equivalente al
anlisis discriminante de dos grupos. En muchas ocasiones, la regresin logstica
proporciona mejores resultados que el anlisis discriminante ya que la aplicacin de la
regresin logstica no exige el cumplimiento

de normalidad y de igualdad entre

varianzas, hiptesis de partida para una adecuada aplicacin del anlisis


discriminante.
Fases
1)

Especificacin: en esta fase, al igual que ocurra con la regresin lineal, debemos
definir las variables dependiente e independientes que queremos estudiar, as
como la forma funcional que las relaciona. En este caso, como se coment
anteriormente, la distribucin condicionada de la variable dependiente sigue un
proceso binomial (no se verifican las hiptesis de normalidad y homocedasticidad
de los errores) por lo que ajustaremos una funcin logstica a la nube de puntos,
as el modelo de regresin logstica puede expresarse segn la siguiente
ecuacin:

p
Ln( ) = 1 + 2 X 2 + ......... + k X k
q
Donde p/q es la razn de probabilidades de la variable dependiente para cada
uno de los valores de las variables independientes, comnmente denominada
odds. La razn de probabilidades toma valores entre 0 e . Cuando es igual a 1
indica que el suceso xito (que ocurra un hecho) es igual de probable que el
suceso fracaso (que no ocurra un hecho). Cuando es mayor que 1, la
probabilidad de que ocurra un suceso es mayor que la de que no ocurra.

Realizando una pequea transformacin algbrica el modelo de regresin


logstica tambin puede expresarse utilizando la siguiente expresin:

e 1 + 2 X 2 + ..... + kXk
p=
1 + e 1 + 2 X 2 + ..... + kXk
La especificacin puede realizarse de dos formas diferentes:

82

Especificacin del modelo mximo: se parte de un modelo que incluye


todas las variables independientes que consideramos que pueden tener
alguna influencia sobre la variable dependiente. El modelo que
seleccionemos para realizar la prediccin se obtendr eliminando
aquellas variables que no presentan significatividad estadstica
(mantendremos aquellas variables que aun no siendo significativas son
de inters para nuestra investigacin) hasta que no quede ninguna.

Especificacin del modelo por pasos hacia delante: en este caso se


parte de un modelo con una sola variable independiente. El modelo
definitivo

se

obtendr

despus

de

haber

ido

incorporando

sucesivamente variables con significatividad estadstica y que mejoren


significativamente el ajuste del modelo, es decir, que minimicen las
diferencias entre las frecuencias de los casos observados y las
frecuencias de los casos pronosticados.
2)

Estimacin: se trata de calcular los parmetros del modelo de regresin logstica.


Para la estimacin del modelo se utiliza el mtodo de la mxima verosimilitud.
Este mtodo consiste en seleccionar aquellos valores de los parmetros que
maximizan la funcin de verosimilitud de la muestra. Con este procedimiento se
seleccionan las estimaciones de los parmetros

que hagan posible que los

resultados sean lo ms verosmiles posibles.


Los parmetros estimados son una medida de la influencia que cada una de
las variables independientes ejerce sobre la probabilidad de que ocurra un
hecho, de tal forma que aumenta la probabilidad de ocurrencia cuando el signo
de los parmetros es positivo y disminuye si el signo es negativo. Un coeficiente
o parmetro igual a 0 indicara que la variable independiente no tiene ninguna
influencia sobre la ocurrencia de un suceso. Matemticamente, cada uno de los
parmetros es el logaritmo del cociente de los odds para dos valores de cada
una de las variables independientes y se denomina odds ratio.
3)

Verificacin: en esta fase comprobamos si el modelo propuesto es vlido para los


objetivos de nuestra investigacin. Utilizaremos tcnicas estadsticas para
determinar qu variables, de forma individual, presentan significatividad
estadstica y tcnicas que indiquen si en conjunto el modelo es aceptable.
Para estudiar la significatividad individual de las variables se utiliza el contraste
de Wald que sigue una distribucin similar a la t-student al cuadrado. La hiptesis
nula que se contrasta es que el coeficiente de cada variable es igual a cero. Si se

83

rechaza la hiptesis entonces la variable independiente influye en la ocurrencia


de un suceso, si no la podemos rechazar entonces, estadsticamente la variable
no influye en la ocurrencia del hecho que estamos estudiando.
Para determinar si el modelo completo es aceptable, esto es para medir la
bondad del ajuste existen distintos indicadores, entre los ms utilizados se
encuentran:

el cociente de verosimilitudes, utiliza la distribucin Chi-cuadrado y se


contrasta la hiptesis nula de que todos los coeficientes, salvo la
constante, son igual a cero. El rechazo de la hiptesis indica que todas
las variables de forma conjunta influyen en la ocurrencia de un suceso.,

el contraste de Hosmer y Lemeshow (1989) que compara las


frecuencias de los valores observados con los predichos utilizando la
Chi-cuadrado y,

el pseudo coeficiente de determinacin. Este coeficiente es una medida


aproximada de la eficacia predictiva del modelo. Toma valores entre 0 y
1 si la capacidad predictiva es nula en el primer caso, o perfecta en el
segundo.

Los

distintos

programas

informticos

de

tratamiento

estadstico de datos ofrecen dos modificaciones de este coeficiente de


Cox y Snell y el de Nagelkerke.
Aplicaciones
La regresin logstica puede usarse con dos objetivos:
1) predictivo, en el que el inters del investigador es predecir el comportamiento de la
variable dependiente a partir del comportamiento de un conjunto de variables y
2) estimativo, cuando el inters se centra en estimar la relacin que existe entre una o
ms variables independientes con la variable dependiente.
Como se coment en captulos anteriores estos objetivos pueden conseguirse
utilizando tcnicas de regresin mltiple. Sin embargo, la regresin lineal no
proporciona resultados aceptables cuando la variable dependiente es de naturaleza
cualitativa. En ciencias sociales, en muchas ocasiones, nos encontramos con variables
que no pueden medirse. Dos son las soluciones que se proponen para resolver este
problema; una es la de utilizar variables proxy, son variables que sustituyen a las
variables que realmente queremos medir, y aplicar tcnicas de regresin lineal y, otra

84

solucin es definir la variable como una variable dicotmica, en este caso para
conseguir los objetivos propuestos el uso de la regresin logstica proporciona
excelentes resultados.

85

CAPTULO 13
Anlisis factorial

1.

Concepto

Es una tcnica de interdependencia de reduccin de datos. En ocasiones las bases de


datos estn integradas por variables en las que aparece una amplia redundancia en la
informacin. Tcnicamente se dice que son variables con un elevado nivel de
intercorrelacin. Ello plantea el problema de la multicolinealidad que inutiliza la base
para muchos modelos predictivos como la regresin mltiple o el anlisis
discriminante. Se plantea entonces eliminar la redundancia informativa o eliminar la
multicolinealidad.
El anlisis factorial va a permitirnos sustituir el conjunto original de variables por otro
sensiblemente menor en nmero de variables no observables o hipotticas, llamadas
factores. Son definidas como variables incorreladas (o con cierta correlacin segn el
tipo de rotacin aplicada) que explican los elevados niveles de intercorrelacin
presentes en la muestra. Estos factores, por tanto, amn de eliminar la
multicolinealidad describen las relaciones entre las variables (Manuel, 2005).
Pensemos en el siguiente caso: calificaciones obtenidas por los alumnos de un colegio
en las asignaturas de lenguaje, matemticas, fsica, qumica, filosofa e ingls, por
ejemplo. Para cada alumno tendramos una puntuacin en cada asignatura. Existe una
forma de reducir esta informacin: realizar un anlisis factorial. Muy probablemente,
con datos reales, se formaran dos factores: El factor 1, denominado Ciencias, estara
compuesto por matemticas, fsica y qumica y, el factor 2, llamado Letras, estara
formado por lenguaje, filosofa e ingls. Ahora, en lugar de tener seis variables,
tendramos dos factores (distintos entre s pero homogneos dentro de s), con la
puntuacin factorial de cada individuo en Ciencias y en Letras.
A veces los factores son conocidos a priori y el diseo experimental se hace,
precisamente, para obtener una puntuacin para cada individuo en los diferentes
factores (puntuaciones factoriales). En este caso el anlisis factorial recibe el nombre
de confirmatorio. En otras situaciones, simplemente los factores no son conocidos y
se trata de obtenerlos a partir del anlisis. Diremos entonces que el anlisis factorial es
exploratorio.

86

2.

Fases

El mtodo del anlisis factorial nos invita a seguir unos pasos para la correcta
extraccin de los resultados. Segn Manuel (2005) y, Visauta y Martori (2003) podran
ser los siguientes:
a) Evaluar si es apropiado con los datos disponibles ejecutar un anlisis factorial.
Tomando como primera condicin que las variables sean numricas, deber haber
una fuerte redundancia informativa en el conjunto de las seleccionadas. Dicho de otro
modo deber existir una fuerte correlacin dentro de ciertos subconjuntos de variables
pero muy pequeas o nulas entre ellos.
Para desarrollar este apartado se deben obtener y evaluar:
-

Matriz de correlaciones de las variables: buscaremos que en esa matriz haya


cierta proporcin de valores mayores que 0,6 en mdulo (Manuel, 2005). Si
todos los valores son muy grandes entonces todas las variables estn muy
intercorreladas pero esto lleva a la presencia de un nico factor, que tampoco
es la situacin ms descriptiva ni por tanto la ms deseada.
Asociado a cada coeficiente de correlacin existe un contraste de hiptesis:
H0: la correlacin es nula
H1: la correlacin no es nula
Si el p-valor (significance) es inferior a 0,05  Rechazamos la H0  lo cual no
quiere decir que la correlacin sea grande.
Rechazar H0 slo significa que la correlacin no puede admitirse nula pero de
ah no debemos deducir que sea necesariamente grande. Eso se observa en el
coeficiente de correlacin.
Entonces la utilidad de la tabla de significaciones es la siguiente: si muchos pvalores son mayores que 0,05, entonces muchas correlaciones sern nulas y
ah es cuando no tiene sentido el anlisis factorial.

Medida de adecuacin muestral de Kaiser-Meyer-Olkin (KMO): en este caso


cuanto ms se acerque a 1 tanto ms sentido tendr aplicar el anlisis factorial,

87

puesto que mayor correlacin existir entre las variables. A partir de 0,6 se
considera un nivel aceptable.
-

Test de esfericidad de Bartlett: en este paso se contrasta la siguiente hiptesis:


H0: la matriz de correlaciones es la identidad7
H1: no lo es
Si no se rechaza H0, entonces estamos admitiendo que la correlacin para
cada pareja de variables es nula y por tanto el anlisis es inviable. Cuando el pvalor de este contraste sea inferior a 0,05 se podr ejecutar el anlisis factorial.

b) Obtencin de los factores.


En esta fase, dado el conjunto de variables intercorreladas el anlisis factorial extrae
un nmero de factores coincidente con el original de variables. Hasta aqu no hay
reduccin en la dimensin lineal del problema. Sin embargo, dado que las variables
son internamente tipificadas por el mtodo, la varianza global coincide con el nmero
de variables. De esta varianza global cada factor recoge una cierta cantidad, es decir,
explica una cierta proporcin. Cuanto mayor sea la cantidad explicada ms importante
es el factor.
El mtodo de Componentes Principales extrae secuencialmente los factores de
manera que cada uno de ellos est incorrelado (no correlacionado aunque depende
del mtodo de rotacin-) con todos los anteriores, de manera que la variabilidad
recogida por los diferentes factores cada vez es menor. De esta forma, se tender a
despreciar los ltimos factores dado que la variabilidad que recogen es pequea y ah
es donde se consigue la reduccin de la dimensionalidad del problema.
Criterios para determinar el nmero de factores a conservar:
-

Criterio de Kaiser: se conservarn aquellos factores con autovalor8 mayor que


1.

Grfico de sedimentacin: encontrar puntos de inflexin o saltos de importancia


entre factores. Detectar un pico relevante da informacin sobre el rechazo de
los factores siguientes.

Recurdese que la matriz identidad se corresponde con: diagonal principal todo 1 y el resto de valores 0.
Entendido como el porcentaje que explica cada factor sobre el total de varianza explicada. Digamos, la
importancia de cada factor en el total de la informacin que representan todas las variables.
8

88

La lgica: basada en la posibilidad de describir el nmero de factores


conservados. Para identificar la lgica de los factores conservados utilizamos la
matriz de componentes y la matriz de componentes rotados, que es donde se
encuentran las variables directamente observables saturadas en los factores
directamente no observables.

c) Rotacin de los factores.


La finalidad de la rotacin no es otra sino la de ayudarnos a interpretar, en el supuesto
de que no quede claro en la matriz de componentes no rotada el sentido y significado
de los factores.
Existen distintos procedimientos de rotacin, fundamentalmente se diferencian dos
tipos: los ortogonales y los no ortogonales. Dentro del primer tipo se encuadra el
mtodo VARIMAX, que trata de minimizar el nmero de variables que hay con pesos o
saturaciones elevadas en cada factor, generando factores incorrelados entre s, y
dentro del segundo, el PROMAX, que mantiene cierto grado de correlacin entre los
factores conservados, muy til cuando hablamos de sucesos en economa.
Sealar que la rotacin no afecta a la comunalidad9 y al porcentaje de la varianza
explicada por el modelo, aunque s puede cambiar la de cada factor.
d) Obtencin de las puntuaciones factoriales.
Puesto que el objetivo fundamental es reducir un gran nmero de variables a un
pequeo nmero de factores, es a veces aconsejable estimar las puntuaciones
factoriales de cada individuo, ms an cuando la finalidad es crear un indicador.
Como un factor no es otra cosa sino una combinacin lineal de las variables originales,
el sistema trata de obtener las puntuaciones factoriales de los individuos a travs del
valor estandarizado de las variables y el coeficiente de la puntuacin factorial del factor
j respecto de la variable i.

Importancia de cada variable comparada con las dems utilizadas en el anlisis. As, estudiando las
comunalidades de la extraccin podemos valorar cules de las variables son peor explicadas por el
modelo. En definitiva, es la proporcin de la varianza de una variable que puede ser explicada por el
modelo factorial obtenido, por tanto, cuanto ms alto sea su valor mejor, ya que un mayor porcentaje de la
variable ser explicada tras la extraccin. Si existiera alguna variable no muy bien explicada, podemos
suponer que va por libre con lo que en un momento determinado podemos eliminarla del anlisis.

89

3.

Aplicabilidad
1. Permite construir indicadores con ponderaciones no arbitrarias.
2. Permite eliminar redundancia informativa o multicolinealidad.
3. Permite sustituir el conjunto original de variables por otro sensiblemente
menor en nmero de variables directamente no observables, llamadas
factores o variables latentes. As, dentro de cada factor existe una alta
correlacin y entre cada factor poca o nula correlacin.

90

CAPTULO 14
Anlisis cluster

1.

Concepto

El anlisis de conglomerados o cluster es una tcnica de interdependencia que


consiste en clasificar individuos en grupos que no son conocidos a priori por el
investigador (a diferencia del anlisis discriminante donde s se conocen los grupos).
Tiene como objetivo final generar grupos de individuos u observaciones muy similares
u homogneos dentro s y muy distintos o heterogneos entre ellos (Manuel, 2005).
Cuando se forman los grupos no slo los genera por homogeneidad sino tambin nos
da la naturaleza o razn por la que se han formado dichas agrupaciones.
La clasificacin que se haga depender exclusivamente de las variables medidas en
los individuos. Por tanto, no aparecern caractersticas en los grupos que no estn
previamente en la base de datos.
El mtodo que utiliza esta tcnica para agrupar individuos es la de las distancias y
similaridades. La distancia entre objetos es mayor cuanto menos se parecen los
objetos, por lo que menor ser la similaridad. Comnmente se emplea la distancia
eucldea para determinar la lejana o cercana entre individuos10.
El anlisis de conglomerados se divide en:
1) K-medias: admite procesar un nmero ilimitado de casos, pero slo permite
utilizar un mtodo de aglomeracin y requiere que se proponga previamente el
nmero de conglomerados que se desea obtener. Une centroides de grupos y
est orientado para muestras numerosas.
2) Jerrquico11: es idneo para determinar el nmero ptimo de conglomerados
existente en los datos y el contenido de los mismos. Aunque tiene un elevado
coste computacional. Une individuos y est orientado para muestras pequeas
o normales.
El anlisis cluster puede ejecutarse a travs de dos mtodos de anlisis:
10

En este caso tambin se tipifican las variables para que las diferentes magnitudes de las mismas no
distorsionen los resultados.
11
Ms recomendable que el k-medias porque no se pierde informacin.

91

1) Aglomerativo: en este anlisis se empieza considerando a todos los individuos


como integrantes de diferentes clusters y secuencialmente se van creando
clusters cada vez ms poblados hasta llegar a la situacin en la que todos los
individuos integran un nico cluster. Es el mtodo ms usual.
De todas las soluciones se trata de elegir la ms descriptiva e interpretable.
2) Divisivo: se parte de todos los individuos integrando un mismo cluster que se
va desmembrando secuencialmente hasta que todos los individuos integran
cluster separados. De nuevo el objetivo es buscar entre todas las soluciones la
ms interpretable.
Los principales criterios para unir clusters son segn Visauta y Martori (2003):
1) Promedio entregrupos: define la distancia entre dos clusters como la media de
las distancias entre todas las combinaciones posibles dos a dos de los
elementos de uno y otro cluster. Si por ejemplo en el primer cluster estn las
comunidades A y B y en el segundo C, D y E, la distancia entre los cluster
primero y segundo ser la media de las distancias A-C, A-D, A-E, B-C, B-D, y
B-E.
2) Promedio intragrupos: combina los clusters de manera que la media de las
distancias entre todos los pares de sujetos dentro del resultante sea la menor
posible.
3) Vecino ms prximo: en cada etapa se unen aquellos conglomerados tales que
sus individuos ms prximos (uno de cada) disten menos que los vecinos ms
prximos de cualquier otra pareja de conglomerados.
4) Vecino ms alejado: en cada etapa se miran aquellos dos cluster tales que sus
vecinos ms alejados disten menos que los vecinos ms alejados de cualquier
otro par de clusters.
5) Centroide: calcula las distancias entre dos clusters como distancia entre sus
medias para todas las variables. Un inconveniente de este procedimiento es
que estas distancias pueden disminuir de un paso a otro.
Estos criterios no tienen por qu conducir a la misma secuencia en la formacin de
clusters.

92

2.

Fases

Atendiendo a Hair et al. (2007) podemos distinguir:


1) Matriz de coeficientes de distancia eucldea al cuadrado: cuanto mayor sea el
coeficiente, ms distancia y diferencia existir con respecto al resto, y a la
inversa cuanto ms pequeo sea.
2) Grfico de Carmbanos vertical: leyendo de abajo hacia arriba se van
formando los clusters. El nmero de filas se identifica con el nmero de
clusters.
3) Tabla de aglomeracin: identifica los clusters combinados en cada paso del
anlisis.
4) Dendrograma: leyendo de izquierda a derecha se van formando los grupos,
representando las lneas verticales la unin de dos clusters.
5) Conglomerado de pertenencia: recoge la solucin o soluciones segn el
nmero de grupos identificados. La eleccin del ms adecuado se basa en la
lgica e interpretacin de los resultados por parte del investigador. Es el criterio
por excelencia para identificar el nmero de clusters.
Por ltimo, es importante comprobar las diferencias entre grupos. Para ello se
realizara un anlisis de la varianza (ANOVA) comparar medias entre grupos-, de
forma que deberan tener unos p-valores inferiores a 0,05 para que se diferencien
entre ellos (diferencias estadsticamente significativas y no fruto del azar). De este
modo, podremos seleccionar adecuadamente cules son los grupos a tener en cuenta.

3.
-

Aplicabilidad
Permite generar grupos de individuos u observaciones muy similares u
homogneos dentro de s, y muy distintos o heterogneos entre ellos. As, es muy
habitual utilizar esta tcnica en estudios de mercado o sociales donde se desean
crear grupos de empresas, regiones, pases, etc.

93

CAPTULO 15
Modelos de ecuaciones estructurales

1.

Concepto

El modelo de ecuaciones estructurales (SEM), segn Hair et al.:


abarca una familia entera de modelos conocidos con muchos nombres, entre ellos anlisis de la
estructura de la covarianza, anlisis de variable latente, anlisis de factor confirmatorio y a menudo
simplemente LISREL. (Hair et al., 2007)

Es una tcnica multivariante que trata de analizar las relaciones de causalidad entre
distintas variables, las cuales pueden comportarse tanto como dependientes como
independientes simultneamente. Siguiendo a Hair et al. (2007) las tcnicas SEM se
distinguen por: a) estimacin de relaciones de dependencia mltiples y cruzadas, y b)
la capacidad de representar conceptos no observados en estas relaciones y tener en
cuenta el error de medida en el proceso de estimacin.
Como conclusin, el SEM tiene como objetivo fundamental la evaluacin de una serie
de relaciones. Estas relaciones son construidas en dos fases bien diferenciadas, la
primera de ellas, es el modelo de medida, donde aparecen las relaciones entre las
variables originales y la latente, y la segunda, el modelo estructural, donde se
contrastan las relaciones entre los constructos o variables latentes; es, por tanto, la
modelizacin de las ecuaciones estructurales propiamente dicho.

2.

Fases

Siguiendo las indicaciones de Arbuckle (2005) y Hair et al. (2007) una modelizacin
adecuada debera guiarse por siete pasos: (1) desarrollar un modelo fundamentado
tericamente, (2) construir un diagrama de secuencias de relaciones causales, (3)
convertir el diagrama de secuencias en un conjunto de modelos y relaciones
estructurales, (4) elegir el tipo de matriz de entrada y estimar el modelo propuesto, (5)
evaluar la identificacin del modelo estructural, (6) evaluar los criterios de calidad e
ajuste, y (7) interpretar y modificar el modelo si est tericamente justificado.

94

(1) Desarrollo de un modelo basado en la teora.


Como hemos comentado, el modelaje de ecuaciones estructurales est basado en
relaciones causales, en las que el cambio en una variable se supone que produce un
cambio en otra variable. As, la causacin que el investigador puede asumir entre
dichas variables no descansa en los mtodos analticos escogidos sino en la
justificacin terica, esto es, deben existir asociaciones suficientes entre dos variables,
antecedentes temporales de la causa frente al efecto y una base terica cuando
menos racional. Es decir, el carcter no debe ser exploratorio sino confirmatorio.
En este caso es importante no incurrir en un error de especificacin elevado, no omitir
variables explicativas relevantes. Ahora bien, debemos tener en cuenta los beneficios
de comprensin de los modelos concisos y parsimoniosos. De ah que el trade-off
entre la inclusin de numerosas variables y la simplicidad del modelo a veces dificulte
la modelizacin.
(2) Construccin de un diagrama de secuencias de relaciones causales.
El diagrama de secuencias nos va a servir para disear una serie de relaciones
lineales causales entre las variables propuestas en el modelo. Es, consecuentemente,
una representacin visual de las relaciones entre variables originales y constructos,
entre variables latentes, as como de relaciones asociativas (correlaciones) entre
variables.
A modo aclaratorio podemos distinguir, grosso modo, los siguientes elementos:

Constructo: tambin denominado variable latente, podemos definirla como una


variable directamente no observable que representa un concepto terico o con
cierto grado de abstraccin. Se obtiene o se mide mediante variables originales
directamente observables.

Flechas: utilizadas para representar relaciones especficas entre constructos o


variables. Una flecha directa indica relacin causal y, una flecha curvada indica
correlacin entre elementos.

(3) Conversin de un diagrama de secuencias en un conjunto de ecuaciones


estructurales y especificacin del modelo de medida.
En trminos formales se distingue entre:

95

Modelo estructural

Se traslada el diagrama de secuencias a una serie de ecuaciones estructurales, donde


cada variable latente endgena es la variable independiente de una ecuacin
separada. Esto es, cada variable endgena puede ser prevista tanto por variables
exgenas como por otras variables endgenas. Para cada efecto supuesto, se estima
un coeficiente estructural y un trmino de error (error de especificacin y error aleatorio
de medida), al igual que en la regresin mltiple (Arbuckle, 2005).


Modelo de medida

En este caso tratamos de construir las variables latentes o constructos mediante una
serie de variables originales directamente observables. Para ello, el SEM realiza un
anlisis factorial confirmatorio donde aparecen los factores (o constructos) y su
relacin con las variables que los forman. Estos factores referidos a dimensiones
subyancentes de los datos, son formados por combinacin lineal entre stos y las
variables originales. Estos constructos son los que a posteriori se entrecruzan para
generar el modelo estructural explicativo correspondiente.
En ocasiones, el modelo de medida se realiza de forma independiente mediante un
anlisis factorial, si son variables mtricas o no mtricas nominales, o un anlisis de
correspondencias mltiple, si las variables son no mtricas nominales u ordinales-.
Posteriormente, con el software correspondiente (AMOS) se ejecutara el modelo
estructural.
(4) Seleccin del tipo de matriz de entrada y estimacin del modelo propuesto.
Al incluir los datos el sistema SEM los transforma, o bien en una matriz de
correlaciones, o bien en una matriz de varianza-covarianza12 ya que segn Hair et al.
(2007) el inters de SEM no est en las observaciones individuales sino el patrn de
relaciones entre los encuestados. Como comentamos anteriormente, el modelo de
medida especifica qu variables (indicadores en SEM) corresponden a cada
constructo, y las puntuaciones de la variable latente son las empleadas en el modelo
estructural.
Tambin es importante tener en cuenta que las observaciones han de ser
independientes, que el muestreo ha de ser aleatorio, que debe existir linealidad entre
12

Esta es la matriz que se suele utilizar puesto que segn Gondar Nores (1999c) es la que permite, con
mayor rigor, un contraste adecuado de la teora y no slo asumir pautas relacionales como en el caso de
la matriz de correlacin.

96

las relaciones, que se deben eliminar los casos atpicos que desven los resultados,
que se debe actuar sobre los datos perdidos y que se debe tener en cuenta la
distribucin de la muestra (distribucin normal).
(5) Valoracin de la identificacin del modelo estructural.
Segn Gondar Nores (1999) el problema de identificacin es la incapacidad del
modelo propuesto para generar estimaciones aisladas, esto es, debemos tener ms
ecuaciones que incgnitas.
Para ello, a efectos de identificacin, nos debemos centrar en el tamao de las
matrices de correlacin o covarianzas relativas respecto al nmero de coeficientes
estimados. A la diferencia entre el nmero de correlaciones o covarianzas y el nmero
efectivo de coeficientes en el modelo propuesto se denomina grados de libertad.
Apoyndonos en este concepto, Hair et al. (2007) recomiendan el cumplimiento de que
los grados de libertad sean mayores o iguales a cero, esto es, el modelo ha de estar
identificado (gl=0) o sobreidentificado (gl>0  ms informacin en la matriz de datos
que el nmero de parmetros a estimar).
(6) Evaluacin de los criterios de calidad de ajuste.
En esta etapa debemos detectar en primer lugar las estimaciones infractoras13.
Posteriormente, se atender a la calidad del ajuste: primero, para el modelo conjunto
y, a continuacin, para los modelos estructurales y de medida por separado.
La calidad del ajuste14 mide la correspondencia entre la matriz de entrada real u
observada con la que se predice mediante el modelo propuesto. Podemos distinguir
tres tipos (Casas, 2006):

Medidas absolutas del ajuste: evalan slo el ajuste global del modelo.
Podemos destacar el estadstico 2, los grados de libertad, la significatividad
del contraste y el GFI.

13

Se trata de coeficientes estimados que exceden los lmites aceptables. Por ejemplo: varianzas de error
negativas o no significativas; coeficientes estandarizados que estn muy cercanos a 1 y, errores estndar
muy elevados.
14
Respecto a los modelos de medida y estructural, es conveniente en el primer caso reconocer la
fiabilidad de las medidas de cada variable (mediante alfa de Cronbach).

97

Medidas de ajuste incremental: comparan el modelo propuesto con otro modelo


especificado por el investigador. Podemos destacar, entre otras, al estadstico
TLI y NFI.

Medidas de ajuste de parsimonia: afinan las medidas de ajuste para ofrecer


una comparacin entre modelos con diferentes nmeros de coeficientes
estimados. El objetivo ser, por tanto, determinar el ajuste conseguido por cada
coeficiente estimado. En este caso las medidas apropiadas para la evaluacin
directa del modelo son el AGFI y la Chi-cuadrado normada, entre otros.

Respecto al modelo estructural consiste en observar que la significacin de los


coeficientes estimados sea inferior a 0,05. Por ltimo, es conveniente corroborar que
no tenemos problemas de multicolinealidad entre las variables seleccionadas.
En ltimo lugar, es apropiado realizar una comparacin de modelos rivales para
determinar cul es el mejor ajustado de un conjunto de modelos. Esto es, se construye
un modelo base y se aplican una serie de reespecificaciones, con las que cada vez se
espera mejorar el ajuste del modelo mientras se mantenga la concordancia de la teora
subyacente.
Se trata, pues, de mantener el mismo nmero de variables latentes e indicadores, de
tal forma que el modelo nulo sea el mismo para ambos modelos (modelos anidados).
El impacto de aadir o destruir una o ms relaciones causales es lo que nos da
informacin acerca de la mayor calidad de ajuste.
(7) Interpretacin y modificacin del modelo.
Una vez que el modelo se considera aceptable, debemos examinar los resultados y su
correspondencia con la teora propuesta. De no ser adecuadas las interrelaciones
habra que reespecificar el modelo (Bacon, 2006).

3.
-

Aplicabilidad
Contrastacin de teoras complejas o de relaciones causales basadas en el
empirismo.

Comparacin de varios modelos para evaluar cul es el que mejor se ajusta a los
datos.

98

Elaboracin de modelos donde se aprecia que algunas variables que son


explicadas por otras, podran a su vez explicar a unas terceras. Frecuente en las
ciencias sociales.

99

BIBLIOGRAFA
-

Aiken, L. R. (1996): Test psicolgicos y evaluacin. Mxico, Prentice Hall


Hispanoamericana.

Arbuckle, J.L. (2005): Amos 6.0 Users Guide. Amos Development Corporation,
Chicago, SPSS.

Astigarraga, E. (2003): El mtodo Delphi. Universidad de Deusto, San


Sebastin.

Babbie, E. (1999): Metodologa de la investigacin. Mxico, Thomson.

Bacon, L.D. (2006): Using Amos for structural equation modeling in market
research.

SPSS

White

Paper.

Disponible

en:

http://www.spss.com/dk/pdf/amos.pdf
-

Bernal, T. (2000): Metodologa de la Investigacin para Administracin y


Economa. Bogot, Prentice Hall.

Bunge, M. (1981): La ciencia, su mtodo y su filosofa. Buenos Aires, Siglo XX.

Casas Guilln, M. (2006): Los modelos de ecuaciones estructurales y su


aplicacin en el ndice Europeo de Satisfaccin del Cliente. Facultad de
Ciencias Econmicas y Empresariales, Universidad San Pablo CEU. Disponible
en: http://www.uv.es/asepuma/X/C29C.pdf

Daz, E. y Heler, M. (1985): El conocimiento cientfico. Buenos Aires, Eudeba.

Fontela, E. (1990): Fundamentos histricos de la Economa Aplicada. Una visin


personal. Economistas, n43, 52-57.

Frey, J. H. and Fontana, A. (1993): "The group interview in social research", in


Morgan, D. (Eds), Successful Focus Groups: Advancing the State-of-the-Art, 9th
ed., Sage Publications, Newbury Park, CA.

Garca De la Fuente, O. (1994): Metodologa de la investigacin cientfica.


Madrid, Ediciones CEES.

George, D. and Mallery, P. (1995): SPSS/PC+ step by step: A simple guide and
reference. Wadsworth Publishing Company. Belmont, CA. Estados Unidos.

100

Gondar Nores, J.E. (1999): Tcnicas estadsticas con SPSS. Amos. Madrid,
Ed. Estudios Estadsticos.

Hair, J. F.; Anderson, R.; Tatham, R. y Black, W. (2007): Anlisis multivariante.


5 edicin, Prentice Hall Iberia, Madrid.

Hardyck, C. D. and Petrinovich, L. F. (1976): Introduction to Statistics for the


Behavioral Sciences. Second edition. Philadephia: Saunders.

Hernndez Sampieri, R., Fernndez-Collado, C. y Baptista, P. (2006):


Metodologa de la investigacin. Mxico, McGraw Hill.

Hosmer, D.W. and Lemeshow, S. (1989): Applied Logistic Regression. Ed. John
Wiley, New York.

Igarza, R. (2008): El mtodo Delphi, apuntes para una herramienta exitosa.


Universidad Austral, Argentina.

Information Technology Services (2001): Structural Equation Modelling using


AMOS:

An

Introduction.

Disponible

en:

http://www.utexas.edu/its/rc/tutorials/stat/amos/
-

Joreskog, K.G. (1993): Structural Equation Modeling with LISREL en Seminario


Internacional de Estadstica en el Pas Vasco, n 29, Eustat (Instituto Vasco de
Estadstica).

Joreskog, K.G. and Wold, H. (1982): Systems Under Indirect Observation:


Causality,

Structure,

Prediction.

Contributions

to

Economic

Analysis.

Amsterdam: North-Holland, vol. 139, Part II.


-

Krueguer, K. (1991): El grupo de discusin. Gua prctica para la investigacin


aplicada. Pirmide, Madrid.

Lafuente, C. y Marn, A. (2008): Metodologa de la investigacin en ciencias


sociales: fases, fuentes y seleccin de tcnicas. Revista EAN, n 64, pp. 5-18.

Landeta, J. (1999): El mtodo Delphi, una tcnica de previsin del futuro. Ariel
S.A., Barcelona.

Len Barrios, G. (2007): El grupo de discusin como artefacto cientfico para el


anlisis social. Revista Comunicolog@: indicios y conjeturas, Publicacin

101

Electrnica

del

Departamento

de

Comunicacin

de

la

Universidad

Iberoamericana Ciudad de Mxico, Primera poca, Nmero 7, Primavera 2007.


Disponible

en:

http://revistacomunicologia.org/index.php?option=com_content&task=view&id=16
6&Itemid=87
-

Linstone, H. A. and Turoff, M. (1975): The Delphi method, techniques and


applications. Addison-Wesley Publishing Company.

Lofland, J. (1984): Analyzing Social Settings. Wadsworth, Belmont, California.

Manuel, C.M. (2005): Anlisis multivariante. Madrid, Escuela de Estadstica,


Universidad Complutense de Madrid (mimeo).

Martin, G., Labeaga, J.M. y Mochon, F. (1997): Introduccin a la Econometra.


Prentice Hall, Madrid

Ortega, F. (2008): El mtodo Delphi, prospectiva en Ciencias Sociales a travs


del anlisis de un caso prctico. Revista-Escuela de Administracin de
Negocios, N 64, sept.-dic., pp. 31-54. Universidad EAN, Colombia.

Prez, C. (2006): Tcnicas de Anlisis Multivariante de Datos. Aplicaciones con


SPSS. Pearson Prentice Hall.

Plummer, K. (1983): Documents of Life. Allen, London.

Poza, C. (2008): Tcnicas estadsticas multivariantes para la generacin de


variables latentes. Revista EAN, n 64, pp.89-99.

Ramrez Vera, D.C. (2006): Redaccin del trabajo escrito. Pautas y


recomendaciones. Universidad de los Andes, Instituto de investigaciones
econmicas

sociales,

Venezuela.

Disponible

en:

http://webdelprofesor.ula.ve/economia/dramirez/MICRO/FORMATO_PDF/Proble
masEconomicos/Redaccion_Trabajos.pdf
-

Ritchey, F.J. (2006): Estadstica para las ciencias sociales. McGraw-Hill,


Mxico.

Ruiz-Maya, L. (2000): Mtodos estadsticos de investigacin en las Ciencias


Sociales: tcnicas no paramtricas. Ed. AC, Madrid.

102

Ruiz Olabunaga, J.I. (2007): Metodologa de la investigacin cualitativa.


Cuarta edicin, Universidad de Deusto. Bilbao.

Snchez Martn, M. E. (2003): La entrevista. Tcnica de recogida de datos en el


anlisis de una situacin social. Documento de trabajo, octubre, Universidad
Complutense de Madrid, Madrid.

Santos Pea, J. (1999): Diseo y tratamiento estadstico de encuestas para


estudios de mercado. Ed. Centro de Estudios Ramn Areces, S.A., Madrid.

Saravia, M. A. (2006): Metodologa de investigacin cientfica. Orientacin


metodolgica para la elaboracin de proyectos e informes de investigacin.
Ministerio de Educacin, Bolivia. Disponible en: www.conacyt.gov.bo

Sierra Bravo, R. (2006): Tesis doctorales y trabajos de investigacin cientfica.


Madrid, THOMSON.

Torres Padilla (2008): Un modelo integrador para el manejo de elementos


intangibles y creacin de valor en la empresa. Tesis doctoral. Universidad
Nebrija, Madrid.

Valls, M.S. (1997): Tcnicas cualitativas de investigacin social. Reflexin


metodolgica y prctica profesional. Sntesis Sociologa, Madrid.

Visauta Vinacua, B. y Martori i Caas, J.C. (2002): Anlisis estadstico con


SPSS para Windows. Volumen I, Estadstica Bsica. Segunda edicin,
McGrawHill.

Visauta Vinacua, B. y Martori i Caas, J.C. (2003): Anlisis estadstico con


SPSS para Windows. Volumen II, Estadstica Multivariante. Segunda edicin,
McGrawHill.

103

Вам также может понравиться