Академический Документы
Профессиональный Документы
Культура Документы
MDULO IX
DISEO Y TCNICAS DE INVESTIGACIN
EN PSICO-ONCOLOGA
Andrea Conchado
Ttulo Diseo y Tcnicas de Investigacin. Mtodos
Autora Andrea Conchado
Profesor Asociado de Universidad. Universitat Politcnica de Valncia
- Mster en Psico-Oncologa.
Mdulo 9. Unidad 01.
NDICE
- Mster en Psico-Oncologa. 1
Mdulo 9. Unidad 01.
INTRODUCCIN
Este mdulo aborda la cuestin de cmo plantear y analizar un problema de investigacin
cientfica de manera lgica y coherente. Para ello resulta imprescindible definir correctamente
los objetivos de la investigacin, formular las preguntas de la investigacin y justificar porqu es
procedente llevar a cabo la investigacin. En otras palabras, se trata de argumentar qu aporta la
presente investigacin al campo de estudio en cuestin, de modo que la comunidad cientfica
posea ms elementos de juicio para valorar el impacto y las implicaciones de nuestros resultados.
El trabajo de campo permitir recoger las respuestas de una muestra representativa de la
poblacin de estudio. A continuacin, el anlisis de datos aportar informacin sobre qu han
respondido los encuestados y en qu medida puede afirmarse que las diferencias observadas
entre grupos se deben a diferencias reales en la poblacin que representan.
OBJETIVOS
Al finalizar este mdulo, sers capaz de:
Formular correctamente hiptesis de investigacin y los objetivos de investigacin asociados
Seleccionar el diseo de investigacin ms adecuado para los objetivos de la investigacin
Calcular el tamao de muestra necesario para desarrollar la investigacin y el error muestral
Analizar las respuestas de los individuos entrevistados
Valorar en qu medida las diferencias observadas entre grupos pueden ser evaluadas como
estadsticamente significativas
Distinguir entre fiabilidad y validez de un cuestionario o escala de medida.
- Mster en Psico-Oncologa. 2
Mdulo 9. Unidad 01.
- Mster en Psico-Oncologa. 3
Mdulo 9. Unidad 01.
- Mster en Psico-Oncologa. 4
Mdulo 9. Unidad 01.
pueden encontrarse los adolescentes, considerando el entorno familiar, social y autoconcepto. As,
podramos obtener casos de adolescentes que tengan mala relacin con la familia, pero buena con los
amigos. Tambin adolescentes que tengan mala, o buena relacin con ambos, y as sucesivamente
hasta abarcar todas las posibilidades. Este sera un diseo de investigacin experimental, donde
podemos controlar las condiciones en que se produce el fenmeno de estudio.
Sin embargo, como puede suponerse, este tipo de experimentos no puede realizarse con
personas, ya que no sera moral ni tico intervenir en el entorno personal, para imponer
determinadas condiciones de estudio. Sin ir ms lejos, cada vez ms existe ms control sobre
cmo se realizan los diseos experimentales cuando implican a los animales. En la mayora de las
investigaciones del campo de la psicologa, tienen mucho ms sentido los diseos no
experimentales, donde el investigador se limita a observar a los individuos, y no interviene para
generar determinadas condiciones de estudio. Trabajar con diseos no experimentales supone
analizar datos sobre fenmenos que ya han ocurrido, y su ocurrencia no depende de la presencia
del investigador. En estas condiciones es posible que no tengamos un elevado nmero de
observaciones en todas las posibles situaciones. Por ejemplo, es posible que no encontremos
muchos adolescentes que tengan mala relacin con sus padres y compaeros, pero buena consigo
mismo. Asimismo, es difcil para el investigador minimizar el error de medida, ya que no tiene el
control de las condiciones en que se produce el fenmeno. En un diseo experimental, que se
llevara a cabo en un laboratorio, el investigador podra cerrar las ventanas para evitar la entrada
de aire, insonorizar la habitacin o aislar un determinado microorganismo. Pero no es posible
realizar acciones equivalentes en el rea de la psicologa, no slo por las consideraciones ticas.
En realidad, sera difcil cuantificar en qu medida la presencia del investigador, y las
condiciones de trabajo que impondra, condicionara las respuestas de los individuos observados.
- Mster en Psico-Oncologa. 5
Mdulo 9. Unidad 01.
Por lo general, a priori descartamos la posibilidad de contactar con toda la poblacin y nos
preguntamos cul es el nmero mnimo de respuestas que necesitamos obtener en la muestra,
para garantizar un error muestral pequeo. En este punto, es necesario sealar que el tamao de
la muestra es un factor importante, pero no el nico que debemos tener en cuenta. Si el objetivo
de la investigacin es simplemente describir las caractersticas de un grupo de individuos, no es
necesario alcanzar un nmero mnimo de respuestas. Puesto que el estudio tendra un enfoque
descriptivo, no haramos inferencia estadstica sobre la poblacin que representa, hablaramos
de las respuestas de dichos individuos a las cuestiones. Sin embargo, si pretendemos analizar las
caractersticas de una poblacin de estudio a partir de entrevistas a una parte de los individuos,
es decir una muestra, tendremos que plantearnos dos cuestiones: La representatividad de la
muestra y el error muestral.
- Mster en Psico-Oncologa. 6
Mdulo 9. Unidad 01.
Una vez determinado el tamao de muestra (n), realizamos el trabajo de campo mediante envo
de cuestionarios y recopilacin de respuestas. Al finalizar este proceso habremos reunido un
nmero de respuestas (n), que con toda seguridad ser distinto al que habamos previsto. El
error muestral correspondiente a este nuevo tamao de muestra (e) podremos calcularlo con las
frmulas:
- Mster en Psico-Oncologa. 7
Mdulo 9. Unidad 01.
Ahora supongamos que la poblacin son 500 adolescentes (valor evidentemente simulado). El
tamao muestral mximo sera:
- Mster en Psico-Oncologa. 8
Mdulo 9. Unidad 01.
sentido obtener la media entre estos nmeros. Otro tipo de variable es el Ordinal, que sirve para
representar distintas categoras de respuesta, que guardan un orden entre ellas. Sera adecuada para
almacenar el curso en que est matriculado cada adolescente. Podramos definir 1 = 1 ESO y 2 = 2
ESO, segn un orden numrico, pero no tendra sentido la media entre ambas categoras. Es
fundamental identificar el tipo de variable ms adecuado para cada pregunta, ya que la seleccin del
anlisis de datos ms adecuado en cada caso depende de esta decisin. Es importante sealar que una
escala Likert se considera escala, siempre y cuando tenga al menos 5 niveles de medida, es decir una
graduacin de 5 puntos. Los estadsticos descriptivos que se obtienen para variables cuantitativas
dejan de tener sentido para variables con 4 categoras o menos.
Por otro lado, la vista de variables muestra una fila por cada variable, y permite definir cada
propiedad en una columna:
Para ms detalles sobre cada campo de ambas vistas, puedes ver el siguiente vdeo:
http://media.upv.es/player/?id=73dbeaa0-b533-11e5-a11b-ed17dcc035b0
- Mster en Psico-Oncologa. 9
Mdulo 9. Unidad 01.
Entre ellos tendremos que escoger una medida de tendencia central, como la media o la mediana,
y una medida de dispersin, como la desviacin o el rango intercuartlico. Siempre que los datos
no tengan valores extremos, o anmalos, resulta adecuado trabajar con la media y la desviacin
tpica. Por el contrario, si encontramos estos valores extremos, aislados y muy alejados de la
media superior o inferiormente, ser conveniente trabajar con la mediana y el rango
intercuartlico. Cuando trabajemos con valoraciones en escala Likert no encontraremos valores
extremos, ya que las respuestas de los individuos estarn acotadas entre los valores mnimos y
mximo de la escala.
En la siguiente tabla se observan los valores medios, desviaciones tpicas y valores mnimo y
mximo a dos tems de ejemplo. Como se observa, la media referente a la tristeza es superior a la
media sobre la sensacin de soledad. Esta tabla se obtiene en PSPP en Analizar / Estadstica
descriptiva / Descriptivos
Cuando queramos analizar las respuestas a una determinada pregunta, en funcin del grupo al
que pertenece cada individuo, debemos considerar la naturaleza de las variables implicadas.
Supongamos que queremos estudiar las ausencias a clase en funcin del gnero del estudiante.
Las dos variables son cualitativas, o nominales. En ese caso, el anlisis ms adecuado es la tabla
de contingencia, o tabla de frecuencias cruzadas. Esta tabla se obtiene en Analizar /
Estadstica descriptiva / Tablas cruzadas
- Mster en Psico-Oncologa. 10
Mdulo 9. Unidad 01.
En esta tabla se muestran las frecuencias absolutas o nmero de casos en la primera fila, el
porcentaje por fila en la segunda fila, el porcentaje por columna en la tercera fila y el porcentaje
total en la ltima fila. Este formato de tablas, que se muestra por defecto, puede ser demasiada
informacin para el investigador, que habitualmente est interesado nicamente en una diferencia
entre porcentajes. As, tal y como hemos dispuesto las variables en esta tabla (Ausencias en filas, y
Gnero en columnas) el dato ms interesante es el porcentaje por columnas, que indica el
porcentaje de ausencias a clase entre los chicos, y entre las chicas. En la opcin Formato
podemos modificar la tabla para que slo se muestre este porcentaje por columnas:
En esta tabla se observa claramente cmo el 80% de los chicos han faltado a clase, mientras que
slo el 20% de las chicas se encuentra en esta situacin. La decisin de qu variables se
mostrarn en filas y columnas, y en consecuencia qu porcentajes ser ms interesante,
corresponde al investigador. Con la prctica es fcil identificar el modo ms conveniente de
mostrar los resultados.
En el caso de que queramos examinar cmo varan las respuestas a los tems (variables
numricas, cuantitativas o de escala) en funcin del gnero del estudiante (variable cualitativa o
nominal), es necesario comprobar cmo las medias de estos tems varan en funcin del grupo.
Para ello, seleccionamos Analizar / Comparar medias / Medias. En esta ventana marcamos los
tems como variables dependientes y la variable de grupo como independiente. As obtenemos la
siguiente tabla:
En esta tabla se observa cmo las chicas obtienen puntuaciones ms altas en el tem sobre tristeza,
mientras que los chicos puntan ms alto en el tem sobre soledad. Las desviaciones estndar nos
permiten valorar en qu medida estas medias son una medida representativa de las respuestas de
cada grupo. No es recomendable comparar medias cuyos grupos tienen desviaciones estndar
distintas, aunque esta puntualizacin la estudiaremos con ms detalle ms adelante.
Por ltimo, en el caso de que queramos analizar la relacin entre dos o ms variables cuantitativas,
como son las respuestas a los tems, podemos utilizar la matriz de correlaciones. Esta matriz es
simtrica y siempre contiene 1 en la diagonal, pues muestra el grado de relacin de cada variable
con las restantes.
- Mster en Psico-Oncologa. 11
Mdulo 9. Unidad 01.
En la diagonal se muestra el grado de relacin de cada variable consigo misma, y por eso siempre
hay 1 en la diagonal. Esta matriz se obtiene en Correlacin bivariada, donde seleccionaramos los
dos tems de este cuestionario para obtener la siguiente tabla:
En la primera fila de cada celda se muestra el coeficiente de correlacin entre ambos tems.
Puesto que es cercano a cero, deberemos concluir que no hay relacin entre ambos tems, es
decir, que los alumnos que se sienten tristes, no implica que tambin se sientan solos, y
viceversa.
- Mster en Psico-Oncologa. 12
Mdulo 9. Unidad 01.
Es importante mencionar que este p valor puede ser influido por distintos factores: el tamao
de la diferencia entre grupos, el tamao de la muestra y el nivel de confianza con que queramos
trabajar. Es fcil comprender que cuando la diferencia entre grupos sea grande, menor ser el p
valor. Por ejemplo, es muy improbable que una diferencia de cuatro puntos en una escala
Likert de 1 a 5, sea evaluada como no significativa.
Por otro lado, tambin influye el nmero de respuestas que hayamos podido recopilar, es decir el
tamao de la muestra. Por lo general, los contrastes de hiptesis tienden a favorecer los
conjuntos de datos de gran tamao. De esta forma, las diferencias observadas en grandes
muestras tienen mayor probabilidad de ser evaluadas como significativas. Es decir, aunque las
diferencias observadas entre grupos sean pequeas, si proceden de grandes bases de datos,
obtendrn menores valores de significacin (p valor). Esta es un arma de doble filo pues en
aquellos casos que tengamos la suerte de contar con grandes bases de datos, debemos interpretar
con cautela los resultados de los contrastes de significacin. En estos casos, cualquier diferencia,
por pequea que sea, puede conllevar un valor de significacin pequeo.
Por ltimo, el nivel de confianza 1-, representa la confiabilidad de nuestras afirmaciones sobre la
poblacin, en base a diferencias observadas sobre la muestra. Por lo general, empleamos el nivel de
confianza estndar del 95%, correspondiente a un error tipo I de = 5%. Por esta razn hemos definido
un valor de referencia de 0.05 para evaluar si las diferencias son estadsticamente significativas, o no.
Sin embargo, podemos aumentar este nivel de confianza hasta otra referencia en 99%, correspondiente
a un error tipo I de = 1%. En estos casos simplemente hay que comparar el p valor de nuestro anlisis
con el valor de referencia de 0.01. Las investigaciones que trabajan con altos niveles de confianza,
demuestran mayor precisin en la determinacin de diferencias significativas entre grupos. Estas
diferencias pueden deberse a elevados tamaos de muestra, grandes diferencias entre grupos, o ambos
factores. En cualquier caso, el investigador casi siempre suele estar interesado en identificar diferencias
significativas, con altos niveles de confianza, es decir, valores pequeos de significacin.
- Mster en Psico-Oncologa. 13
Mdulo 9. Unidad 01.
En esta tabla se muestra el test de hiptesis para cada tem, asumiendo que las varianzas entre
grupos son iguales o no. Como hemos comentado anteriormente, no es correcto comparar
medias entre grupos con distintos niveles de dispersin, expresado a travs de la desviacin
tpica, o su cuadrado, la varianza. Observemos el primer tem Te sientes triste. La prueba de
Levene para la igualdad de varianzas indica que puede asumirse igualdad de varianzas. En otras
palabras, la hiptesis nula de igualdad de varianzas no puede rechazarse, ya que el valor de
significacin (p valor = 0.074) es superior a 0.05. No ocurre lo mismo para el tem Te sientes
solo (p valor = 0.041). En consecuencia, para el primer tem debemos leer la fila superior Se
asume la igualdad de varianzas, mientras que para el segundo tem debemos leer la fila inferior
Igualdad de varianzas no asumida.
Analicemos entonces los resultados de la Prueba t para la igualdad de medias. En el tem Te
sientes triste se observa una diferencia media de -2.20 puntos, esta diferencia procede de las
puntuaciones promedio obtenidas en chicos (2.00) y chicas (4.20). El test de hiptesis
transforma esta diferencia media a unidades del estadstico t de Student, en este caso -4.49, y un
valor de significacin de 0.002. Puesto que este valor de significacin es inferior a 0.05, podemos
afirmar, con un nivel de confianza del 95%, que las diferencias en este tem entre chicos y chicas
es estadsticamente significativa. De hecho, puesto que el valor de significacin es inferior a 0.01,
podemos hacer esta afirmacin con un nivel de confianza del 99%.
Del mismo modo, en el tem Te sientes solo/a se observa una diferencia media de 0.80, que
procede de las puntuaciones promedio obtenidas en chicos (2.80) y chicas (2.00). El test de
hiptesis transforma esta diferencia media a unidades del estadstico t de Student, en este caso
0.93, y un valor de significacin de 0.393. Puesto que este valor de significacin es superior a
0.05, debemos asumir las diferencias en este tem entre chicos y chicas NO son estadsticamente
significativas. La diferencia observada de 0.80 puntos es debida al azar, y no a diferencias reales
entre las poblaciones de chicas y chicos. Evidentemente, esta afirmacin la hacemos con un 95%
y no nos planteamos aumentar el nivel de confianza al 99% pues no tiene sentido cuando
aceptamos la hiptesis nula.
Las dos ltimas columnas de la tabla muestran el intervalo de confianza para la diferencia de
medias. Estas columnas muestran informacin coherente con las conclusiones anteriores. Estos
intervalos muestran el rango de valores donde es muy posible que se encuentre el valor real, o
poblacional, de la diferencia de medias. Cuando el intervalo de confianza contiene el valor cero,
las diferencias observadas son NO estadsticamente significativas. Por el contrario, cuando el
intervalo de confianza NO contiene al cero, indica que las diferencias observadas son
estadsticamente significativas. Comprueba que ocurre as en los tems que hemos examinado
anteriormente.
Por otro lado, podemos plantearnos en qu medida las diferencias de porcentajes observadas
entre dos variables nominales, o cualitativas, son estadsticamente significativas. En este caso
trabajaramos con el test no paramtrico de la 2 (chi - cuadrado). Este test estadstico se obtiene
en la misma opcin de men para tablas cruzadas (Analizar / Estadstica descriptiva / Tablas
cruzadas) y debemos entrar a la opcin Estadsticos, donde marcamos Chi C. Mostramos de
nuevo la tabla cruzada, para facilitar la lectura:
- Mster en Psico-Oncologa. 14
Mdulo 9. Unidad 01.
A continuacin el resultado del test de hiptesis, que muestra un valor de la 2 de 3.60 y un valor de
significacin de 0.058. Estrictamente hablando, este valor es superior al valor de referencia de 0.05, y
por tanto las diferencias observadas de 80% y 20% deberan valorarse como NO estadsticamente
significativas. Sin embargo, es evidente que se estn produciendo diferencias notables en las ausencias
a clase entre chicos y chicas, a pesar de que el test de hiptesis las valore como NO significativas.
Qu est ocurriendo en este caso? Aparentemente el reducido tamao de la muestra no permite
concluir que las diferencias observadas se valoren como estadsticamente significativas. Tenemos
10 respuestas en nuestro conjunto de datos, que es absolutamente insuficiente para obtener test
de hiptesis con confiabilidad. En trminos generales es recomendable alcanzar un nmero
mnimo en torno a 30 respuestas por grupo, para aplicar contrastes de hiptesis con cierta
confiabilidad, independiente de las cuestiones sobre diseo muestral comentadas anteriormente.
Por otro lado, comentamos brevemente el contenido del resto de la tabla. El resto de estadsticos,
mostrados a continuacin del estadstico chi cuadrado, ofrecen informacin complementaria.
Existe un gran nmero de medidas de asociacin que pueden obtenerse en funcin de la chi
cuadrado y la razn de semejanza (tambin llamada razn de verosimilitud), que pueden resultar
adecuados para combinaciones de variables nominales y ordinales (Coeficiente de correlacin de
Spearman, Phi, V de Cramer, Tau b de Kendall).
La prueba exacta de Fisher se aplica en los casos en que tenemos pocas observaciones en alguna
combinacin de categoras de respuesta, concretamente menos de 5 observaciones. Sin ir ms lejos, en
este caso deberamos en esta prueba exacta, pues tenemos menos de 5 chicos que no asisten a clase,
menos de 5 chicos que s asisten a clase, etc. Esta prueba confirma la conclusin anterior, de que las
diferencias entre chicos y chicas en lo que respecta a las ausencias a clase NO son estadsticamente
significativas, pues el p valor, o nivel de significacin, es 0.107, superior al valor de referencia 0.05.
Por ltimo, debemos distinguir entre los niveles de significacin correspondientes a los test de
dos colas (2 - tailed) o una cola (1 - tailed). Los test de dos colas plantean que las medias, o los
porcentajes, entre grupos simplemente no son iguales, y se centran en aceptar o rechazar esta
afirmacin. Por el contrario, los test de una cola, plantean que las medias, o los porcentajes, de un
grupo es superior o inferior al otro. Por tanto, estos test de hiptesis se centran en evaluar si esa
diferencia se cumple, en el sentido que haya definido el investigador. Es decir, si la diferencia es
superior o inferior, como se ha definido. La cuestin es si la regin de rechazo se encuentra a
ambos lados del valor central (test bilateral), o nicamente a un lado de la distribucin (test
unilateral). Por lo general, el investigador trabajar con test bilaterales.
- Mster en Psico-Oncologa. 15
Mdulo 9. Unidad 01.
- Mster en Psico-Oncologa. 16
Mdulo 9. Unidad 01.
REFERENCIAS
Brown, T. A. (2015). Confirmatory factor analysis for applied research. Guilford Publications.
Campbell, D. T., & Fiske, D. W. (1959). Convergent and discriminant validation by the
multitrait-multimethod matrix. Psychological Bulletin. US: American Psychological
Association.
Mcdowell, I. (1989). Measuring Health: A Guide to Rating Scales. Statistics in Medicine
(Vol. 8). doi:10.1093/aje/155.10.899
Morales, P. (2003). Construccin de escalas de actitudes tipo Likert. Granada: Editorial La
Muralla.
Nunnally, J. C., & Bernstein, I. H. (1994). The theory of measurement error. Psychometric
Theory, 209247.
Pea, D. (2008). Fundamentos de estadstica. Madrid: Alianza Editorial.
Sampieri, R. H., Collado, C. F., Lucio, P. B., & Prez, M. D. L. L. C. (1998). Metodologa de la
investigacin. Mxico D.F.: McGraw-Hill.
- Mster en Psico-Oncologa. 17