Вы находитесь на странице: 1из 19

Al comenzar una sesin de trabajo con el SPSS aparece una ventana de apariencia

similar a una hoja de Excel, que es el Editor de Datos, tal y como se muestra en la
Figura 1 . Esta es la ventana principal del SPSS, pero no la nica.

En la Fig. 1 observamos en el encabezado el ttulo principal del archivo en el cual se


est trabajando, en este caso Sin ttulo, porque se iniciar con la creacin de una base
de datos. En la siguiente lnea se tiene la barra del men con las opciones de archivo,
edicin, ver, datos, transformar, analizar, grficos, utilidades, ventaja, y ayuda (?) .
Luego tenemos la barra de herramientas (ver figura 2), con cada uno de sus conos.

BARRA DE MENU PRINCIPAL


En la Figura 4 se observa la primera opcin del men, Archivo , que incluye:
Nuevo. Crea nuevos ficheros o bases de datos, sintaxis, resultados o de procesos

Abrir. Abre ficheros o bases de datos existentes, sintaxis, resultados, de procesos


u otros);
Abrir base de datos. Nueva consulta, editar consulta o ejecutar consulta

Leer datos de texto. Puede transformar archivos de texto a tablas

Guardar. Guarda el archivo actual

Guardar Como. Guarda el archivo actual con otro nombre y en otro directorio si
as se quiere
Mostrar informacin de datos. Muestra los archivos de datos posibles

Hacer cach de datos. Crea memoria para los datos que se estn introduciendo

Imprimir Imprime la operacin actual.

Presentacin preliminar. Se visualiza en pantalla completa la tarea actual, tal y


como se imprimir
Cambiar servidor. Se tiene la posibilidad de cambiar de servidor al que nos
encontramos conectados.
Detener procesador. Interrumpe el procesamiento y anlisis de datos en el SPSS

Datos usados recientemente Muestra un listado de los datos utilizados ms


recientemente
Archivos usados recientemente Muestra los archivos que se han utilizado
recientemente
Salir Opcin para salir del SPSS.

Luego tenemos la opcin de Edicin (Figura 5), que presenta la siguientes subopciones:

BARRA DE MENU PRINCIPAL: Datos, Transformar y Analizar


La Figura 7 presenta la opcin Datos , que es una de las opciones que mayor uso tienen
cuando se trata de realizar anlisis con el SPSS. Entre las subopciones tenemos las
siguientes: Definir propiedades de variables (etiqueta los valores de las variables y
define otras propiedades despus de explorar datos); Copiar propiedades de datos
(permite copiar sobre el archivo de datos de trabajo, las propiedades de un conjunto de
datos y de las variables seleccionadas); Definir fechas (Definir fechas genera variables
de fecha que se pueden utilizar para establecer la periodicidad de una serie temporal y
para etiquetar los resultados de los anlisis de series temporales); Insertar variable
(permite insertar una variable en el editor); Insertar caso (permite insertar un caso en el
editor); Ir a caso (permite situarse en un caso determinado); Ordenar casos (permite
ordenar casos segn criterios preestablecidos); Transponer (transpone filas por
columnas en el editor de datos); Reestructurar (reestructura los datos de varias variables
columnas- en un nico caso y convertirlos en grupos de casos relacionados filas- y
viceversa); Fundir archivos (permite mezclar archivos por casos o por variables);
Agregar (permite agregar variables a un archivo); Diseo ortogonal (admite disear y
mostrar diseos factoriales ortogonales); Segmentar archivo (admite segmentar archivos
segn ciertos criterios); Seleccionar casos (admite la eleccin de uno o varios casos);
Ponderar casos (permite la ponderacin de casos).

La Figura 8 muestra la opcin Transformar , y contiene las siguientes subopciones:


Calcular (realiza clculos); Semilla de aleatorizacin (fija la semilla para el clculo de
nmeros aleatorios); Contar apariciones (encuentra frecuencias absolutas de valores);
Recodificar (recodifica los valores de una variable); Categorizar variables (convierte
variables cuantitativas a cualitativas); Asignar rangos a casos (crea nuevas variables
que contienen rangos); Recodificacin automtica (convierte los valores numricos y de
cadena en valores enteros consecutivos); Crear serie temporal (crea una variable tipo
serie de tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos creando
nuevas variables); Ejecutar transformaciones pendientes (realizar transformaciones en
espera).

La opcin Analizar en la barra del men bsico contiene las siguientes subopciones
(ver figura 9): Informes, Estadsticos descriptivos, Tablas, Comparar medias, Modelo
lineal general, Modelos mixtos, Correlaciones, Regresin, Loglineal, Reduccin de
datos, Escalas, Pruebas no paramtricas, Series temporales, Supervivencia y Respuestas
mltiples.

Considero sta opcin del men (Analizar) como una de las ms importantes dentro del
SPSS, motivo por el cual se estudiarn cada una de sus subopciones por separado.

La Figura 7 presenta la opcin Datos , que es una de las opciones que mayor uso tienen cuando se trata de
variables (etiqueta los valores de las variables y define otras propiedades despus de explorar datos); Cop
conjunto de datos y de las variables seleccionadas); Definir fechas (Definir fechas genera variables de fec
resultados de los anlisis de series temporales); Insertar variable (permite insertar una variable en el edito
determinado); Ordenar casos (permite ordenar casos segn criterios preestablecidos); Transponer (transpo
columnas- en un nico caso y convertirlos en grupos de casos relacionados filas- y viceversa); Fundir a
archivo); Diseo ortogonal (admite disear y mostrar diseos factoriales ortogonales); Segmentar archivo
varios casos); Ponderar casos (permite la ponderacin de casos).

La Figura 8 muestra la opcin Transformar , y contiene las siguientes subopciones: Calcular (realiza clc
apariciones (encuentra frecuencias absolutas de valores); Recodificar (recodifica los valores de una variab
(crea nuevas variables que contienen rangos); Recodificacin automtica (convierte los valores numricos
tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos creando nuevas variables); Ejecutar

La opcin Analizar en la barra del men bsico contiene las siguientes subopciones (ver figura 9): Inform
Correlaciones, Regresin, Loglineal, Reduccin de datos, Escalas, Pruebas no paramtricas, Series tempo

Comparar medias (Figura 13), que contiene en orden respectivo: Medias (calcula
medias de subgrupo y estadsticos univariados relacionados para variables dependientes
dentro de las categoras de una o ms variables independientes); Prueba T para una
muestra (contrasta si la media de una sola variable difiere de una constante
especificada); Prueba T para muestras independientes (compara las medias de dos
grupos de casos); Prueba T para muestras relacionadas (compara las medias de dos
variables de un solo grupo); ANOVA de un factor (este procedimiento genera un anlisis
de varianza de un factor para una variable dependiente cuantitativa respecto a una nica
variable de factor -variable independiente-).

Creando una base datos


Para irnos familiarizando an ms con nuestro programa SPSS, vamos a proceder a
crear una nueva base de datos. Al cargar o abrir el programa SPSS surge un recuadro
como lo muestra la figura 14(a), entonces, para crear nuestra propia base de datos
damos un clic en la opcin introducir datos y luego clic en aceptar . Lo primero
que debemos notar es que para ingresar valores datos en el SPSS, las filas representan
sujetos o casos , en tanto que las columnas constituyen las caractersticas o atributos de
cada sujeto en una determinada variable. Esto se observa claramente en la figura 14(b).

Figura 14 a.

Figura 14 b.

Ahora, el siguiente paso es ir a la vista de variables para designar nuestra primera


variable de la investigacin. Como ejemplo tomaremos dos variables, la primera el
gnero y la segunda la edad.
La figura 15 presenta dnde nos encontramos situados en este momento. En la figura
15(a) se observa que se ha escrito el nombre de la primera variable gnero, y se darn
cuenta ustedes que al presionar la tecla de enter, aparecen de inmediato valores en las
otras casillas, lo que se ve en la figura 15(b).

Figura 15.

Figura 15 a.

Figura 15 b.

Muy bien, ahora enfoqumonos en cada una de las columnas que aparecen en la Vista
de variables , para analizar cada una de sus propiedades.
Una vez colocado el nombre de la variable , se nos presenta el Tipo de variable que se
trate, especifica los tipos de datos de cada variable. Por defecto se asume que todas las
variables nuevas son numricas. En nuestro caso, dejaremos la variable gnero como de
tipo cadena (alfanumrica), con una anchura de 8 caracteres (figura 16).

Figura 16
Uno de los puntos muy importantes y que debe ponrsele mucho nfasis es la etiqueta ,
ya que as aparecer la variable en nuestras tablas de anlisis. Continuando con el

ejemplo anterior, seguiremos trabajando con el nombre de gnero y as etiquetaremos


la variable. En algunos casos, cuando el nombre sea muy extenso, es recomendable
utilizar abreviaturas que identifiquen cada una de las variables, como por ejemplo:
latino (Latinoamericano), estud (estudiante), cirplast (Cirujano Plstico), etc. La
figura 17 nos muestra como se va transformando hasta ahora nuestra base de datos.

Figura 17
Ahora pasamos a la opcin de Valores , que es donde combinamos nmeros con
palabras, que nos servir para identificar caractersticas o atributos con un simple
nmero y viceversa.
Para comenzar, damos un clic en la casilla en donde aparece hasta el momento
ninguno en valores , como se observa en la figura 18, y aparece el recuadro de
etiquetas de valor.

Figura 18

Cuando tenemos el recuadro, lo que debemos hacer es codificar nombres con nmeros,
asociando de esta forma un nmero para una caracterstica o atributo del sujeto.
Entonces, para nuestro caso de la variable gnero, se designar de la siguiente forma:
Nmero 1 para femenino, y
Nmero 2 para masculino.
Una vez hecho esto, se pulsa en el botn aadir para que agregue las nuevas etiquetas
de valor. La figura 19(a) muestra este proceso.

Figura 19( a)

Figura 19 (b)

Las ltimas opciones son Alineacin y Medida (Figura 20). La alineacin tiene que ver con la forma e
la variable como Nominal (cuando no se tiene ningn orden especificado o el orden no interesa) , Ordinal
autores tambin como de razn, e indican que entre un atributo y otro existe la misma diferencia o dista
nominal, ya que no tiene un ordenamiento especfico.

Figura
Ahora ya hemos completado la codificacin de nuestra variable gnero. Procedemos a realizar lo mismo
servir para nuestro aprendizaje.
Con respecto a la variable edad , tendr un tratamiento un poco diferente, ya que podemos reclasificarla p
Joven, de 20 aos o menos (X 20)

Adulto, mayor de veinte aos y menor de 50 (20 < X < 50).


Persona mayor, de 50 aos o ms (X 50).

Entonces, comenzamos colocando el nombre a nuestra variable, tal cual se muestra en la figura 21

Figura
Ahora ingresaremos el tipo de la variable, que quedar como numrica para la edad (Figura 22).

Figura 22.

Finalizada la operacin de asignar valores a la variable edad , ahora nos concentraremos


en la medida que se le asignar. De momento, las otras columnas quedarn con los
valores por defecto, a saber: perdidos, columnas y alineacin.
Si observan detenidamente la figura 24, notarn (como ya se dijo antes) que existen tres
tipos de medida . En la variable gnero la medida no era muy importante, pero en la
actual variable (edad) si es prioritario el asignarle un tipo de medida que nos ayude en la
tipificacin de la variable. Para este ejemplo, la variable edad tendr una medida de
carcter ordinal.

Como ya tenemos codificadas las variables, ahora procedemos a ingresar los valores de
nuestra nueva base de datos, y para ello simplemente hay que dar clic en la pestaa
vista de datos como se observa en la figura 25, siendo ah en donde ingresaremos los
datos recolectados.
Figura 25

Procedimiento de tablas de contingencia con SPSS

Las tablas de contingencia nos permiten realizar comparaciones de Relacin /


Independencia entre dos o ms variables categricas, ya sean de tipo Nominal u Ordinal.
En este tipo de tablas se definen las categoras de una variable a travs de la frecuencia o
el porcentaje de las categoras de una segunda variable.

Para comprender el concepto nos apoyaremos en los resultados de la encuesta piloto


realizada a 20 personas cuyas preguntas son Gnero del encuestado? y Tiene telfono
celular?. Los resultados de estas preguntas se plasman en las tablas de la figura 26. Si
nos fijamos en los resultados de la tabla del Gnero, notaremos que el 35% de los
encuestados corresponde a los hombres, mientras el 65% restante corresponde a las
mujeres.

As mismo, si nos fijamos en la tabla de tenencia de telfono celular, observaremos que el


40% de los encuestados si tiene, mientras el 60% no tiene. A travs de una tabla de
contingencia podemos obtener la relacin de estas dos preguntas, identificando aspectos
como cuntos hombres tienen telfono celular? o cuantas mujeres no tienen telfono
celular?.

Figura 26

Para generar una tabla de contingencia, es necesario vincular las categoras de una de las
variables en las Filas y las categoras de la segunda variable en las Columnas.
Si introducimos las categoras de la variable Gnero en las Filas y las categoras de la
variable Telfono celular en las Columnas obtendramos la tabla de la figura (27), en donde
la posicin uno (1) representa a los hombres que tienen telfono, la posicin dos (2)
representa a los hombres que No tienen telfono; la posicin tres (3) representa a las
mujeres que tienen telfono y la posicin cuatro (4) a las mujeres que No tienen telfono.

Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los datos y
verificar cuantos de los hombres y mujeres tienen telfono y cuantos no. Los resultados de
este procedimiento son expuestos en la figura siguiente. Adems de las frecuencias de
cada uno de los cruces de categoras, tambin se acostumbra introducir Totales en las filas
y columnas, con el fin de obtener la mayor cantidad de informacin posible de las
variables.

Figura 27

Si nos fijamos en la tabla de la figura 28, notaremos que los dos totales dan como
resultado final, el nmero de encuestados (que para el caso corresponde a 20). La nica
condicin que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en la

tabla de contingencia, es tener una respuesta o valor valido en las dos o ms variables que
compongan la tabla de lo contrario, el caso ser excluido. Por ejemplo, si uno de los
encuestados no responde la pregunta del Gnero, pero si la del Telfono o viceversa, el
caso ser excluido al momento de generar la tabla de contingencia.

Las tablas de contingencia pueden servir a diferentes propsitos como el anlisis


descriptivo, en cuyo caso el objetivo es proporcionar informacin condensada que describa
las categoras de las variables involucradas, sin realizar comparaciones explicitas que
generen conclusiones de una poblacin. A su vez este tipo de tablas tambin pueden ser
empleadas para la generacin de anlisis de Inferencia, en donde se intenta extraer
conclusiones sobre las relaciones de las variables que puedan ser aplicadas a una
poblacin.

Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo
general la prueba de independencia de Chi-cuadrado). Para generar una tabla de
contingencia es necesario tener un archivo de datos abierto en el Editor de datos de
SPSS.

Una vez abierto el archivo, podemos ejecutar el procedimiento, el cual se encuentra en el


men Analizar... Estadsticos descriptivos...Tablas de contingencia [Fig.A]; al hacer clic
sobre el procedimiento aparece el cuadro de dilogo correspondiente [Fig.B]. Este cuadro
de dilogo esta dividido en cuatro secciones (Lista de variables, Casillas de seleccin,
Opciones de resultados y Botones de opcin).

Figuras A y B

En la seccin Casillas de seleccin, encontramos las tres ubicaciones que podemos


emplear para las variables de la tabla (Filas, Columnas o Capas); al ingresar una variable
a la casilla Filas, sus categoras definen cada una de las filas de datos de la tabla; a su vez
al ingresar una variable en la casilla Columnas, sus categoras definen cada una de las
columnas de la tabla.

Si se ingresan mltiples variables a una de las casillas, el programa genera una tabla de
contingencia para cada combinacin de variables de fila y columna. Por ltimo
encontramos la casilla de Capa; al ingresar una variable en esta casilla, el programa
genera una tabla de contingencia para cada una de las categoras de la variable de Capa.

Para comprender mejor la metodologa empleada en las tablas de contingencia y los


elementos que nos facilita el procedimiento, en las siguientes lecciones vamos a generar
una serie de ejemplos, intentando aumentar la complejidad de forma gradual.

Todas las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas
dentro de las opciones del botn Estadstico. Al hacer clic en l aparece el cuadro de
dilogo correspondiente.

Dentro de las diferentes pruebas estadsticas de asociacin que nos ofrece el


procedimiento encontramos el Chi-cuadrado de Pearson, Chi-cuadrado de la razn de
verosimilitud, prueba de asociacin lineal por lineal, prueba exacta de Fisher, Chi-cuadrado
corregido de Yates, r de Pearson, rho de Spearman, coeficiente de contingencia, phi, V de
Cramer, lambdas simtricas y asimtricas, tau de Kruskal y Goodman, coeficiente de
incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c de Kendall, coeficiente eta,
kappa de Cohen, estimacin de riesgo relativo, razn de ventajas, prueba de McNemar,
estadsticos de Cochran y Mantel-Haenszel. La mayora de estas pruebas nos permiten
comprobar si existe alguna relacin entre las variable, generando un nmero para
representar la fuerza de la relacin.

Por el momento slo haremos nfasis en el Chi-cuadrado de Pearson, la cual es la ms


utiliza. Esta prueba nos permite determinar si el comportamiento de las categoras de una
variable presentan diferencias Estadsticamente significativas. Para establecer la diferencia
a travs de SPSS, debemos partir de la teora que no existe relacin entre las variables de
la tabla de contingencia (Hiptesis nula); es decir, debemos asumir que los resultados de
las categoras de una variable no se ven afectados o influenciados por las categoras de la
segunda variable.

El clculo del Chi-cuadrado arroja como resultado un valor numrico denominado alfa (a),
el cual debe ser comparado con el valor terico de 0.05. Cuando el valor calculado es
menor que el 0.05 se rachaza la hiptesis nula, con lo cual podemos concluir que si existe
una relacin entre las variables; por el contrario si el valor calculado es mayor que 0.05 no
se rechaza la hiptesis nula aceptando que no existe ninguna relacin entre las variables.

A manera de ejemplo vamos a generar la prueba de asociacin del Chi-cuadrado para las
variables Gnero y Estado civil; para lograrlo debemos volver al cuadro de dilogo y hacer
clic en el botn Restablecer de manera que se retome la configuracin inicial del
procedimiento. Una vez se habilita el cuadro, ubicamos en el listado la variable Estado civil
y la ingresamos en la casilla Filas; sucesivamente ubicamos la variable Gnero y la
ingresamos en la casilla Columnas. A continuacin seleccionamos el botn Estadsticos y
activamos la opcin Chi-cuadrado, haciendo clic sobre la opcin. Para finalizar hacemos
clic en Continuar y luego en Aceptar con lo que los resultados son creados en el visor
(figura siguiente)

Figura

Como de costumbre el programa genera la tabla del resumen del procesamiento y la tabla
de contingencia, pero adicionalmente genera una tercera tabla denominada Pruebas de
Chi-cuadrado. En ella aparecen los valores del Chi-cuadrado y la razn de verosimilitud los
cuales son calculados con base a la diferencia entre las frecuencias observadas y las
esperadas. De todos los valores que se incluyen en la tabla, slo hay uno que realmente

nos interesa y es el valor correspondiente a la significacin asinttica (Bilateral) de la


prueba Chi-cuadrado de Pearson; este valor es el resultado de la prueba y es el que se
emplea para realizar la comparacin.

De acuerdo al resultado podemos concluir que las variables Estado civil y Gnero si tienen
relacin ya que el valor obtenido es menor que [0.05]. Existen tres factores que pueden
alterar el resultado de las pruebas de asociacin e independencia como lo son el tamao
de la muestra, la fidelidad de los datos y el sesgo muestral; antes de sacar alguna
conclusin es necesario revisar estos factores ya que cualquiera de ellos puede
distorsionar severamente el resultado.

Para concluir con las tablas de contingencia vamos a revisar el ltimo botn de opcin que
podemos encontrar en el cuadro de dilogo, el cual corresponde a Exactas (Este botn
slo est disponible si se ha instalado el mdulo de pruebas exactas). Al seleccionar este
botn, aparece el cuadro de dilogo correspondiente [Fig.]; a travs de sus opciones se
proporcionan dos mtodos adicionales para calcular los niveles de significacin de los
estadsticos disponibles en los procedimientos Tablas de contingencia y Pruebas no
paramtricas. Estos mtodos (el mtodo exacto y el de Monte Carlo), proporcionan el
medio para obtener resultados exactos cuando los datos no cumplen alguno de los
supuestos subyacentes necesarios para obtener resultados fiables.

Figura

Las pruebas exactas permiten obtener un nivel de significacin exacto sin confiar en
supuestos que los datos podran no cumplir. Por ejemplo, los resultados de un examen de
calidad de 20 empaques en una fbrica muestran que los cinco empaques plsticos
superaron la prueba, mientras que los resultados de los empaques de papel son diversos.

Una prueba de Chi-cuadrado de Pearson, que contrasta la hiptesis nula de que los
resultados son independientes del material, produce un nivel de significacin asinttico del
0,07. Este resultado lleva a la conclusin de que los resultados del examen son
independientes del material del empaque.

Sin embargo, dado que los datos incluyen slo 20 casos y las casillas tienen frecuencias
esperadas menores que 5, este resultado no es fidedigno. Al realizar una prueba exacta a
la muestra obtenemos que el Chi-cuadrado de Pearson es de 0,04, lo que conduce a la
conclusin contraria. Segn la significacin exacta, se concluir que los resultados del
examen y el material del empaque estn relacionados. Esto demuestra la importancia de la
obtencin de resultados exactos cuando no se pueden cumplir los supuestos del mtodo
asinttico. La significacin exacta es siempre fiable, independientemente del tamao, la
distribucin, la dispersin o el equilibrio de los datos.

En conclusin, el procedimiento Tablas de contingencia nos permite realizar tablas en las


que se describan las categoras de una variable a travs de las categoras de una segunda
variable. Para efectuar la descripcin se pueden emplear diferentes medidas como el
recuento, el porcentaje de fila, el porcentaje de columna o el porcentaje de tabla.
Adicionalmente este procedimiento nos permite generar grficos de barras con las
variables involucradas en la tabla, as como tambin pruebas estadsticas de
independencia como el Chi-cuadrado de Pearson e incluso generar pruebas estadsticas
de precisin como el mtodo de Monte Carlo o el mtodo Exacto

Вам также может понравиться