Академический Документы
Профессиональный Документы
Культура Документы
similar a una hoja de Excel, que es el Editor de Datos, tal y como se muestra en la
Figura 1 . Esta es la ventana principal del SPSS, pero no la nica.
Guardar Como. Guarda el archivo actual con otro nombre y en otro directorio si
as se quiere
Mostrar informacin de datos. Muestra los archivos de datos posibles
Hacer cach de datos. Crea memoria para los datos que se estn introduciendo
Luego tenemos la opcin de Edicin (Figura 5), que presenta la siguientes subopciones:
La opcin Analizar en la barra del men bsico contiene las siguientes subopciones
(ver figura 9): Informes, Estadsticos descriptivos, Tablas, Comparar medias, Modelo
lineal general, Modelos mixtos, Correlaciones, Regresin, Loglineal, Reduccin de
datos, Escalas, Pruebas no paramtricas, Series temporales, Supervivencia y Respuestas
mltiples.
Considero sta opcin del men (Analizar) como una de las ms importantes dentro del
SPSS, motivo por el cual se estudiarn cada una de sus subopciones por separado.
La Figura 7 presenta la opcin Datos , que es una de las opciones que mayor uso tienen cuando se trata de
variables (etiqueta los valores de las variables y define otras propiedades despus de explorar datos); Cop
conjunto de datos y de las variables seleccionadas); Definir fechas (Definir fechas genera variables de fec
resultados de los anlisis de series temporales); Insertar variable (permite insertar una variable en el edito
determinado); Ordenar casos (permite ordenar casos segn criterios preestablecidos); Transponer (transpo
columnas- en un nico caso y convertirlos en grupos de casos relacionados filas- y viceversa); Fundir a
archivo); Diseo ortogonal (admite disear y mostrar diseos factoriales ortogonales); Segmentar archivo
varios casos); Ponderar casos (permite la ponderacin de casos).
La Figura 8 muestra la opcin Transformar , y contiene las siguientes subopciones: Calcular (realiza clc
apariciones (encuentra frecuencias absolutas de valores); Recodificar (recodifica los valores de una variab
(crea nuevas variables que contienen rangos); Recodificacin automtica (convierte los valores numricos
tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos creando nuevas variables); Ejecutar
La opcin Analizar en la barra del men bsico contiene las siguientes subopciones (ver figura 9): Inform
Correlaciones, Regresin, Loglineal, Reduccin de datos, Escalas, Pruebas no paramtricas, Series tempo
Comparar medias (Figura 13), que contiene en orden respectivo: Medias (calcula
medias de subgrupo y estadsticos univariados relacionados para variables dependientes
dentro de las categoras de una o ms variables independientes); Prueba T para una
muestra (contrasta si la media de una sola variable difiere de una constante
especificada); Prueba T para muestras independientes (compara las medias de dos
grupos de casos); Prueba T para muestras relacionadas (compara las medias de dos
variables de un solo grupo); ANOVA de un factor (este procedimiento genera un anlisis
de varianza de un factor para una variable dependiente cuantitativa respecto a una nica
variable de factor -variable independiente-).
Figura 14 a.
Figura 14 b.
Figura 15.
Figura 15 a.
Figura 15 b.
Muy bien, ahora enfoqumonos en cada una de las columnas que aparecen en la Vista
de variables , para analizar cada una de sus propiedades.
Una vez colocado el nombre de la variable , se nos presenta el Tipo de variable que se
trate, especifica los tipos de datos de cada variable. Por defecto se asume que todas las
variables nuevas son numricas. En nuestro caso, dejaremos la variable gnero como de
tipo cadena (alfanumrica), con una anchura de 8 caracteres (figura 16).
Figura 16
Uno de los puntos muy importantes y que debe ponrsele mucho nfasis es la etiqueta ,
ya que as aparecer la variable en nuestras tablas de anlisis. Continuando con el
Figura 17
Ahora pasamos a la opcin de Valores , que es donde combinamos nmeros con
palabras, que nos servir para identificar caractersticas o atributos con un simple
nmero y viceversa.
Para comenzar, damos un clic en la casilla en donde aparece hasta el momento
ninguno en valores , como se observa en la figura 18, y aparece el recuadro de
etiquetas de valor.
Figura 18
Cuando tenemos el recuadro, lo que debemos hacer es codificar nombres con nmeros,
asociando de esta forma un nmero para una caracterstica o atributo del sujeto.
Entonces, para nuestro caso de la variable gnero, se designar de la siguiente forma:
Nmero 1 para femenino, y
Nmero 2 para masculino.
Una vez hecho esto, se pulsa en el botn aadir para que agregue las nuevas etiquetas
de valor. La figura 19(a) muestra este proceso.
Figura 19( a)
Figura 19 (b)
Las ltimas opciones son Alineacin y Medida (Figura 20). La alineacin tiene que ver con la forma e
la variable como Nominal (cuando no se tiene ningn orden especificado o el orden no interesa) , Ordinal
autores tambin como de razn, e indican que entre un atributo y otro existe la misma diferencia o dista
nominal, ya que no tiene un ordenamiento especfico.
Figura
Ahora ya hemos completado la codificacin de nuestra variable gnero. Procedemos a realizar lo mismo
servir para nuestro aprendizaje.
Con respecto a la variable edad , tendr un tratamiento un poco diferente, ya que podemos reclasificarla p
Joven, de 20 aos o menos (X 20)
Entonces, comenzamos colocando el nombre a nuestra variable, tal cual se muestra en la figura 21
Figura
Ahora ingresaremos el tipo de la variable, que quedar como numrica para la edad (Figura 22).
Figura 22.
Como ya tenemos codificadas las variables, ahora procedemos a ingresar los valores de
nuestra nueva base de datos, y para ello simplemente hay que dar clic en la pestaa
vista de datos como se observa en la figura 25, siendo ah en donde ingresaremos los
datos recolectados.
Figura 25
Figura 26
Para generar una tabla de contingencia, es necesario vincular las categoras de una de las
variables en las Filas y las categoras de la segunda variable en las Columnas.
Si introducimos las categoras de la variable Gnero en las Filas y las categoras de la
variable Telfono celular en las Columnas obtendramos la tabla de la figura (27), en donde
la posicin uno (1) representa a los hombres que tienen telfono, la posicin dos (2)
representa a los hombres que No tienen telfono; la posicin tres (3) representa a las
mujeres que tienen telfono y la posicin cuatro (4) a las mujeres que No tienen telfono.
Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los datos y
verificar cuantos de los hombres y mujeres tienen telfono y cuantos no. Los resultados de
este procedimiento son expuestos en la figura siguiente. Adems de las frecuencias de
cada uno de los cruces de categoras, tambin se acostumbra introducir Totales en las filas
y columnas, con el fin de obtener la mayor cantidad de informacin posible de las
variables.
Figura 27
Si nos fijamos en la tabla de la figura 28, notaremos que los dos totales dan como
resultado final, el nmero de encuestados (que para el caso corresponde a 20). La nica
condicin que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en la
tabla de contingencia, es tener una respuesta o valor valido en las dos o ms variables que
compongan la tabla de lo contrario, el caso ser excluido. Por ejemplo, si uno de los
encuestados no responde la pregunta del Gnero, pero si la del Telfono o viceversa, el
caso ser excluido al momento de generar la tabla de contingencia.
Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo
general la prueba de independencia de Chi-cuadrado). Para generar una tabla de
contingencia es necesario tener un archivo de datos abierto en el Editor de datos de
SPSS.
Figuras A y B
Si se ingresan mltiples variables a una de las casillas, el programa genera una tabla de
contingencia para cada combinacin de variables de fila y columna. Por ltimo
encontramos la casilla de Capa; al ingresar una variable en esta casilla, el programa
genera una tabla de contingencia para cada una de las categoras de la variable de Capa.
Todas las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas
dentro de las opciones del botn Estadstico. Al hacer clic en l aparece el cuadro de
dilogo correspondiente.
El clculo del Chi-cuadrado arroja como resultado un valor numrico denominado alfa (a),
el cual debe ser comparado con el valor terico de 0.05. Cuando el valor calculado es
menor que el 0.05 se rachaza la hiptesis nula, con lo cual podemos concluir que si existe
una relacin entre las variables; por el contrario si el valor calculado es mayor que 0.05 no
se rechaza la hiptesis nula aceptando que no existe ninguna relacin entre las variables.
A manera de ejemplo vamos a generar la prueba de asociacin del Chi-cuadrado para las
variables Gnero y Estado civil; para lograrlo debemos volver al cuadro de dilogo y hacer
clic en el botn Restablecer de manera que se retome la configuracin inicial del
procedimiento. Una vez se habilita el cuadro, ubicamos en el listado la variable Estado civil
y la ingresamos en la casilla Filas; sucesivamente ubicamos la variable Gnero y la
ingresamos en la casilla Columnas. A continuacin seleccionamos el botn Estadsticos y
activamos la opcin Chi-cuadrado, haciendo clic sobre la opcin. Para finalizar hacemos
clic en Continuar y luego en Aceptar con lo que los resultados son creados en el visor
(figura siguiente)
Figura
Como de costumbre el programa genera la tabla del resumen del procesamiento y la tabla
de contingencia, pero adicionalmente genera una tercera tabla denominada Pruebas de
Chi-cuadrado. En ella aparecen los valores del Chi-cuadrado y la razn de verosimilitud los
cuales son calculados con base a la diferencia entre las frecuencias observadas y las
esperadas. De todos los valores que se incluyen en la tabla, slo hay uno que realmente
De acuerdo al resultado podemos concluir que las variables Estado civil y Gnero si tienen
relacin ya que el valor obtenido es menor que [0.05]. Existen tres factores que pueden
alterar el resultado de las pruebas de asociacin e independencia como lo son el tamao
de la muestra, la fidelidad de los datos y el sesgo muestral; antes de sacar alguna
conclusin es necesario revisar estos factores ya que cualquiera de ellos puede
distorsionar severamente el resultado.
Para concluir con las tablas de contingencia vamos a revisar el ltimo botn de opcin que
podemos encontrar en el cuadro de dilogo, el cual corresponde a Exactas (Este botn
slo est disponible si se ha instalado el mdulo de pruebas exactas). Al seleccionar este
botn, aparece el cuadro de dilogo correspondiente [Fig.]; a travs de sus opciones se
proporcionan dos mtodos adicionales para calcular los niveles de significacin de los
estadsticos disponibles en los procedimientos Tablas de contingencia y Pruebas no
paramtricas. Estos mtodos (el mtodo exacto y el de Monte Carlo), proporcionan el
medio para obtener resultados exactos cuando los datos no cumplen alguno de los
supuestos subyacentes necesarios para obtener resultados fiables.
Figura
Las pruebas exactas permiten obtener un nivel de significacin exacto sin confiar en
supuestos que los datos podran no cumplir. Por ejemplo, los resultados de un examen de
calidad de 20 empaques en una fbrica muestran que los cinco empaques plsticos
superaron la prueba, mientras que los resultados de los empaques de papel son diversos.
Una prueba de Chi-cuadrado de Pearson, que contrasta la hiptesis nula de que los
resultados son independientes del material, produce un nivel de significacin asinttico del
0,07. Este resultado lleva a la conclusin de que los resultados del examen son
independientes del material del empaque.
Sin embargo, dado que los datos incluyen slo 20 casos y las casillas tienen frecuencias
esperadas menores que 5, este resultado no es fidedigno. Al realizar una prueba exacta a
la muestra obtenemos que el Chi-cuadrado de Pearson es de 0,04, lo que conduce a la
conclusin contraria. Segn la significacin exacta, se concluir que los resultados del
examen y el material del empaque estn relacionados. Esto demuestra la importancia de la
obtencin de resultados exactos cuando no se pueden cumplir los supuestos del mtodo
asinttico. La significacin exacta es siempre fiable, independientemente del tamao, la
distribucin, la dispersin o el equilibrio de los datos.