Академический Документы
Профессиональный Документы
Культура Документы
Si desea obtener ms informacin sobre los productos de software de SPSS, visite nuestra pgina Web en http://www.spss.com o pngase en contacto con SPSS Inc. 233 South Wacker Drive, 11th Floor Chicago, IL 60606-6412 EE.UU. Tel: (312) 651-3000 Fax: (312) 651-3668 SPSS es una marca registrada; los dems nombres de productos son marcas comerciales de SPSS Inc. para los programas de software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la autorizacin expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el software y en los copyrights de los materiales publicados. El SOFTWARE y la documentacin se proporcionan con DERECHOS LIMITADOS. Su uso, duplicacin o revelacin por parte del Gobierno estn sujetos a las restricciones establecidas en la subdivisin (c) (1) (ii) de la clusula Rights in Technical Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU. Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan slo con fines identificativos y pueden ser marcas comerciales de sus respectivas empresas. TableLook es una marca comercial de SPSS Inc. Windows es una marca comercial registrada de Microsoft Corporation. DataDirect, DataDirect Connect, INTERSOLV y SequeLink son marcas comerciales registradas de DataDirect Technologies. Algunas partes de este producto se han creado utilizando LEADTOOLS 19912000, LEAD Technologies, Inc. TODOS LOS DERECHOS RESERVADOS. LEAD, LEADTOOLS y LEADVIEW son marcas comerciales registradas de LEAD Technologies, Inc. Sax Basic es una marca comercial de Sax Software Corporation. Copyright 19932004 de Polar Engineering and Consulting. Todos los derechos reservados. Algunas partes de este producto estn basadas en el trabajo de FreeType Team (http://www.freetype.org). Una parte del software de SPSS contiene tecnologa zlib. Copyright 19952002 de Jean-loup Gailly y Mark Adler. El software zlib se proporciona tal cual, sin ningn tipo de garanta implcita o explcita. Una parte del software de SPSS contiene bibliotecas de Sun Java Runtime. Copyright 2003 de Sun Microsystems, Inc. Reservados todos los derechos. Las bibliotecas de Sun Java Runtime incluyen cdigo con licencia de RSA Security, Inc. Algunas partes de las bibliotecas tienen licencia de IBM y estn disponibles en http://oss.software.ibm.com/icu4j/. Manual del usuario de SPSS Base 14.0 Copyright 2005 de SPSS Inc. Reservados todos los derechos. Impreso en Estados Unidos de Amrica. Queda prohibida la reproduccin, el almacenamiento en sistemas de recuperacin o la transmisin de cualquier parte de esta publicacin en cualquier forma y por cualquier medio (electrnico o mecnico, fotocopia, grabacin o cualquier otro) sin previa autorizacin expresa y por escrito de parte del editor. 1 2 3 4 5 6 7 8 9 0 08 07 06 05 ISBN 1-56827-683-4
Prefacio
SPSS 14.0
SPSS 14.0 es un sistema global para el anlisis de datos. SPSS puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para generar informes tabulares, grficos y diagramas de distribuciones y tendencias, estadsticos descriptivos y anlisis estadsticos complejos. Este manual, Manual del usuario de SPSS Base 14.0, proporciona la documentacin sobre la interfaz grfica de usuario de SPSS para Windows. Los ejemplos que utilizan procedimientos estadsticos que se encuentran en SPSS Base 14.0 se suministran en el sistema de ayuda que se instala con el software. Los algoritmos utilizados en los procedimientos estadsticos se proporcionan en formato PDF y estn disponibles en el men Ayuda. Asimismo, adems de los mens y los cuadros de dilogos, SPSS utiliza un lenguaje de comandos. Algunas de las funciones avanzadas del sistema slo son accesibles a travs de la sintaxis de comandos. (Dichas funciones no estn disponibles en la versin para estudiantes.) La informacin de referencia detallada sobre la sintaxis de comandos est disponible en dos formatos: integrada en el sistema de ayuda global y como un documento independientes en formato PDF en SPSS 14.0 Command Syntax Reference, tambin disponible desde el men Ayuda.
SPSS Opciones
Las siguientes opciones estn disponibles como mejoras adicionales de la versin completa (no la versin para estudiantes) SPSS Base del sistema:
SPSS Modelos de regresin proporciona tcnicas para analizar los datos que no
se ajusten a los tradicionales modelos estadsticos. Incluye procedimientos para el anlisis probit, la regresin logstica, la estimacin ponderada, la regresin de mnimos cuadrados en dos fases y la regresin no lineal general.
iii
la investigacin experimental y biomdica sofisticada. Incluye procedimientos para los modelos lineales generales (MLG), los modelos lineales mixtos, el anlisis de componentes de la varianza, el anlisis loglineal, la regresin ordinal, las tablas de mortalidad actuariales, el anlisis de supervivencia de Kaplan-Meier y las regresiones de Cox bsica y extendida.
SPSS Tablas crea distintos informes tabulares de gran calidad, como por ejemplo
completos, con diversos modelos de ajuste de curvas, modelos de suavizado y mtodos para la estimacin de funciones autorregresivas.
SPSS Categoras ejecuta procedimientos de escalamiento ptimo, incluidos los anlisis de correspondencias. SPSS Anlisis conjunto ofrece una manera realista de medir el modo en que los
diferentes atributos del producto afectan a las preferencias de los consumidores y los ciudadanos. Con SPSS Anlisis conjunto se puede medir con facilidad el efecto sobre el equilibrio de cada uno de los atributos de un producto dentro del contexto del conjunto de atributos del producto, tal como hacen los consumidores cuando deciden lo que van a comprar.
SPSS Pruebas exactas calcula los valores p exactos (valores de significacin) para
las pruebas estadsticas en aquellos casos en los que las muestras son pequeas o se distribuyen de forma poco uniforme y puedan hacer que las pruebas habituales resulten poco precisas.
SPSS Anlisis de valores perdidos describe los patrones de los datos perdidos, realiza una estimacin de las medias y otros estadsticos y permite imputar los valores a las observaciones perdidas. SPSS Mapas transforma los datos distribuidos geogrficamente en mapas de alta calidad, con smbolos, colores, grficos de barras, grficos de sectores y combinaciones de temas, para representar no slo lo que est ocurriendo sino tambin dnde tiene lugar. SPSS Muestras complejas permite a los analistas de encuestas, mercado, salud y
opinin pblica, as como a los socilogos que utilizan una metodologa de encuesta de ejemplo, incorporar los diseos de muestras complejas al anlisis de datos.
iv
clasifica casos en grupos o pronostica valores de una variable (criterio) dependiente basada en valores de variables independientes (predictores). El procedimiento proporciona herramientas de validacin para anlisis de clasificacin exploratorios y confirmatorios.
SPSS Data Validation ofrece una rpida instantnea visual de los datos. Ofrece la posibilidad de aplicar reglas de validacin que identifiquen valores de los datos no vlidos. Puede crear reglas que marquen los valores fuera de rango, valores perdidos o valores en blanco. Tambin puede guardar variables que registren cada una de las violaciones de las reglas y el nmero total de violaciones de reglas por cada caso. Tambin se incluye un conjunto limitado de reglas predefinidas que puede copiar o modificar. Amos (del ingls analysis of moment structures, anlisis de estructuras de momento)
utiliza el modelado de ecuaciones estructurales para confirmar y explicar los modelos conceptuales que tratan las actitudes, percepciones y otros factores que determinan el comportamiento. La familia de productos de SPSS tambin incluye aplicaciones para la entrada de datos, anlisis de textos, clasificacin, redes neuronales y servicios predictivos para empresas.
Instalacin
Para instalar el sistema SPSS Base, ejecute el Asistente para autorizacin de licencia utilizando el cdigo de autorizacin que le envi SPSS Inc. Para obtener ms informacin, consulte las instrucciones de instalacin proporcionadas con el sistema SPSS Base.
Compatibilidad
SPSS est diseado para ejecutarse en gran cantidad de sistemas de ordenadores. Consulte las instrucciones de instalacin entregadas con su sistema para obtener informacin especfica acerca de los requisitos mnimos y los recomendados.
Nmeros de serie
El nmero de serie es su nmero de identificacin con SPSS Inc. Necesitar este nmero cuando se ponga en contacto con SPSS Inc. para recibir informacin sobre asistencia, formas de pago o actualizacin del sistema. El nmero de serie se incluye en el sistema Base de SPSS.
Servicio al cliente
Si tiene cualquier duda referente a la forma de envo o pago, pngase en contacto con su oficina local, que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Tenga preparado su nmero de serie para identificarse.
Cursos de preparacin
SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. En todos los cursos habr talleres prcticos. Estos cursos tendrn lugar peridicamente en las principales capitales. Si desea obtener ms informacin sobre estos cursos, pngase en contacto con su oficina local que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide.
Asistencia tcnica
El servicio de asistencia tcnica de SPSS est a disposicin de todos los clientes registrados. Los clientes podrn ponerse en contacto con este servicio de asistencia tcnica si desean recibir ayuda sobre la utilizacin de SPSS o sobre la instalacin en alguno de los entornos de hardware admitidos. Para ponerse en contacto con el servicio de asistencia tcnica, consulte la pgina Web de SPSS en http://www.spss.com, o pngase en contacto con la oficina ms cercana, que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Tenga preparada la informacin necesaria para identificarse personalmente, a su organizacin y el nmero de serie de su sistema.
Publicaciones adicionales
Puede adquirir copias adicionales de los manuales de los productos de SPSS directamente de SPSS Inc. Visite la seccin Store de la pgina Web de SPSS en http://www.spss.com/estore o pngase en contacto con su oficina de SPSS local que
vi
encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Para pedidos telefnicos en Estados Unidos y Canad, llame a SPSS Inc. al 800-543-2185. Para pedidos telefnicos desde otros pases, pngase en contacto con la oficina ms cercana que encontrar en la pgina Web de SPSS. SPSS Statistical Procedures Companion, por Marija Noruis, ha sido publicado por Prentice Hall. Se prev una nueva versin de este libro, actualizado para SPSS 14.0. El libro SPSS Advanced Statistical Procedures Companion, que tambin se basa en SPSS 14.0, se publicar muy pronto. El libro SPSS 13.0 Guide to Data Analysis para SPSS 14.0 tambin se est elaborando. Las publicaciones anunciadas de forma exclusiva por Prentice Hall estarn disponibles en la pgina Web de SPSS en http://www.spss.com/estore (seleccione su pas de origen y pulse en Books).
Dganos su opinin
Sus comentarios son importantes. Hganos saber su experiencia con los productos SPSS. Nos interesa especialmente recibir noticias sobre aplicaciones nuevas e interesantes para el sistema SPSS Base. Envenos un correo electrnico a suggest@spss.com o escriba a SPSS Inc., Attn.: Director of Product Planning, 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU.
Acerca de este manual
Este manual es la documentacin de la interfaz grfica del usuario para los procedimientos incluidos en el sistema SPSS Base. Las ilustraciones de los cuadros de dilogo estn tomadas de SPSS para Windows. Los cuadros de dilogo de los dems sistemas operativos son similares. La informacin detallada sobre la sintaxis de comandos para las caractersticas del sistema SPSS Base se encuentra integrada en el sistema de ayuda global y como un documento independiente en formato PDF en SPSS 14.0 Command Syntax Reference, disponible desde el men Ayuda.
Cmo ponerse en contacto con SPSS
Si desea pertenecer a nuestra lista de correo, pngase en contacto con nuestras oficinas que encontrar en la pgina Web en http://www.spss.com/worldwide.
vii
Contenido
1 Resumen 1
Cules son las novedades de SPSS 14.0? . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Ventanas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Mens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Barra de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Cuadros de dilogo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Nombres y etiquetas de variable en las listas de los cuadros de dilogo . . . 11 Controles del cuadro de dilogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Subcuadros de dilogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Seleccin de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Iconos de la lista Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Informacin sobre las variables en un cuadro de dilogo . . . . . . . . . . . . . . 13 Pasos bsicos en el anlisis de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Asesor estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Informacin adicional sobre SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Obtencin de ayuda
17
Uso de la tabla de contenido de la Ayuda . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Uso del ndice de la ayuda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Uso de la pestaa Bsqueda de la Ayuda . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Obtencin de ayuda en los controles de un cuadro de dilogo . . . . . . . . . . 22 Obtencin de ayuda sobre los trminos de los resultados . . . . . . . . . . . . . . 23 Uso de los estudios de casos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Copia del texto de ayuda de una ventana emergente . . . . . . . . . . . . . . . . . 24
ix
Archivos de datos
25
Apertura de un archivo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Para abrir archivos de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Tipos de archivos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Opciones de apertura de archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Lectura de archivos de Excel 5 o versiones posteriores . . . . . . . . . . . . . . . 27 Lectura de archivos de versiones anteriores y otros archivos Hojas de clculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Lectura de archivos de dBASE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Lectura de archivos de Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Lectura de archivos de bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Asistente para la importacin de texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Lectura de datos de Dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Informacin sobre el archivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 Almacenamiento de archivos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Almacenamiento de archivos de datos modificados . . . . . . . . . . . . . . . . . . 68 Almacenamiento de archivos de datos en formato de Excel . . . . . . . . . . . . 68 Almacenamiento de archivos de datos en formato de SAS . . . . . . . . . . . . . 69 Almacenamiento de archivos de datos en formato de Stata . . . . . . . . . . . . 71 Para guardar un archivo de datos nuevo o guardar los datos con un formato distinto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Almacenamiento de datos: Tipos de archivos de datos . . . . . . . . . . . . . . . . 73 Almacenamiento de subconjuntos de variables . . . . . . . . . . . . . . . . . . . . . 76 Almacenamiento de archivos: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Proteccin de datos originales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Archivo activo virtual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
83
Editor de datos
95
Vista de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Vista de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Introduccin de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Edicin de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Ir a caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Estado de seleccin de casos en el Editor de datos . . . . . . . . . . . . . . . . . 116 Editor de datos: Opciones de presentacin . . . . . . . . . . . . . . . . . . . . . . . . 116 Impresin en el Editor de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
119
Tratamiento bsico de varias fuentes de datos . . . . . . . . . . . . . . . . . . . . . 120 Copia y pegado de informacin entre conjuntos de datos . . . . . . . . . . . . . 122 Cambio del nombre de los conjuntos de datos . . . . . . . . . . . . . . . . . . . . . 122
Preparacin de datos
123
Propiedades de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Definicin de propiedades de variables . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Conjuntos de respuestas mltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Copia de propiedades de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
xi
161
Clculo de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 Valores perdidos en funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Generadores de nmeros aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Contar apariciones de valores dentro de los casos . . . . . . . . . . . . . . . . . . 167 Recodificacin de valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Recodificar en las mismas variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Recodificar en distintas variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Asignar rangos a los casos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 Recodificacin automtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 Asistente para fecha y hora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Transformaciones de los datos de serie temporal . . . . . . . . . . . . . . . . . . . 200 Puntuacin de datos con modelos predictivos . . . . . . . . . . . . . . . . . . . . . 208
215
Ordenar casos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Transponer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Fusin de archivos de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Aadir casos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Aadir variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 Agregar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Segmentar archivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
xii
Seleccionar casos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Ponderar casos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Reestructuracin de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
263
Visor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 Uso de los resultados en otras aplicaciones . . . . . . . . . . . . . . . . . . . . . . . 272 Pegado de objetos en el Visor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 Pegado especial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 Para pegar un objeto de otra aplicacin en el Visor . . . . . . . . . . . . . . . . . 276 Exportar resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 Impresin de documentos del Visor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 Almacenamiento de resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
11 Visor de borrador
299
Para crear resultados de borrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 Control del formato de los resultados de borrador. . . . . . . . . . . . . . . . . . . 301 Atributos de fuente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 Para imprimir resultados de borrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 Almacenamiento de los resultados del Visor de borrador . . . . . . . . . . . . . 308
12 Tablas pivote
309
xiii
Sealizadores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 Presentacin y ocultacin de casillas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 Edicin de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 Cambio del aspecto de las tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 Propiedades de tabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 Para modificar las propiedades de las tablas pivote . . . . . . . . . . . . . . . . . 323 Propiedades de tabla: General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 Propiedades de tabla: Notas al pie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 Propiedades de tabla: Formatos de casilla . . . . . . . . . . . . . . . . . . . . . . . . 326 Propiedades de tabla: Bordes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328 Propiedades de tabla: Imprimiendo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 Fuente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Anchos de casillas de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Propiedades de casilla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Propiedades de casilla: Valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334 Propiedades de casilla: Alineacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 Propiedades de casilla: Mrgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336 Propiedades de casilla: Sombreado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 Marcador de nota al pie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337 Seleccin de filas y columnas en las tablas pivote . . . . . . . . . . . . . . . . . . 338 Para seleccionar una fila o una columna de una tabla pivote . . . . . . . . . . 338 Modificacin de los resultados de las tablas pivote . . . . . . . . . . . . . . . . . 339 Impresin de tablas pivote . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 Para imprimir las capas ocultas de una tabla pivote . . . . . . . . . . . . . . . . . 340 Control de las rupturas de tabla para tablas anchas y largas. . . . . . . . . . . 341
343
xiv
Pegar sintaxis desde cuadros de dilogo . . . . . . . . . . . . . . . . . . . . . . . . . 346 Copia de la sintaxis desde las anotaciones de los resultados . . . . . . . . . . 347 Edicin de la sintaxis en un archivo diario. . . . . . . . . . . . . . . . . . . . . . . . . 349 Para ejecutar la sintaxis de comandos . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 Varios comandos Ejecutar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351
14 Frecuencias
353
15 Descriptivos
361
16 Explorar
367
Explorar: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 Explorar: Grficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 Explorar: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 Funciones adicionales del comando EXAMINE . . . . . . . . . . . . . . . . . . . . . 374
xv
17 Tablas de contingencia
377
Capas de las tablas de contingencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380 Grficos de barras agrupadas de las tablas de contingencia . . . . . . . . . . 380 Tablas de contingencia: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380 Tablas de contingencia: Mostrar en las casillas . . . . . . . . . . . . . . . . . . . . 384 Tablas de contingencia: Formato de tabla . . . . . . . . . . . . . . . . . . . . . . . . . 386
18 Resmenes de casos
387
19 Medias
393
20 Cubos OLAP
399
Cubos OLAP: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 Cubos OLAP: Diferencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405 Cubos OLAP: Ttulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
21 Pruebas T
407
xvi
Prueba T para muestras relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 Prueba T para una muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414 Funciones adicionales del comando T-TEST . . . . . . . . . . . . . . . . . . . . . . . 417
22 ANOVA de un factor
419
ANOVA de un factor: Contrastes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 ANOVA de un factor: Contrastes post hoc. . . . . . . . . . . . . . . . . . . . . . . . . 423 ANOVA de un factor: Opciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426 Funciones adicionales del comando ONEWAY . . . . . . . . . . . . . . . . . . . . . 427
429
MLG: Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 MLG: Contrastes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 MLG: Grficos de perfil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437 MLG: Comparaciones post hoc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439 MLG: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442 Opciones MLG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 444 Funciones adicionales de los comandos UNIANOVA. . . . . . . . . . . . . . . . . 445
24 Correlaciones bivariadas
447
Correlaciones bivariadas: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 Funciones adicionales de los comandos CORRELATIONS y NONPAR CORR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
xvii
25 Correlaciones parciales
451
Correlaciones parciales: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454 Funciones adicionales del comando PARTIAL CORR . . . . . . . . . . . . . . . . . 454
26 Distancias
457
Distancias: Medidas de disimilaridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459 Distancias: Medidas de similaridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 Funciones adicionales del comando PROXIMITIES . . . . . . . . . . . . . . . . . . 461
27 Regresin lineal
463
Mtodos de seleccin de variables en el anlisis de regresin lineal . . . . 467 Regresin lineal: Establecer regla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 Regresin lineal: Grficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 Regresin lineal: Para guardar variables nuevas . . . . . . . . . . . . . . . . . . . 471 Regresin lineal: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 Regresin lineal: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 Funciones adicionales del comando REGRESSION . . . . . . . . . . . . . . . . . . 477
28 Estimacin curvilnea
479
Modelos del procedimiento Estimacin curvilnea . . . . . . . . . . . . . . . . . . 483 Estimacin curvilnea: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
xviii
29 Anlisis discriminante
487
Anlisis discriminante: Definir rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490 Anlisis discriminante: Seleccionar casos . . . . . . . . . . . . . . . . . . . . . . . . 490 Anlisis discriminante: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491 Anlisis discriminante: Mtodo de inclusin por pasos . . . . . . . . . . . . . . . 493 Anlisis discriminante: Clasificar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 Anlisis discriminante: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 496 Funciones adicionales del comando DISCRIMINANT . . . . . . . . . . . . . . . . 496
30 Anlisis factorial
499
Seleccin de casos en el anlisis factorial . . . . . . . . . . . . . . . . . . . . . . . . 505 Anlisis factorial: Descriptivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 506 Anlisis factorial: Extraccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507 Anlisis factorial: Rotacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509 Anlisis factorial: Puntuaciones factoriales . . . . . . . . . . . . . . . . . . . . . . . 510 Anlisis factorial: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511 Funciones adicionales del comando FACTOR . . . . . . . . . . . . . . . . . . . . . . 512
513 515
xix
Grficos de anlisis de conglomerados en dos fases . . . . . . . . . . . . . . . . 522 Resultados de anlisis de conglomerados en dos fases . . . . . . . . . . . . . . 523
525
Anlisis de conglomerados jerrquico: Mtodo . . . . . . . . . . . . . . . . . . . . 529 Anlisis de conglomerados jerrquico: Estadsticos . . . . . . . . . . . . . . . . . 530 Anlisis de conglomerados jerrquico: Grficos . . . . . . . . . . . . . . . . . . . . 531 Anlisis de conglomerados jerrquico: Guardar variables nuevas . . . . . . 531 Funciones adicionales de la sintaxis de comandos CLUSTER . . . . . . . . . . 532
533
Eficacia del anlisis de conglomerados de K-medias . . . . . . . . . . . . . . . . 538 Anlisis de conglomerados de K-medias: Iterar . . . . . . . . . . . . . . . . . . . . 539 Anlisis de conglomerados de K-medias: Guardar . . . . . . . . . . . . . . . . . . 540 Anlisis de conglomerados de K-medias: Opciones . . . . . . . . . . . . . . . . . 540 Funciones adicionales del comando QUICK CLUSTER . . . . . . . . . . . . . . . . 541
35 Pruebas no paramtricas
543
Prueba de chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544 Prueba binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 548 Prueba de rachas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551 Prueba de Kolmogorov-Smirnov para una muestra . . . . . . . . . . . . . . . . . . 554 Pruebas para dos muestras independientes . . . . . . . . . . . . . . . . . . . . . . . 557 Pruebas para dos muestras relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . 561
xx
Pruebas para varias muestras independientes . . . . . . . . . . . . . . . . . . . . . 565 Pruebas para varias muestras relacionadas . . . . . . . . . . . . . . . . . . . . . . . 569
573
Definir conjuntos de respuestas mltiples. . . . . . . . . . . . . . . . . . . . . . . . . 574 Frecuencias de respuestas mltiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 576 Tablas de contingencia de respuestas mltiples . . . . . . . . . . . . . . . . . . . . 578 Tablas de respuestas mltiples: Definir rangos de las variables . . . . . . . . 580 Tablas de contingencia de respuestas mltiples: Opciones. . . . . . . . . . . . 581 Funciones adicionales del comando MULT RESPONSE . . . . . . . . . . . . . . . 582
583
Informe de estadsticos en filas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583 Informe de estadsticos en columnas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592 Funciones adicionales del comando REPORT . . . . . . . . . . . . . . . . . . . . . . 598
38 Anlisis de fiabilidad
599
Anlisis de fiabilidad: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601 Funciones adicionales del comando RELIABILITY . . . . . . . . . . . . . . . . . . . 603
39 Escalamiento multidimensional
605
xxi
Escalamiento multidimensional: Crear la medida a partir de los datos. . . . 608 Escalamiento multidimensional: Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 609 Escalamiento multidimensional: Opciones . . . . . . . . . . . . . . . . . . . . . . . . 610 Funciones adicionales del comando de ALSCAL . . . . . . . . . . . . . . . . . . . . 611
40 Estadsticos de la razn
613
42 Curvas COR
631
43 Utilidades
635
Informacin sobre la variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 635 Comentarios del archivo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 636 Conjuntos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637 Definir conjuntos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637 Usar conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 638 Reordenacin de listas de variables de destino. . . . . . . . . . . . . . . . . . . . . 639
xxii
44 Opciones
641
General: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642 Opciones del Visor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 Opciones del Visor de borrador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645 Etiqueta de los resultados: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 Opciones de grfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 649 Opciones de grficos interactivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654 Tabla pivote: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655 Datos: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 658 Moneda: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 659 Procesos: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661
663
Editor de mens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663 Personalizacin de las barras de herramientas. . . . . . . . . . . . . . . . . . . . . 664 Mostrar barras de herramientas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664 Para personalizar las barras de herramientas . . . . . . . . . . . . . . . . . . . . . . 665
46 Unidad de produccin
671
Uso de la Unidad de produccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 Opciones de exportacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674 Entradas del usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676 Solicitud de entrada del usuario en los trabajos de produccin con macros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678
xxiii
Opciones de produccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679 Control del formato en los trabajos de produccin . . . . . . . . . . . . . . . . . . 680 Ejecucin de trabajos de produccin desde una lnea de comandos . . . . . 683 Publicar en Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685 Inicio de sesin del servidor Web de SmartViewer . . . . . . . . . . . . . . . . . . 686
687
Para ejecutar un proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687 Procesos incluidos en SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 688 Autoprocesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 689 Creacin y edicin de procesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691 Para editar un proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691 Ventana de proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 692 Procesos de iniciacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694 Creacin de autoprocesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 696 Funcionamiento de los procesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 700 Clases de objetos de SPSS y convenciones de denominacin de variables 702 Procedimiento nuevo (Proceso) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 707 Adicin de una descripcin a un proceso . . . . . . . . . . . . . . . . . . . . . . . . . 710 Procesamiento de cuadros de dilogo personalizados . . . . . . . . . . . . . . . 710 Depuracin de procesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715 Archivos de procesos y archivos de sintaxis. . . . . . . . . . . . . . . . . . . . . . . 718
721
xxiv
Etiquetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729 Opciones de SGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 731 Registro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736 Exclusin de presentacin de resultados del Visor . . . . . . . . . . . . . . . . . . 737 Envo de resultados a archivos de datos de SPSS . . . . . . . . . . . . . . . . . . . 737 Estructura de tablas OXML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747 Identificadores SGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 751
Apndices A Administrador de acceso a bases de datos B Personalizacin de documentos HTML 755 757
Para aadir cdigo HTML personalizado a los documentos de resultados exportados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 757 Contenido y formato del archivo de texto para HTML personalizado . . . . . 758 Para utilizar otro archivo o ubicacin para el cdigo HTML personalizado . 758
ndice
761
xxv
Captulo
Resumen
SPSS para Windows proporciona un poderoso sistema de anlisis estadstico y de gestin de datos en un entorno grfico, utilizando mens descriptivos y cuadros de dilogo sencillos que realizan la mayor parte del trabajo. La mayora de las tareas se pueden llevar a cabo simplemente situando el puntero del ratn en el lugar deseado y pulsando en el botn. Adems de la simple interfaz de los anlisis estadsticos consistente en situar el puntero y pulsar, SPSS para Windows proporciona:
Editor de datos. El Editor de datos es un sistema verstil, similar a una hoja de clculo,
selectiva, modificar el orden de presentacin en la pantalla y desplazar tablas y grficos de gran calidad entre SPSS y otras aplicaciones.
Tablas de pivote multidimensionales. Sus resultados cobrarn vida en las tablas pivote
multidimensionales. Explore las tablas reorganizando las filas, las columnas y las capas. Haga importantes descubrimientos que suelen quedar velados en los informes convencionales. Compare fcilmente los grupos dividiendo la tabla de manera que aparezca solamente un grupo cada vez.
Grficos de alta resolucin. Como funciones bsicas de SPSS se incluyen grficos de
sectores, grficos de barras, histogramas, diagramas de dispersin y grficos 3-D de alta resolucin y a todo color, entre muchos otros.
Acceso a bases de datos. Obtenga informacin de bases de datos mediante el Asistente
sus datos para el anlisis. Puede crear fcilmente subconjuntos de datos, combinar categoras, aadir, agregar, fusionar, segmentar y transponer archivos, entre muchas otras posibilidades.
1
2 Captulo 1
un botn o exportar tablas y grficos en formato HTML para distribuirlos por Internet o dentro de una Intranet.
Ayuda en pantalla. Los tutoriales le ofrecern una introduccin global ampliamente detallada; los temas de la Ayuda sensible al contexto de los cuadros de dilogo le guiarn a travs de la ejecucin de tareas especficas; las definiciones de las ventanas emergentes para los resultados de las tablas pivote le explicarn los trminos estadsticos y Estudios de casos le proporcionar ejemplos prcticos sobre cmo utilizar los procedimientos estadsticos y cmo interpretar los resultados. Lenguaje de comandos. Aunque la mayora de las tareas se pueden llevar a cabo
simplemente situando el puntero del ratn en el lugar deseado y pulsando en el botn, SPSS proporciona adems un potente lenguaje de comandos que permite guardar y automatizar muchas tareas comunes. El lenguaje de comandos tambin proporciona algunas funcionalidades no incluidas en los mens y cuadros de dilogo. La documentacin completa sobre la sintaxis de comandos est integrada en el sistema de ayuda global y est disponible como un documento en formato PDF independiente, referencia de sintaxis de comandos de SPSS SPSS Command Syntax Reference, que tambin est disponible en el men Ayuda.
Disponibilidad de varios orgenes de datos abiertos al mismo tiempo, lo que facilita tareas como comparar los archivos de datos, copiar datos y atributos de un archivo a otro y fusionar varios orgenes de datos sin guardar primero cada origen de datos como un archivo de datos de SPSS ordenado. Lectura y escritura de archivos de datos con formato Stata. Podr leer los archivos de datos de la versin Stata 48 y escribir archivos de datos de la versin Stata 58. Si desea obtener ms informacin, escriba Stata en la pestaa ndice del sistema de ayuda. Lectura de datos de orgenes de datos de SPSS Dimensions, incluyendo Quanvert, Quancept y mrInterview. Si desea obtener ms informacin, consulte Lectura de datos de Dimensions en Captulo 3 en p. 62. Lectura de datos de orgenes de datos de OLE DB. Si desea obtener ms informacin, consulte Seleccin de una fuente de datos en Captulo 3 en p. 31.
3 Resumen
Definicin de etiquetas de valor descriptivas de hasta 120 bytes (el lmite anterior era de 60 bytes). Creacin de valores de datos de etiquetas de valor o utilizarlos en la lgica de transformacin con la funcin VALUELABEL. Bsqueda y sustitucin de valores de cadena con la funcin REPLACE. Definicin de atributos de variable personalizados y atributos de archivo de datos con los comandos VARIABLE ATTRIBUTE y DATAFILE ATTRIBUTE. Escritura de datos en las tablas de bases de datos y otros formatos utilizando nombres de campo/columna que no estn restringidos por las normas de denominacin de variables de SPSS. SAVE TRANSLATE se ha mejorado para permitir utilizar valores entre comillas para los nombres de campo/columna que contienen espacios, comas u otros caracteres que no estn permitidos en los nombres de variable de SPSS. Uso del nuevo subcomando SQL del comando SAVE TRANSLATE para aadir columnas nuevas a las tablas de bases de datos, modificar atributos de las columnas de la tabla de base de datos, unir tablas y realizar otras acciones permitidas con instrucciones SQL vlidas.
Grficos
Uso de la nueva interfaz del generador de grficos (men Grficos) para crear grficos a partir de grficos de la galera predefinidos o a partir de las partes individuales que constituyen un grfico (por ejemplo, el sistema de coordenadas y las barras). Creacin de tipos de grficos personalizados mediante la slida sintaxis de comandos de GGRAPH y GPL.
Mejoras en los estadsticos
El nuevo modelizador experto de la opcin Tendencias identifica y calcula automticamente el modelo que mejor se ajusta para una o ms series, lo que elimina la necesidad de identificar un modelo adecuado mediante ensayo y error. Se puede acceder al modelizador experto desde el cuadro de dilogo
4 Captulo 1
Modelizador de series temporales o mediante la sintaxis de comandos (con el comando TSMODEL). La nueva opcin Validacin de datos proporciona una instantnea visual rpida de los datos y ofrece la capacidad de aplicar reglas de validacin que identifican valores de datos no vlidos. Puede crear reglas que marquen los valores fuera de rango, valores perdidos o valores en blanco. Tambin puede guardar variables que registren cada una de las violaciones de las reglas y el nmero total de violaciones de reglas por cada caso. Tambin se incluye un conjunto limitado de reglas predefinidas que puede copiar o modificar. Puede acceder a la opcin Validacin de datos a travs del cuadro de dilogo Validar datos del men Datos o mediante la sintaxis de comandos (con el comando VALIDATEDATA). El nuevo procedimiento de deteccin de anomalas de la opcin Validacin de datos busca observaciones poco habituales que podran afectar negativamente a los modelos predictivos. Algunas de estas observaciones atpicas representan casos verdaderamente nicos y, por lo tanto, no son adecuadas para la prediccin, mientras que otras observaciones estn provocadas por errores de entrada de datos donde los valores son tcnicamente correctos y no pueden ser tomados por el procedimiento Validacin de datos. Puede acceder a la opcin de deteccin de anomalas a travs del cuadro de dilogo Identificar datos atpicos del men Datos o mediante la sintaxis de comandos (con el comando DETECTANOMALY). El nuevo procedimiento de desplegamiento multidimensional (PREFSCAL) de la opcin Categoras intenta buscar la estructura de un conjunto de medidas de proximidad entre los objetos de filas y columnas. Este proceso se logra asignando las observaciones a posiciones especficas en un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntos en el espacio concuerden al mximo con las similaridades (o disimilaridades) dadas. El resultado es una representacin de mnimos cuadrados de los objetos en dicho espacio de pocas dimensiones que, en muchos casos, ayuda a entender mejor los datos. Se puede acceder a este procedimiento actualmente mediante la sintaxis de comandos PREFSCAL. El nuevo procedimiento de seleccin de predictor (SELECTPRED) de SPSS Server abarca una gran cantidad de variables predictoras continuas y categricas. El procedimiento selecciona un subconjunto menor para su uso en los procedimientos de creacin de modelos predictivos que no pueden aceptar tantos predictores. Se puede acceder a este procedimiento actualmente mediante la sintaxis de comandos SELECTPRED.
5 Resumen
El nuevo procedimiento de Nave Bayes (NAIVEBAYES) de SPSS Server genera un modelo estable y sencillo para la clasificacin y seleccin de predictor. Se puede acceder a este procedimiento actualmente mediante la sintaxis de comandos NAIVEBAYES. Las capacidades de prueba de significacin mejoradas de la opcin Tablas permiten realizar pruebas de significacin en subtotales y conjuntos de respuestas mltiples. Se ha aumentado la flexibilidad a la hora de definir los conjuntos de respuestas mltiples para dicotomas mltiples.
Resultados
Los resultados de la tabla pivote se proporcionan ahora para Asignar rangos a los casos (RANK), Reemplazar valores perdidos (RMV) y Crear series temporales (CREATE) en el sistema Base; todos los procedimientos de la opcin Anlisis conjunto; Anlisis loglineal: Seleccin de modelo (HILOGLINEAR) de la opcin Modelos avanzados; y Anlisis probit (PROBIT), Estimacin ponderada (WLS) y Mnimos cuadrados en dos fases (2SLS) de la opcin Modelos de regresin.
Mejoras del rendimiento
Las estructuras de tabla que precisaban de una gran cantidad de tiempo para su creacin o podan quedarse sin memoria con la opcin Tablas personalizadas (CTABLES) se crean ahora de forma rpida y eficaz.
Aspecto mejorado
Los iconos de las variables se han mejorado, proporcionando ms informacin de un vistazo sobre las variables, incluido el nivel de medida (nominal, ordinal, de escala) y el tipo de datos (de cadena, numrico, fecha, hora). Se ha incorporado asistencia completa para la configuracin de los temas y la apariencia de Windows XP.
6 Captulo 1
En versiones anteriores, las funciones ANY y RANGE slo devolvan un valor perdido si el primer argumento daba como resultado un valor perdido. Para mantener la coherencia con otras funciones y clculos, estas funciones tambin devolvern un valor perdido si cualquiera de los argumentos restantes son valores perdidos del sistema o valores perdidos definidos por el usuario y el valor del primer argumento no coincide con ninguno de los otros argumentos no perdidos. As:
COMPUTE newvar=ANY(var1, var2, var3)
Regresin logstica
En versiones anteriores de SPSS, el orden de los valores de cadena recodificados dependa del orden de los valores del archivo de datos; por ejemplo, al recodificar la variable dependiente, el primer valor de cadena que se encontraba se recodificaba como 0 y el segundo valor de cadena que se encontraba se recodificaba como 1. El procedimiento ahora recodifica las variables de cadena para que el orden de los valores recodificados sea el orden alfanumrico de los valores de cadena. As, el procedimiento puede recodificar las variables de cadena de forma diferente que en versiones anteriores. Regresin logstica est disponible en la opcin Modelos de regresin.
Funcin de macros
Las mejoras de la funcin de macros pueden provocar errores en las tareas que antes se ejecutaban sin errores. Especialmente, en el caso de la sintaxis que se procesa con reglas interactivas, si se produce una llamada de macro al final de un comando, y no hay ningn terminador del comando (un punto o una lnea en blanco), el siguiente comando que siga a la expansin de la macro se interpretar como una lnea de continuacin en lugar de como un comando nuevo, como en:
DEFINE !macro1() var1 var2 var3 !ENDDEFINE. FREQUENCIES VARIABLES = !macro1 DESCRIPTIVES VARIABLES = !macro1.
En el modo interactivo, el comando DESCRIPTIVES se interpretar como una continuacin del comando FREQUENCIES y no se ejecutar ningn comando.
7 Resumen
Ventanas
Existen diversos tipos de ventanas en SPSS:
Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede crear nuevos archivos de datos o modificar los existentes con el Editor de datos. Si tiene ms de un archivo de datos abierto, habr una ventana Editor de datos independiente para cada archivo. Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en el Visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre automticamente la primera vez que se ejecuta un procedimiento que genera resultados. Visor de borrador. Los resultados pueden mostrarse como texto simple (en lugar de
resultados mostrados en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las filas y las columnas, aadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados de manera selectiva.
Editor de grficos. Puede modificar los grficos y diagramas de alta resolucin en las ventanas de los grficos. Es posible cambiar los colores, seleccionar diferentes tipos de fuentes y tamaos, intercambiar los ejes horizontal y vertical, rotar diagramas de dispersin 3-D e incluso cambiar el tipo de grfico. Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas
pivote pueden modificarse con el Editor de resultados de texto. Puede editar los resultados y cambiar las caractersticas de las fuentes (tipo, estilo, color y tamao).
Editor de sintaxis. Puede pegar las selecciones del cuadro de dilogo en una ventana de
sintaxis, donde aparecern en forma de sintaxis de comandos. A continuacin puede editar esta sintaxis para utilizar las funciones especiales de SPSS que no se encuentran disponibles en los cuadros de dilogo. Tambin puede guardar los comandos en un archivo para utilizarlos en sesiones de SPSS posteriores.
Editor de procesos. El procesamiento y la automatizacin OLE permiten personalizar
y automatizar muchas tareas en SPSS. Utilice el Editor de procesos para crear y modificar los procesos bsicos.
9 Resumen
punto de la ventana).
E Pulse en el botn Designar ventana de la barra de herramientas (la que tiene el icono
Nota: en cuanto a las ventanas Editor de datos, la ventana Editor de datos activa determina el conjunto de datos que se utiliza en anlisis o clculos posteriores. No hay ninguna ventana Editor de datos designada. Si desea obtener ms informacin, consulte Tratamiento bsico de varias fuentes de datos en Captulo 6 en p. 120.
Mens
Muchas de las tareas que desea realizar en SPSS estn disponibles mediante las selecciones de mens. Cada ventana de SPSS tiene su propia barra de mens con selecciones de mens adecuadas para ese tipo de ventana. Los mens Analizar y Grficos aparecen en todas las ventanas, lo cual permite generar fcilmente nuevos resultados sin tener que cambiar de ventana.
Barra de estado
La barra de estado que aparece en la parte inferior de cada ventana de SPSS proporciona la siguiente informacin:
Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de casos indica el nmero de casos procesados hasta el momento. En los procedimientos estadsticos que requieren procesamientos iterativos, se muestra el nmero de iteraciones.
10 Captulo 1
Estado del filtro. Si ha seleccionado una muestra aleatoria o un subconjunto de casos para el anlisis, el mensaje Filtrado indica que existe algn tipo de filtrado activado actualmente y por tanto en el anlisis no se incluyen todos los casos del archivo de datos. Estado de ponderacin. El mensaje Ponderado indica que se est utilizando una
se ha segmentado en diferentes grupos para su anlisis en funcin de los valores de una o ms variables de agrupacin.
Cuadros de dilogo
La mayora de las opciones de los mens acceden a un cuadro de dilogo cuando se seleccionan. Los cuadros de dilogo se utilizan para seleccionar variables y opciones para el anlisis. Los cuadros de dilogo para los procedimientos estadsticos tienen normalmente dos componentes bsicos:
Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la lista de origen slo aparecen los tipos de variables que el procedimiento seleccionado permite. La utilizacin de variables de cadena corta y de cadena larga est restringida en muchos procedimientos. Listas de variables de destino. Una o varias listas que indican las variables elegidas para el anlisis; un ejemplo son las listas de variables dependientes e independientes.
11 Resumen
12 Captulo 1
Pegar. Genera la sintaxis de comandos a partir de las selecciones del cuadro de dilogo
y la pega en la ventana de sintaxis. A continuacin, puede personalizar los comandos con funciones adicionales que no se encuentran disponibles en los cuadros de dilogo.
Restablecer. Desactiva las variables en las listas de variables seleccionadas y restablece todas las especificaciones del cuadro de dilogo y los subcuadros de dilogo al estado por defecto. Cancelar. Cancela los cambios que se realizaron en las selecciones del cuadro de
dilogo desde la ltima vez que se abri y lo cierra. Durante una sesin se mantienen las selecciones del cuadro de dilogo. El cuadro de dilogo retiene el ltimo conjunto de especificaciones hasta que se anulan.
Ayuda. Proporciona ayuda contextual. Este control le lleva a una ventana de Ayuda con informacin sobre el cuadro de dilogo actual. Tambin puede obtener ayuda sobre los controles individuales del cuadro de dilogo pulsando en el control con el botn derecho del ratn.
Subcuadros de dilogo
Puesto que la mayora de los procedimientos ofrecen un gran nmero de posibilidades, un solo cuadro de dilogo no puede contener todas las opciones disponibles. El cuadro de dilogo principal suele contener la informacin mnima que se requiere para ejecutar un procedimiento. Las especificaciones adicionales se realizan en los subcuadros de dilogo. En el cuadro de dilogo principal, los controles con puntos suspensivos (...) despus del nombre indican que se mostrar un subcuadro de dilogo.
Seleccin de variables
Para seleccionar una sola variable, basta con resaltarla en la lista de variables de origen y pulsar en el botn de flecha derecha situado junto a la lista de variables de destino. Si slo existe una lista de variables de destino, puede pulsar dos veces en las variables individuales para desplazarlas desde la lista de origen hasta la de destino.
13 Resumen
Tambin pueden seleccionar diversas variables: Para seleccionar diversas variables que estn agrupadas en la lista de variables, pulse en la primera de ellas y, despus, en la ltima del grupo mientras mantiene pulsada la tecla Mays. Para seleccionar diversas variables que no estn agrupadas en la lista de variables, pulse en la primera de ellas; a continuacin, pulse en la siguiente variable mientras mantiene pulsada la tecla Ctrl, y as sucesivamente.
guardado, leer una hoja de clculo, una base de datos o un archivo de datos de texto, o introducir los datos directamente en el Editor de datos.
Seleccionar un procedimiento. Seleccione un procedimiento de los mens para calcular estadsticos o crear un grfico. Seleccionar las variables para el anlisis. Las variables del archivo de datos se muestran en un cuadro de dilogo para el procedimiento. Ejecute el procedimiento y observe los resultados. Los resultados se muestran en el
Visor.
15 Resumen
Asesor estadstico
Si no est familiarizado con SPSS o con los procedimientos estadsticos que ofrece, el asesor estadstico (Statistics Coach) puede ayudarle solicitndole informacin mediante preguntas simples, utilizando un lenguaje no tcnico y ejemplos visuales que le ayudarn a seleccionar las funciones bsicas de los estadsticos y los grficos ms apropiados para sus datos. Para utilizar el Asesor estadstico, elija en los mens de cualquier ventana de SPSS:
? Asesor estadstico
El Asesor estadstico cubre slo un subconjunto selecto de procedimientos del sistema Base de SPSS. Est diseado para proporcionar una asistencia general para muchas de las tcnicas estadsticas bsicas que se utilizan habitualmente.
Captulo
Obtencin de ayuda
La ayuda se proporciona de diversas formas:
acceso al sistema de ayuda principal adems de a los tutoriales y al material de referencia tcnica.
Temas. Proporciona acceso a las pestaas Contenido, ndice y Buscar, que pueden
funciones bsicas de SPSS. No necesita consultar el tutorial de principio a fin. Puede elegir los temas que desea consultar, pasar de un tema a otro, ver los temas en cualquier orden y utilizar el ndice o la tabla de contenidos para buscar temas concretos.
Estudios de casos. Ejemplos prcticos sobre cmo crear diferentes tipos de
anlisis estadsticos y cmo interpretar los resultados. Tambin se proporcionan los archivos de datos de muestra utilizados en estos ejemplos para que pueda trabajar en dichos ejemplos y observar con exactitud cmo se generaron los resultados. Puede elegir los procedimientos concretos que desee aprender en la tabla de contenidos o buscar los temas correspondientes en el ndice.
Asesor estadstico. Mtodo de asistencia para orientarle en el proceso de bsqueda
del procedimiento que desea utilizar. Tras realizar una serie de selecciones, el Asesor estadstico abre el cuadro de dilogo para el procedimiento estadstico, de generacin de informes o de creacin de grficos que cumple los criterios seleccionados. El Asesor estadstico proporciona acceso a la mayora de los procedimientos estadsticos y de generacin de informes en el sistema Base y en los procedimientos de creacin de grficos.
17
18 Captulo 2
la sintaxis de comandos est disponible en dos formatos: integrada en el sistema de ayuda global y como un documento independiente en formato PDF en SPSS Command Syntax Reference, disponible en el men Ayuda.
Algoritmos de estadsticos. Los algoritmos que se utilizan para la mayora de los
procedimientos estn disponibles en formato PDF en el men Ayuda y en los temas de ayuda para la interfaz del cuadro de dilogo asociada.
Ayuda contextual. En muchos puntos de la interfaz de usuario, puede obtener ayuda sensible al contexto. Botn Ayuda en los cuadros de dilogo. La mayora de los cuadros de dilogo
disponen de un botn Ayuda que permite acceder directamente al tema de ayuda correspondiente. Este tema proporciona informacin general y vnculos a los temas relacionados.
Ayuda en el men contextual de un cuadro de dilogo. Muchos cuadros de dilogo
proporcionan ayuda sensible al contexto para controles y funciones individuales. Pulse con el botn derecho del ratn en cualquier control de un cuadro dilogo y seleccione Qu es esto? en el men contextual que aparece para ver una descripcin del control e instrucciones sobre su uso. (Si Qu es esto? no aparece en el men contextual, esta forma de ayuda no est disponible para dicho cuadro de dilogo.)
Ayuda en el men contextual de una tabla pivote. Pulse con el botn derecho del
Estudios de casos. Pulse con el botn derecho del ratn en una tabla pivote y
seleccione Estudios de casos en el men contextual para ir directamente a un ejemplo detallado del procedimiento que ha generado la tabla. (Si Estudios de casos no aparece en el men contextual, esta forma de ayuda no est disponible para dicho procedimiento.)
Sintaxis de comandos. En una ventana de sintaxis de comandos, coloque el cursor
en cualquier punto de un bloque de sintaxis para un comando y pulse F1 en el teclado. Se muestra un esquema de sintaxis de comandos completo para dicho comando. La documentacin completa sobre la sintaxis de comandos
19 Obtencin de ayuda
est disponible en los vnculos de la lista de temas relacionados y en la pestaa Contenido de la ayuda.
Procesamientos y automatizacin OLE. En una ventana de proceso (men Archivo,
Nuevo o Abrir, Proceso), el men Ayuda proporciona acceso a informacin en el lenguaje de procesamiento y las propiedades, los mtodos y los objetos de automatizacin OLE de SPSS. Puede acceder a la ayuda contextual de una ventana de proceso con F1 o F2 (visor de objetos).
Configuracin de Microsoft Internet Explorer
La mayora de las funciones de ayuda de esta aplicacin utilizan tecnologa basada en Microsoft Internet Explorer. Algunas versiones de Internet Explorer (incluida la versin que se incluyen con Microsoft XP, Service Pack 2) bloquearn por defecto lo que se consideren contenidos activos en las ventanas de Internet Explorer de su ordenador local. Esta configuracin por defecto puede hacer que se bloqueen algunos contenidos de las funciones de ayuda. Para ver todos los contenidos de ayuda, puede cambiar el comportamiento por defecto de Internet Explorer.
E Elija en los mens de Internet Explorer, seleccione: Herramientas Opciones de Internet... E Pulse en la pestaa Opciones avanzadas. E Desplcese hacia abajo hasta la seccin Seguridad. E Seleccione (marque) Permitir que el contenido activo se ejecute en archivos de Mi PC.
Otros recursos
Si no encuentra la informacin que desea en el sistema de ayuda, estos otros recursos pueden ofrecerle las respuestas que necesita.
SPSS para la gua de desarrolladores de Windows. Proporciona informacin
y ejemplos para las herramientas de desarrollador incluidas con SPSS para Windows, incluyendo la automatizacin OLE, las API de otros fabricantes, las DLL de entrada/salida, la unidad de produccin y la utilidad de procesamiento.
20 Captulo 2
La gua de desarrolladores (Developers Guide) est disponible en formato PDF en el directorio SPSS\developer del CD de instalacin.
Sitio Web del servicio tcnico. Se pueden encontrar respuestas a muchos problemas
comunes en http://support.spss.com. (El sitio Web de servicio tcnico requiere un ID de inicio de sesin y una contrasea. La informacin sobre cmo obtener el ID y la contrasea se facilita en la direccin URL mencionada anteriormente.)
E Pulse en la pestaa Contenido. E Pulse dos veces en los elementos con un icono de libro para expandir o contraer
el contenido.
E Pulse en un elemento para ir a ese tema de la Ayuda. Figura 2-1 Pestaa Contenido de la ventana de ayuda
21 Obtencin de ayuda
E Pulse en la pestaa ndice. E Introduzca el trmino que desee buscar en el ndice. E Pulse dos veces en el tema que desee consultar.
El ndice de la ayuda utiliza la bsqueda incremental para buscar el texto introducido y selecciona la coincidencia ms aproximada del ndice.
Figura 2-2 Pestaa ndice y bsqueda incremental
La bsqueda de texto en ndice es ms eficaz si puede definir el criterio de bsqueda para limitar el nmero de temas de la lista. Por ejemplo, si sabe que quiere encontrar una funcin para truncar valores numricos, el texto funcin truncar devolver una lista mejor de temas potenciales que escribir simplemente truncar. Los temas con un nombre de comando entre parntesis indican que el tema de la Ayuda es para la sintaxis de comandos. Los temas que no incluyen el nombre de comando entre parntesis suelen ser temas de ayuda para los cuadros de dilogo y otros temas de interfaz grfica de usuario.
23 Obtencin de ayuda
Aparecer una ventana emergente con una descripcin del control y de cmo utilizarlo. Tambin se puede acceder a la informacin general sobre el cuadro de dilogo mediante el botn Ayuda que contiene.
Figura 2-4 Ayuda sobre el control del cuadro de dilogo con el botn derecho del ratn
24 Captulo 2 Figura 2-5 Ayuda de glosario de la tabla pivote activada con el botn derecho del ratn
Captulo
Archivos de datos
Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido diseado para trabajar con muchos de ellos, incluyendo: Hojas de clculo creadas con Excel y Lotus Tablas de bases de datos de diferentes orgenes de bases de datos, incluido Oracle, SQLServer, Access, dBASE, entre otros Archivos de texto delimitados por tabuladores y otros tipos de archivos de slo texto Archivos de datos con formato SPSS creados en otros sistemas operativos Archivos de datos de SYSTAT Archivos de datos de SAS Archivos de datos de Stata
Si lo desea, puede: Leer los nombres de las variables de la primera fila en las hojas de clculo y en los archivos delimitados por tabuladores. Especificar el rango de casillas que desee leer en los archivos de hojas de clculo. Especificar una hoja dentro de un archivo de Excel que desee leer (Excel 5 o versiones posteriores).
almacenamiento de archivos en este formato lleva mucho ms tiempo que guardarlos en formato SPSS.
Excel. Abre archivos de Excel. Lotus 1-2-3. Abre archivos de datos guardados en formato 1-2-3 en las versiones 3.0, 2.0 o 1A de Lotus. SYLK. Abre archivos de datos guardados en formato SYLK (vnculo simblico), un
o dBASE II. Cada caso es un registro. Las etiquetas de valor y de variable y las especificaciones de valores perdidos se pierden si se guarda un archivo en este formato.
Nombre de archivo largo de SAS. Versiones 79 de SAS para Windows, extensin larga. Nombre de archivo corto de SAS. Versiones 79 de SAS para Windows, extensin corta. SAS v6 para Windows. Versin 6.08 de SAS para Windows y OS2. SAS v6 para UNIX. Versin 6 de SAS para UNIX (Sun, HP, IBM). Transporte de SAS. Archivo de transporte de SAS.
27 Archivos de datos
varias hojas de trabajo. El Editor de datos lee por defecto la primera hoja. Para leer una diferente, seleccione la que desee en la lista desplegable.
Rango. En los archivos de hoja de clculo, tambin puede leer un rango de casillas. Para especificar rangos de casillas utilice el mismo mtodo que emplear en la aplicacin de hoja de clculo.
cada variable est determinado por el tipo de datos y el ancho en el archivo de Excel. Si la columna contiene ms de un tipo de datos (por ejemplo, fecha y numrico), el tipo de datos se define como cadena y todos los valores se leen como valores de cadena vlidos.
Casillas en blanco. En las variables numricas, las casillas en blanco se convierten en
el valor perdido del sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son valores de cadena vlidos y las casillas en blanco se tratan como valores de cadena vlidos.
Nombres de variable. Si lee la primera fila del archivo de Excel (o la primera fila
del rango especificado) como nombres de variable, los valores que no cumplan las normas de denominacin de variables se convertirn en nombres de variables vlidos y los nombres originales se utilizarn como etiquetas de variable. Si no lee nombres de variable del archivo de Excel, se asignarn nombres de variable por defecto.
28 Captulo 3
segn el ancho de la columna y el tipo de datos de la primera casilla de la columna. Los valores de otro tipo se convierten en valor perdido por el sistema. Si la primera casilla de datos de la columna est en blanco, se utiliza el tipo de datos global por defecto para la hoja de clculo (normalmente numrico).
Casillas en blanco. En las variables numricas, las casillas en blanco se convierten en
el valor perdido del sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son valores de cadena vlidos y las casillas en blanco se tratan como valores de cadena vlidos.
Nombres de variable. Si no se leen los nombres de variable de la hoja de clculo, se
utilizan las letras de las columnas (A, B, C, ...) como nombres de variable de los archivos de Excel y de Lotus. Para los archivos de SYLK y de Excel guardados en el formato de presentacin R1C1, el programa utiliza para los nombres de variable el nmero de la columna precedido por la letra C (C1, C2, C3, ...).
29 Archivos de datos
de variable de SPSS en formato que distingue entre maysculas y minsculas. Los nombres de variable de Stata que slo se diferencian en el uso de las maysculas y minsculas se convierten en nombres de variable de SPSS vlidos aadiendo un subrayado y una letra secuencial (_A, _B, _C, ..., _Z, _AA, _AB, ..., etc.).
Etiquetas de variable. Las etiquetas de variable de Stata se convierten en etiquetas
de variable de SPSS.
Etiquetas de valor. Las etiquetas de valor de Stata se convierten en etiquetas
de valor de SPSS, excepto las etiquetas de valor de Stata asignadas a valores perdidos extendidos.
Valores perdidos. Los valores perdidos extendidos de Stata se convierten en
de serie temporal de Stata (semanas, meses, trimestres, etc.) se convierten a formato numrico simple (F), conservando el valor entero interno original, que es el nmero de semanas, meses, trimestres, etc., desde el inicio de 1960.
30 Captulo 3 E Seleccione la fuente de datos. E Si es necesario (segn la fuente de datos), seleccione el archivo de base de datos y/o
Especifique cualquier criterio de seleccin para los datos. Aada un mensaje solicitando al usuario que introduzca datos para crear una consulta con parmetros. Guarde la consulta creada antes de ejecutarla.
Para leer archivos de bases de datos con una consulta ODBC guardada
E Elija en los mens: Archivo Abrir base de datos Ejecutar consulta... E Seleccione el archivo de consulta (*.spq) que desee ejecutar. E Si es necesario (segn el archivo de base de datos), introduzca un nombre de acceso
y una contrasea.
E Si la consulta tiene una solicitud incrustada, introduzca otra informacin necesaria
31 Archivos de datos
Si no tiene configurada ninguna fuente de datos ODBC o si desea aadir una nueva, pulse en Aadir fuente de datos ODBC. En el anlisis en modo distribuido (disponible con SPSS Server), este botn no est disponible. Para aadir fuentes de datos en el anlisis en modo distribuido, consulte con el administrador del sistema. Una fuente de datos ODBC est compuesta por dos partes esenciales de informacin: el controlador que se utilizar para acceder a los datos y la ubicacin de la base de datos a la que se desea acceder. Para especificar las fuentes de datos debern estar instalados los controladores adecuados. Para el anlisis en modo local se pueden instalar los controladores desde el CD-ROM de este producto.
Data Access Pack de SPSS. Instala los controladores de una variedad de formatos
incluido Microsoft Access. Para instalar el Data Access Pack de Microsoft, pulse dos veces sobre Microsoft Data Access Pack en la carpeta Microsoft Data Access Pack del CD-ROM.
Para acceder a las fuentes de datos OLE DB, debe tener los siguientes elementos instalados en el ordenador que ejecuta SPSS: .NET framework Dimension Data Model y OLE DB Access Las versiones de estos componentes compatibles con esta versin de SPSS se pueden instalar desde el CD de instalacin de SPSS y estn disponibles en el men de reproduccin automtica.
33 Archivos de datos
Slo puede aadir fuentes de datos OLE DB en el anlisis en modo local. Para aadir fuentes de datos OLE DB en el anlisis en modo distribuido en un servidor Windows, consulte con el administrador del sistema. En el anlisis en modo distribuido (disponible con SPSS Server), las fuentes de datos OLE DB slo estn disponibles en servidores Windows, y debe tener instalado en el servidor .NET, Dimensions Data Model y OLE DB Access.
Figura 3-2 Asistente para bases de datos con acceso a fuentes de datos OLE DB
34 Captulo 3 E Pulse en Siguiente o en la pestaa Conexin. E Seleccione la base de datos introduciendo la ubicacin del directorio y el nombre de
base de datos o pulsando en el botn para desplazarse hasta una base de datos. (Puede que tambin sean necesarios un nombre de usuario y una contrasea.)
E Pulse en Aceptar una vez que haya escrito toda la informacin necesaria. (Puede
E Pulse en Aceptar.
Volver a la primera pantalla del Asistente para bases de datos, donde puede seleccionar el nombre guardado de la lista de fuentes de datos OLE DB y continuar con el siguiente paso del asistente.
Presentacin de los nombres de los campos. Para ver los campos de la tabla, pulse en el
signo ms (+) situado a la izquierda del nombre de una tabla. Para ocultar los campos pulse en el signo menos () situado a la izquierda del nombre de una tabla.
Para aadir un campo. Pulse dos veces en cualquier campo de la lista Tablas disponibles o arrstrelo hasta la lista Recuperar los campos en este orden. Los campos se pueden volver a ordenar arrastrndolos y colocndolos dentro de la lista de campos. Para eliminar un campo. Pulse dos veces en cualquier campo de la lista Recuperar los
37 Archivos de datos
Nota: para fuentes de datos OLE DB, slo puede seleccionar campos de una sola tabla. Las uniones entre varias tablas no es compatible con fuentes de datos OLE DB.
Establecimiento de relaciones. Para crear una relacin, arrastre un campo desde cualquier tabla hasta el campo con el que quiera unirlo. El Asistente para bases de datos dibujar una lnea de unin entre los dos campos que indica su relacin. Estos campos deben ser del mismo tipo de datos.
38 Captulo 3
Unir tablas automticamente. Intenta unir las tablas automticamente en funcin de las claves primarias/externas o de los nombres de campo y tipos de datos coincidentes. Especificacin de tipos de uniones. Si el controlador permite uniones exteriores, podr
especificar uniones interiores, uniones exteriores izquierdas o uniones exteriores derechas. Para seleccionar el tipo de unin, pulse dos veces en la lnea de unin entre los campos y el asistente mostrar el cuadro de dilogo Propiedades de la relacin.
Propiedades de la relacin
Este cuadro de dilogo permite especificar el tipo de relacin que une las tablas.
Figura 3-7 Cuadro de dilogo Propiedades de la relacin
Uniones interiores. Una unin interior incluye slo las filas donde los campos
relacionados son iguales. En este ejemplo, se incluirn todas las filas con los mismos valores de ID en las dos tablas.
Uniones exteriores. Adems de las coincidencias de uno a uno con uniones interiores,
tambin puede utilizar uniones exteriores para fusionar tablas con un esquema de coincidencia de uno a varios. Por ejemplo, puede hacer una coincidencia con una tabla donde slo hay algunos registros que representan los valores de datos y las etiquetas descriptivas asociadas, con valores en una tabla que contiene cientos o miles de registros que representan los encuestados. Una unin exterior izquierda incluye todos los registros de la tabla izquierda y slo aquellos registros de la tabla derecha en los que los campos relacionados son iguales. En una unin exterior derecha, se
39 Archivos de datos
importan todos los registros de la tabla derecha y slo aquellos registros de la tabla izquierda en los que los campos relacionados son iguales.
Para crear sus criterios necesita por lo menos dos expresiones y una relacin para conectarlas.
E Para crear una expresin, seleccione uno de los siguientes mtodos:
En una celda Expresin, puede escribir nombres de campo, constantes, operadores aritmticos, funciones numricas y de otro tipo, y variables lgicas. Pulse dos veces en el campo de la lista Campos. Arrastre el campo de la lista Campos hasta la celda Expresin. Seleccione un campo del men desplegable en una celda Expresin activa.
E Para elegir el operador relacional (como = o >), site el cursor en la casilla Relacin y
41 Archivos de datos
Las fechas y horas de las expresiones se deben especificar de un modo especial (incluidas las llaves que se muestran en los ejemplos): Los literales de fecha se deben especificar usando el formato general: {d aaaa-mm-dd}. Los literales de hora se deben especificar usando el formato general: {t hh:mm:ss}. Los literales de fecha/hora (marcas de hora) se deben especificar usando el formato general: {dt aaaa-mm-dd hh:mm:ss}.
Funciones. SPSS ofrece una seleccin de funciones preincorporadas SQL aritmticas, lgicas, de cadena, de fecha y de hora. Puede arrastrar una funcin de la lista hasta la expresin, o introducir una funcin SQL vlida. Consulte la documentacin de la base de datos para obtener funciones SQL vlidas. Hay una lista de funciones estndar disponibles en:
http://msdn.microsoft.com/library/en-us/odbc/htm/odbcscalar_functions.asp
Utilizar muestreo aleatorio. Esta opcin selecciona una muestra aleatoria de casos de la
fuente de datos. Para grandes fuentes de datos, es posible que desee limitar el nmero de casos a una pequea y representativa muestra, lo que reduce considerablemente el tiempo de ejecucin de procesos. Si el muestreo aleatorio original se encuentra disponible para la fuente de datos, resulta ms rpido que el muestreo aleatorio de SPSS dado que este ltimo an debe leer toda la fuente de datos para extraer una muestra aleatoria.
Aproximadamente (Seleccionar, Muestra aleatoria). Genera una muestra aleatoria
con el nmero de casos especificado a partir del nmero total de casos especificado. Si el nmero total de casos especificado excede el nmero total de casos presentes en el archivo de datos, la muestra contendr un nmero menor de casos proporcional al nmero solicitado. Nota: Si utiliza el muestreo aleatorio, agregacin (disponible en el modo distribuido con el servidor de SPSS) no estar disponible.
Pedir el valor al usuario. Permite insertar una solicitud en la consulta para crear una
consulta con parmetros. Cuando un usuario ejecute la consulta, se le solicitar que introduzca los datos (segn lo que se haya especificado aqu). Puede interesarle esta opcin si necesita obtener diferentes vistas de los mismos datos. Por ejemplo, es
42 Captulo 3
posible que desee ejecutar la misma consulta para ver las cifras de ventas de diversos trimestres fiscales.
E Site el cursor en cualquier casilla de expresin y pulse en Pedir el valor al usuario
Para crear una solicitud, introduzca una cadena de peticin y un valor por defecto. Esta cadena aparecer cada vez que un usuario ejecute la consulta. La cadena especificar el tipo de informacin que debe introducir. Si la informacin no se ofrece en una lista, la cadena sugerir el formato que debe aplicarse a la informacin. A continuacin se muestra un ejemplo: Introduzca un trimestre (Q1, Q2, Q3, ...).
Permitir al usuario seleccionar el valor de la lista. Si selecciona esta casilla de verificacin, puede limitar las elecciones del usuario a los valores que incluya en esta lista. Asegrese de que los valores se separan por retornos de carro.
43 Archivos de datos
Adicin de Datos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con el servidor SPSS), podr agregar los datos antes de leerlos en SPSS.
Tambin se pueden agregar los datos despus de leerlos en SPSS, pero si lo hace antes ahorrar tiempo en el caso de grandes fuentes de datos.
E Para crear datos agregados, seleccione una o ms variables de segmentacin que
45 Archivos de datos
Definicin de variables
Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base
de datos se utiliza como etiqueta de la variable. A menos que modifique el nombre de la variable, el Asistente para bases de datos asignar nombres de variable a cada columna de la base de datos de una de las siguientes formas: Si el nombre del campo de la base de datos forma un nombre de variable vlido y nico, se usar como el nombre de la variable. Si el nombre del campo de la base de datos no es un nombre de variable vlido y nico, se generar automticamente un nombre nico. Pulse en cualquier casilla para editar el nombre de la variable.
Conversin de cadenas en variables numricas. Seleccione la casilla Recodificar como
numrica para convertir automticamente una variable de cadena en una variable
numrica. Los valores de cadena se convierten en valores enteros consecutivos en funcin del orden alfabtico de los valores originales. Los valores originales se mantienen como etiquetas de valor para las nuevas variables.
Anchura para los campos de ancho variable. Esta opcin controla la anchura de los
valores de las cadenas de anchura variable. Por defecto, la anchura es de 255 bytes y slo se leen los primeros 255 bytes (generalmente 255 caracteres en idiomas de un solo byte). El valor mximo que se puede asignar a este parmetro es de 32.767 bytes. Aunque posiblemente no desee truncar los valores de cadena, tampoco desear especificar un valor innecesariamente alto, ya que producira que el procesamiento de SPSS fuera ineficaz.
Ordenacin de casos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con el servidor SPSS), podr ordenar los datos antes de leerlos en SPSS.
Tambin se pueden ordenar los datos despus de leerlos en SPSS, pero si lo hace antes ahorrar tiempo en el caso de grandes fuentes de datos.
Resultados
El cuadro de dilogo Resultados muestra la instruccin Select de SQL para la consulta. Se puede editar la instruccin Select de SQL antes de ejecutar la consulta, pero si pulsa el botn Atrs para introducir cambios en pasos anteriores, se perdern los cambios realizados en la instruccin Select.
48 Captulo 3
Para guardar la consulta para utilizarla ms adelante, utilice la seccin Guardar la consulta en un archivo. Para pegar la sintaxis GET DATA completa en una ventana de sintaxis, seleccione Pegarlo en el editor de sintaxis para su modificacin ulterior. Copiar y pegar la instruccin Select de la ventana Resultados no pegar la sintaxis de comandos necesaria. Nota: La sintaxis pegada contiene un espacio en blanco delante de las comillas de cierre en cada lnea de SQL generada por el asistente. Estos espacios no son superfluos. Cuando se procesa el comando, todas las lneas de la instruccin SQL se fusionan de un modo muy literal. Si esos espacios, los caracteres ltimo y primero de cada lnea se uniran.
Figura 3-14 Cuadro de dilogo Resultados
49 Archivos de datos
50 Captulo 3
El archivo de texto se mostrar en una ventana de vista previa. Puede aplicar un formato predefinido (guardado con anterioridad desde el Asistente para la importacin de texto) o seguir los pasos del asistente para especificar cmo desea que se lean los datos.
51 Archivos de datos
Este paso ofrece informacin sobre las variables. Una de las variables es similar a uno de los campos de la base de datos. Por ejemplo, cada elemento de un cuestionario es una variable.
Cmo estn organizadas sus variables? Para leer los datos adecuadamente, el
Asistente para la importacin de texto necesita saber cmo determinar el lugar en el que terminan los valores de datos de una variable y comienzan los valores de datos de la variable siguiente. La organizacin de las variables define el mtodo utilizado para diferenciar una variable de la siguiente.
52 Captulo 3
separar variables. Las variables quedan registradas en el mismo orden para cada caso, pero no necesariamente conservando la misma ubicacin para las columnas.
Ancho fijo. Cada variable se registra en la misma posicin de columna en el mismo
registro (lnea) para cada caso del archivo de datos. No se requiere delimitador entre variables De hecho, en muchos archivos de datos de texto generados por programas de ordenador, podra parecer que los valores de los datos se suceden, sin espacios que los separen. La ubicacin de la columna determina qu variable se est leyendo.
Estn incluidos los nombres de las variables en la parte superior del archivo? Si la
primera fila del archivo de datos contiene etiquetas descriptivas para cada variable, podr utilizar dichas etiquetas como nombres de las variables. Los valores que no cumplan las normas de denominacin de variables se convertirn en nombres de variables vlidos.
53 Archivos de datos
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de datos. Por ejemplo, cada persona que responde a un cuestionario es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea
del archivo de datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de datos contienen etiquetas descriptivas o cualquier otro texto que no represente valores de datos, dicha lnea o lneas no sern la lnea 1.
Cmo se representan sus casos? Controla la manera en que el Asistente para la importacin de texto determina dnde finaliza cada caso y comienza el siguiente. Cada lnea representa un caso. Cada lnea contiene un slo caso. Es bastante
comn que cada lnea (fila) contenga un slo caso, aunque dicha lnea puede ser muy larga para un archivo de datos con un gran nmero de variables. Si no todas las lneas contienen el mismo nmero de valores de datos, el nmero de variables para cada caso quedar determinado por la lnea que tenga el mayor nmero de
54 Captulo 3
valores de datos. A los casos con menos valores de datos se les asignarn valores perdidos para las variables adicionales.
Un nmero concreto de variables representa un caso. El nmero de variables
especificado para cada caso informa al Asistente para la importacin de texto de dnde detener la lectura de un caso y comenzar la del siguiente. Una misma lnea puede contener varios casos y los casos pueden empezar en medio de una lnea y continuar en la lnea siguiente. El Asistente para la importacin de texto determina el final de cada caso basndose en el nmero de valores ledos, independientemente del nmero de lneas. Cada caso debe contener valores de datos (o valores perdidos indicados por delimitadores) para todas las variables; de otra forma, el archivo de datos no se leer correctamente.
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos,
los primeros n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a partir de un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede aproximar al porcentaje especificado. Cuantos ms casos contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados al porcentaje especificado.
55 Archivos de datos
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de datos. Por ejemplo, cada encuestado es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea
del archivo de datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de datos contienen etiquetas descriptivas o cualquier otro texto que no represente valores de datos, dicha lnea o lneas no sern la lnea 1.
Cuntas lneas representan un caso? Controla la manera en que el Asistente para la
importacin de texto determina dnde finaliza cada caso y comienza el siguiente. Cada variable queda definida por su nmero de lnea dentro del caso y por la ubicacin de su columna. Para leer los datos correctamente, deber especificar el nmero de lneas de cada caso.
56 Captulo 3
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos,
los primeros n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a partir de un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede aproximar al porcentaje especificado. Cuantos ms casos contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados al porcentaje especificado.
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer el archivo de datos y le permite modificar la manera en que el asistente leer las variables del archivo de datos.
57 Archivos de datos
smbolos que separan los valores de datos. Puede seleccionar cualquier combinacin de espacios, comas, signos de punto y coma, tabulaciones o cualquier otro carcter. En caso de existir varios delimitadores consecutivos sin valores de datos, dichos delimitadores sern considerados valores perdidos.
Cul es el calificador de texto? Caracteres utilizados para encerrar valores que contienen caracteres delimitadores. Por ejemplo, si una coma es el delimitador, los valores que contengan comas se leern incorrectamente a menos que estos valores se encierre en un calificador de texto, impidiendo que las comas del valor se interpreten como delimitadores entre los valores. Los archivos de datos con formato CSV de Excel utilizan las comillas dobles () como calificador de texto. El calificador de texto aparece tanto al comienzo como al final del valor, encerrndolo completamente.
58 Captulo 3
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer el archivo de datos y le permite modificar la manera en que el asistente leer las variables del archivo de datos. Las lneas verticales de la ventana de vista previa indican el lugar en el que en ese momento el Asistente para la importacin de texto piensa que cada variable comienza en el archivo. Inserte, mueva y elimine lneas de ruptura de variable segn convenga para separar variables. Si para cada caso se utilizan varias lneas, seleccione cada lnea de la lista desplegable y modifique las lneas de ruptura de variable segn convenga. Notas: En archivos de datos generados por ordenador que producen un flujo continuo de valores de datos sin espacios ni otras caractersticas distintivas, puede resultar difcil determinar el lugar en el que comienza cada variable. Los archivos de datos del tipo citado anteriormente suelen depender de un archivo de definicin de datos u otro tipo de descripcin escrita que especifique la ubicacin por lneas y columnas de cada variable. El Asistente para la importacin de texto est diseado para utilizarlo con una fuente monoespaciada (de paso fijo) para mostrar el contenido del archivo. Con fuentes no monoespaciadas (proporcionales), el contenido del archivo no se alinear correctamente. Este valor de fuente se controla mediante el valor Fuentes de los resultados de texto en la pestaa Visor del cuadro de dilogo Opciones (men Editar).
59 Archivos de datos
Este paso controla el nombre de la variable y el formato de datos que el Asistente para la importacin de texto utilizar para leer cada variable, as como las que se incluirn en el archivo de datos definitivo.
Nombre de variable. Puede sobrescribir los nombres de variable por defecto y
sustituirlos por otros diferentes. Si lee nombres de variable desde el archivo de datos, el Asistente para la importacin de texto modificar de manera automtica los nombres de variable que no cumplan las normas de denominacin de variables. Seleccione una variable en la ventana de vista previa e introduzca un nombre de variable.
Formato de datos. Seleccione una variable en la ventana de vista previa y, a continuacin, seleccione un formato de la lista desplegable. Pulse el botn del ratn con la tecla MAYS presionada para seleccionar una serie de variables consecutivas,
60 Captulo 3
o bien con la tecla CTRL presionada para seleccionar una serie de variables no consecutivas.
importado.
Numrico. Los valores vlidos incluyen nmeros, los signos ms y menos iniciales
y un indicador decimal.
Cadena. Son valores vlidos prcticamente todos los caracteres del teclado y los
espacios en blanco incrustados. En los archivos delimitados, puede especificar hasta un mximo de 32.767 de caracteres para el valor. El Asistente para la importacin de texto fija como valor por defecto para el nmero de caracteres el valor de cadena ms largo que se haya encontrado para la variable o variables seleccionadas. Para los archivos de ancho fijo, el nmero de caracteres en los valores de cadena queda definido por la ubicacin de las lneas de ruptura de variable en el paso 4.
Fecha/hora. Entre los valores vlidos se encuentran las fechas con formato general: dd-mm-aaaa, mm/dd/aaaa, dd.mm.aaaa, aaaa/mm/dd, hh:mm:ss, as como una amplia variedad de formatos de hora y fecha. Los meses se pueden representar en dgitos, nmeros romanos, abreviaturas de tres letras o con el nombre completo. Seleccione un formato de fecha de la lista. Dlar. Los valores vlidos son nmeros con un signo dlar inicial optativo y puntos
separar los decimales y un punto para separar los millares. Nota: Los valores que contengan caracteres no vlidos para el formato seleccionado sern considerados valores perdidos. Los valores que contengan uno cualquiera de los delimitadores especificados sern considerados como valores mltiples.
61 Archivos de datos
Este es el paso final del Asistente para la importacin de texto. Puede guardar sus propias especificaciones en un archivo para hacer uso de ellas cuando importe archivos de datos de texto similares. Tambin puede pegar la sintaxis generada por el Asistente para la importacin de texto en una ventana de sintaxis. As podr personalizar y/o guardar dicha sintaxis para utilizarla en futuras sesiones o en trabajos de produccin.
Cach local de los datos. Una cach de los datos es una copia completa del archivo de
datos, almacenada en un espacio temporal del disco. La cach del archivo de datos puede mejorar el rendimiento.
62 Captulo 3
63 Archivos de datos
Tipo de datos de casos. El formato del archivo de datos de casos. Los formatos
disponibles incluyen: Archivo de datos de Quancept (DRS). Datos del caso en un archivo Quancept .drs, .drz o .dru. Base de datos de Quanvert. Datos del caso en una base de datos de Quanvert. Base de datos de Dimensions (MS SQL Server). Datos de casos en una base de datos relacional de investigacin de mercado de SPSS en SQL Server. Esta opcin se puede utilizar para leer los datos recopilados mediante mrInterview. Archivo de datos XML de Dimensions. Datos de casos en un archivo XML.
Ubicacin de datos de casos. El archivo que contiene los datos de casos. El formato de
este archivo debe ser coherente con el tipo de datos de casos seleccionado.
Figura 3-23 Propiedades de vnculo de datos: Pestaa Conexin
64 Captulo 3
Nota: no se sabe hasta qu punto el resto de opciones de la pestaa Conexin o cualquier opcin del resto de pestaas Propiedades de vnculo de datos pueden afectar a la lectura de datos de Dimensions en SPSS, por lo que se recomienda no cambiar ninguna de ellas.
las variables que indican el estado de encuesta (en curso, finalizada, fecha de finalizacin, etc.). A continuacin, puede seleccionar cualquier variable de sistema que desee incluir. Por defecto, se excluyen todas las variables del sistema.
Mostrar variables de cdigos. Muestra cualquier variable que represente cdigos
que se utilizan para respuestas Otros abiertas para variables categricas. A continuacin, puede seleccionar cualquier variable de cdigos que desee incluir. Por defecto, se excluyen todas las variables de cdigos.
Mostrar variables de archivo de origen. Muestra cualquier variable que contenga
nombres de archivo de imgenes de respuestas exploradas. A continuacin, puede seleccionar cualquier variable de archivo de origen que desee incluir. Por defecto, todas las variables de archivo de origen estn excluidas.
65 Archivos de datos Figura 3-24 Pestaa Importacin de datos de dimensiones: Seleccionar variables
prueba o ambos. Tambin puede seleccionar casos basados en cualquier combinacin de los siguientes parmetros de estado de encuesta: Finalizada correctamente Activa / en curso
66 Captulo 3
Tiempo agotado Detenida por proceso Detenida por encuestado Cierre del sistema de encuestas Seal (el proceso se completa con una instruccin sealizadora)
Fecha de finalizacin de la recopilacin de datos. Puede seleccionar casos basados en
recopilacin de datos antes de la fecha especificada. No se incluyen los casos para los que la recopilacin de datos se complet en la fecha de finalizacin. Si especifica tanto una fecha de inicio como una fecha de finalizacin, se definir un rango de fechas de finalizacin desde la fecha de inicio hasta la fecha de finalizacin (sta ltima no incluida).
67 Archivos de datos Figura 3-25 Pestaa Importacin de datos de dimensiones: Seleccin de casos
68 Captulo 3
activarla).
E Elija en los mens: Archivo Guardar
69 Archivos de datos
Al exportar a Excel 97 o versiones posteriores, se ofrece la posibilidad de incluir las etiquetas de valor en lugar de los valores. Al estar limitados los archivos de Excel a 256 columnas de datos, slo se incluirn en el archivo exportado las primeras 256 variables. Los archivos de Excel 4.0 y Excel 5.0/95 estn limitados a 16.384 registros o filas de datos. Los archivos de Excel 972000 permiten 65.536 registros. Si los datos superan estos lmites, aparecer un mensaje de aviso y los datos se truncarn de acuerdo con el mximo tamao permitido por Excel.
Tipos de variables
La siguiente tabla muestra la relacin del tipo de las variables entre los datos originales de SPSS y los datos exportados a Excel.
Tipo de variable de SPSS Numrico Coma Dolar Fecha Time Cadena Formato de datos de Excel 0.00; #,##0.00; ... 0.00; #,##0.00; ... $#,##0_); ... d-mmm-aaaa hh:mm:ss General
70 Captulo 3
Si existen, las etiquetas de variable de SPSS se asignan a etiquetas de variable de SAS. Si no hay ninguna etiqueta de variable en los datos de SPSS, el nombre de variable se asigna a la etiqueta de variable de SAS. SAS slo permite que exista un valor perdido del sistema, mientras que SPSS permite que haya varios valores perdidos del sistema. Por tanto, todos los valores perdidos del sistema en SPSS se asignan a un nico valor perdido del sistema en el archivo SAS.
Almacenamiento de etiquetas de valor
Existe la posibilidad de guardar los valores y las etiquetas de valor asociadas al archivo de datos en un archivo de sintaxis de SAS. Por ejemplo, al exportar las etiquetas de valor del archivo de datos coches.sav, el archivo de sintaxis generado contiene:
libname library 'd:\spss\' ; proc format library = library ; value ORIGIN /* Pas de origen */ 1 = 'EE.UU.' 2 = 'Europa' 3 = 'Japn' ; value CYLINDER /* Nmero de cilindros */ 3 = '3 cilindros' 4 = '4 cilindros' 5 = '5 cilindros' 6 = '6 cilindros' 8 = '8 cilindros' ; value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */ 0 = 'No seleccionado' 1 = 'Seleccionado' ; proc datasets library = library ; modify cars; format ORIGIN ORIGIN.;
71 Archivos de datos
La siguiente tabla muestra la relacin del tipo de las variables entre los datos originales de SPSS y los datos exportados a SAS.
Tipo de variable de SPSS Numrico Coma Puntos Notacin cientfica Fecha Fecha (Hora) Dolar Moneda personalizada Cadena Tipo de variable de SAS Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Carcter Formato de datos de SAS 12 12 12 12 (Fecha) p.ej., MMDDAA10,... Hora18 12 12 $8
72 Captulo 3
Para las versiones 7 y 8, los primeros 32 bytes de nombres de variable en formato que distingue entre maysculas y minsculas se guardan como nombres de variable Stata. Para versiones anteriores, los primeros 8 bytes de nombres de variable se guardan como nombres de variable Stata. Cualquier carcter distinto de letras, nmero y caracteres de subrayado se convierten en caracteres de subrayado. Los nombres de variable de SPSS que contienen caracteres de varios bytes (por ejemplo, caracteres japoneses o chinos) se convierten en nombres de variable con formato general Vnnn, donde nnn es un valor entero. Para las versiones 56 y las versiones Intercooled 78, se guardan los primeros 80 bytes de valores de cadena. Para Stata SE 78, se guardan los primeros 244 bytes de valores de cadena. Para las versiones 56 y las versiones Intercooled 78, slo se guardan los primeros 2.047 bytes de valores de cadena. Para Stata SE 78, slo se guardan las primeras 32.767 variables.
Tipo de variable de SPSS Numrico Coma Puntos Notacin cientfica Fecha, Momento_fecha Tiempo, Tiempo_fecha Dia_semana Mes_ao Dlar Moneda personalizada Cadena Tipo de variable Stata Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Cadena Formato de datos Stata g g g g D_m_Y g (nmero de segundos) g (1-7) g (1-12) g g s
Para guardar un archivo de datos nuevo o guardar los datos con un formato distinto
E Active la ventana Editor de datos (pulse en cualquier punto de la ventana para
activarla).
73 Archivos de datos E Elija en los mens: Archivo Guardar como... E Seleccione un tipo de archivo de la lista desplegable. E Introduzca un nombre de archivo para el nuevo archivo de datos.
Para escribir nombres de variable en la primera fila de una hoja de clculo o de un archivo de datos delimitados por tabuladores:
E Pulse en Escribir nombres de variable en hoja de clculo en el cuadro de dilogo
datos como.
Los archivos de datos guardados con formato SPSS no se pueden leer en versiones anteriores a la 7.5. Al utilizar archivos de datos con nombres de variable con longitud superior a ocho bytes en SPSS 10.X u 11.X, se utilizan versiones nicas de ocho bytes de los nombres de variable, pero se mantienen los nombres originales de las variables para su utilizacin en la versin 12.0 o posterior. En versiones anteriores a SPSS
74 Captulo 3
10.0, los nombres largos originales de las variables se pierden si se guarda el archivo de datos. Al utilizar archivos de datos con variables de cadena con ms de 255 bytes en versiones de SPSS anteriores a la versin 13.0, dichas variables de cadena se fragmentan en variables de cadena de 255 bytes.
SPSS 7.0 (*.sav). Formato SPSS 7.0 para Windows. Los archivos de datos guardados con formato SPSS 7.0 se pueden leer en SPSS 7.0 y en versiones anteriores de SPSS para Windows, pero no incluyen los conjuntos de respuestas mltiples definidos ni la informacin sobre la introduccin de datos para Windows. SPSS/PC+ (*.sys). Formato SPSS/PC+. Si el archivo de datos contiene ms de 500
variables, slo se guardarn las 500 primeras. Para las variables con ms de un valor definido como perdido por el usuario, los valores definidos como perdidos por el usuario adicionales se recodificarn en el primero de estos valores.
SPSS porttil (*.por). El formato porttil de SPSS puede leerse en otras versiones
de SPSS y en versiones para otros sistemas operativos (por ejemplo, Macintosh y UNIX). Los nombres de variable se limitan a ocho bytes, y se convertirn a nombres nicos de ocho bytes si es preciso.
Delimitado por tabulaciones (*.dat). Archivos de texto ASCII con valores separados
por tabuladores.
ASCII en formato fijo (*.dat). Archivos de texto ASCII con formato fijo, utilizando los
formatos de escritura por defecto para todas las variables. No existen tabuladores ni espacios entre los campos de variable.
Excel 2.1(*.xls). Archivo de hoja de clculo de Microsoft Excel 2,1. El nmero
75 Archivos de datos
SYLK (*.slk). Formato de vnculo simblico para archivos de hojas de clculo de Microsoft Excel y de Multiplan. El nmero mximo de variables que puede guardar es 256. dBASE IV (*.dbf). Formato dBASE IV. dBASE III (*.dbf). Formato dBASE III. dBASE II (*.dbf). Formato dBASE II. SAS v6 para Windows (*.sd2). Formato de archivo de SAS v6 para Windows/OS2. SAS v6 para UNIX (*.ssd01). Formato de archivo de SAS v6 para UNIX (Sun, HP, IBM). SAS v6 para Alpha/OSF (*.ssd04). Formato de archivo de SAS v6 para Alpha/OSF
(DEC UNIX).
SAS v7+ Windows extensin corta (*.sd7). Versiones 78 de SAS para Windows con
76 Captulo 3
El cuadro de dilogo Guardar datos como: Variables permite seleccionar las variables que desea guardar en el nuevo archivo de datos. Por defecto, se almacenarn todas las variables. Anule la seleccin de las variables que no desea guardar o pulse en Eliminar todo y, a continuacin, seleccione aquellas variables que desea guardar.
activarla).
E Elija en los mens: Archivo Guardar como... E Seleccione los tipos de archivo. E Pulse en Variables. E Seleccione las variables que desee almacenar.
77 Archivos de datos
Si hace modificaciones posteriores de los datos y, a continuacin, intenta guardar el archivo de datos, puede guardar los datos slo con un nombre de archivo distinto; as, los datos originales no se vern afectados. Puede restablecer los permisos de archivo a lectura/escritura seleccionando la opcin Marcar archivo como de lectura/escritura en el men Archivo.
La lectura de archivos de datos de SPSS La fusin de dos o ms archivos de datos de SPSS La lectura de tablas de bases de datos con el Asistente para bases de datos La fusin de un archivo de datos de SPSS con una tabla de base de datos La ejecucin de procedimientos que leen datos (por ejemplo, Frecuencias, Tablas de contingencia, Explorar)
Las acciones que crean una o ms columnas de datos en espacio temporal en disco son:
El clculo de nuevas variables La recodificacin de variables existentes La ejecucin de procedimientos que crean o modifican variables (por ejemplo, almacenamiento de valores pronosticados en Regresin lineal)
Las acciones que crean una copia completa del archivo de datos en espacio temporal en disco son:
79 Archivos de datos
La ejecucin de procedimientos que ordenan los datos (por ejemplo, Ordenar casos, Segmentar archivo) La lectura de datos con los comandos GET TRANSLATE o DATA LIST La utilizacin de la unidad Datos de cach o el comando CACHE La activacin de otras aplicaciones de SPSS que leen el archivo de datos (por ejemplo, AnswerTree, DecisionTime) Nota: El comando GET DATA proporciona una funcionalidad comparable a DATA LIST, sin crear una copia completa del archivo de datos en el espacio temporal del disco. El comando SPLIT FILE de la sintaxis de comandos no ordena el archivo de datos y por lo tanto no crea una copia del archivo de datos. Este comando, sin embargo, necesita tener los datos ordenados para un funcionamiento apropiado y la interfaz del cuadro de dilogo para este procedimiento ordenar de forma automtica el archivo de datos, con la consiguiente copia completa de dicho archivo. En la versin para estudiantes no est disponible la sintaxis de comandos.
Acciones que crean una copia completa del archivo de datos por defecto:
Lectura de bases de datos con el Asistente para bases de datos La lectura de archivos de texto con el Asistente para la importacin de texto El Asistente para la importacin de texto proporciona un ajuste opcional para crear de forma automtica una cach de los datos. Por defecto, se selecciona esta opcin. Para desactivar esta opcin, simplemente desmarque la casilla de verificacin Cach local de los datos. En el Asistente para bases de datos puede pegar la sintaxis de comando generada y eliminar el comando CACHE.
80 Captulo 3
leer los datos, la ejecucin de la consulta SQL se repite para cada procedimiento, lo que puede significar un importante incremento en el tiempo de procesamiento si se ejecuta un gran nmero de procedimientos. Si se dispone de suficiente espacio en disco en el ordenador que realiza el anlisis (el ordenador local o el servidor remoto), se pueden eliminar varias consultas SQL y mejorar el tiempo de procesamiento mediante la creacin de una cach de datos del archivo activo. La cach de datos es una copia temporal de todos los datos. Nota: Por defecto, el Asistente para bases de datos crea de forma automtica una cach de datos, pero si se utiliza el comando GET DATA en la sintaxis de comandos para leer una base de datos, no se crear una cach de datos de forma automtica. En la versin para estudiantes no est disponible la sintaxis de comandos.
ejemplo, la prxima vez que se ejecute un procedimiento estadstico), que ser lo que normalmente se quiera porque no necesita una lectura adicional de los datos. Crear cach ahora crea una cach de datos inmediatamente, lo cual no ser necesario la mayora de las veces. Crear cach ahora se utiliza principalmente por dos razones: Una fuente de datos est bloqueada y no se puede actualizar por nadie hasta que finalice la sesin actual, abra una fuente de datos diferente o haga una cach de los datos. Para grandes fuentes de datos, el desplazamiento por el contenido de la pestaa Vista de datos en el Editor de datos ser mucho ms rpido si se hace una cach de datos.
81 Archivos de datos
cambios realizados en el archivo de datos activo antes de crear una cach del archivo).
E En los mens de la ventana de sintaxis, elija: Ejecutar Todos
Nota: El ajuste de la cach no se almacena entre sesiones. Cada vez que se inicia una nueva sesin, se toma el valor por defecto de la opcin que es 20.
Captulo
El anlisis en modo distribuido permite utilizar un ordenador que no es el local (o de escritorio) para realizar trabajos que requieren un gran consumo de memoria. Debido a que los servidores remotos utilizados para anlisis distribuidos son normalmente ms potentes y rpidos que los ordenadores locales, un anlisis en modo distribuido puede reducir significativamente el tiempo de procesamiento del ordenador. El anlisis distribuido con un servidor remoto puede ser til si el trabajo trata: Archivos de datos, en particular lecturas de datos de fuentes de bases de datos. Tareas que requieren un gran consumo de memoria. Cualquier tarea que tarde bastante tiempo en el anlisis en modo local ser una buena candidata para el anlisis distribuido, El anlisis distribuido slo afecta a las tareas relacionadas con los datos, como lectura de datos, transformacin de datos, clculo de nuevas variables y clculo de estadsticos. El anlisis distribuido no tiene ningn efecto sobre tareas relacionadas con la edicin de resultados, como la manipulacin de tablas pivote o la modificacin de grficos. Nota: El anlisis distribuido est disponible slo si ambos equipos tienen una versin local y acceso a una versin de servidor con licencia del software instalado en un servidor remoto.
se ejecutarn con mayor rapidez en modo distribuido si el servidor dispone de un acceso superior a la base de datos o si el servidor se est ejecutando en la misma
83
84 Captulo 4
mquina que el motor de base de datos. Asimismo, si el software necesario para acceder a la base de datos slo est disponible en el servidor o si el administrador de red no permite descargar grandes tablas de datos, slo podr acceder a la base de datos en modo distribuido.
Relacin entre clculos y resultados. Los comandos que ms aprovechan la ejecucin
en modo distribuido son comandos que realizan gran cantidad de clculos y generan pocos resultados de salida (por ejemplo, tablas pivote pequeas y pocas, breves resultados de texto, o pocos y sencillos grficos). El grado de mejora depende sobre todo de la capacidad de clculo del servidor remoto.
Trabajos pequeos. Los trabajos que se ejecutan con rapidez en modo local, siempre se ejecutarn ms lentamente en modo distribuido debido a la carga general inherente al cliente /servidor. Grficos. Los grficos orientados a los casos, como los diagramas de dispersin, los
grficos de residuos de regresin y los grficos de secuencia, necesitan que los datos brutos se encuentren en el ordenador local. Para archivos de datos y tablas de bases de datos grandes, este proceso puede repercutir en un descenso del rendimiento en el modo distribuido debido a que los datos deben enviarse desde el servidor remoto al ordenador local. Otros grficos se basan en datos resumidos o agregados y deben realizarse de forma adecuada ya que la agregacin se lleva a cabo en el servidor.
Grficos interactivos. Si los datos brutos se guardan con los grficos interactivos (un ajuste opcional), puede producir que se transfieran grandes cantidades de datos desde el servidor remoto al ordenador local, incrementando de forma significativa el tiempo que se tarda en guardar los resultados. Tablas pivote. Las tablas pivote grandes pueden tardar ms en crearse en el modo
distribuido. Esta situacin es particularmente cierta para el procedimiento Cubos OLAP y para las tablas que contienen datos sobre los casos individuales, como las disponibles en el procedimiento Resumir.
Resultados de texto. Cuanto ms texto se produzca, ms lentos sern los resultados en modo distribuido, ya que este texto se genera en el servidor remoto y se copia al ordenador local para ser visualizado. Sin embargo, los resultados de texto tienen una carga general pequea y suelen transmitirse rpidamente.
Acceso al servidor
El cuadro de dilogo Acceso al servidor permite seleccionar el ordenador para procesar comandos y ejecutar procedimientos. Puede seleccionar el ordenador local o un servidor remoto.
Figura 4-1 Cuadro de dilogo Acceso al servidor
Se pueden aadir, modificar o eliminar servidores remotos de la lista. Los servidores remotos requieren normalmente un ID de usuario y una contrasea; tambin puede ser necesario un nombre de dominio. Pngase en contacto con el administrador del sistema para obtener informacin acerca de servidores, ID de usuario y contraseas, nombres de dominio disponibles y dems informacin necesaria para la conexin. Puede seleccionar un servidor por defecto y guardar el ID de usuario, nombre de dominio y contrasea asociados a cualquier servidor. De esta manera, se conectar de forma automtica al servidor por defecto en el momento de iniciar la sesin.
Para obtener una lista de servidores disponibles, los nmeros de puerto para dichos servidores y toda la informacin adicional necesaria para la conexin, pngase en contacto con el administrador del sistema. No utilice el Nivel de socket seguro a menos que lo indique el administrador.
Nombre del servidor. Un nombre de servidor puede ser un nombre alfanumrico
asignado a un ordenador (por ejemplo, ServidorRed) o una direccin IP nica asignada a un ordenador (por ejemplo, 202.123.456.78).
Nmero de puerto. El nmero de puerto es el puerto que el software del servidor
lista de servidores.
Conectar con Nivel de socket seguro. Las encriptaciones de Nivel de socket seguro
(SSL) requieren el anlisis distribuido cuando se envan al servidor remoto de SPSS. Antes de utilizar el SSL, consulte con el administrador. Para que esta opcin se active, SSL debe estar configurado en su equipo de escritorio y en el servidor.
desea utilizar.
E Introduzca el ID de usuario, nombre de dominio y contrasea suministrados por
el administrador. Nota: De esta manera, se conectar de forma automtica al servidor por defecto en el momento de iniciar la sesin.
Para cambiar a otro servidor:
E Seleccione el servidor de la lista. E Introduzca el ID de usuario, nombre de dominio y contrasea (si es necesario).
Nota: Al cambiar de servidor durante una sesin, se cierran todas las ventanas abiertas. Se solicitar guardar los cambios antes de que se cierren las ventanas.
Para aadir un servidor:
E Solicite al administrador la informacin de conexin del servidor. E Pulse en Aadir para abrir el cuadro de dilogo Configuracin del acceso al servidor. E Introduzca la informacin de conexin y la configuracin opcional y pulse en Aceptar.
88 Captulo 4
En el anlisis en modo distribuido, el cuadro de dilogo Abrir archivo remoto sustituye al cuadro de dilogo estndar Abrir archivo. El contenido de la lista de archivos, carpetas y unidades muestra lo que hay disponible en o desde el servidor remoto. En la parte superior del cuadro de dilogo se indica el nombre del servidor actual. En el anlisis en modo distribuido, slo tendr acceso a los archivos del equipo local si especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos como carpetas compartidas. Si el servidor est ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondr de acceso a los archivos de datos locales en el anlisis en modo distribuido, aunque los archivos estn en carpetas compartidas.
o
Archivo Abrir base de datos
o
Archivo Leer datos de texto...
En el anlisis en modo distribuido, el cuadro de dilogo Guardar archivo remoto sustituye al cuadro de dilogo estndar Guardar archivo. El contenido de la lista de carpetas y unidades muestra lo que hay disponible en o desde el servidor remoto. En la parte superior del cuadro de dilogo se indica el nombre del servidor actual. Slo tendr acceso a las carpetas del equipo
90 Captulo 4
local si especifica la unidad como un dispositivo compartido y las carpetas como carpetas compartidas. Si el servidor est ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondr de acceso a los archivos de datos locales en el anlisis en modo distribuido, aunque los archivos estn en carpetas compartidas. Si quiere guardar archivos de datos en una carpeta local, los derechos sobre las carpetas compartidas deben incluir el permiso de escritura en la carpeta.
para ejecutar comandos y procedimientos, la visualizacin de los archivos de datos y las unidades representa la vista desde el servidor remoto. Aunque vea nombres de carpetas que le son familiares (como Archivos de programas y unidades como C), estas no son las carpetas y unidades del ordenador local, sino las del servidor remoto.
91 Anlisis en modo distribuido Figura 4-5 Vistas de los equipos local y remoto
En el anlisis en modo distribuido, slo tendr acceso a los archivos de datos del equipo local si especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos como carpetas compartidas. Si el servidor est ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondr de acceso a los archivos de datos locales en el anlisis en modo distribuido, aunque los archivos estn en carpetas compartidas. El anlisis en modo distribuido no es lo mismo que acceder a archivos de datos que se encuentran en otro ordenador de la red. Se puede acceder a archivos de datos en otros dispositivos de red tanto en anlisis en modo local como en anlisis en modo distribuido. En modo local, se accede a otros dispositivos desde el ordenador local. En el modo distribuido, se accede a otros dispositivos de red desde el servidor remoto.
92 Captulo 4
Si no est seguro de si est utilizando el anlisis en modo local o distribuido, mire la barra de ttulo en el cuadro de dilogo para acceder a archivos de datos. Si el ttulo del cuadro de dilogo contiene la palabra remoto (como en Abrir archivo remoto) o si el texto Servidor remoto: [nombre del servidor] aparece en la parte superior del cuadro de dilogo, significa que est en modo distribuido. Nota: Esta situacin afecta slo a los cuadros de dilogo para acceder a archivos de datos (por ejemplo, Abrir datos, Guardar datos, Abrir base de datos y Aplicar diccionario de datos). Para todos los dems tipos de archivos (por ejemplo, archivos del Visor, archivos de sintaxis y archivos de procesos) se utiliza la visualizacin local.
Si desea obtener ms informacin acerca de compartir unidades y carpetas, consulte la ayuda del sistema operativo.
remoto. Si el directorio y/o archivo no existen en el servidor remoto, se generar un error en la sintaxis del comando, como en el siguiente ejemplo:
GET FILE='c:\misdocs\misdatos.sav'.
Si utiliza la versin de servidor de SPSS para Windows NT, puede usar las especificaciones de la UNC (convencin de denominacin universal) al acceder a los archivos de datos mediante la sintaxis de comandos. El formato general de una especificacin UNC es:
\\nombre_servidor\nombre_compartido\ruta\nombre_archivo
Nombre_servidor es el nombre del ordenador que contiene el archivo de datos. Nombre_compartido es la carpeta (directorio) en el ordenador que aparece designada como una carpeta compartida. Ruta es cualquier ruta de acceso de carpetas (subdirectorios) por debajo de la carpeta compartida. Nombre_archivo es el nombre del archivo de datos. A continuacin se muestra un ejemplo:
GET FILE = '\\hqdev001\public\julio\ventas.sav'.
Si el ordenador no tiene un nombre asignado, puede utilizar su direccin IP, como en:
GET FILE = '\\204.125.125.53\public\julio\ventas.sav'.
Incluso con especificaciones de ruta de acceso UNC, slo se puede acceder a archivos de datos que estn en carpetas y dispositivos compartidos. Cuando se utiliza anlisis en modo distribuido, esta situacin incluye archivos de datos del ordenador local.
Servidores UNIX. En las plataformas UNIX, no hay un equivalente a las rutas UNC y
todas las rutas de acceso de los directorios deben ser rutas absolutas que comienzan en la raz del servidor; las rutas relativas no estn permitidas. Por ejemplo, si el archivo de datos est ubicado en /bin/spss/datos y el directorio actual tambin es /bin/spss/datos, la sintaxis GET FILE='ventas.sav' no es vlida; se debe especificar la ruta completa, como en:
GET FILE='/bin/spss/datos/ventas.sav'.
Captulo
Editor de datos
El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para la creacin y edicin de archivos de datos. La ventana Editor de datos se abre automticamente cuando se inicia una sesin. El Editor de datos proporciona dos vistas de los datos.
Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de
valor definidas.
Vista de variables. Esta vista muestra la informacin de definicin de las variables,
que incluye las etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha y numrico), nivel de medida (nominal, ordinal o de escala) y los valores perdidos definidos por el usuario. En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el archivo de datos.
95
96 Captulo 5
Vista de datos
Figura 5-1 Vista de datos
Muchas de las funciones de la Vista de datos son similares a las que se encuentran en aplicaciones de hojas de clculo. Sin embargo, existen varias diferencias importantes: Las filas son casos. Cada fila representa un caso o una observacin. Por ejemplo, cada individuo que responde a un cuestionario es un caso. Las columnas son variables. Cada columna representa una variable o una caracterstica que se mide. Por ejemplo, cada elemento en un cuestionario es una variable. Las casillas contienen valores. Cada casilla contiene un valor nico de una variable para cada caso. La casilla se encuentra en la interseccin del caso y la variable. Las casillas slo contienen valores de datos. A diferencia de los programas de hoja de clculo, las casillas del Editor de datos no pueden contener frmulas. El archivo de datos es rectangular. Las dimensiones del archivo de datos vienen determinadas por el nmero de casos y de variables. Se pueden introducir datos en cualquier casilla. Si introduce datos en una casilla fuera de los lmites del archivo de datos definido, el rectngulo de datos se ampliar para incluir todas las filas y columnas situadas entre esa casilla y los lmites del archivo. No hay casillas vacas en los lmites del archivo de datos. Para variables numricas, las
97 Editor de datos
casillas vacas se convierten en el valor perdido del sistema. Para variables de cadena, un espacio en blanco se considera un valor vlido.
Vista de variables
Figura 5-2 Vista de variables
La Vista de variables contiene descripciones de los atributos de cada variable del archivo de datos. En la Vista de variables: Las filas son variables. Las columnas son atributos de las variables. Se pueden aadir o eliminar variables, y modificar los atributos de las variables, incluidos los siguientes: Nombre de variable Tipo de datos Nmero de dgitos o caracteres
98 Captulo 5
Nmero de decimales Las etiquetas descriptivas de variable y de valor Valores perdidos definidos por el usuario Ancho de columna Nivel de medida Todos estos atributos se guardan al guardar el archivo de datos. Adems de la definicin de propiedades de variables en la Vista de variables, hay dos otros mtodos para definir las propiedades de variables: El Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo de datos de SPSS externo u otro conjunto de datos que est disponible en la sesin actual como plantilla para definir las propiedades del archivo y las variables del conjunto de datos activo. Tambin puede utilizar las variables del conjunto de datos activo como plantillas para otras variables del conjunto de datos activo. La opcin Copiar propiedades de datos est disponible en el men Datos en la ventana Editor de datos. La opcin Definir propiedades de variables (tambin disponible en el men Datos de la ventana Editor de datos) explora los datos y muestra una lista con todos los valores de datos nicos para las variables seleccionadas, indica los valores sin etiquetas y ofrece una funcin de etiquetas automticas. Este mtodo es especialmente til para las variables categricas que utilizan cdigos numricos para representar las categoras (por ejemplo, 0 = hombre, 1 = mujer).
99 Editor de datos
Nombres de variable
Para los nombres de variable se aplican las siguientes normas: El nombre debe comenzar por una letra. Los dems caracteres pueden ser letras, dgitos, puntos o los smbolos @, #, _ o $. Los nombres de variable no pueden terminar en punto. Se debe evitar acabar los nombres de variable con subrayado (para evitar conflictos con las variables creadas automticamente por algunos procedimientos). La longitud del nombre no debe exceder los 64 bytes. Normalmente, 64 bytes suelen equivaler a 64 caracteres en idiomas de un solo byte (por ejemplo, ingls, francs, alemn, espaol, italiano, hebreo, ruso, griego, rabe, tailands) y a 32 caracteres en los idiomas de dos bytes (por ejemplo, japons, chino, coreano). No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, !, ?, y *). Cada nombre de variable debe ser nico; no se permiten duplicados. Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras reservadas son: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. Los nombres de variable se pueden definir combinando de cualquier manera caracteres en maysculas y en minsculas, esta distincin entre maysculas y minsculas se conserva en lo que se refiere a la presentacin. Cuando es necesario dividir los nombres largos de variable en varias lneas en los resultados, SPSS intenta dividir las lneas aprovechando los subrayados, los puntos y los cambios de minsculas a maysculas.
representan categoras que no obedecen a una ordenacin intrnseca. Por ejemplo, el departamento de la compaa en el que trabaja un empleado. Son ejemplos de variables nominales: la regin, el cdigo postal o la confesin religiosa.
100 Captulo 5
Ordinal. Una variable puede ser tratada como ordinal cuando sus valores
representan categoras con alguna ordenacin intrnseca. Por ejemplo los niveles de satisfaccin con un servicio, que vayan desde muy insatisfecho hasta muy satisfecho. Son ejemplos de variables ordinales: las puntuaciones de actitud que representan el nivel de satisfaccin o confianza y las puntuaciones de evaluacin de la preferencia.
Escala. Una variable puede ser tratada como de escala cuando sus valores
representan categoras ordenadas con una mtrica con significado, por lo que son adecuadas las comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en aos y los ingresos en dlares. Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio (orden que no es el correcto). Por norma general, se puede indicar que es ms fiable utilizar cdigos numricos para representar datos ordinales. Para las nuevas variables creadas durante una sesin, los datos ledos de los formatos de archivo externos y los archivos de datos SPSS creados antes de la versin 8, la asignacin del nivel de medida por defecto se basa en las siguientes reglas: Las variables numricas con menos de 24 valores nicos y las variables de cadena se establecen en nominales. Las variables numricas con 24 o ms valores nicos se establecen en variables de escala. Se puede cambiar el valor de corte de escala/nominal para las variables numricas en el cuadro de dilogo Opciones. Si desea obtener ms informacin, consulte Opciones de grficos interactivos en Captulo 44 en p. 654. El cuadro de dilogo Definir propiedades de variables, disponible en el men Datos, puede ayudarle a asignar el nivel de medida correcto. Si desea obtener ms informacin, consulte Asignacin del nivel de medida en Captulo 7 en p. 129.
Tipo de variable
Tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume que todas las variables nuevas son numricas. Se puede utilizar Tipo de variable para cambiar el tipo de datos. El contenido del cuadro de dilogo Tipo de variable depende del tipo de datos seleccionado. Para algunos tipos de datos, hay cuadros de texto para la anchura y el nmero de decimales; para otros tipos de datos, simplemente puede seleccionar un formato de una lista desplegable de ejemplos.
Figura 5-3 Cuadro de dilogo Tipo de variable
formato numrico estndar. El Editor de datos acepta valores numricos en formato estndar o en notacin cientfica.
Coma. Una variable numrica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin comas, o bien en notacin cientfica. Los valores no pueden contener comas a la derecha del indicador decimal. Punto. Una variable numrica cuyos valores se muestran con puntos que delimitan
cada tres posiciones y con la coma como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin puntos, o bien en notacin cientfica. Los valores no pueden contener puntos a la derecha del indicador decimal.
Notacin cientfica. Una variable numrica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una potencia de base diez. El Editor de datos acepta para estas variables valores numricos con o sin el exponente.
102 Captulo 5
El exponente puede aparecer precedido por una E o una D con un signo opcional, o bien slo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y 1,23+2).
Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o espacios. El rango de siglo para los valores de ao de dos dgitos est determinado por la configuracin de las opciones (en el men Edicin, seleccione Opciones y, a continuacin, pulse en la pestaa Datos). Dlar. Una variable numrica que se muestra con un signo dlar inicial ($), comas que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el signo dlar inicial. Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de
los formatos de moneda personalizados que se hayan definido previamente en la pestaa Moneda del cuadro de dilogo Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en la introduccin de datos pero s se mostrarn en el Editor de datos.
Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se utilizan
en los clculos. Los valores pueden contener cualquier carcter siempre que no se exceda la longitud definida. Las maysculas y las minsculas se consideran diferentes. Este tipo tambin se conoce como variable alfanumrica.
Etiquetas de variable
Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128 caracteres en los idiomas de doble byte). Las etiquetas de variable pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable.
104 Captulo 5
Etiquetas de valor
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras que no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer). Las etiquetas de valor pueden ocupar hasta 120 bytes. Las etiquetas de valor no estn disponibles para las variables de cadena larga (variables de cadena de ms de 8 caracteres).
Figura 5-4 Cuadro de dilogo Etiquetas de valor
105 Editor de datos E Para cada valor, escriba el valor y una etiqueta. E Pulse en Aadir para introducir la etiqueta de valor. E Pulse en Aceptar.
Vista de variables del Editor de datos, pulse en el botn de casilla y, a continuacin, seleccione la etiqueta que desea modificar en el cuadro de dilogo Etiquetas de valor.
E En el punto de la etiqueta en el que desea dividir la etiqueta, escriba \n.
El \n no aparece en las tablas pivote ni en los grficos; se interpreta como un carcter de salto de lnea.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos.
Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto. Slo pueden especificarse rangos para las variables numricas. No se pueden definir valores perdidos para variables de cadena larga (variables de cadena de ms de ocho caracteres).
Valores perdidos para las variables de cadena. Se considera que son vlidos todos
los valores de cadena, incluidos los valores vacos o nulos, a no ser que se definan explcitamente como perdidos. Para definir como perdidos los valores nulos o vacos de una variable de cadena, escriba un espacio en blanco en uno de los campos debajo de la seleccin Valores perdidos discretos.
Se considera que son vlidos todos los valores de cadena, incluidos los valores vacos o nulos, a no ser que se definan explcitamente como perdidos. Para definir como perdidos los valores nulos o vacos de una variable de cadena, escriba un espacio en blanco en uno de los campos debajo de la seleccin Valores perdidos discretos.
Ancho de columna
Se puede especificar un nmero de caracteres para el ancho de la columna. Los anchos de columna tambin se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de las columnas. Los formatos de columna afectan slo a la presentacin de valores en el Editor de datos. Al cambiar el ancho de columna no se cambia el ancho definido de una variable. Si el ancho real y definido de un valor es ms ancho que la columna, aparecern asteriscos (*) en la ventana Vista de datos.
Alineacin de la variable
La alineacin controla la presentacin de los valores de los datos y/o de las etiquetas de valor en la Vista de datos. La alineacin por defecto es a la derecha para las variables numricas y a la izquierda para las variables de cadena. Este ajuste slo afecta a la presentacin en la Vista de datos.
variables.
108 Captulo 5 E Elija en los mens: Edicin Copiar E Seleccione la casilla de atributos a la que quiere aplicar el atributo. (Puede seleccionar
Si pega el atributo en filas vacas, se crean nuevas variables con atributos por defecto para todos los atributos excepto para el seleccionado.
Para aplicar todos los atributos de una variable definida:
E En la Vista de variables, seleccione el nmero de fila para la variable con los atributos
atributos que quiere utilizar para la nueva variable. (Se resaltar la fila entera.)
E Elija en los mens: Edicin Copiar E Pulse en el nmero de la fila vaca situada bajo la ltima variable definida en el
archivo de datos.
109 Editor de datos E Elija en los mens: Edicin Pegar variables... E En el cuadro de dilogo Pegar variables, escriba el nmero de variables que desea
crear.
E Introduzca un prefijo y un nmero inicial para las nuevas variables. E Pulse en Aceptar.
Los nombres de las nuevas variables se compondrn del prefijo especificado, ms un nmero secuencial que comienza por el nmero indicado.
Introduccin de datos
En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se puede introducir datos en cualquier orden. Asimismo, se pueden introducir datos por caso o por variable, para reas seleccionadas o para casillas individuales. Se resaltar la casilla activa. El nombre de la variable y el nmero de fila de la casilla activa aparecen en la esquina superior izquierda del Editor de datos. Cuando seleccione una casilla e introduzca un valor de datos, el valor se muestra en el editor de casillas situado en la parte superior del Editor de datos. Los valores de datos no se registran hasta que se pulsa Intro o se selecciona otra casilla. Para introducir datos distintos de los numricos, en primer lugar, se debe definir el tipo de variable. Si introduce un valor en una columna vaca, el Editor de datos crear automticamente una nueva variable y asignar un nombre de variable.
De este modo se introducir el valor y la etiqueta de valor se mostrar en la casilla. Nota: este proceso slo funciona si ha definido etiquetas de valor para la variable.
Edicin de datos
Con el Editor de datos es posible modificar los valores de datos de la Vista de datos de muchas maneras. Tiene la posibilidad de: Cambiar los valores de datos. Cortar, copiar y pegar valores de datos. Aadir y eliminar casos. Aadir y eliminar variables. Cambiar el orden de las variables.
112 Captulo 5
casillas.)
E Edite el valor directamente en la casilla o en el editor de casillas. E Pulse Intro (o desplcese a otra casilla) para registrar el valor nuevo.
es uno de los formatos da-mes-ao, pero se convierte en perdido por el sistema si el tipo de formato de la casilla de destino es uno de los formatos mes-da-ao.
Conversin de fecha a numrico. Los valores de fecha y hora se convierten a un nmero
de segundos si la casilla de destino es uno de los formatos numricos (por ejemplo, numrico, dlar, de punto o de coma). Al almacenarse internamente las fechas como el nmero de segundos transcurridos desde el 14 de octubre de 1582, la conversin de fechas a valores numricos puede generar nmeros extremadamente grandes. Por ejemplo, la fecha 10/29/91 se convierte al valor numrico 12.908.073.600.
Conversin de numrico a fecha u hora. Los valores numricos se convierten a fechas u
horas si el valor representa un nmero de segundos que puede producir una fecha u hora vlidos. Para las fechas, los valores numricos menores que 86.400 se convierten al valor perdido del sistema.
Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del sistema.
114 Captulo 5
Se insertar una nueva variable con el valor perdido del sistema para todos los casos.
variable sobre la columna de variables a la derecha del lugar donde desea colocar la variable, o en la Vista de variables, arrastre la variable a la fila de variables debajo de donde desee colocarla.
Ir a caso
El cuadro de dilogo Ir a caso permite ir al nmero de caso (fila) especificado en el Editor de datos.
Figura 5-7 Cuadro de dilogo Ir a caso
para el caso.
116 Captulo 5
de cuadrcula.
Etiquetas de valor. Esta opcin activa y desactiva la presentacin de los valores reales
de los datos y las etiquetas de valor descriptivas definidas por el usuario. Esta opcin slo est disponible en la Vista de datos.
Uso de varias vistas
En la Vista de datos, puede crear varias vistas (paneles) mediante los divisores situados sobre la barra de desplazamiento horizontal y a la derecha de la barra de desplazamiento vertical.
Tambin puede utilizar el men Ventana para insertar y eliminar divisores de paneles. Para insertar divisores:
E En la Vista de datos, elija en los mens: Ventana Dividir
Los divisores se insertan sobre y a la izquierda de la casilla seleccionada. Si se ha seleccionado la casilla superior izquierda, los divisores se insertan para dividir la vista actual aproximadamente por la mitad horizontal y verticalmente. Si se selecciona una casilla distinta de la casilla superior de la primera columna, se inserta un divisor de paneles horizontales sobre la casilla seleccionada. Si se selecciona una casilla distinta de la primera casilla de fila superior, se inserta un divisor de paneles verticales a la izquierda de la casilla seleccionada.
118 Captulo 5
Las lneas de cuadrcula se imprimen si aparecen actualmente en la vista seleccionada. Las etiquetas de valor se imprimen si aparecen actualmente en la Vista de datos. En caso contrario, se imprimirn los valores de datos reales. Utilice el men Ver en la ventana Editor de datos para mostrar u ocultar las lneas de cuadrcula y para que se muestren o no los valores de los datos y las etiquetas de valor.
Captulo
A partir de SPSS 14.0, SPSS puede tener varias fuentes de datos abiertas al mismo tiempo, lo que facilita: Cambiar de una fuente de datos a otra. Comparar el contenido de diferentes fuentes de datos. Copiar y pegar datos entre fuentes de datos. Crear varios subconjuntos de casos y/o variables para su anlisis. Fundir varias fuentes de datos con diferentes formatos de datos (por ejemplo, hojas de clculo, bases de datos, datos en texto) sin tener que guardar antes cada fuente de datos en el formato de SPSS.
119
120 Captulo 6
Cada fuente de datos que se abra aparecer en una nueva ventana del Editor de datos. Todas las fuentes de datos que haya abierto anteriormente permanecern abiertas y estarn disponibles para su uso. Al abrir por primera vez una fuente de datos, se convierte automticamente en el conjunto de datos activo. Para cambiar el conjunto de datos activo basta con pulsar en cualquier parte de la ventana del Editor de datos de la fuente de datos que desee utilizar o bien seleccionar la ventana del Editor de datos correspondiente a dicha fuente de datos en el men Ventana.
Slo ser posible analizar las variables del conjunto de datos activo.
Figura 6-2 Lista de variables con las variables del conjunto de datos activo
No se puede cambiar el conjunto de datos activo mientras est abierto cualquier cuadro de dilogo que acceda a los datos (incluidos todos los cuadros de dilogo que muestran las listas de variables). Al menos una ventana del Editor de datos debe estar abierta durante una sesin. Al cerrar la ltima ventana abierta del Editor de datos, SPSS se cierra automticamente, preguntndole antes si desea guardar los cambios. Nota: Si utiliza la sintaxis de comandos con las fuentes de datos abiertas (por ejemplo,
GET FILE, GET DATA), deber indicar explcitamente el nombre de cada conjunto
de datos para poder tener ms de una fuente de datos abierta al mismo tiempo.
122 Captulo 6
de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99.
Captulo
Preparacin de datos
Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podr empezar a crear informes, grficos y anlisis sin ningn trabajo preliminar adicional. Sin embargo, hay algunas funciones de preparacin adicional de los datos que pueden resultarle tiles, entre las que se incluyen: Asignar propiedades de las variables que describan los datos y determinen cmo se deben tratar ciertos valores. Identificar los casos que pueden contener informacin duplicada y excluir dichos casos de los anlisis o eliminarlos del archivo de datos. Crear nuevas variables con algunas categoras distintas que representen rangos de valores de variables que tengan un mayor nmero de valores posibles.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o ledos en SPSS desde un formato de archivos externo (como una hoja de clculo de Excel o un archivo de datos de texto) carecen de ciertas propiedades de variables que pueden resultar muy tiles, como: Definicin de etiquetas de valor descriptivas para cdigos numricos (por ejemplo, 0 = Hombre y 1 = Mujer). Identificacin de cdigos de valores perdidos (por ejemplo, 99 = No procede). Asignacin del nivel de medida (nominal, ordinal o de escala).
123
124 Captulo 7
Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del Editor de datos. Tambin hay algunas utilidades que le pueden ofrecer asistencia en este proceso:
Definir propiedades de variables puede ayudarle a definir etiquetas de valor
descriptivas y valores perdidos. Esto es especialmente til para datos categricos con cdigos numricos utilizados para valores de categoras.
Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos
con formato SPSS como plantilla para definir las propiedades de variables y archivos en el archivo de datos actual. Esto es particularmente til si utiliza frecuentemente archivos de datos con un formato externo que tenga un contenido similar, como puedan ser informes mensuales en formato Excel.
125 Preparacin de datos Figura 7-1 Cuadro de dilogo inicial para seleccionar las variables que se van a definir
E Seleccione las variables numricas o de cadena corta para las que desea crear etiquetas
de valor o definir o cambiar otras propiedades de las variables, como los valores perdidos o las etiquetas de variable descriptivas. Nota: Las variables de cadena largas (variables de cadena con una anchura definida de ms de ocho caracteres) no se visualizan en la lista de variables. Las variables de cadena largas no pueden tener etiquetas de valor definidas ni categoras de valores perdidos.
E Especificar el nmero de casos que se van a explorar para generar la lista de valores
nicos. resulta especialmente til para los archivos de datos con mayor nmero de casos, para el cual una exploracin del archivo de datos completo podra tardar una gran cantidad de tiempo.
E Especifique un lmite superior para el nmero de valores nicos que se va a visualizar.
Esto es especialmente til para evitar que se generen listas de cientos, miles o incluso millones de valores para las variables de escala (intervalo continuo, razn).
126 Captulo 7 E Pulse en Continuar para abrir el cuadro de dilogo Definir propiedades de variables
principal.
E Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar
dichos valores, puede introducirlos en la columna Valores por debajo del ltimo valor explorado.
E Repita este proceso para cada variable de la lista para la que desee crear etiquetas
de valor.
E Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
El cuadro de dilogo principal Definir propiedades de las variables proporciona la siguiente informacin para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecer una marca de
verificacin en la columna Sin etiqueta indicando que la variable contiene valores sin etiquetas de valor asignadas. Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la parte superior de la lista:
E Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables
exploradas. Tambin puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de columna correspondiente debajo de la Lista de variables exploradas.
Rejilla etiqueta valores Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede aadir o
se basa en el nmero de casos explorados. Por ejemplo, si slo ha explorado los primeros 100 casos del archivo de datos, la lista reflejar slo los valores nicos presentes en esos casos. Si el archivo de datos ya se ha ordenado por la variable para la que desea asignar etiquetas de valor, la lista puede mostrar muchos menos valores nicos de los que hay realmente presentes en los datos.
Recuento. Nmero de veces que aparece cada valor en los casos explorados. Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la
designacin de la categora de los valores perdidos pulsando en la casilla de verificacin. Una marca indica que la categora se ha definido como categora perdida por el usuario. Si una variable ya tiene un rango de valores definidos como perdidos por el usuario (por ejemplo 90 - 99), no podr aadir ni eliminar categoras de valores perdidos para esa variable con Definir propiedades de variables. Puede utilizar la Vista de variables del Editor de datos para modificar las categoras de valores perdidos para la variable con rangos de valores perdidos. Si desea obtener ms informacin, consulte Valores perdidos en Captulo 5 en p. 105.
Cambiado. Indica que ha aadido o cambiado una etiqueta de valor.
128 Captulo 7
Nota: Si ha especificado 0 para el nmero de casos que se van a explorar en el cuadro de dilogo inicial, la rejilla etiqueta valores estar en blanco al principio, a excepcin de algunas etiquetas de valor ya existentes y/o categoras de valores perdidos definidas para la variable seleccionada. Adems, se desactivar el botn Sugerir para el nivel de medida.
Nivel de medida. Las etiquetas de valor son especialmente tiles para las variables
categricas (nominales u ordinales), y algunos procedimientos tratan a las variables categricas y de escala de manera diferente, por lo que a veces es importante asignar el nivel de medida correcto. Sin embargo, por defecto, todas las nuevas variables numricas se asignan al nivel de medida de escala. Por tanto, puede que muchas variables que son de hecho categricas, aparezcan inicialmente como variables de escala. Si no est seguro de qu nivel de medida debe asignar a una variable, pulse en Sugerir.
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a una o varias otras variables. Valores sin etiquetas. Para crear automticamente etiquetas para valores sin etiquetas,
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentacin. No puede cambiar el tipo fundamental de la variable (numrica o de cadena). Para las variables de cadena, slo puede cambiar la etiqueta de variable, no el formato de presentacin. Para las variables numricas, puede cambiar el tipo numrico (como numrico, fecha, dlar o moneda personalizada), el ancho (nmero mximo de dgitos, incluyendo los indicadores decimales y/o de agrupacin) y el nmero de posiciones decimales. Para el formato de fecha numrica, puede seleccionar un formato de fecha especfico (como dd-mm-aaaa, mm/dd/aa, aaaaddd, etc.) Para formato numrico personalizado, puede seleccionar uno de los cinco formatos de moneda personalizados (de CCA a CCE). Si desea obtener ms informacin, consulte Moneda: Opciones en Captulo 44 en p. 659.
Aparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categoras de valores perdidos. Aparece un perodo (.) si los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categoras de valores perdidos no son vlidos para el tipo de formato de presentacin seleccionado. Por ejemplo, un valor numrico interno inferior a 86.400 no es vlido para una variable de formato de fecha.
130 Captulo 7
Nota: Los valores definidos para representar valores perdidos no se incluyen en la evaluacin para el nivel de medida. Por ejemplo, la explicacin del nivel de medida sugerido puede indicar que la sugerencia se basa, en parte, en el hecho de que la variable no contiene valores negativos, mientras que, de hecho, puede contener valores negativos, pero dichos valores ya se han definido como valores perdidos.
E Pulse en Continuar para aceptar el nivel de medida sugerido o en Cancelar para
mantener el mismo.
131 Preparacin de datos E Seleccione una nica variable desde la que va a copiar las etiquetas de valor y otras
Las etiquetas de valor existentes y categoras de valores perdidos para las variables de destino no se sustituyen. Las etiquetas de valor y las categoras de valores perdidos para los valores que no se han definido an para las variables de destino se aaden al conjunto de etiquetas de valor y categoras de valores perdidos para las variables de destino. El nivel de medida para las variables de destino siempre se sustituye. Si la variable de origen o de destino tiene un rango definido de valores perdidos, no se copian las definiciones de los valores perdidos.
132 Captulo 7
Editor de datos.Si desea obtener ms informacin, consulte Copia de propiedades de datos en p. 135.)
puede tener hasta 63 bytes. De forma automtica, se aade un signo dlar al comienzo del nombre del conjunto.
E Escriba una etiqueta descriptiva para el conjunto. (Esto es opcional.)
133 Preparacin de datos E Pulse Aadir para aadir el conjunto de respuestas mltiples a la lista de conjuntos
definidos.
Dicotomas
Un conjunto de dicotomas mltiples se compone normalmente de mltiples variables dicotmicas: variables con slo dos valores posibles del tipo s/no, presente/ausente, seleccionado/no seleccionado. Si bien las variables pueden no ser estrictamente dicotmicas, todas las variables del conjunto se codifican de la misma manera, y el valor contado representa la condicin correspondiente a afirmativo/presente/seleccionado. Por ejemplo, una encuesta formula la pregunta, En cules de las siguientes fuentes confa para obtener noticias? y proporciona cinco posibles respuestas. El encuestado puede sealar varias opciones marcando un cuadro situado junto a cada opcin. Las cinco respuestas se convierten en cinco variables en el archivo de datos, con las codificaciones 0 para No (no seleccionado) y 1 para S (seleccionado). En el conjunto de dicotomas mltiples, el valor contado es 1. El archivo de datos de muestra survey_sample.sav (en el directorio tutorial/sample_files del directorio de instalacin) ya tiene tres conjuntos de respuestas mltiples definidos. $mltnews es un conjunto de dicotomas mltiples.
E Seleccione (pulse en) $mltnews en la lista Conjuntos de respuestas mltiples.
Con ello se muestran las variables y las opciones utilizadas para definir este conjunto de respuestas mltiples. La lista Variables del conjunto, muestra las cinco variables utilizadas para construir el conjunto de respuestas mltiples. El grupo Las variables estn codificadas como indica que las variables son dicotmicas. El valor contado es 1.
E Seleccione (pulse en) una de las variables de la lista Variables del conjunto. E Pulse con el botn derecho del ratn en la variable y seleccione Informacin sobre la variable en el men contextual emergente. E En la ventana Informacin sobre la variable, pulse en la flecha de la lista desplegable
134 Captulo 7 Figura 7-6 Informacin de las variables para una variable origen de dicotomas mltiples
Las etiquetas de valor indican que la variable es una dicotoma con valores de 0 y 1, que representan No y S, respectivamente. Las cinco variables de la lista estn codificadas de la misma manera y el valor de 1 (el cdigo para S) es el valor contado para el conjunto de dicotomas mltiples.
Categoras
Un conjunto de categoras mltiples se compone de varias variables, todas ellas codificadas de la misma manera, a menudo con muchas posibles categoras de respuestas. Por ejemplo, un elemento de la encuesta pregunta, Nombre hasta tres nacionalidades que mejor describan su herencia tnica. Puede haber cientos de respuestas posibles, pero por cuestiones de codificacin se ha limitado la lista a las 40 nacionalidades ms comunes, con cualquier otra opcin relegada a la categora otras. En el archivo de datos, las tres opciones se convierten en tres variables, cada una con 41 categoras (40 nacionalidades codificadas ms la categora otras). En el archivo de datos de muestra, $ethmult y $mltcars son conjuntos de categoras mltiples.
Origen de etiquetas de categora
de variable para las variables que no tienen etiquetas de variable definidas) como las etiquetas de categora de conjunto. Por ejemplo, si todas las variables del conjunto tienen la misma etiqueta de valor (o no tienen etiquetas de valor definidas) para el valor contado (por ejemplo, S), debe utilizar las etiquetas de variable como las etiquetas de categora de conjunto.
Etiquetas de valores contados. Utiliza las etiquetas de valor definidas de los valores
contados como etiquetas de categora de conjunto. Seleccione esta opcin slo si todas las variables tienen una etiqueta de valor definida para el valor contado y la etiqueta de valor para el valor contado es distinta para cada variable.
Utilizar etiqueta de variable como etiqueta de conjunto. Si selecciona Etiquetas de
valores contados, tambin puede utilizar la etiqueta de variable para la primera
variable del conjunto con una etiqueta de variable definida como la etiqueta de conjunto. Si ninguna de las variables del conjunto tiene etiquetas de variable definidas, el nombre de la primera variable del conjunto se utiliza como la etiqueta de conjunto.
136 Captulo 7
Para utilizar el conjunto de datos activo como archivo de datos de origen, deber contener al menos una variable. No podr utilizar un conjunto de datos activo que est completamente en blanco como archivo de datos de origen. Las propiedades no definidas (vacas) del conjunto de datos de origen no sobrescriben las propiedades definidas en el conjunto de datos activo. Las propiedades de variable se copian desde la variable de origen nicamente a las variables de destino de un tipo coincidente: de cadena (alfanumricas) o numrico (incluidas numricas, fecha y moneda). Nota: En el men Archivo, Copiar propiedades de datos sustituir a Aplicar diccionario de datos, disponible anteriormente.
137 Preparacin de datos Figura 7-7 Asistente para la copia de propiedades de datos: Paso 1
E Seleccione el archivo de datos que contenga las propiedades de archivo y/o variable
que desee copiar. Puede ser un conjunto de datos abierto actualmente, un archivo de datos con formato SPSS externo o el conjunto de datos activo.
E Siga las instrucciones detalladas del Asistente para la copia de propiedades de datos.
138 Captulo 7 Figura 7-8 Asistente para la copia de propiedades de datos: Paso 2
Aplicar propiedades de variables del conjunto de datos de origen seleccionadas a variables coincidentes del conjunto de datos activo. Las propiedades de variable
se copian desde una o ms variables de origen seleccionadas en las variables coincidentes del conjunto de datos activo. Las variables coinciden si el nombre y el tipo de variable (de cadena o numrico) son los mismos. En el caso de las variables de cadena, la longitud tambin debe ser la misma. Por defecto, slo se muestran en las dos listas de variables las variables coincidentes.
Crear variables coincidentes en el conjunto de datos activo si an no existen.
Actualiza la lista de origen para que muestre todas las variables del archivo de datos de origen. Si se seleccionan variables de origen que no existen en el conjunto de datos activo (basndose en el nombre de variable), se crearn nuevas
variables en el conjunto de datos activo con los nombres y las propiedades de variable del archivo de datos de origen. Si el conjunto de datos activo no contiene variables (un nuevo conjunto de datos en blanco), se mostrarn todas las variables del archivo de datos de origen y se crearn automticamente en el conjunto de datos activo nuevas variables basadas en las variables de origen seleccionadas.
Aplicar propiedades de una nica variable de origen a variables seleccionadas del mismo tipo del conjunto de datos activo. Las propiedades de variable de una nica
variable seleccionada en la lista de origen se pueden aplicar a una o ms variables seleccionadas de la lista del conjunto de datos activo. En esta lista slo se mostrarn las variables que sean del mismo tipo (numrico o de cadena) que la variable seleccionada en la lista de origen. Si se trata de variables de cadena, slo se mostrarn las cadenas con la misma longitud definida que la variable de origen. Esta opcin no est disponible si el conjunto de datos activo no contiene variables. Nota: No se pueden crear nuevas variables en el conjunto de datos activo con esta opcin.
Aplicar slo propiedades de conjunto de datos (sin seleccin de variables). Slo se pueden aplicar al conjunto de datos activo las propiedades de archivo (por ejemplo, documentos, etiquetas de archivo, grosor). No se podr aplicar ninguna propiedad de variable. Esta opcin no est disponible si el conjunto de datos activo es tambin el archivo de datos de origen.
140 Captulo 7 Figura 7-9 Asistente para la copia de propiedades de datos: Paso 3
Etiquetas de valor. Las etiquetas de valor son etiquetas descriptivas asociadas a valores
de datos. Se suelen utilizar cuando se seleccionan valores de datos numricos para representar categoras no numricas (por ejemplo, cdigos 1 y 2 para Hombre y Mujer). Puede reemplazar o fundir las etiquetas de valor en las variables de destino.
Reemplazar elimina todas las etiquetas de valor definidas para la variable de
destino y las reemplaza por las etiquetas de valor definidas en la variable de origen.
Fundir funde las etiquetas de valor definidas en la variable de origen con cualquier
etiqueta de valor definida existente en la variable de destino. Si existe una etiqueta de valor definida con el mismo valor tanto en la variable de origen como en la de destino, la etiqueta de valor de la variable de destino permanecer inalterada.
Atributos personalizados. Atributos de variable personalizados, creados normalmente por el comando VARIABLE ATTRIBUTE en la sintaxis de comandos.
Reemplazar elimina todos los atributos personalizados para la variable de destino
de datos perdidos (por ejemplo, 98 para No sabe y 99 para No procede). Por lo general, estos valores tienen tambin etiquetas de valor definidas que describen el significado de cdigos de valores perdidos. Todos los valores perdidos existentes definidos para la variable de destino se eliminarn y se reemplazarn por los valores perdidos de la variable de origen.
Etiqueta de variable. Las etiquetas de variable descriptivas pueden contener espacios y caracteres reservados que no se permiten en los nombres de las variables. Si desea utilizar esta opcin para copiar propiedades de variable desde una variable de origen en varias variables de destino, reflexione antes de hacerlo. Nivel de medida. El nivel de medida puede ser nominal, ordinal o de escala. En los
procedimientos que diferencian entre los distintos niveles de medida, tanto el nivel nominal como el ordinal se consideran categricos.
Formatos. Controla el tipo numrico (como numrico, fecha o moneda), el ancho
(nmero total de caracteres que se muestran, incluidos los caracteres iniciales y finales y el indicador decimal) y el nmero de decimales que se van a mostrar para las variables numricas. Esta opcin no se tendr en cuenta para las variables de cadena.
Alineacin. Afecta nicamente a la alineacin (izquierda, derecha, central) del Editor de datos de la Vista de datos. Ancho de columna del Editor de datos. Afecta nicamente al ancho de columna de la
142 Captulo 7 Figura 7-10 Asistente para la copia de propiedades de datos: Paso 4
Conjuntos resp. mltiples. Aplica varias definiciones del conjunto de respuestas mltiples del archivo de datos de origen al conjunto de datos activo. (Nota: En este momento, nicamente el generador de grficos y el componente adicional Tablas utilizan los conjuntos de respuestas mltiples.)
Se ignorarn los conjuntos de respuestas mltiples del archivo de datos de origen que contengan variables no existentes en el conjunto de datos activo, a menos que se creen estas variables basndose en las especificaciones del paso 2 (Seleccin de las variables de origen y de destino) del Asistente para la copia de propiedades de datos.
143 Preparacin de datos Reemplazar elimina todos los conjuntos de respuestas mltiples del conjunto de
datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
Fundir aade los conjuntos de respuestas mltiples del archivo de datos de origen
a la coleccin de este tipo de conjuntos incluida en el conjunto de datos activo. En caso de que exista un conjunto con el mismo nombre en ambos archivos, el conjunto existente en el conjunto de datos activo permanecer inalterado.
Conjuntos de variables. Los conjuntos de variables se utilizan para controlar la lista
de variables que se muestra en los cuadros de dilogo. Para definir conjuntos de variables, seleccione Definir conjuntos en el men Utilidades. Se ignorarn los conjuntos del archivo de datos de origen que contengan variables no existentes en el conjunto de datos activo, a menos que se creen estas variables basndose en las especificaciones del paso 2 (Seleccin de las variables de origen y de destino) del Asistente para la copia de propiedades de datos.
Reemplazar elimina todos los conjuntos de variables existentes en el conjunto de
datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
Fundir aade los conjuntos de variables del archivo de datos de origen a la
coleccin de este tipo de conjuntos incluida en el conjunto de datos activo. En caso de que exista un conjunto con el mismo nombre en ambos archivos, el conjunto existente del conjunto de datos activo permanecer inalterado.
Documentos. Notas aadidas al archivo de datos a travs del comando DOCUMENT.
Reemplazar elimina todos los documentos existentes en el conjunto de datos
trabajo. Los documentos exclusivos del archivo de origen que no existan en el conjunto de datos activo se aadirn al conjunto de datos activo. A continuacin, todos los documentos se ordenarn por fecha.
Atributos personalizados. Atributos del archivo de datos personalizados, creados normalmente por el comando DATAFILE ATTRIBUTE en la sintaxis de comandos.
144 Captulo 7 Reemplazar elimina todos los atributos del archivo de datos personalizados
existentes en el conjunto de datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
Fundir combina los del archivo de datos de los conjuntos de datos de origen y
activo. Los nombres de atributos exclusivos del archivo de origen que no existan en el conjunto de datos activo se aadirn al conjunto de datos activo. En caso de que exista un atributo con el mismo nombre en ambos archivos de datos, el atributo con nombre existente en el conjunto de datos activo permanecer inalterado.
Especificacin de ponderacin. Pondera los casos por la variable de ponderacin
actual del archivo de datos de origen, siempre que exista una variable coincidente en el conjunto de datos activo. Sobrescribe cualquier ponderacin activada actualmente en el conjunto de datos activo.
Etiqueta de archivo. Etiqueta descriptiva que se aplica a un archivo de datos mediante el comando FILE LABEL.
Resultados
Figura 7-11 Asistente para la copia de propiedades de datos: Paso 5
El ltimo paso del Asistente para la copia de propiedades de datos proporciona informacin sobre el nmero de variables para las que se van a copiar las propiedades de variable del archivo de datos de origen, el nmero de nuevas variables que se van a crear y el nmero de propiedades (de archivo) de conjunto de datos que se van a copiar. Tambin puede pegar la sintaxis de comandos generada en una ventana de sintaxis y guardarla para su posterior uso.
146 Captulo 7
Si lo desea, puede:
E Seleccionar una o varias variables para ordenar los casos dentro de los bloques
definidos por las variables seleccionadas de casos coincidentes. El orden definido por estas variables determina el primer y el ltimo caso de cada bloque. En caso contrario, se utilizar el orden del archivo original.
E Filtrar automticamente los casos duplicados de manera que no se incluyan en los
147 Preparacin de datos Figura 7-12 Cuadro de dilogo Identificar casos duplicados
Definir casos coincidentes por. Los casos se consideran duplicados si sus valores
coinciden para todas las variables seleccionadas. Si desea identificar nicamente aquellos casos que coincidan al 100% en todos los aspectos, seleccione todas las variables.
Ordenar dentro de los bloques coincidentes por. Los casos se ordenan automticamente
por las variables que definen los casos coincidentes. Puede seleccionar otras variables de ordenacin que determinarn el orden secuencial de los casos en cada bloque de coincidencia. Para cada variable de ordenacin, el orden puede ser ascendente o descendente.
148 Captulo 7
Si selecciona ms de una variable de ordenacin, los casos se ordenarn por cada variable dentro de las categoras de la variable anterior de la lista. Por ejemplo, si selecciona fecha como la primera variable de ordenacin y cantidad como la segunda, los casos se ordenarn por cantidad dentro de cada fecha. Utilice los botones de flecha hacia arriba y hacia abajo que hay a la derecha de la lista para cambiar el orden de las variables. El orden determina el primer y el ltimo caso de cada bloque de coincidencia, que determina el valor de la variable indicador del caso primario opcional. Por ejemplo, si desea descartar todos los casos salvo el ms reciente de cada bloque de coincidencia, puede ordenar los casos del bloque en orden ascendente por una variable de fecha, lo cual hara que la fecha ms reciente fuese la ltima fecha del bloque.
Variable indicador de casos primarios. Crea una variable con un valor de 1 para todos
los casos nicos y para el caso identificado como caso primario en cada bloque de casos coincidentes y un valor de 0 para los duplicados no primarios de cada bloque. El caso primario puede ser el primer o el ltimo caso de cada bloque de coincidencia, segn determine el orden del bloque de coincidencia. Si no especifica ninguna variable de ordenacin, el orden del archivo original determina el orden de los casos dentro de cada bloque. Puede utilizar la variable indicador como una variable de filtro para excluir los duplicados que no sean primarios de los informes y los anlisis sin eliminar dichos casos del archivo de datos.
Recuento secuencial de casos coincidentes en cada bloque. Crea una variable con un valor secuencial de 1 a n para los casos de cada bloque de coincidencia. La secuencia se basa en el orden actual de los casos de cada bloque, que puede ser el orden del archivo original o el orden determinado por las variables de ordenacin especificadas. Mover los casos coincidentes a la parte superior del archivo. Ordena el archivo de datos
de manera que todos los bloques de casos coincidentes estn en la parte superior del archivo de datos, facilitando la inspeccin visual de los casos coincidentes en el Editor de datos.
Mostrar tabla de frecuencias de las variables creadas. Las tablas de frecuencias
contienen los recuentos de cada valor de las variables creadas. Por ejemplo, para la variable de indicador de caso primario, la tabla mostrara tanto el nmero de casos con un valor de 0 en esa variable, que indica el nmero de duplicados, como el
nmero de casos con un valor de 1 para esa variable, que indica el nmero de casos nicos y primarios.
Valores perdidos. En el caso de variables numricas, los valores perdidos del sistema se tratan como cualquier otro valor: los casos que tengan el valor perdido del sistema para una variable de identificacin se tratarn como si tuviesen valores coincidentes para dicha variable. En el caso de variables de cadena, los casos que no tengan ningn valor para una variable de identificacin se tratarn como si tuviesen valores coincidentes para dicha variable.
Categorizador visual
El Categorizador visual est concebido para ayudarle en el proceso de creacin de variables nuevas, basado en la agrupacin de los valores contiguos de las variables existentes para dar lugar a un nmero limitado de categoras diferentes. Puede utilizar el Categorizador visual para: Crear variables categricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una variable de escala con los ingresos para crear una variable categrica nueva que contenga intervalos de ingresos. Colapsar un nmero elevado de categoras ordinales en un conjunto menor de categoras. Por ejemplo, es posible colapsar una escala de evaluacin de nueve categoras en tres categoras que representen: bajo, medio y alto. En el primer paso del Categorizador visual, puede:
E Seleccione las variables numricas de escala u ordinales para las que desee crear
150 Captulo 7 Figura 7-13 Cuadro de dilogo inicial para seleccionar las variables que se van a categorizar
Como alternativa, puede limitar la cantidad de casos que se van a explorar. Con los archivos de datos que contengan un gran nmero de casos, la limitacin del nmero de casos que se va a explorar puede ahorrar tiempo, pero debe evitarse este procedimiento en lo posible, ya que influir en la distribucin de los valores que sern utilizados en los clculos posteriores en el Categorizador visual. Nota: Las variables de cadena y las variables numricas nominales no se muestran en la lista de variables origen. El Categorizador visual requiere que las variables sean numricas, medidas bien a nivel ordinal o de escala, puesto que asume que los valores de los datos representan algn tipo de orden lgico que puede ser utilizado para agrupar los valores con sentido. Puede cambiar el nivel de medida de una variable en la Vista de variables del Editor de datos. Si desea obtener ms informacin, consulte Nivel de medida de variable en Captulo 5 en p. 99.
no pueden repetirse, y deben seguir las normas de denominacin de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99.
E Defina los criterios de categorizacin para la nueva variable. Si desea obtener ms
152 Captulo 7
Categorizacin de variables
Figura 7-14 Categorizador visual, cuadro de dilogo principal
El cuadro de dilogo principal del Categorizador visual proporciona la siguiente informacin de las variables exploradas:
Lista de variables exploradas. Muestra las variables que fueron seleccionadas en el cuadro de dilogo inicial. Puede ordenar la lista por el nivel de medida (de escala u ordinal) o por la etiqueta o el nombre de variable, pulsando en los encabezados de las columnas. Casos explorados. Indica el nmero de casos explorados. Todos los casos explorados
sin valores perdidos definidos por el usuario o del sistema para la variable seleccionada, se usan en la generacin de la distribucin de valores que emplea el Categorizador visual, incluyendo el histograma que se visualiza en el cuadro de dilogo principal y los puntos de corte basados en percentiles o unidades de desviacin tpica.
Valores perdidos. Indica el nmero de casos explorados con valores perdidos definidos por el usuario y perdidos del sistema. Los valores perdidos no se incluyen en ninguno de los intervalos de categorizacin. Si desea obtener ms informacin, consulte Valores perdidos definidos por el usuario en el Categorizador visual en p. 159. Variable actual. El nombre y etiqueta de variable (si existe) de la variable actualmente
categorizada.
Nombre. Debe introducir un nombre para la nueva variable. Los nombres de
variable no pueden repetirse, y deben seguir las normas de denominacin de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99.
Etiqueta. Puede introducir una etiqueta de variable descriptiva con una longitud
de hasta 255 caracteres. La etiqueta de variable por defecto ser la etiqueta de variable (si existe) o el nombre de variable de la variable origen con el texto (Categorizada) aadido al final de la etiqueta.
Mnimo y Mximo. Valores mnimo y mximo para la variable seleccionada
actualmente, basados en los casos explorados y excluyendo los valores definidos como perdidos por el usuario.
Valores no perdidos. El histograma muestra la distribucin de valores no perdidos
correspondiente a la variable seleccionada actualmente, basndose en los casos explorados. Despus de haber definido las categoras para la nueva variable, se mostrarn lneas verticales en el histograma para indicar los puntos de corte que definen los intervalos. Puede pulsar y arrastrar las lneas de los puntos de corte a distintos puntos del histograma, modificando as la amplitud de los intervalos. Puede eliminar categoras arrastrando las lneas de los puntos de corte fuera del histograma. Nota: El histograma (que muestra valores no perdidos), el mnimo y el mximo se basan en los casos explorados. Si no incluye todos los casos en la exploracin, es posible que no se refleje con precisin la distribucin real, sobre todo si el archivo
154 Captulo 7
de datos se orden segn la variable seleccionada. Si no explora ningn caso, no encontrar disponible informacin sobre la distribucin de valores.
Cuadrcula. Muestra los valores que definen los puntos de corte superiores de cada
introducir los valores o utilizar Crear puntos de corte para crear automticamente los intervalos basndose en los criterios seleccionados. Por defecto, se incluye automticamente un punto de corte con el valor SUPERIOR. Este intervalo contendr cualesquiera valores no perdidos por encima de los restantes puntos de corte. El intervalo definido por el punto de corte inferior incluir todos los valores no perdidos que sean menores que o iguales a dicho valor (o, sencillamente, inferiores a ese valor, dependiendo de la forma en que haya definido los puntos de corte superiores).
Etiqueta. Etiquetas opcionales y descriptivas de los valores de la nueva variable
categorizada. Puesto que los valores de la nueva variable slo sern nmeros enteros en secuencia, del 1 a n, las etiquetas que describan lo que representan los valores pueden resultar muy tiles. Puede introducir las etiquetas o usar Crear etiquetas para crear las etiquetas de valor de forma automtica.
Para eliminar un intervalo de la rejilla
E Pulse con el botn derecho las casillas Valor o Etiqueta del intervalo. E En el men contextual emergente, seleccione Eliminar fila.
Nota: Si elimina la categora SUPERIOR, los casos con valores superiores al valor del ltimo punto de corte especificado recibirn el valor perdido del sistema en la nueva variable.
Para eliminar todas las etiquetas o todas las categoras definidas
E Pulse en cualquier parte de la rejilla con el botn derecho del ratn. E En el men contextual emergente, seleccione Eliminar todas las etiquetas o Eliminar todos los puntos de corte.
Incluidos (<=). Los casos con el valor especificado en la casilla Valor se incluyen
en el intervalo. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con el valor exacto 25 se incluirn en el primer intervalo, de esta forma se incluirn todos los casos con valor menor o igual a 25.
Excluido (<). Los casos con el valor especificado en la casilla Valor no se incluyen
en el intervalo. Por contra, se incluyen en la siguiente categora. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con el valor exacto 25 se incluirn en el segundo intervalo en vez de en el primero, puesto que el primero slo contendr casos con valores inferiores a 25.
Crear puntos de corte. Genera categoras automticamente para crear intervalos de igual amplitud, intervalos con el mismo nmero de casos o intervalos basados en un nmero de desviaciones tpicas. Esta posibilidad no est disponible si no se ha explorado ningn caso. Si desea obtener ms informacin, consulte Generacin automtica de categoras en p. 155. Crear etiquetas. Genera etiquetas descriptivas para los valores enteros consecutivos
contenidos en la nueva variable categorizada, en funcin de los valores de la rejilla y el tratamiento especificado para los lmites superiores (incluidos o excluidos).
Invertir la escala. Por defecto, los valores de la nueva variable categorizada sern nmeros enteros consecutivos, del 1 a n. La inversin de la escala convierte los valores en nmeros enteros consecutivos, de n a 1. Copiar categoras. Puede copiar las especificaciones de categorizacin de otra variable
a la variable seleccionada en ese momento, o desde la variable seleccionada en ese momento a otras varias variables. Si desea obtener ms informacin, consulte Copia de categoras en p. 158.
156 Captulo 7 E Seleccione los criterios de generacin de los puntos de corte que definirn los
intervalos.
E Pulse en Aplicar. Figura 7-15 Cuadro de dilogo Crear puntos de corte
Nota: El cuadro de dilogo Crear puntos de corte no est disponible si no se ha explorado ningn caso.
Intervalos de igual amplitud. Genera categoras de igual amplitud (por ejemplo, 110,
1120, 2130, etc.), basndose en dos (cualesquiera) de los tres criterios siguientes:
Posicin del primer punto de corte. Valor que define el lmite superior de la
categora inferior (por ejemplo, el valor 10 indica un intervalo que incluya todos los valores hasta 10).
Nmero de puntos de corte. El nmero de intervalos es el nmero de puntos de
Percentiles iguales basados en los casos explorados. Genera intervalos con un nmero
igual de casos en cada categora (utilizando el algoritmo aempirical para el clculo de percentiles), en funcin de uno de los criterios siguientes:
Nmero de puntos de corte. El nmero de intervalos es el nmero de puntos de
corte ms uno. Por ejemplo, tres puntos de corte generan cuatro categoras percentiles (cuartiles), conteniendo cada una el 25% de los casos.
% de casos. Amplitud de cada intervalo, expresado en forma de porcentaje sobre
el nmero total de casos. Por ejemplo, el valor 33,3 generara tres categoras (dos puntos de corte), conteniendo cada una el 33,3% de los casos. Si la variable origen contiene un nmero relativamente pequeo de valores distintos, o un gran nmero de casos con el mismo valor, es posible que obtenga menos categoras que las solicitadas. En caso de haber varios valores idnticos en un punto de corte, todos se incluyen en el mismo intervalo; por consiguiente, los porcentajes reales pueden no ser siempre iguales.
Puntos de corte en media y desviaciones tpicas seleccionadas, basadas en casos explorados. Genera categoras basndose en los valores de la media y la desviacin
tpica de la distribucin de la variable. Si no selecciona ninguno de los intervalos de desviacin tpica, se crearn dos intervalos, siendo la media el punto de corte que divida las categoras. Puede seleccionar cualquier combinacin de los intervalos de desviacin tpica, basndose en una, dos o tres desviaciones tpicas. Por ejemplo, al seleccionar las tres opciones se obtendrn ocho intervalos: seis intervalos distanciados en una desviacin tpica de amplitud y dos intervalos para los casos que se encuentren a ms de tres desviaciones tpicas por encima y por debajo de la media. En una distribucin normal, el 68% de los casos se encuentra dentro de una distancia de una desviacin tpica respecto a la media, el 95% entre dos desviaciones tpicas y el 99% dentro de tres desviaciones tpicas. La creacin de categoras basadas en desviaciones tpicas puede ocasionar que algunas categoras queden definidas fuera del rango real de los datos, e incluso fuera del rango de valores posibles de los datos (por ejemplo, un rango de salarios negativos). Nota: Los clculos de los percentiles y las desviaciones tpicas se basan en los casos explorados. Si limita el nmero de casos explorados, puede que las categoras resultantes no incluyan la proporcin de casos deseada en dichas categoras, sobre todo si el archivo de datos se orden segn la variable origen. Por ejemplo, si limita
158 Captulo 7
la exploracin a los primeros 100 casos de un archivo de datos con 1000 casos y el archivo de datos est ordenado en orden descendente por edad del encuestado, en lugar de cuatro categoras percentiles de la edad, cada una con el 25% de los casos, podra encontrarse con que las tres primeras categoras contuvieran cada una slo en torno al 3,3% de los casos, mientras que la ltima categora albergara el 90% de los casos.
Copia de categoras
Al crear categoras para una o ms variables, puede copiar las especificaciones de categorizacin de otra variable a la seleccionada en ese momento, o desde la variable seleccionada en ese momento a varias otras variables.
Figura 7-16 Copia de categoras en o desde la variable actual
definido intervalos.
E Pulse A otras variables.
159 Preparacin de datos E Seleccione las variables para las que desea crear nuevas variables con los mismos
intervalos.
E Pulse Copiar.
o
E Seleccione (pulse) una variable de la Lista de variables exploradas sobre la cual desea
Tambin se copiarn las etiquetas de valor si se especificaron en la variable cuyas especificaciones de categorizacin se van a copiar. Nota: Una vez que haya pulsado en Aceptar en el cuadro de dilogo principal del Categorizador visual, para crear nuevas variables categorizadas (o cerrado el cuadro de dilogo de alguna otra forma), no podr usar de nuevo el Categorizador visual para copiar dichas categoras en otras variables.
160 Captulo 7
usuario en la variable de origen tena definida una etiqueta de valor, dicha etiqueta se mantendr como etiqueta de valor para el valor recodificado de la nueva variable. Nota: Si la variable de origen tiene definido un rango de valores perdidos de usuario con la forma MENOR-n, donde n es un nmero positivo, los valores perdidos definidos por el usuario correspondientes a la nueva variable, sern nmeros negativos.
Captulo
En una situacin ideal, los datos brutos son perfectamente apropiados para el tipo de anlisis que se desea realizar y cualquier relacin existente entre las variables o es adecuadamente lineal o es claramente ortogonal. Desafortunadamente, esto ocurre pocas veces. El anlisis preliminar puede revelar esquemas de codificacin poco prcticos o errores de codificacin, o bien pueden requerirse transformaciones de los datos para exponer la verdadera relacin existente entre las variables. Puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la agrupacin de categoras para su anlisis posterior, hasta otras ms avanzadas, como la creacin de nuevas variables basadas en ecuaciones complejas e instrucciones condicionales.
Clculo de variables
Utilice el cuadro de dilogo Calcular para calcular los valores de una variable basndose en transformaciones numricas de otras variables. Puede calcular valores para las variables numricas o de cadena (alfanumricas). Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las nuevas variables, tambin se puede especificar el tipo y la etiqueta de variable. Puede calcular valores de forma selectiva para subconjuntos de datos basndose en condiciones lgicas. Puede utilizar ms de 70 funciones preincorporadas, incluyendo funciones aritmticas, funciones estadsticas, funciones de distribucin y funciones de cadena.
161
escribir directamente en dicho campo. Puede pegar las funciones o las variables de sistema utilizadas habitualmente seleccionando un grupo de la lista Grupo de funciones y pulsando dos veces en la funcin o variable de las listas de funciones y variables especiales (o seleccione la funcin o variable y pulse en la flecha que se encuentra sobre la lista Grupo de funciones). Rellene los parmetros indicados mediante interrogaciones (aplicable
slo a las funciones). El grupo de funciones con la etiqueta Todo contiene una lista de todas las funciones y variables de sistema disponibles. En un rea reservada del cuadro de dilogo se muestra una breve descripcin de la funcin o variable actualmente seleccionada. Las constantes de cadena deben ir entre comillas o apstrofos. Si los valores contienen decimales, debe utilizarse una coma(,) como indicador decimal. Para las nuevas variables de cadena, tambin debern seleccionar Tipo y etiqueta para especificar el tipo de datos.
164 Captulo 8
Si el resultado de una expresin condicional es falso o perdido, no se incluir el caso en el subconjunto seleccionado. La mayora de las expresiones condicionales utilizan al menos uno de los seis operadores de relacin (<, >, <=, >=, =, y ~=) de la calculadora. Las expresiones condicionales pueden incluir nombres de variable, constantes, operadores aritmticos, funciones numricas (y de otros tipos), variables lgicas y operadores de relacin.
escribir el texto de una etiqueta o bien utilizar los primeros 110 caracteres de la expresin de clculo.
Tipo. Las variables calculadas pueden ser numricas o de cadena (alfanumricas). Las variables de cadena no se pueden utilizar en clculos aritmticos.
Figura 8-3 Cuadro de dilogo Tipo y etiqueta
Funciones
Se dispone de muchos tipos de funciones, entre ellos: Funciones aritmticas Funciones estadsticas Funciones de cadena Funciones de fecha y hora
Funciones de distribucin Funciones de variables aleatorias Funciones de valores perdidos Funciones de puntuacin (slo servidor de SPSS) Si desea obtener una lista completa de las funciones, busque funciones en el ndice del sistema de Ayuda en pantalla.
El resultado es el valor perdido si un caso tiene un valor perdido para cualquiera de las tres variables. En la expresin:
MEAN(var1, var2, var3)
El resultado es el valor perdido slo si el caso tiene valores perdidos para las tres variables. En las funciones estadsticas se puede especificar el nmero mnimo de argumentos que deben tener valores no perdidos. Para ello, escriba un punto y el nmero mnimo de argumentos despus del nombre de la funcin, como en:
MEAN.2(var1, var2, var3)
166 Captulo 8
Generador activo. Hay dos generadores de nmeros aleatorios disponibles: Compatible con SPSS 12. El generador de nmeros aleatorios utilizado en SPSS 12
y versiones anteriores. Utilice este generador de nmeros aleatorios si necesita reproducir los resultados aleatorizados generados por versiones previas basadas en una semilla de aleatorizacin especificada.
Tornado de Mersenne. Un generador de nmeros aleatorios nuevo que es ms
fiable en los procesos de simulacin. Utilice este generador de nmeros aleatorios si no es necesario reproducir resultados aleatorizados correspondientes a SPSS 12 o anteriores.
Inicializacin del generador activo. La semilla de aleatorizacin cambia cada vez
que se genera un nmero aleatorio para utilizarlo en las transformaciones (como las funciones de distribucin aleatorias), el muestreo aleatorio o la ponderacin de los casos. Para replicar una secuencia de nmeros aleatorios, establezca el valor de inicializacin del punto de inicio antes de cada anlisis que utilice los nmeros aleatorios. El valor debe ser un entero positivo.
Figura 8-4 Cuadro de dilogo Generadores de nmeros aleatorios
168 Captulo 8 E Pulse en Definir valores y especifique los valores que se deben contar.
Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones de valores.
169 Transformaciones de los datos Figura 8-7 Cuadro de dilogo Contar apariciones: Si los casos
Si desea conocer las consideraciones generales sobre el uso del cuadro de dilogo Si los casos, consulte Calcular variable: Si los casos en p. 163.
Recodificacin de valores
Los valores de datos se pueden modificar mediante la recodificacin. Esto es particularmente til para agrupar o combinar categoras. Puede recodificar los valores dentro de las variables existentes o crear variables nuevas que se basen en los valores recodificados de las variables existentes.
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de dilogo Si los casos para esto es igual al que se describe para Contar apariciones.
incluyen sus puntos finales y los valores definidos como perdidos por el usuario que estn dentro del rango.
Valor (Recodificar). Valor antiguo individual que se a recodificar en un valor
nuevo. El tipo de datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de datos de las variables desee recodificar.
Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numrico est vaco, o cuando no est definido un valor como resultado de un comando de transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier carcter en las variables de cadena.
Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos y se les ha asignado el valor perdido del sistema, lo cual se indica mediante un punto (.).
Rango (Rango inclusivo de valores). Un rango inclusivo de valores. No est
disponible para variables de cadena. Se incluirn cualesquiera valores definidos por el usuario como perdidos que se encuentren dentro del rango.
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.
Perdido por el sistema. Recodifica el valor antiguo especificado como valor
perdido por el sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos con valor perdido por el sistema se excluyen de muchos procedimientos. No se encuentra disponible para las variables de cadena.
Antiguo>Nuevo. Contiene la lista de especificaciones que se va a utilizar
para recodificar la variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La lista se ordena automticamente basndose en la especificacin del valor antiguo y siguiendo este orden: valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una especificacin de
172 Captulo 8
recodificacin en la lista, el procedimiento volver a ordenar la lista automticamente, si fuera necesario, para mantener este orden.
Figura 8-9 Cuadro de dilogo Valores antiguos y nuevos
173 Transformaciones de los datos Figura 8-10 Cuadro de dilogo Recodif. en distintas var. (Recodificar en distintas variables)
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de dilogo Si los casos para esto es igual al que se describe para Contar apariciones.
174 Captulo 8
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas variables. Los valores antiguos deben ser del mismo tipo de datos (numricos o de cadena) que la variable original. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por el usuario que estn dentro del rango. Valor (Recodificar). Valor antiguo individual que se a recodificar en un valor
nuevo. El tipo de datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de datos de las variables desee recodificar.
Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numrico est vaco, o cuando no est definido un valor como resultado de un comando de transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier carcter en las variables de cadena.
Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos y se les ha asignado el valor perdido del sistema, lo cual se indica mediante un punto (.).
Rango (Rango inclusivo de valores). Un rango inclusivo de valores. No est
disponible para variables de cadena. Se incluirn cualesquiera valores definidos por el usuario como perdidos que se encuentren dentro del rango.
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.
perdido por el sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos con valor perdido por el sistema se excluyen de muchos procedimientos. No se encuentra disponible para las variables de cadena.
Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no
requieren la recodificacin, utilice esta opcin para incluir los valores antiguos. Cualquier valor antiguo que no sea especificado no se incluye en la nueva variable, y los casos con esos valores se asignan al valor perdido por el sistema en la nueva variable.
Las variables de los resultados son cadenas. Define la nueva variable recodificada
como variable de cadena (alfanumrica). La variable antigua puede ser numrica o de cadena.
Convertir cadenas numricas en nmeros. Convierte los valores de cadena que
contienen nmeros en valores numricos. A las cadenas que contengan cualquier cosa que no sean nmeros y un carcter de signo opcional (+ -) se les asignar el valor perdido por el sistema.
Antiguo>Nuevo. Contiene la lista de especificaciones que se va a utilizar
para recodificar la variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La lista se ordena automticamente basndose en la especificacin del valor antiguo y siguiendo este orden: valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una especificacin de recodificacin en la lista, el procedimiento volver a ordenar la lista automticamente, si fuera necesario, para mantener este orden.
177 Transformaciones de los datos Figura 8-12 Cuadro de dilogo Asignar rangos a los casos
asignar rangos a las variables numricas. Si lo desea, puede asignar los rangos a los casos en orden ascendente o descendente y organizar los rangos por subgrupos.
178 Captulo 8
Rango fraccional. El valor de la nueva variable es igual al rango dividido por la suma de las ponderaciones de los casos no perdidos. Rango fraccional como porcentaje. Cada rango se divide por el nmero de casos que tienes valores vlidos y se multiplica por 100. Suma de ponderaciones de los casos. El valor de la nueva variable es igual a la suma de las ponderaciones de los casos. La nueva variable es una constante para todos los casos del mismo grupo. Ntiles. Los rangos se basan en los grupos percentiles, de forma que cada uno de
los grupos contenga aproximadamente el mismo nmero de casos. Por ejemplo, con 4 Ntiles se asignar un rango 1 a los casos por debajo del percentil 25, 2 a los casos entre los percentiles 25 y 50, 3 a los casos entre los percentiles 50 y 75, y 4 a los casos por encima del percentil 75.
Estimaciones de proporcin. Estimaciones de la proporcin acumulada de la
estimada.
Frmula de estimacin de la proporcin. Para estimaciones de la proporcin y
puntuaciones normales se pueden seleccionar las frmulas de estimacin de la proporcin: Blom, Tukey, Rankit o Van der Waerden.
Blom. Crea nuevas variables de ordenacin (rangos) que se basan en estimaciones
de la proporcin, las cuales utilizan la frmula (r-3/8) / (w+1/4), donde r es el rango y w es la suma de las ponderaciones de los casos.
Tukey. Utiliza la frmula (r-1/3) / (w+1/3), donde r es el rango y w es la suma de
es el rango, que va de 1 a w.
Van der Waerden. La transformacin de Van de Waerden, definida por la frmula
r/(w+1), donde w es la suma de las ponderaciones de los casos y r es el rango, cuyo valor va de 1 a w.
179 Transformaciones de los datos Figura 8-13 Cuadro de dilogo Asignar rangos a los casos: Tipos
La tabla siguiente muestra cmo los distintos mtodos asignan rangos a los valores empatados.
Valor 10 15 15 15 16 20 Media 1 3 3 3 5 6 Menor 1 2 2 2 5 6 Mayor 1 4 4 4 5 6 Secuencial 1 2 2 2 3 4
180 Captulo 8
Recodificacin automtica
El cuadro de dilogo Recodificacin automtica le permite convertir los valores numricos y de cadena en valores enteros consecutivos. Si los cdigos de la categora no son secuenciales, las casillas vacas resultantes reducen el rendimiento e incrementan los requisitos de memoria de muchos procedimientos. Adems, algunos procedimientos no pueden utilizar variables de cadena y otros requieren valores enteros consecutivos para los niveles de los factores.
Figura 8-15 Cuadro de dilogo Recodificacin automtica
La nueva variable, o variables, creadas por la recodificacin automtica conservan todas las etiquetas de variable y de valor definidas de la variable antigua. Para los valores que no tienen una etiqueta de valor ya definida se utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra los valores antiguos, los nuevos y las etiquetas de valor. Los valores de cadena se recodifican por orden alfabtico, con las maysculas antes que las minsculas. Los valores perdidos se recodifican como valores perdidos mayores que cualquier valor no perdido y conservando el orden. Por ejemplo, si la variable original posee 10 valores no perdidos, el valor perdido mnimo se recodificar como 11, y el valor 11 ser un valor perdido para la nueva variable.
Usar el mismo esquema de recodificacin para todas las variables. Esta opcin
le permite aplicar un nico esquema de recodificacin para todas las variables seleccionadas, lo que genera un esquema de codificacin coherente para todas las variables nuevas. Si selecciona esta opcin, se aplican las siguientes reglas y limitaciones: Todas las variables deben ser del mismo tipo (numricas o de cadena). Todos los valores observados para todas las variables seleccionadas se utilizan para crear un orden de valores para recodificar en enteros consecutivos. Los valores perdidos definidos por el usuario para las variables nuevas se basan en la primera variable de la lista con valores perdidos definidos por el usuario. El resto de los valores de las dems variables originales, excepto los valores perdidos del sistema, se consideran vlidos.
Trate los valores de cadena en blanco como valores perdidos definidos por el usuario.
En el caso de las variables de cadena, los valores en blanco o nulos no son tratados como valores perdidos del sistema. Esta opcin recodifica automticamente las cadenas en blanco en un valor perdido definido por el usuario mayor que el valor no perdido mximo.
Plantillas
Puede guardar el esquema de recodificacin automtica en un archivo de plantilla y, a continuacin, aplicarlo a otras variables y otros archivos de datos. Por ejemplo, puede tener un nmero considerable de cdigos de producto alfanumricos que se registran automticamente en enteros cada mes, pero algunos meses se aaden cdigos de productos nuevos al esquema de recodificacin original. Si guarda el esquema original en una plantilla y, a continuacin, la aplica a los datos nuevos que contienen el nuevo conjunto de cdigos, todos los cdigos nuevos encontrados en los datos se recodifican automticamente en valores superiores al ltimo valor de la plantilla para conservar el esquema de recodificacin automtica original de los cdigos de productos originales.
Guardar plantilla como. Guarda el esquema de recodificacin automtica para las
variables seleccionadas en un archivo de plantilla externo. La plantilla contiene informacin que asigna los valores no perdidos originales a los valores recodificados.
182 Captulo 8
En la plantilla slo se guarda la informacin para los valores no perdidos. La informacin sobre los valores perdidos definidos por el usuario no se conserva. Si ha seleccionado varias variables para su recodificacin, pero no ha optado por utilizar el mismo esquema de recodificacin automtica para todas las variables o no va a aplicar una plantilla existente como parte de la recodificacin automtica, la plantilla se basar en la primera variable de la lista. Si ha seleccionado varias variables para su recodificacin, y tambin ha seleccionado Usar el mismo esquema de recodificacin para todas las variables y/o Aplicar plantilla, la plantilla contendr el esquema de recodificacin automtica combinado para todas las variables.
Aplicar plantilla desde. Aplica una plantilla de recodificacin automtica previamente
guardada a las variables seleccionadas para la recodificacin, aade los valores adicionales encontrados en las variables al final del esquema y conserva la relacin entre los valores originales y recodificados automticamente almacenados en el esquema guardado. Todas las variables seleccionadas para la recodificacin deben ser del mismo tipo (numricas o de cadena) y dicho tipo debe coincidir con el tipo definido en la plantilla. Las plantillas no pueden contener informacin sobre los valores perdidos definidos por el usuario. Los valores perdidos definidos por el usuario para las variables de destino se basan en la primera variable de la lista de variables originales con valores perdidos definidos por el usuario. El resto de los valores de las dems variables originales, excepto los valores perdidos del sistema, se consideran vlidos. Las asignaciones de valores de la plantilla se aplican en primer lugar. Los valores restantes se recodifican en valores superiores al ltimo valor de la plantilla, con los valores perdidos definidos por el usuario (basados en la primera variable de la lista con valores perdidos definidos por el usuario) recodificados en valores superiores al ltimo valor vlido. Si ha seleccionado diversas variables para su recodificacin automtica, la plantilla se aplica en primer lugar, seguida de una recodificacin automtica comn combinada para todos los valores adicionales encontrados en las variables seleccionadas, lo que resulta en un nico esquema de recodificacin automtica para todas las variables seleccionadas.
184 Captulo 8 Figura 8-16 Pantalla principal del Asistente para fecha y hora
Aprender cmo se representan las fechas y las horas en SPSS. Esta opcin ofrece
una pantalla en la que se presenta una breve descripcin de las variables de fecha/hora en SPSS. El botn Ayuda tambin proporciona un vnculo para obtener informacin ms detallada.
Crear una variable de fecha/hora a partir de una cadena que contiene una fecha o una hora. Use esta opcin para crear una variable de fecha/hora a partir de
una variable de cadena. Por ejemplo, dispone de una variable de cadena que representa fechas con el formato mm/dd/aaaa y desea crear una variable de fecha/hora a partir de ella.
Crear una variable de fecha/hora fusionando variables que contengan partes diferentes de la fecha u hora. Esta opcin permite construir una variable de
fecha/hora a partir de un conjunto de variables existentes. Por ejemplo, dispone de una variable que representa el mes (como un nmero entero), una segunda que representa el da del mes y una tercera que representa el ao. Se pueden combinar estas variables en una nica variable de fecha/hora.
Calcular con fechas y horas. Use esta opcin para aadir o sustraer valores a
variables de fecha/hora. Por ejemplo, puede calcular la duracin de un proceso sustrayendo una variable que represente la hora de comienzo del proceso de otra variable que represente la hora de finalizacin del proceso.
Extraer una parte de una variable de fecha/hora. Esta opcin permite extraer parte
de una variable de fecha/hora, como el da del mes de una variable de fecha/hora, con el formato mm/dd/aaaa.
Asignar periodicidad a un conjunto de datos. Esta opcin presenta el cuadro de
dilogo Definir fechas, que se usa para crear variables de fecha/hora compuestas por un conjunto de fechas secuenciales. Esta caracterstica se usa generalmente para asociar fechas con datos de serie temporal. Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de variables necesarios para completar la tarea. Por ejemplo, si el conjunto de datos no contiene variables de cadena, la tarea de creacin de una variable de fecha/hora a partir de una cadena no se aplica y se desactiva.
representa una fecha, como mm/dd/aaaa. Las variables de fecha/hora tienen un formato que representa una fecha y una hora, como dd-mmm-aaaa hh:mm:ss. Internamente, las variables de fecha y de fecha/hora se almacenan como el nmero de segundos a partir del 14 de octubre de 1582. Las variables de fecha y de fecha/hora se denominan a menudo variables con formato de fecha.
186 Captulo 8
Las especificaciones de ao reconocidas son tanto de dos como de cuatro dgitos. Por defecto, los aos representados por dos dgitos representan un intervalo que comienza 69 aos antes de la fecha actual y finaliza 30 aos despus de la fecha actual. Este intervalo est determinado por la configuracin de las Opciones y se puede modificar (en el men Edicin, seleccione Opciones y pulse en la pestaa Datos). Los delimitadores que se pueden usar en los formatos de da-mes-ao son guiones, puntos, comas, barras y espacios en blanco. Los meses se pueden representar en dgitos, nmeros romanos o abreviaturas de tres caracteres, y se pueden escribir con el nombre completo. Los nombres de los meses expresados con abreviaturas de tres letras y nombres completos deben estar en ingls, ya que no se reconocen los nombres de meses en otros idiomas.
Variables de duracin. Las variables de duracin tienen un formato que representa una
duracin de tiempo, como hh:mm. Se almacenan internamente como segundos sin hacer referencia a ninguna fecha en particular. En las especificaciones de tiempo (se aplican a las variables de fecha/hora y de duracin), los dos puntos se pueden usar como delimitadores entre horas, minutos y segundos. Las horas y los minutos son valores necesarios, pero los segundos son opcionales. Para separar los segundos de las fracciones de segundo, es necesario utilizar un punto. Las horas pueden tener una magnitud ilimitada, pero el valor mximo de los minutos es 59 y el de los segundos, 59.999...
Fecha y hora actuales. La variable del sistema $TIME contiene la fecha y hora actuales. Representa el nmero de segundos transcurridos desde el 14 de octubre de 1582 hasta la fecha y la hora en que se ejecute el comando de transformacin que la use.
de cadena representa las fechas. La lista Valores de ejemplo muestra los valores reales de la variable seleccionada en el archivo de datos. Los valores de la variable de cadena que no se ajusten al patrn seleccionado darn como resultado un valor perdido del sistema para la nueva variable.
188 Captulo 8
una variable existente. Si lo desea, puede: Seleccionar un formato de fecha/hora para la nueva variable en la lista Formato de resultado. Asignar una etiqueta de variable descriptiva a la nueva variable.
Algunas combinaciones de selecciones no estn permitidas. Por ejemplo, la creacin de una variable de fecha/hora a partir de un valor de Ao y Da del mes no es vlida porque, una vez seleccionado Ao, es necesario especificar una fecha completa. No se puede utilizar una variable de fecha/hora existente como una de las partes de la variable de fecha/hora final que se est creando. Las variables que componen las partes de la nueva variable de fecha/hora deben ser nmeros enteros. La excepcin es el uso permitido de una variable de fecha/hora existente como la parte de los segundos de la nueva variable. Puesto que se permite el uso de fracciones de segundos, las variables utilizadas para los segundos no tiene que ser obligatoriamente un nmero entero. Los valores de cualquier parte de la nueva variable que no se ajusten al rango permitido darn como resultado un valor perdido del sistema para la nueva variable. Esto podra suceder, por ejemplo, si se usa inadvertidamente una variable que representa un da del mes como valor de Mes. Puesto que el rango
190 Captulo 8
vlido para los meses en SPSS es 113, todos los casos en que el valor del da del mes pertenezca al rango 1431 se considerarn valores perdidos del sistema para la nueva variable.
fecha y hora.
Seleccin del tipo de clculo que realizar con las variables de fecha/hora
Figura 8-21 Adicin o sustraccin de valores de variables de fecha/hora, paso 1
Aadir o sustraer una duracin a una fecha. Use esta opcin para aadir o sustraer
valores a una variable con formato de fecha. Si lo desea, puede aadir o sustraer duraciones que sean valores fijos, como 10 das, o los valores de una variable numrica (por ejemplo, una variable que represente aos).
192 Captulo 8
Calcular el nmero de unidades de tiempo entre dos fechas. Use esta opcin para
obtener la diferencia entre dos fechas medidas en una unidad seleccionada. Por ejemplo, puede obtener el nmero de aos o el nmero de das que separan dos fechas.
Sustraer dos duraciones. Use esta opcin para obtener la diferencia entre dos
variables con formatos de duracin, como hh:mm o hh:mm:ss. Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de variables necesarios para completar la tarea. Por ejemplo, si el conjunto de datos no contiene dos variables con formatos de duracin, la tarea de sustraccin de dos duraciones no se aplica y se desactiva.
E Seleccione una variable de fecha (u hora). E Seleccione una variable de duracin o especifique un valor para Constante de
duracin. Las variables utilizadas para las duraciones no pueden ser variables de fecha o de fecha/hora. Pueden ser variables de duracin o variables numricas simples.
E Seleccione la unidad que represente la duracin en la lista desplegable. Seleccione Duracin si se usa una variable y sta tiene el formato de una duracin, como hh:mm
o hh:mm:ss.
194 Captulo 8
Especificacin de los resultados de la adicin o sustraccin de una duracin a una variable de fecha/hora
Figura 8-23 Adicin o sustraccin de duracin, paso 3
una variable existente. Si lo desea, puede: Asignar una etiqueta de variable descriptiva a la nueva variable.
Asistente para fecha y hora denominada Realizar clculos con las fechas.
E Seleccione las variables que se van a sustraer. E Seleccione la unidad del resultado en la lista desplegable.
196 Captulo 8
una variable existente. Si lo desea, puede: Asignar una etiqueta de variable descriptiva a la nueva variable.
198 Captulo 8
E Seleccione la variable que contiene la parte de fecha u hora que desee extraer. E En la lista desplegable, seleccione la parte de la variable que se va a extraer. Si lo
desea, puede extraer informacin de fechas que no sea explcitamente parte de la fecha que se muestra, por ejemplo, un da de la semana.
200 Captulo 8
seleccionar un formato de la lista Formato de resultado. En los casos en que el formato de resultado no es necesario se desactivar la lista Formato de resultado. Si lo desea, puede: Asignar una etiqueta de variable descriptiva a la nueva variable.
Elaborar nuevas variables de series temporales como funciones de variables de series temporales existentes. Reemplazar valores definidos como perdidos por el usuario y perdidos del sistema con estimaciones basadas en uno de los diversos mtodos existentes. Una serie temporal se obtiene midiendo una variable (o un conjunto de variables) de manera regular a lo largo de un perodo de tiempo. Las transformaciones de los datos de serie temporal suponen una estructura de archivo de datos en la que cada caso (fila) representa un conjunto de observaciones para un momento diferente y la duracin del tiempo entre los casos es uniforme.
Definir fechas
El cuadro de dilogo Definir fechas genera variables de fecha que se pueden utilizar para establecer la periodicidad de una serie temporal y para etiquetar los resultados de los anlisis de series temporales.
Figura 8-30 Cuadro de dilogo Definir fechas
Los casos son. Define el intervalo de tiempo utilizado para generar las fechas.
202 Captulo 8 Sin fecha elimina las variables de fecha definidas anteriormente. Se eliminarn
todas las variables con los nombres siguientes: ao_, trimestre_, mes_, semana_, da_, hora_, minuto_, segundo_ y fecha_.
Personalizado indica la presencia de variables de fecha personalizadas, creadas
con la sintaxis de comandos (por ejemplo, una semana de cuatro das laborables). Este elemento simplemente refleja el estado actual del conjunto de datos activo. Su seleccin en la lista no produce ningn efecto.
El primer caso es. Define el valor de la fecha inicial, que se asigna al primer caso. A los casos subsiguientes se les asignan valores secuenciales, basndose en el intervalo de tiempo. Periodicidad a nivel superior. Indica la variacin cclica repetitiva, como el nmero de meses de un ao o el nmero de das de la semana. El valor mostrado indica el valor mximo que se puede introducir.
Para cada componente utilizado para definir la fecha, se crea una nueva variable numrica. Los nombres de las nuevas variables terminan con un carcter de subrayado. A partir de los componentes tambin se crea una variable de cadena descriptiva, fecha_. Por ejemplo, si selecciona Semanas, das, horas, se crearn cuatro nuevas variables: semana_, da_, hora_ y fecha_. Si ya se han definido variables de fecha, stas sern reemplazadas cuando se definan nuevas variables de fecha con los mismos nombres que las existentes.
Para definir fechas para los datos de serie temporal
E Elija en los mens: Datos Definir fechas... E Seleccione un intervalo de tiempo en la lista Los casos son. E Introduzca el valor o los valores que definen la fecha inicial en El primer caso es, que
datos de serie temporal; mientras que las variables con formato de fecha representan fechas y horas mostradas en varios formatos de fecha y hora. Las variables de fecha son nmeros enteros sencillos que representan el nmero de das, semanas, horas, etc., a partir de un punto inicial especificado por el usuario. Internamente, la mayora de las variables con formato de fecha se almacenan como el nmero de segundos transcurridos desde el 14 de octubre de 1582.
204 Captulo 8
o variables originales.
E Seleccione la variable o variables a partir de las cuales desee crear nuevas variables de
serie temporal. Slo se pueden utilizar variables numricas. Si lo desea, puede: Introducir nombres de variables, para omitir los nombres por defecto de las nuevas variables. Cambiar la funcin para una variable seleccionada.
el nmero de valores previos utilizados para calcular la diferencia. Dado que se pierde una observacin para cada orden de diferencia, aparecern valores perdidos del sistema al comienzo de la serie. Por ejemplo, si el orden de diferencia es 2, los primeros dos casos tendrn el valor perdido del sistema para la nueva variable.
Diferencia estacional. Diferencia los valores de la serie respecto a los valores de
la propia serie distanciados un orden (un lapso) de valores constante. El orden se basa en la periodicidad definida actualmente. Para calcular diferencias estacionales debe haber definido variables de fecha (men Datos, Definir fechas) que incluyan un componente estacional (como por ejemplo los meses del ao). El orden es el nmero de perodos estacionales utilizados para calcular la diferencia. El nmero de casos con el valor perdido del sistema al comienzo de la serie es igual a la periodicidad multiplicada por el orden de la diferencia estacional. Por ejemplo, si la periodicidad actual es 12 y el orden es 2, los primeros 24 casos tendrn el valor perdido del sistema para la nueva variable.
Media mvil centrada. Se utiliza el promedio de un rango de los valores de la serie, que rodean e incluyen al valor actual. La amplitud es el nmero de valores de la serie utilizados para calcular el promedio. Si la amplitud es par, la media mvil se calcula con el promedio de cada par de medias no centradas. Nmero de casos con el valor
perdido del sistema al comienzo y al final de la serie para una amplitud de n es igual a n/2 para los valores de la amplitud par y para los valores de la amplitud impar. Por ejemplo, si la amplitud es 5, el nmero de casos con el valor perdido del sistema al comienzo y al final de la serie es 2.
Media mvil anterior. Se utiliza el promedio de un rango de las observaciones precedentes. La amplitud es el nmero de valores precedentes de la serie utilizados para calcular el promedio. El nmero de casos con el valor perdido del sistema al comienzo de la serie es igual al valor de la amplitud. Medianas mviles. Se utiliza la mediana de un rango de los valores de la serie, que
rodean e incluyen al valor actual. La amplitud es el nmero de valores de la serie utilizados para calcular la mediana. Si la amplitud es par, la mediana se calcula con el promedio de cada par de medianas no centradas. Nmero de casos con el valor perdido del sistema al comienzo y al final de la serie para una amplitud de n es igual a n/2 para los valores de la amplitud par y para los valores de la amplitud impar. Por ejemplo, si la amplitud es 5, el nmero de casos con el valor perdido del sistema al comienzo y al final de la serie es 2.
Suma acumulada. Cada valor de la serie se sustituye por la suma acumulada de los valores precedentes, incluyendo el valor actual. Retardo. Cada valor de la serie se sustituye por el valor del caso precedente, en el orden especificado. El orden especifica a qu distancia se encuentra el caso precedente. El nmero de casos con el valor perdido del sistema al comienzo de la serie es igual al valor del orden. Adelanto. Cada valor de la serie se sustituye por el valor de un caso posterior, en el
orden especificado. El orden especifica a qu distancia se encuentra el caso posterior. El nmero de casos con el valor perdido del sistema al final de la serie es igual al valor del orden.
Suavizado. Los nuevos valores de la serie se basan en un suavizador de datos
compuesto. El suavizador comienza con una mediana mvil de 4, que se centra por una mediana mvil de 2. A continuacin, se vuelven a suavizar estos valores aplicando una mediana mvil de 5, una mediana mvil de 3 y los promedios ponderados mviles (hanning). Los residuos se calculan sustrayendo la serie suavizada de la serie original. Despus se repite todo el proceso sobre los residuos calculados. Por ltimo, los residuos suavizados se calculan sustrayendo los valores suavizados obtenidos la primera vez que se realiz el proceso. A esto se le denomina a veces suavizado T4253H.
206 Captulo 8
207 Transformaciones de los datos Figura 8-32 Cuadro de dilogo Reemplazar los valores perdidos
Para reemplazar los valores perdidos para las variables de series temporales
E Elija en los mens: Transformar Reemplazar valores perdidos... E Seleccione el mtodo de estimacin que desee utilizar para reemplazar los valores
perdidos.
E Seleccione la variable o variables para las que desea reemplazar los valores perdidos.
Si lo desea, puede: Introducir nombres de variables, para omitir los nombres por defecto de las nuevas variables. Cambiar el mtodo de estimacin para una variable seleccionada.
vlidos circundantes. La amplitud de los puntos adyacentes es el nmero de valores vlidos, por encima y por debajo del valor perdido, utilizados para calcular la media.
208 Captulo 8
Mediana de puntos adyacentes. Sustituye los valores perdidos por la mediana de los
valores vlidos circundantes. La amplitud de los puntos adyacentes es el nmero de valores vlidos, por encima y por debajo del valor perdido, utilizados para calcular la mediana.
Interpolacin lineal. Sustituye los valores perdidos utilizando una interpolacin lineal.
Se utilizan para la interpolacin el ltimo valor vlido antes del valor perdido y el primer valor vlido despus del valor perdido. Si el primer o el ltimo caso de la serie tiene un valor perdido, el valor perdido no se sustituye.
Tendencia lineal en el punto. Reemplaza los valores perdidos de la serie por la tendencia lineal en ese punto. Se hace una regresin de la serie existente sobre una variable ndice escalada de 1 a n. Los valores perdidos se sustituyen por sus valores pronosticados.
del solicitante y el prstamo en cuestin. La puntuacin del crdito obtenida a partir del modelo de riesgo se usa para aceptar o rechazar la solicitud de prstamo. La puntuacin se trata como una transformacin de los datos. El modelo se expresa internamente como un conjunto de transformaciones numricas que se deben aplicar a un determinado conjunto de variables (las variables predictoras especificadas en el modelo), con el fin de obtener un resultado predictivo. En este sentido, el proceso de puntuacin de los datos con un modelo dado es, inherentemente, igual que la aplicacin de cualquier funcin, como puede ser una funcin de raz cuadrada, a un conjunto de datos. La puntuacin slo est disponible con el servidor de SPSS y puede realizarse interactivamente por los usuarios que trabajan en anlisis en modo distribuido. Para puntuar archivos de datos de gran tamao, es posible que desee usar SPSS Batch
Facility, una versin ejecutable independiente de SPSS que se distribuye junto con la versin de servidor de SPSS. Para obtener informacin acerca del uso de SPSS Batch Facility, consulte el manual del usuario de SPSS Batch Facility (SPSS Batch Facility Users Guide), que se incluye como archivo PDF en el CD del producto de la versin de servidor de SPSS. El proceso de puntuacin consta de:
E Cargar un modelo de un archivo en formato XML (PMML). E Calcular las puntuaciones como una variable nueva, mediante las funciones
ApplyModel oStrApplyModel disponibles en el cuadro de dilogo Calcular variable . Para obtener ms informacin sobre las funciones ApplyModel o StrApplyModel, consulte las expresiones de puntuacin de la seccin sobre expresiones de transformacin de la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
210 Captulo 8
E Escriba un nombre para asociarlo a este modelo. Cada modelo cargado debe tener un
nombre exclusivo.
E Pulse en Archivo y seleccione un archivo de modelo. El cuadro de dilogo Abrir
archivo resultante muestra los archivos disponibles en anlisis en modo distribuido. Esto incluye los archivos del equipo donde se instal el servidor de SPSS y los archivos del equipo local que se encuentran en carpetas compartidas o en unidades compartidas. Nota: Al puntuar datos, el modelo se aplica a las variables del conjunto de datos activo con los mismos nombres que las variables del archivo de modelo. Puede asignar variables del modelo original a otras variables del conjunto de datos activo mediante la sintaxis de comandos (consulte el comando MODEL HANDLE).
Nombre. Nombre utilizado para identificar este modelo. Las normas para los nombres de modelo vlidos son las mismos que para los nombres de variable (consulte Nombres de variable en Captulo 5 en p. 99) de SPSS, con la adicin del carcter $ como un primer carcter permitido. Este nombre se utiliza para especificar el modelo cuando se puntan los datos con las funciones ApplyModel o StrApplyModel.
Archivo. El archivo XML (PMML) que contiene las especificaciones del modelo. Valores perdidos
Este grupo de opciones controla el tratamiento de los valores perdidos, que se encuentran durante el proceso de puntuacin, para las variables predictoras del modelo. Un valor perdido en el contexto de puntuacin hace referencia a: Una variable predictora no contiene ningn valor. Para las variables numricas, esto significa el valor perdido del sistema. Para las variables de cadena, esto significa una cadena nula. El valor se ha definido como perdido por el usuario, en el modelo, para el predictor dado. Los valores definidos como perdidos por el usuario en el conjunto de datos activo, pero no en el modelo, no se tratan como valores perdidos en el proceso de puntuacin. La variable predictora es categrica y el valor no es una de las categoras definidas en el modelo.
Usar sustitucin de valores. Puede utilizar la sustitucin de valores cuando punte
casos con valores perdidos. El mtodo para determinar el valor que sustituye a un valor perdido depende del tipo de modelo predictivo.
Modelos de SPSS. Para las variables independientes en modelos de regresin lineal
y discriminantes, si se especific la sustitucin por el valor medio para los valores perdidos cuando se gener y guard el modelo, dicho valor medio se utiliza en lugar del valor perdido en el clculo de puntuacin y la puntuacin contina. Si el valor medio no est disponible, el valor perdido del sistema se devuelve.
Modelos de AnswerTree y modelos del comando SPSS TREE. Para los modelos
CHAID y CHAID exhaustivo, se selecciona el nodo filial de mayor tamao para una variable de segmentacin perdida. El nodo filial de mayor tamao es el que tiene mayor poblacin entre los nodos filiales que utilizan los casos de muestra de aprendizaje. Para los modelos C&RT y QUEST, las variables de segmentacin sustitutas (si las hay) se utilizan primero. (Las divisiones sustitutas son divisiones que intentan coincidir con la divisin original tanto como sea posible utilizando predictores alternativos.) Si no se especifica ninguna divisin sustituta o todas las variables de segmentacin sustitutas corresponden a valores perdidos, se utiliza el nodo filial de mayor tamao.
212 Captulo 8
en los modelos de SPSS. Los modelos de regresin logstica se tratan como se describe en los modelos de regresin logstica. Los modelos de rbol C&RT se tratan como se describe para los modelos C&RT bajo los modelos de AnswerTree.
Modelos de regresin logstica. Para las covariables de los modelos de regresin
logstica, si un valor medio del predictor se incluye como parte del modelo guardado, este valor medio se utiliza en lugar del valor perdido en el clculo de puntuacin y la puntuacin contina. Si el predictor es categrico (por ejemplo, un factor en un modelo de regresin logstica) o si el valor medio no est disponible, se devolver el valor perdido del sistema.
Usar perdido por el sistema. Devuelve el valor perdido por el sistema al puntuar un
Esto generar una tabla de asas de modelo. La tabla contiene una lista de todos los modelos cargados e incluye el nombre (denominado asa de modelo) asignado al modelo, el tipo de modelo, la ruta de acceso al archivo de modelo y el mtodo para tratar los valores perdidos.
Figura 8-35 Lista de modelos cargados
Captulo
Los archivos de datos no siempre estn organizados de la forma ideal para las necesidades especficas del usuario. Puede que le interese combinar archivos de datos, organizar los datos en un orden diferente, seleccionar un subconjunto de casos o cambiar la unidad de anlisis agrupando casos. Entre la amplia gama de posibilidades de transformacin de archivos disponibles se encuentran las siguientes:
Ordenar datos. Puede ordenar los casos en funcin del valor de una o ms variables. Transponer casos y variables. El formato de archivo de datos de SPSS lee las filas
como casos y las columnas como variables. Para los archivos de datos en los que el orden est invertido, se pueden intercambiar las filas y las columnas para leer los datos en el formato correcto.
Fundir archivos. Puede fundir dos o ms archivos de datos. Es posible combinar
archivos con las mismas variables pero con casos distintos, o con los mismos casos pero variables diferentes.
Seleccionar subconjuntos de casos. Puede restringir el anlisis a un subconjunto de
215
216 Captulo 9
Ordenar casos
Este cuadro de dilogo ordena los casos (las filas) del archivo de datos basndose en los valores de una o ms variables de ordenacin. Puede ordenar los casos en orden ascendente o descendente. Si selecciona ms de una variable de ordenacin, los casos se ordenarn por variable dentro de las categoras de la variable anterior de la lista Ordenar por. Por ejemplo, si selecciona Sexo como la primera variable de ordenacin y Minora como la segunda, los casos se ordenarn por minoras dentro de cada categora de sexo. Para las variables de cadena, las letras maysculas preceden a las minsculas correspondientes en orden. Por ejemplo, el valor de cadena S precede a s.
Figura 9-1 Cuadro de dilogo Ordenar casos
Transponer
Transponer crea un archivo de datos nuevo en el que se transponen las filas y las columnas del archivo de datos original de manera que los casos (las filas) se convierten en variables, y las variables (las columnas) se convierten en casos. Tambin crea automticamente nombres de variable y presenta una lista de dichos nombres. Se crea automticamente una nueva variable de cadena, case_lbl, que contiene el nombre de variable original. Si el conjunto de datos activo contiene una variable de identificacin o de nombre con valores nicos, podr utilizarla como variable de nombre: sus valores se emplearn como nombres de variable en el archivo de datos transpuesto. Si se trata de una variable numrica, los nombres de variable comenzarn por la letra V, seguida de un valor numrico. Los valores perdidos definidos por el usuario se convierten en el valor perdido del sistema en el archivo de datos transpuesto. Para conservar cualquiera de estos valores, se debe cambiar la definicin de los valores perdidos en la vista de variables del Editor de datos.
Para transponer variables y casos
E Elija en los mens: Datos Transponer... E Seleccione la variable o variables que desee transponer en casos.
218 Captulo 9
Aadir casos
Aadir casos fusiona el conjunto de datos activo con un segundo conjunto de datos o un archivo de datos con formato SPSS que contenga las mismas variables (columnas) pero diferentes casos (filas). Por ejemplo, podra registrar la misma informacin de los clientes de dos zonas de venta diferentes y conservar los datos de cada zona en archivos distintos. El segundo conjunto de datos puede ser un archivo de datos con formato SPSS externo o un conjunto de datos disponible en la sesin actual.
219 Gestin y transformacin de los archivos Figura 9-3 Cuadro de dilogo Aadir casos
Variables desemparejadas. Muestra las variables que se van a excluir del nuevo
archivo de datos fusionado. Las variables del conjunto de datos activo se identifican mediante un asterisco (*). Las variables del otro conjunto de datos se identifican con un signo ms (+). Por defecto, la lista contiene: Las variables de cualquiera de los archivos de datos que no coincidan con un nombre de variable del otro archivo. Puede crear pares a partir de variables desemparejadas e incluirlos en el nuevo archivo fusionado. Las variables definidas como datos numricos en un archivo y como datos de cadena en el otro. Las variables numricas no pueden fusionarse con variables de cadena. Variables de cadena de longitud diferente. El ancho definido de una variable de cadena debe ser el mismo en ambos archivos de datos.
Variables del nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo
archivo de datos fusionado. Por defecto, la lista incluye todas las variables que coinciden en el nombre y el tipo de datos (numricos o de cadena). Puede eliminar de la lista las variables que no desee incluir en el archivo fusionado. Las variables desemparejadas incluidas en el archivo fusionado contendrn los datos perdidos para los casos del archivo que no contiene esa variable.
220 Captulo 9
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y un valor 1 para los casos del archivo de datos externo.
Para fundir archivos de datos con las mismas variables y casos diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo. Los casos de este archivo aparecern primero en el nuevo archivo de datos fusionado.
E Elija en los mens: Datos Fundir archivos Aadir casos... E Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
la misma informacin registrada con nombres diferentes en los dos archivos. Por ejemplo, la fecha de nacimiento podra tener el nombre de variable fechnac en un archivo y nacfech en el otro.
Para seleccionar una pareja de variables desemparejadas
E Pulse en una de las variables en la lista Variables desemparejadas. E Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista con el
ratn (pulse al mismo tiempo la tecla Ctrl y el botn izquierdo del ratn).
E Pulse en Casar para desplazar el par de variables a la lista Variables del nuevo
conjunto de datos activo. (El nombre de variable del conjunto de datos activo se emplear como el nombre de variable en el archivo fusionado.)
221 Gestin y transformacin de los archivos Figura 9-4 Seleccin de parejas de variables mediante la tecla Ctrl
222 Captulo 9
Aadir variables
Aadir variables fusiona el conjunto de datos activo con otro conjunto de datos abierto o un archivo de datos con formato SPSS que contenga los mismos casos (filas) pero diferentes variables (columnas). Por ejemplo, es posible que desee fusionar un archivo de datos que contenga los resultados previos de la prueba con otro que contenga los resultados posteriores. Los casos deben estar ordenados de la misma manera en ambos conjuntos de datos. Si se utilizan una o ms variables clave para emparejar los casos, los dos conjuntos de datos deben estar ordenados por orden ascendente de la variable o variables clave. Los nombres de las variables del segundo archivo de datos que son duplicados de los del conjunto de datos activo se excluyen por defecto, ya que Aadir variables supone que estas variables contienen informacin duplicada.
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y un valor 1 para los casos del archivo de datos externo.
Figura 9-5 Cuadro de dilogo Aadir variables
Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo de datos fusionado. Por defecto, la lista contiene los nombres de variable de otro conjunto de datos que son duplicados de los del conjunto de datos. Las variables del conjunto de datos activo se identifican mediante un asterisco (*). Las variables del otro conjunto de datos se identifican con un signo ms (+). Si desea incluir en el archivo fusionado una variable excluida con un nombre duplicado, cmbiele el nombre y adala a la lista de variables que se van a incluir. Nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo conjunto de
datos fusionado. Por defecto, se incluyen en la lista todos los nombres de variable nicos que existan en ambos conjuntos de datos.
Variables clave. Si algunos casos de un conjunto de datos no se emparejan con los
del otro conjunto de datos (es decir, si faltan casos en un conjunto de datos), utilice las variables clave para identificar y emparejar correctamente los casos de ambos conjuntos de datos. Tambin puede utilizar las variables clave segn tablas de claves.
224 Captulo 9
Las variables clave deben tener los mismos nombres en ambos conjuntos de datos. Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables clave, y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de ordenacin. Los casos que no se emparejan con las variables clave se incluyen en el archivo fusionado, pero no se funden con los casos del otro archivo. Los casos no emparejados slo contienen valores para las variables del archivo de procedencia; las variables del otro archivo contienen el valor perdido del sistema.
El que no es conjunto de datos activo (o el conjunto de datos activo) es una tabla de claves. Una tabla de claves, o tabla de referencia, es un archivo en el que los datos de
cada caso se pueden aplicar a varios casos del otro archivo de datos. Por ejemplo, si un archivo contiene informacin sobre los diferentes miembros de la familia (como el sexo, la edad, la formacin) y el otro contiene informacin global (como los ingresos totales, el nmero de miembros o la ubicacin), se puede utilizar el archivo global como una tabla de referencia y aplicar los datos comunes de la familia a cada uno de sus miembros en el archivo fusionado.
Para fundir archivos con los mismos casos pero variables diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo.
E Elija en los mens: Datos Fundir archivos Aadir variables... E Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos. Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables clave, y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de ordenacin.
Agregar datos
Agregar datos agrega grupos de casos en el conjunto de datos activo en casos individuales y crea un archivo nuevo agregado o variables nuevas en el conjunto de datos activo que contiene los datos agregados. Los casos se agregan en funcin del valor de una o ms variables de segmentacin (agrupacin). Si crea un archivo de datos agregado nuevo, dicho archivo de datos nuevo contiene un caso para cada grupo definido por las variables de segmentacin. Por ejemplo, si hay una variable de segmentacin con dos valores, el archivo de datos nuevo contiene slo dos casos. Si aade variables agregadas al conjunto de datos activo, no se agrega el archivo de datos. Cada caso con los mismos valores de variables de segmentacin recibe los mismos valores para las nuevas variables agregadas. Por ejemplo, si el sexo es la nica variable de segmentacin, todos los hombres reciben el mismo valor para la variable agregada nueva que representa la edad media.
variables de segmentacin. Cada combinacin nica de valores de variables de segmentacin define un grupo. Al crear un archivo de datos agregados nuevo, todas las variables de segmentacin se guardan en el archivo nuevo con sus nombres y la informacin del diccionario. La variable de segmentacin puede ser tanto numrica como de cadena.
Agregar variables. Las variables de origen se utilizan con funciones agregadas para
crear variables agregadas nuevas. El nombre de la variable agregada viene seguido de una etiqueta de variable opcional entrecomillada, el nombre de la funcin de agregacin y el nombre de la variable de origen entre parntesis. Para las funciones de agregacin, las variables de origen deben ser numricas.
Puede anular los nombres por defecto de las variables agregadas con nuevos nombres de variable, proporcionar etiquetas de variable descriptivas y cambiar las funciones empleadas para calcular los valores de los datos agregados. Tambin puede crear una variable que contenga el nmero de casos en cada grupo de segmentacin.
Para agregar un archivo de datos
E Elija en los mens: Datos Agregar... E Seleccione una o ms variables de segmentacin que definan cmo deben agruparse
Puede aadir variables agregadas al conjunto de datos activo o crear un archivo de datos agregados nuevo.
Aadir las variables agregadas al archivo de datos de trabajo. Las nuevas variables
basadas en las funciones de agregacin se aaden al archivo de datos de trabajo. El propio archivo de datos no se agrega. Cada caso con los mismos valores en las variables de segmentacin recibe los mismos valores en las nuevas variables agregadas.
Crear un nuevo conjunto de datos que contenga nicamente las variables agregadas.
Guarda los datos agregados en un nuevo conjunto de datos durante la sesin actual. El conjunto de datos incluye las variables de segmentacin que definen los casos agregados y todas las variables de agregacin definidas por las funciones de agregacin. El conjunto de datos activo no se ve afectado.
Escribir un nuevo archivo de datos que contenga slo las variables agregadas. Crea
un nuevo archivo de datos con los datos agregados. Por defecto, se guarda un archivo denominado aggr.sav en el directorio actual.
228 Captulo 9
En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar datos ordenados previamente.
El archivo ya est ordenado por las variables de segmentacin. Si los datos ya han sido ordenados por los valores de las variables de segmentacin, esta opcin permite al procedimiento una ejecucin ms rpida y utilizar menos memoria. Utilice esta opcin con precaucin.
Los datos se deben ordenar por valores de variables de segmentacin en el mismo orden que las variables de segmentacin especificadas para el procedimiento Agregar datos. Si va a aadir variables al conjunto de datos activo, seleccione slo esta opcin si los datos se han ordenado mediante valores ascendentes de las variables de segmentacin.
Ordenar el archivo antes de la agregacin. En situaciones muy extraas y con archivos
de datos voluminosos, puede ser necesario ordenar el archivo de datos por los valores de las variables de segmentacin antes de realizar la agregacin. No se recomienda esta opcin a menos que se presenten problemas de memoria y/o rendimiento.
229 Gestin y transformacin de los archivos Figura 9-7 Cuadro de dilogo Funcin de agregacin
230 Captulo 9
Segmentar archivo
Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis basndose en los valores de una o ms variables de agrupacin. Si selecciona varias variables de agrupacin, los casos se agruparn por variable dentro de las categoras de la variable anterior de la lista Grupos basados en. Por ejemplo, si selecciona sexo como la primera variable de agrupacin y minora como la segunda, los casos se agruparn por minoras dentro de cada categora de sexo. Es posible especificar hasta ocho variables de agrupacin. Cada ocho caracteres de una variable de cadena larga (variables de cadena que superan los ocho caracteres) cuenta como una variable hasta llegar al lmite de ocho variables de agrupacin. Los casos deben ordenarse segn los valores de las variables de agrupacin, en el mismo orden en el que aparecen las variables en la lista Grupos basados en. Si el archivo de datos todava no est ordenado, seleccione Ordenar archivo segn variables de agrupacin.
Figura 9-9 Cuadro de dilogo Segmentar archivo
Comparar los grupos. Los grupos de segmentacin del archivo se presentan juntos para
poder compararlos. Para las tablas pivote se crea una sola tabla y cada variable de segmentacin del archivo puede desplazarse entre las dimensiones de la tabla. En
el caso de los grficos se crea un grfico diferente para cada grupo y se muestran juntos en el Visor.
Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran
Seleccionar casos
Seleccionar casos proporciona varios mtodos para seleccionar un subgrupo de casos basndose en criterios que incluyen variables y expresiones complejas. Tambin se puede seleccionar una muestra aleatoria de casos. Los criterios usados para definir un subgrupo pueden incluir: Valores y rangos de las variables Rangos de fechas y horas Nmeros de caso (filas) Expresiones aritmticas Expresiones lgicas Funciones
Todos los casos. Desactiva el filtrado y utiliza todos los casos. Si se satisface la condicin. Utiliza una expresin condicional para seleccionar los casos. Si el resultado de la expresin condicional es verdadero, el caso se selecciona. Si el resultado es falso o perdido, entonces el caso no se selecciona. Muestra aleatoria de casos. Selecciona una muestra aleatoria basndose en un
seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor distinto del 0 o del valor perdido para la variable seleccionada.
Resultados
Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes alternativas para tratar los casos no seleccionados:
Filtrar los casos no seleccionados. Los casos no seleccionados no se incluyen en el
anlisis, pero se conservan en el conjunto de datos. Podr utilizar los casos no seleccionados ms adelante en la sesin, si desactiva el filtrado. Si selecciona una muestra aleatoria o si selecciona los casos mediante una expresin condicional, se generar una variable con el nombre filter_$ que tendr el valor 1 para los casos seleccionados y el valor 0 para los casos no seleccionados.
Copiar los casos seleccionados a un nuevo conjunto de datos. Los casos
seleccionados se copiarn a un nuevo conjunto de datos, lo que mantendr inalterado el conjunto de datos original. Los casos no seleccionados no se incluirn en el nuevo conjunto de datos y se mantendrn en su estado original en el conjunto de datos original.
Eliminar los casos no seleccionados. Los casos no seleccionados se eliminarn
del conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningn cambio y abrindolo de nuevo. La eliminacin de los casos ser permanente si se guardan los cambios en el archivo de datos. Nota: Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar estos casos.
Para seleccionar un subconjunto de casos
E Elija en los mens: Datos Seleccionar casos... E Seleccione uno de los mtodos de seleccin de casos. E Especifique los criterios para la seleccin de casos.
Si el resultado de una expresin condicional es verdadero, se incluir el caso en el subconjunto seleccionado. Si el resultado de una expresin condicional es falso o perdido, no se incluir el caso en el subconjunto seleccionado. La mayora de las expresiones condicionales utilizan al menos uno de los seis operadores de relacin (<, >, <=, >=, =, y ~=) de la calculadora. Las expresiones condicionales pueden incluir nombres de variable, constantes, operadores aritmticos, funciones numricas (y de otros tipos), variables lgicas y operadores de relacin.
235 Gestin y transformacin de los archivos Figura 9-12 Cuadro de dilogo Seleccionar casos: Muestra aleatoria
casos indicado. Dado que esta rutina toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede aproximar al especificado. Cuantos ms casos contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados al porcentaje especificado.
Exactamente. Un nmero de casos especificado por el usuario. Tambin se debe
especificar el nmero de casos a partir de los cuales se generar la muestra. Este segundo nmero debe ser menor o igual que el nmero total de casos presentes en el archivo de datos. Si lo excede, la muestra contendr un nmero menor de casos proporcional al nmero solicitado.
236 Captulo 9 Figura 9-13 Cuadro de dilogo Seleccionar casos: Rango para rangos de casos (sin variables de fecha definidas)
Figura 9-14 Cuadro de dilogo Seleccionar casos: Rango para datos de la serie temporal con variables de fecha definidas
Ponderar casos
Ponderar casos proporciona a los casos diferentes ponderaciones (mediante una rplica simulada) para el anlisis estadstico. Los valores de la variable de ponderacin deben indicar el nmero de observaciones representadas por casos nicos en el archivo de datos. Los casos con valores perdidos, negativos o cero para la variable de ponderacin se excluyen del anlisis. Los valores fraccionarios son vlidos; se usan exactamente donde adquieren sentido y, con mayor probabilidad, donde se tabulan los casos.
237 Gestin y transformacin de los archivos Figura 9-15 Cuadro de dilogo Ponderar casos
Si aplica una variable de ponderacin, sta seguir vigente hasta que se seleccione otra o se desactive la ponderacin. Si guarda un archivo de datos ponderado, la informacin de ponderacin se guardar con el archivo. Puede desactivar la ponderacin en cualquier momento, incluso despus de haber guardado el archivo de forma ponderada.
Ponderaciones en las tablas de contingencia. El procedimiento Tablas de contingencia
cuenta con diversas opciones para el tratamiento de ponderaciones de los casos. Si desea obtener ms informacin, consulte Tablas de contingencia: Mostrar en las casillas en Captulo 17 en p. 384.
Ponderaciones en los diagramas de dispersin y los histogramas. Los diagramas
de dispersin y los histogramas tienen una opcin para activar y desactivar las ponderaciones de los casos, pero dicha opcin no afecta a los casos que tienen un valor negativo, un valor 0 o un valor perdido para la variable de ponderacin. Estos casos permanecen excluidos del grfico incluso si se desactiva la ponderacin desde el grfico.
Para ponderar casos
E Elija en los mens: Datos Ponderar casos... E Seleccione Ponderar casos mediante. E Seleccione una variable de frecuencia.
238 Captulo 9
Los valores de la variable de frecuencia se utilizan como ponderaciones de los casos. Por ejemplo, un caso con un valor 3 para la variable de frecuencia representar tres casos en el archivo de datos ponderado.
Si lo desea, puede: Crear variables de identificacin, que permitirn un seguimiento de un valor del nuevo archivo a partir de un valor del archivo original. Ordenar los datos antes de la reestructuracin. Definir opciones para el nuevo archivo. Pegar la sintaxis de comandos en una ventana de sintaxis.
239 Gestin y transformacin de los archivos Figura 9-16 Asistente de reestructuracin de datos
disponga, en los datos, de grupos de columnas relacionadas y desee que aparezcan en el nuevo archivo de datos como grupos de filas. Si elige esta opcin, el asistente mostrar los pasos para Variables a casos.
Reestructurar casos seleccionados en variables. Seleccione esta opcin cuando
disponga, en los datos, de grupos de filas relacionadas y desee que aparezcan en el nuevo archivo de datos como grupos de columnas. Si elige esta opcin, el asistente mostrar los pasos para Casos a variables.
Transponer todos los datos. Seleccione esta opcin cuando desee transponer los
datos. Todas las filas se convertirn en columnas y todas las columnas en filas, en el nuevo archivo de datos. Esta opcin cierra el Asistente de reestructuracin de datos y abre el cuadro de dilogo Transponer datos.
240 Captulo 9
Una variable contiene informacin que se desea analizar, por ejemplo, una medida o una puntuacin. Un caso es una observacin, por ejemplo, un individuo. En una estructura de datos simple, cada variable es una nica columna de datos y cada caso es una nica fila. De manera que, por ejemplo, si estuviera midiendo las puntuaciones de un examen realizado a todos los alumnos de una clase, todos los valores de las notas apareceran en una nica columna y habra una fila para cada alumno. Cuando se analizan datos, a menudo se est analizando cmo vara una variable en funcin de cierta condicin. Dicha condicin puede ser un tratamiento experimental especfico, un grupo demogrfico, un momento en el tiempo u otra cosa. En el anlisis de datos, a las condiciones de inters a menudo se las denomina factores. Al analizar factores, se dispone de una estructura de datos compleja. Es posible que haya informacin acerca de una variable en ms de una columna de datos (por ejemplo, una columna para cada nivel de un factor), o que haya informacin acerca de un caso en ms de una fila (por ejemplo, una fila para cada nivel de un factor). El Asistente de reestructuracin de datos le ayuda a reestructurar archivos con una estructura de datos compleja. La estructura del archivo actual y la estructura que se desea en el nuevo archivo determinan las elecciones que se deben seleccionar en el asistente.
Cmo estn organizados los datos en el archivo actual? Es posible que los datos
actuales estn organizados de manera que los factores estn registrados en una variable diferente (como grupos de casos) o con la variable (como grupos de variables).
Grupos de casos. El archivo actual tiene registradas las variables y las
En este ejemplo, las dos primeras filas son un grupo de casos porque estn relacionadas. Contienen datos para el mismo nivel del factor. En el anlisis de datos de SPSS, cuando los datos estn estructurados de esta manera, se hace referencia al factor como variable de agrupacin.
Grupos de columnas. El archivo actual tiene registradas las variables y las
En este ejemplo, las dos primeras columnas son un grupo de variables porque estn relacionadas. Contienen datos para la misma variable, var_1 para el nivel 1 del factor y var_2 para el nivel 2 del factor. En el anlisis de datos de SPSS, si los datos se estructuran de esta manera, el factor se suele denominar de medidas repetidas.
Cmo deben organizarse los datos en el archivo nuevo? Normalmente, la organizacin
estar determinada por el procedimiento que se vaya a utilizar para analizar los datos.
Procedimientos que requieren grupos de casos. Los datos debern estructurarse
en grupos de casos para realizar los anlisis que requieran una variable de agrupacin. Algunos ejemplos son: univariante, multivariante y componentes de la varianza de los Modelos lineales generales; Modelos mixtos; Cubos OLAP; y muestras independientes de las Pruebas T o Pruebas no paramtricas. Si la estructura de datos actual es de grupos de variables y desea realizar estos anlisis, seleccione Reestructurar variables seleccionadas en casos.
Procedimientos que requieren grupos de variables. Los datos se debern estructurar
en grupos de variables para analizar medidas repetidas. Algunos ejemplos son: medidas repetidas de los Modelos lineales generales, anlisis de covariables dependientes del tiempo del Anlisis de regresin de Cox, muestras relacionadas de las Pruebas T o muestras relacionadas de las Pruebas no paramtricas. Si la estructura de datos actual es de grupos de casos y desea realizar estos anlisis, seleccione Reestructurar casos seleccionados en variables.
242 Captulo 9 Figura 9-17 Datos actuales para reestructurar variables a casos
Se desea realizar una prueba t para muestras independientes. Se dispone de un grupo de columnas compuesto por puntuacin_a y puntuacin_b, pero no se dispone de la variable de agrupacin que requiere el procedimiento. Seleccione Reestructurar variables seleccionadas en casos en el Asistente de reestructuracin de datos, reestructure un grupo de variables en una nueva variable denominada puntuacin y cree un ndice denominado grupo. El nuevo archivo de datos se muestra en la siguiente imagen.
Figura 9-18 Datos nuevos y reestructurados para variables a casos
Cuando se ejecute la prueba t para muestras independientes, podr utilizar grupo como variable de agrupacin.
Se desea realizar una prueba t para muestras relacionadas. La estructura de datos es de grupos de casos, pero no se dispone de las medidas repetidas para las variables relacionadas que requiere el procedimiento. Seleccione Reestructurar casos seleccionados en variables en el Asistente de reestructuracin de datos, utilice id para identificar los grupos de filas en los datos actuales y utilice tiempo para crear el grupo de variables en el nuevo archivo.
Figura 9-20 Datos nuevos y reestructurados para casos a variables
Cuando se ejecute la prueba t de muestras relacionadas, podr utilizar ant y des como el par de variables.
variables existen en los datos actuales. Un grupo de columnas relacionadas, llamado grupo de variables, registra medidas repetidas de la misma variable en distintas columnas. Por ejemplo, si en los datos actuales hay tres columnas, c1, c2 y c3, que registran el contorno, entonces hay un grupo de variables. Si adems hay otras tres columnas, a1, a2 y a3, que registran la altura, entonces hay dos grupos de variables.
Cuntos grupos de variables debe haber en el archivo nuevo? Considere cuntos grupos de variables desea que estn representados en el nuevo archivo de datos, teniendo en cuenta que no es necesario reestructurar todos los grupos de variables en el nuevo archivo.
244 Captulo 9 Figura 9-21 Asistente de reestructuracin de datos: Nmero de grupos de variables, paso 2
archivo. El nmero que se especifique afectar al siguiente paso, en el que el asistente crear de forma automtica el nmero especificado de nuevas variables.
En este paso, se debe proporcionar informacin sobre cmo se van a utilizar las variables del archivo actual en el nuevo archivo. Tambin se puede crear una variable que identifique las filas en el nuevo archivo.
Figura 9-22 Asistente de reestructuracin de datos: Seleccionar variables, paso 3
Cmo se deben identificar las nuevas filas? En el nuevo archivo de datos, puede crear
una variable que identifique la fila del archivo de datos actual que ha sido utilizada para crear un grupo de filas nuevo. El identificador puede ser un nmero de caso secuencial o los valores de una variable. Utilice los controles disponibles en el apartado Identificacin de grupos de casos para definir la variable de identificacin utilizada en el nuevo archivo. Pulse en la casilla para cambiar el nombre de variable por defecto y para dotar a la variable de identificacin de una etiqueta de variable descriptiva.
246 Captulo 9
asistente del nmero de grupos de variables que se deseaba reestructurar. El asistente cre una nueva variable para cada grupo. Los valores para el grupo de variables aparecern en dicha variable en el nuevo archivo. Utilice los controles en Variables que se van a transponer para definir la variable reestructurada en el nuevo archivo.
Para especificar una variable reestructurada
E Ponga las variables que componen el grupo de variables que desea transformar en
la lista Variables que se van a transponer. Todas las variables del grupo debern ser del mismo tipo (numricas o de cadena). Se puede incluir la misma variable ms de una vez en el grupo de variables (las variables se copian de la lista origen de variables en lugar de moverlas); los valores se repetirn en el nuevo archivo.
Para especificar varias variables reestructuradas
E Seleccione la primera variable de destino que desea definir de la lista desplegable
Variable de destino.
E Ponga las variables que componen el grupo de variables que desea transformar en la
lista Variables que se van a transponer. Todas las variables del grupo debern ser del mismo tipo (numricas o de cadena). Puede incluir la misma variable ms de una vez en el grupo de variables. (Las variables se copian de la lista origen de variables en lugar de moverlas, y los valores se repetirn en el nuevo archivo.)
E Seleccione la siguiente variable de destino que desea definir y repita el proceso de
seleccin de variables para todas las variables de destino disponibles. Aunque puede incluir la misma variable ms de una vez en el mismo grupo de variables de destino, no puede incluir la misma variable en ms de un grupo de variables de destino. Cada lista de grupos de variables de destino debe contener el mismo nmero de variables. (Las variables que aparecen ms de una vez se incluyen en el recuento).
El nmero de grupos de variables de destino est determinado por el nmero de grupos de variables especificados en el paso anterior. Aqu puede cambiar los nombres de las variables por defecto, pero deber volver al paso anterior para cambiar el nmero de grupos de variables que se van a reestructurar. Debe definir los grupos de variables (seleccionando variables de la lista de origen) para todas las variables de destino disponibles antes de poder pasar al siguiente paso.
Qu se debe copiar en el nuevo archivo? En el nuevo archivo se pueden copiar variables que no se han reestructurado. Sus valores se propagarn en las nuevas filas. Desplace las variables que desea copiar en el nuevo archivo en la lista Variables fijas.
248 Captulo 9 Figura 9-23 Asistente de reestructuracin de datos: Crear variables de ndice, paso 4
Cuntas variables de ndice debe haber en el archivo nuevo? Las variables de ndice
se pueden utilizar como variables de agrupacin en los procedimientos de SPSS. En la mayora de los casos, es suficiente una nica variable de ndice; no obstante, si los grupos de variables del archivo actual reflejan varios niveles de factor, puede ser conveniente utilizar varios ndices.
Uno. El asistente crear una nica variable de ndice. Ms de uno. El asistente crear varios ndices y deber introducir el nmero de
ndices que desea crear. El nmero especificado afectar al siguiente paso, en el que el asistente crea de forma automtica el nmero especificado de ndices.
Ninguno. Seleccione esta opcin si no desea crear variables de ndice en el nuevo
archivo.
Se va a reestructurar el grupo de variables en una nica variable, contorno, y se va a crear un nico ndice numrico. Los nuevos datos se muestran en la siguiente tabla.
Figura 9-25 Datos nuevos y reestructurados con un ndice
El ndice comienza por 1 y se incrementa por cada variable del grupo. Vuelve a comenzar cada vez que se encuentra una fila en el archivo original. Ahora se puede utilizar ndice en procedimientos de SPSS que requieran una variable de agrupacin.
Se va a reestructurar el grupo de variables en una nica variable, contorno, y se van a crear dos ndices. Los nuevos datos se muestran en la siguiente tabla.
Figura 9-27 Datos nuevos reestructurados con los dos ndices
251 Gestin y transformacin de los archivos Figura 9-28 Asistente de reestructuracin de datos: Crear una variable de ndice, paso 5
Si desea obtener ms informacin, consulte Ejemplo de un ndice para variables a casos en p. 249.
Nmeros secuenciales. El asistente asignar de forma automtica nmeros
por defecto y proporcionar una etiqueta de variable descriptiva para la variable de ndice.
252 Captulo 9
Si desea obtener ms informacin, consulte Ejemplo de dos ndices para variables a casos en p. 249.
Cuntos niveles hay registrados en el archivo actual? Calcule los niveles de factor
que hay registrados en los datos actuales. Un nivel define un grupo de casos que experimentan las mismas condiciones. Si hay varios factores, los datos actuales se
deben organizar de manera que los niveles del primer factor sean un ndice primario dentro del cual varan los niveles de los siguientes factores.
Cuntos niveles debe haber en el archivo nuevo? Introduzca el nmero de niveles
para cada ndice. Los valores para varias variables de ndice son siempre nmeros secuenciales. Los valores comienzan en 1 y se incrementan con cada nivel. El primer ndice se incrementa ms despacio y el ltimo ms deprisa.
Nmero total de niveles combinados. No se puede crear ms niveles de los que existen
en los datos actuales. Como los datos reestructurados contendrn una fila por cada combinacin de tratamientos, el asistente realizar una comprobacin del nmero de niveles que se crean. Comparar el producto de los niveles creados con el nmero de variables del grupo de variables. Deben coincidir.
Nombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable por defecto y proporcionar una etiqueta de variable descriptiva para las variables de ndice.
Desea eliminar las variables no seleccionadas? En el paso de seleccin de variables (paso 3), se seleccionaron los grupos de variables que se iban a reestructurar, las variables que se iban a copiar y una variable de identificacin de los datos actuales. Los datos de las variables seleccionadas aparecern en el nuevo archivo. Si hay ms variables en los datos actuales, puede elegir descartarlas o conservarlas. Desea conservar los datos perdidos? El asistente comprueba cada nueva fila potencial
en busca de valores nulos. Un valor nulo es un valor en blanco o perdido por el sistema. Se puede elegir entre conservar o descartar las filas que contienen slo valores nulos.
Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el nuevo archivo. Dicha variable contiene el nmero de nuevas filas generadas por una fila de los datos actuales. Una variable de recuento puede ser de
gran utilidad si decide descartar del nuevo archivo los valores nulos, ya que esto conlleva la generacin de un nmero distinto de nuevas filas por una fila dada de los datos actuales. Pulse en una casilla para cambiar el nombre de variable por defecto y proporcionar una etiqueta de variable descriptiva para la variable de recuento.
256 Captulo 9
un grupo de filas relacionadas porque miden la misma unidad de observacin, por ejemplo, un individuo o una institucin. El asistente necesita conocer cules son las variables del archivo actual que identifican los grupos de casos para que se pueda consolidar cada grupo en una nica fila del nuevo archivo. Desplace las variables que identifican grupos de casos en el archivo actual a la lista de Variables de identificacin. Las variables que se utilizan para segmentar el archivo de datos actual se utilizan de forma automtica para identificar los grupos de casos. Cada vez que se encuentra una nueva combinacin de valores de identificacin, el asistente crear una nueva fila, de manera que los casos del archivo actual debern ordenarse en funcin de los valores de las variables de identificacin, en el mismo orden en el que aparecen las variables en la lista Variables de identificacin. Si el archivo de datos actual no est an ordenado, podr hacerlo en el siguiente paso.
Cmo deben crearse los nuevos grupos de variables en el archivo nuevo? En los datos originales, una variable aparece en una nica columna. En el nuevo archivo de datos, dicha variable aparecer en varias columnas. Las variables de ndice son variables existentes en los datos actuales que el asistente deber utilizar para crear las nuevas columnas. Los datos reestructurados contendrn una nueva variable por cada valor nico contenido en dichas columnas. Desplace a la lista Variables de ndice las variables que se deben utilizar para formar los nuevos grupos de variables. Cuando el asistente ofrezca opciones, tambin puede elegir ordenar las nuevas columnas por el ndice. Qu sucede con las dems columnas? El asistente decide de forma automtica lo que
hay que hacer con las variables que quedan en la lista Archivo actual. Comprueba cada variable para ver si los valores de los datos varan dentro de un grupo de casos. Si hay alguna variacin, el asistente reestructurar los valores en un grupo de variables en el nuevo archivo. Si no la hay, el asistente copiar los valores en el nuevo archivo.
En este paso, debe decidir si se ordena el archivo actual antes de reestructurarlo. Cada vez que el asistente se encuentra una nueva combinacin de valores de identificacin, se crea una nueva fila, por lo tanto, es importante que los datos estn ordenados por las variables que identifican los grupos de casos.
Figura 9-32 Asistente de reestructuracin de datos: Ordenacin de los datos, paso 3
Cmo estn ordenadas las filas en el archivo actual? Tenga en cuenta la ordenacin de
los datos actuales y cules son las variables que se estn utilizando para identificar grupos de casos (especificadas en el paso anterior).
S. El asistente ordenar de forma automtica los datos actuales en funcin de la
variable de identificacin, con el mismo orden en el que aparecen las variables en la lista Variables de identificacin en el paso anterior. Seleccione esta opcin cuando los datos no estn ordenados en funcin de las variables de identificacin o cuando no est seguro. Esta opcin requiere una lectura adicional de los
258 Captulo 9
datos, pero garantiza que las filas estn correctamente ordenadas antes de la reestructuracin.
No. El asistente no ordenar los datos actuales. Seleccione esta opcin cuando
est seguro de que los datos actuales estn ordenados en funcin de las variables que identifican los grupos de casos.
Cmo deben ordenarse los nuevos grupos de variables en el archivo nuevo? Por variable. El asistente agrupa juntas las nuevas variables creadas a partir de
variables de ndice.
Ejemplo. Las variables que se van a reestructurar son w y h, y el ndice es mes:
w h mes
Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el nuevo archivo. Dicha variable contendr el nmero de filas de los datos actuales que se utilizaron para crear una fila en el nuevo archivo de datos. Desea crear variables indicadoras? El asistente puede utilizar las variables de ndice para crear variables indicadoras en el nuevo archivo de datos. Crear una nueva variable por cada valor nico de la variable de ndice. Las variables indicadoras indican la presencia o ausencia de un valor para un caso. Una variable indicadora toma el valor 1 si el caso tiene un valor; en caso contrario, vale 0. Ejemplo. La variable de ndice es producto. Registra los productos que ha comprado un cliente. Los datos originales son:
cliente 1 1 2 3 producto pollo huevos huevos pollo
260 Captulo 9
La creacin de una variable indicadora da como resultado una nueva variable para cada valor nico de producto. Los datos reestructurados son:
cliente 1 2 3 indpollo 1 0 1 indhuevos 1 1 0
En este ejemplo, se pueden utilizar los datos reestructurados para obtener recuentos de frecuencias de los productos que compran los clientes.
261 Gestin y transformacin de los archivos Figura 9-34 Asistente de reestructuracin de datos: Finalizar
reestructurado. Seleccione esta opcin si desea reemplazar el archivo actual inmediatamente. Nota: Si los datos originales estn ponderados, los nuevos datos tambin lo estarn, a menos que la variable utilizada como ponderacin se reestructure o se elimine del nuevo archivo.
Pegar la sintaxis. El asistente pegar la sintaxis que ha generado en una ventana
de sintaxis. Seleccione esta opcin si no est preparado para reemplazar el archivo actual, si desea modificar la sintaxis o si desea guardarla para utilizarla en el futuro.
10
Captulo
Cuando ejecute un procedimiento, los resultados se mostrarn en una ventana llamada Visor. Desde esta ventana puede desplazarse con facilidad a los resultados que desee ver. Tambin puede modificar los resultados y crear un documento que contenga exactamente los resultados que desee.
Visor
Los resultados se muestran en el Visor. Puede utilizar el Visor para: Examinar los resultados. Mostrar u ocultar tablas y grficos seleccionados. Cambiar el orden de presentacin de los resultados moviendo los elementos seleccionados. Mover elementos entre el Visor y otras aplicaciones.
263
El Visor se divide en dos paneles: El panel izquierdo muestra una vista de titulares del contenido. El panel derecho contiene tablas estadsticas, grficos y resultados de texto. Puede utilizar las barras de desplazamiento para examinar los resultados o bien pulsar en un elemento de los titulares para ir directamente a la tabla o grfico correspondientes. Puede pulsar y arrastrar el borde derecho del panel de titulares para cambiar la anchura del mismo.
Si desea obtener ms informacin, consulte Visor de borrador en Captulo 11 en p. 299. Tambin puede ir a la funcin Ayuda para aprender ms:
E Seleccione en cualquiera de las ventanas las siguientes opciones de los mens: ? Temas
E Pulse en la pestaa ndice de la ventana de Ayuda en pantalla. E Escriba visor de borrador y, a continuacin, pulse dos veces en la entrada de ndice.
o
E Pulse en el elemento para seleccionarlo. E Elija en los mens: Ver Ocult.
o
E Pulse en el icono de libro cerrado (Ocultar) de la barra de herramientas de titulares.
266 Captulo 10
El icono de libro abierto (Mostrar) se convierte en el icono activo, indicando que el elemento no est oculto.
titulares. Se ocultarn todos los resultados del procedimiento y se contraer la presentacin de titulares.
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar elementos no contiguos.)
E Pulse y arrastre los elementos seleccionados (mantenga pulsado el botn del ratn
mientras arrastra).
E Suelte el botn del ratn en el elemento situado justamente encima de la ubicacin
donde desea colocar los elementos movidos. Tambin puede mover elementos con las opciones Cortar y Pegar detrs del men Edicin.
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar elementos no contiguos.)
o
E Elija en los mens: Edicin Borrar
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar elementos no contiguos.)
E Mantenga pulsada la tecla Ctrl mientras pulsa y arrastra los elementos seleccionados
Tambin puede copiar elementos con las opciones Copiar y Pegar detrs del men Edicin.
(mantenga pulsada la tecla Mays o la tecla Ctrl para seleccionar mltiples elementos).
E Elija en los mens: Formato Alineacin izquierda
268 Captulo 10
Nota: Todos los resultados aparecen alineados a la izquierda en el Visor. Los ajustes de alineacin slo afectan a los resultados. Los elementos con alineacin centrada y a la derecha se identifican por un pequeo smbolo situado encima y a la izquierda del elemento.
269 Trabajo con resultados Figura 10-2 Vista de titulares contrada y resultados ocultos
puede: Expandir y contraer la presentacin de titulares. Cambiar el nivel de los titulares para los elementos seleccionados. Cambiar el tamao de los elementos en la presentacin de titulares. Cambiar la fuente utilizada en la presentacin de titulares.
contraer o expandir. o
E Pulse en el elemento de los titulares.
o
Ver Expandir
o
Edicin Resaltado Descender
El cambio del nivel de titulares es particularmente til despus de mover elementos en el nivel de titulares. El desplazamiento de elementos puede cambiar el nivel de titulares de los elementos y puede utilizar los botones de flecha izquierda y derecha de la barra de herramientas de los titulares para restaurar el nivel de titulares original.
o
Insertar Nuevo texto E Pulse dos veces en el nuevo objeto. E Introduzca el texto que desee en esta ubicacin.
272 Captulo 10 E Elija en los mens: Insertar Archivo de texto... E Seleccione un archivo de texto.
grficos como imgenes de metarchivo. El formato de la imagen puede cambiarse de tamao en la otra aplicacin y a veces determinados aspectos de la edicin se pueden realizar con las caractersticas que proporcione la otra aplicacin. Las tablas pivote pegadas como imgenes conservan todas las caractersticas de bordes y fuente.
RTF (formato de texto enriquecido). Las tablas pivote pueden pegarse en otras
aplicaciones con formato RTF. En la mayora de las aplicaciones, esto significa que la tabla pivote se pega como una tabla que puede editarse posteriormente en la otra aplicacin.
Mapa de bits. Los grficos pueden pegarse en otras aplicaciones como mapas de bits. BIFF. El contenido de una tabla se puede pegar en una hoja de clculo y conservar
la precisin numrica.
Texto. El contenido de una tabla se puede copiar y pegar como texto. Este proceso
puede ser til en aplicaciones como el correo electrnico, donde slo se puede aceptar o transmitir texto.
o
Edicin Pegado especial...
aplicacin determinar el mejor formato para la operacin de pegado. En la mayora de las aplicaciones, el comando de pegado pegar los resultados como una imagen (metarchivo). En los procesadores de textos, este comando pegar las tablas pivote con formato RTF, el cual las pega como tablas. En las aplicaciones de hoja de clculo, las tablas pivote se pegan con formato BIFF. Los grficos se pegan como metarchivos.
Pegado especial. Los resultados se pegan al Portapapeles en mltiples formatos.
Pegado especial le permite seleccionar el formato que desea de la lista de formatos disponibles en la aplicacin de destino.
274 Captulo 10
SPSS. Esta accin activar la incrustacin ActiveX para las tablas pivote. El archivo objs-off.bat desactiva la incrustacin ActiveX. Para incrustar una tabla pivote o un grfico interactivo en otra aplicacin:
E Copie la tabla en el Visor. E Elija en los mens de la aplicacin de destino: Edicin Pegado especial... E En la lista, seleccione Objeto Tabla pivote de SPSS u Objeto de control de grficos de SPSS.
La aplicacin de destino debe admitir los objetos ActiveX. Consulte la documentacin que se suministra con la aplicacin para obtener informacin sobre la compatibilidad con ActiveX. Algunas aplicaciones que no admiten ActiveX pueden aceptar en un principio las tablas pivote ActiveX, sin embargo pueden presentar posteriormente un comportamiento inestable. No confe en los objetos incrustados hasta que no haya comprobado la estabilidad de la aplicacin con los objetos ActiveX incrustados.
El elemento se pegar como metarchivo. Slo la capa y las columnas visibles cuando se copi el elemento estarn disponibles en el metarchivo. Las otras capas o las columnas ocultas no estarn disponibles.
Al realizar esta operacin, la tabla pivote se pegar como una tabla. Slo se pegarn en la tabla la capa y las columnas que estaban visibles cuando se copi el elemento. Las otras capas o las columnas ocultas no estarn disponibles. Con este formato slo es posible copiar y pegar una tabla pivote cada vez.
El texto sin formato de la tabla pivote contiene tabuladores entre columnas. Las columnas se pueden alinear ajustando los tabuladores en la otra aplicacin.
276 Captulo 10
Nota: Utilice la opcin Copiar objetos slo para copiar varios elementos del Visor en otra aplicacin. Para copiar y pegar dentro de los documentos del Visor (por ejemplo, entre dos ventanas del Visor), utilice el comando Copiar del men Edicin.
Pegado especial
Pegado especial permite seleccionar el formato de un objeto copiado que se pega en el Visor. Los tipos de archivo posibles para el objeto se muestran en el cuadro de dilogo Pegado especial El objeto se insertar en el Visor despus del objeto actualmente seleccionado.
Figura 10-3 Cuadro de dilogo Pegado especial
277 Trabajo con resultados E En el panel de titulares o en el panel de contenidos del Visor, pulse en la tabla, en el
Exportar resultados
Con Exportar resultados se guardan las tablas pivote y los resultados de texto en formato HTML, texto, Word/RTF, Excel y PowerPoint (requiere PowerPoint 97 o posterior) y, asimismo, se guardan los grficos en una amplia variedad de formatos comunes utilizados por otras aplicaciones. (Nota: en la versin para estudiantes no est disponible la exportacin a PowerPoint.)
Documento de salida. Exporta cualquier combinacin de tablas pivote, resultados
de texto y grficos. Para los formatos HTML y de texto, los grficos se exportan en el formato de exportacin de grficos seleccionado actualmente. Si se trata de documentos HTML, los grficos se incrustan mediante referencias y deben exportarse a un formato adecuado para incluirlos en los documentos HTML. En el caso de documentos de texto se inserta una lnea en el archivo de texto para cada grfico, indicando el nombre de archivo del grfico exportado. Para los formatos Word o RTF, los grficos se exportan en formato de metarchivo de Windows y se incrustan en el documento de Word. No se incluyen grficos en los documentos de Excel. Para el formato PowerPoint, los grficos se exportan en formato TIFF y se incrustan en el archivo de PowerPoint.
Documento de resultados (sin grficos). Exporta tablas pivote y resultados de texto. Se
Windows (WMF), metarchivo mejorado (EMF), mapa de bits de Windows (BMP), PostScript encapsulado (EPS), JPEG, TIFF, PNG y PICT de Macintosh.
278 Captulo 10
Exportar qu. Permite exportar todos los objetos del Visor, todos los objetos visibles o
son HTML, texto, Excel, Word/RTF y PowerPoint, mientras que para los formatos HTML y de texto, los grficos se exportan en el formato de grfico seleccionado actualmente en el cuadro de dilogo Opciones para el formato seleccionado. Para Slo grficos, seleccione un formato de exportacin del grfico en la lista desplegable. Para exportar documentos de resultados, tablas pivote y texto, siga las instrucciones siguientes:
Archivo HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los
por tabuladores o por espacios. Todos los resultados de texto se exportan en formato separado por espacios.
Archivo de Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan
como filas, columnas y casillas de Excel, con todos los atributos de formato intactos, por ejemplo, bordes de casilla, estilos de fuente y colores de fondo, etc. Los resultados de texto se exportan con todos los atributos de fuente intactos. Cada lnea del resultado de texto constituye una fila del archivo de Excel y se incluye todo su contenido en una sola casilla.
Archivo de Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word,
con todos los atributos de formato intactos (por ejemplo, bordes de casilla, estilos de fuente, colores de fondo, etc.). Los resultados de texto se exportan en formato RTF. Los resultados de texto siempre se muestran en SPSS con un tipo de letra de paso fijo (monoespaciadas) y se exportan con los mismos atributos de fuente. Es necesario utilizar una fuente de paso fijo para que los resultados de texto separado por espacios queden correctamente alineados; por defecto, la mayora de los navegadores de Web utilizan una fuente de paso fijo para el texto con formato previo.
Archivo PowerPoint (*.ppt). Las tablas pivote se exportan como tablas de Word
y se incrustan en diapositivas independientes en el archivo de PowerPoint (una diapositiva por cada tabla pivote). Se conservan todos los atributos de formato de la tabla pivote, por ejemplo, bordes de casillas, estilos de fuente y colores de fondo. Los resultados de texto se exportan en formato RTF. Los resultados de texto siempre se muestran en SPSS con un tipo de letra de paso fijo (monoespaciadas) y se exportan con los mismos atributos de fuente. Es
necesario utilizar una fuente de paso fijo para que los resultados de texto separado por espacios queden correctamente alineados; por defecto, la mayora de los navegadores de Web utilizan una fuente de paso fijo para el texto con formato previo. (Nota: en la versin para estudiantes no est disponible la exportacin a PowerPoint.)
Sistema de gestin de resultados. Puede exportar automticamente adems todos los
resultados o tipos de resultados especificados por el usuario como texto, HTML, XML y archivos de datos en formato SPSS. Si desea obtener ms informacin, consulte Sistema de gestin de resultados en Captulo 48 en p. 721.
de exportacin.
Figura 10-4 Cuadro de dilogo Exportar resultados
incluido el tamao de los grficos para documentos HTML. Para los formatos Word o RTF, todos los grficos se exportan en formato de metarchivo de Windows (WMF). No se incluyen grficos para los documentos de Excel.
Mantener las notas y el texto al pie al exportar. Seleccione esta casilla para incluir las notas y el texto al pie en la exportacin de tablas pivote.
Exportar todas las capas. Seleccione esta casilla para exportar todas las capas de una tabla pivote de varias capas. Si no selecciona la casilla, slo se exportar la capa superior.
exportacin.
E Pulse en Opciones.
Opciones de PowerPoint
Opciones de PowerPoint controla la inclusin de los ttulos de diapositivas, la inclusin de notas y textos al pie para las tablas pivote, la gestin de tablas pivote de varias capas y las opciones para los grficos exportados a PowerPoint. (Nota: en la versin para estudiantes no est disponible la exportacin a PowerPoint.)
Figura 10-6 Cuadro de dilogo Opciones de PowerPoint
Incluir el ttulo en la diapositiva. Seleccione esta casilla para incluir un ttulo en cada
diapositiva creada mediante la exportacin. Cada diapositiva contiene un nico elemento exportado del Visor. El ttulo se genera a partir de la entrada del titular para el elemento en el panel de titulares del Visor.
282 Captulo 10
Mantener las notas y el texto al pie al exportar. Seleccione esta casilla para incluir las notas y el texto al pie en la exportacin de tablas pivote. Exportar todas las capas. Seleccione esta casilla para exportar todas las capas de una tabla pivote de varias capas. Cada capa se colocar en una diapositiva distinta y todas las capas tendrn el mismo ttulo. Si no selecciona esta casilla, slo se exportar la capa superior.
Las tablas pivote se pueden exportar en formato separado por tabuladores o por espacios. Para el formato separado por tabuladores, si una casilla no est vaca, se imprimir su contenido y un tabulador. Si una casilla est vaca, se imprimir un tabulador.
Todos los resultados de texto se exportan en formato separado por espacios. Todos los resultados separados por espacios requieren una fuente de paso fijo (monoespaciada) para su correcta alineacin.
Formato de casilla. En las tablas pivote separadas por espacios se eliminan por defecto
todas las lneas de separacin y se establece el ancho de cada columna mediante la etiqueta o el valor ms largo de la columna. Para limitar el ancho de las columnas y ajustar las etiquetas largas, especifique un nmero de caracteres para el ancho de la columna. Este ajuste slo afecta a las tablas pivote.
Separador de casillas. En las tablas pivote separadas por espacios puede especificar
los caracteres que se emplean para crear los bordes de las casillas.
Formato de imagen. Controla el formato de exportacin de los grficos y otros ajustes,
entre cada tabla. En el caso de las tablas pivote de varias capas, esta opcin inserta un salto de pgina entre cada capa.
284 Captulo 10 E Elija en los mens: Archivo Exportar... E En el caso de los documentos de resultados, pulse en Opciones, seleccione el formato de exportacin y, a continuacin, pulse en Tamao del grfico. E En el caso de Slo grficos, seleccione el formato de exportacin y, a continuacin, pulse en Tamao del grfico.
codificados en la imagen. El modelo de color YUV es una forma de codificacin de color, utilizada normalmente para la transmisin por vdeo digital y MPEG. El acrnimo significa seal Y, seal U, seal V. El componente Y especifica la escala de grises o luminancia, y los componentes U y V se corresponden con la crominancia (informacin de color). Las relaciones representan las tasas de muestreo de cada componente. Si se reducen las tasas de muestreo U y V, se reduce a su vez el tamao de los archivos (y tambin la calidad). Espacio de color determina el grado de prdida de los colores de la imagen exportada. YUV 4:4:4 implica una menor prdida, mientras que YUV 4:2:2 y YUV 4:1:1 representan un equilibrio decreciente entre el tamao de los archivos (espacio en disco) y la calidad de los colores que estn representados.
Codificacin progresiva. Activa la imagen para realizar la carga por etapas,
mostrndola al principio a baja resolucin y aumentando a continuacin la calidad conforme contina cargndose la imagen.
Configuracin de calidad de compresin. Controla la relacin de compresin de la calidad de la imagen. Cuanto mejor es la calidad de la imagen, mayor es el tamao del archivo exportado.
Operaciones con el color. Se encuentran disponibles las siguientes operaciones: Invertir. Cada pxel se guarda como la inversa del color origina. Correccin de gamma. Ajusta la intensidad de los colores en el grfico exportado
mediante el cambio de la constante gamma utilizada para asignar los valores de intensidad. Esta caracterstica se puede utilizar fundamentalmente para iluminar u oscurecer la imagen de mapa de bits. El valor puede estar comprendido entre 0,10 (el ms oscuro) y 6,5 (el ms claro).
Si el nmero de colores del grfico es superior al nmero de colores para dicha profundidad, los colores se interpolarn para reproducir los colores del grfico.
Profundidad de la pantalla actual es el nmero de colores que se muestra
mediante el cambio de la constante gamma utilizada para asignar los valores de intensidad. Esta caracterstica se puede utilizar fundamentalmente para iluminar u oscurecer la imagen de mapa de bits. El valor puede estar comprendido entre 0,10 (el ms oscuro) y 6,5 (el ms claro).
Utilizar compresin RLE. (Slo BMP). Se trata de una tcnica de compresin de menor prdida admitida por los formatos de archivo comunes de Windows. La compresin de menor prdida implica que la calidad de la imagen no se sacrifica en detrimento de archivos de menor tamao.
286 Captulo 10
Si el nmero de colores del grfico es superior al nmero de colores para dicha profundidad, los colores se interpolarn para reproducir los colores del grfico.
Profundidad de la pantalla actual es el nmero de colores mostrados actualmente
mediante el cambio de la constante gamma utilizada para asignar los valores de intensidad. Esta caracterstica se puede utilizar fundamentalmente para iluminar u oscurecer la imagen de mapa de bits. El valor puede estar comprendido entre 0,10 (el ms oscuro) y 6,5 (el ms claro).
Transparencia. Permite seleccionar un color que se mostrar como transparente
en el grfico exportado. La caracterstica se encuentra disponible slo con una exportacin de color verdadero de 32 bits. Introduzca valores enteros entre 0 y 255 para cada color. El valor por defecto para cada color es 255, y se crea un color blanco transparente por defecto.
Formato. (Slo TIFF) Permite definir el espacio de color y comprimir el grfico exportado. Todas las profundidades de color estn disponibles en color RVA. Slo se encuentra disponible un color verdadero de 24 y 32 bits para CMYK. Con la opcin YCbCr, slo se encuentra disponible un color verdadero de 24 bits.
Para los rboles (opcin rboles de clasificacin), los mapas (opcin Mapas) y para los grficos interactivos (men Grficos, submen Interactivo) se encuentran disponibles las siguientes opciones de EPS:
Vista previa de las imgenes. Permite guardar una imagen de vista previa en la imagen
EPS. Una imagen de vista previa se utiliza principalmente si se ubica un archivo EPS en otro documento. Muchas aplicaciones no pueden mostrar ninguna imagen EPS en la pantalla, pero s pueden mostrar la vista previa que se ha guardado con la imagen. La vista previa de la imagen puede ser WMF (de menor tamao y ms escalable) o TIFF (porttil y admitida por otras plataformas). Compruebe la aplicacin en que desea incluir el grfico EPS para ver qu formato de vista previa admite la aplicacin.
Fuentes. Controla el tratamiento de fuentes TrueType en las imgenes EPS. Incrustar como TrueType nativo. Incrusta la mayora de los datos de fuentes en el
EPS. La fuente PostScript resultante se denomina fuente de tipo 42 (Type 42). Nota: no todas las impresoras PostScript tienen controladores de nivel 3 que puedan leer las fuentes de tipo 42.
Convertir en fuentes PostScript. Convierte las fuentes TrueType en fuentes
PostScript (Tipo 1) basadas en la familia de fuentes. Por ejemplo, Times New Roman se convierte en Times y Arial se convierte en Helvetica. Nota: este formato no se recomienda para los grficos interactivos que utilizan la fuente del marcador de SPSS (por ejemplo, diagramas de dispersin) dado que no existe ningn equivalente PostScript representativo para los smbolos del marcador TrueType de SPSS.
Sustituir fuentes con curvas. Convierte las fuentes TrueType en datos de curvas
PostScript. El texto ya no se puede editar como texto en las aplicaciones que pueden editar los grficos EPS. Se produce asimismo una prdida de calidad, pero esta opcin resulta til si dispone de una impresora PostScript que no admite las fuentes del tipo 42 (Type 42) y necesita conservar smbolos especiales TrueType, como es el caso de los marcadores utilizados en los diagramas de dispersin interactivos.
288 Captulo 10
Otros grficos
formato TIFF para su visualizacin en aplicaciones que no pueden mostrar imgenes EPS en la pantalla.
Fuentes. Controla el tratamiento de fuentes en las imgenes EPS. Sustituir fuentes con curvas. Convierte las fuentes en datos de curvas PostScript.
El texto ya no se puede editar como texto en las aplicaciones que pueden editar los grficos EPS. Esta opcin es til si las fuentes que se utilizan en el grfico no estn disponibles en el dispositivo de los resultados.
Utilizar referencias de fuentes. Si las fuentes que se utilizan en el grfico estn
disponibles en el dispositivo de resultados, se har uso de ellas. En caso contrario, el dispositivo de resultados utiliza fuentes alternativas.
tamao fsico que cuando se abre a 96 ppp x 120 ppp), pero no todas las aplicaciones admiten este formato.
Windows estndar. Lo admiten la mayora de las aplicaciones que pueden mostrar
metarchivos de Windows.
actualmente en el panel de contenidos. No se imprimen los elementos ocultos (los elementos con un icono de libro cerrado en el panel de titulares o los ocultados en las capas de titulares contradas).
Seleccin. Se imprimen slo los elementos que estn seleccionados actualmente en los paneles de titulares y de contenidos.
Figura 10-9 Cuadro de dilogo Imprimir del Visor
290 Captulo 10
Presentacin preliminar
Presentacin preliminar muestra lo que se imprimir en cada pgina de los documentos del Visor. Es una buena idea comprobar la presentacin preliminar antes de imprimir un documento del Visor, ya que muestra elementos que quiz no puedan verse en el panel de contenidos; entre ellos: Los saltos de pgina Las capas ocultas de las tablas pivote Las rupturas de las tablas anchas Los resultados completos de las tablas de gran tamao Los encabezados y pies que estn impresos en cada pgina
Si se han seleccionado resultados en el Visor, la presentacin preliminar slo mostrar estos resultados. Si desea ver una presentacin preliminar de todos los resultados, asegrese de que no haya nada seleccionado en el Visor.
292 Captulo 10
Configuracin de pgina
Con Preparar pgina, se puede controlar: El tamao y la orientacin del papel Los mrgenes de la pgina Los encabezados y pies de pgina Numeracin de pginas El tamao impreso para los grficos
Figura 10-11 Cuadro de dilogo Preparar pgina
La configuracin de Preparar pgina se guarda con el documento del Visor. Preparar pgina solamente afecta a la configuracin para la impresin de documentos del Visor. Esta configuracin no tiene efecto alguno ni en la impresin de los datos del Editor de datos ni en la impresin de sintaxis de una ventana de sintaxis.
294 Captulo 10 Figura 10-12 Pestaa Cabecera/Pie del cuadro de dilogo Opciones de Preparar pgina:
Las etiquetas de las cabeceras de los titulares indican el primer, el segundo, el tercer y/o el cuarto nivel de cabecera del titular para el primer elemento en cada pgina. Los ttulos y los subttulos de pgina imprimen los ttulos y subttulos de pgina actuales. Los ttulos y los subttulos de pgina se crean con la opcin Nuevo ttulo de pgina del men Insertar del Visor o con los comandos TITLE y SUBTITLE de la sintaxis de comandos. Si no ha especificado ningn ttulo ni subttulo de pgina, este ajuste no se tendr en cuenta. Nota: las caractersticas de las fuentes de los nuevos ttulos y subttulos de pgina se controlan en la pestaa Visor del cuadro de dilogo Opciones (a la que se accede al seleccionar Opciones en el men Edicin). Tambin se pueden cambiar las caractersticas de los ttulos y subttulos de pgina existentes editndolos en el Visor. Para ver cmo aparecern los encabezados y pies en la pgina impresa, seleccione
Presentacin preliminar del men Archivo.
tamao de la pgina definido. La relacin de aspecto de los grficos (proporcin anchura-altura) no se ve afectada por el tamao del grfico impreso. El tamao global impreso de un grfico est limitado tanto por su altura como por su anchura. Cuando los bordes externos de un grfico alcancen los bordes izquierdo y derecho de la pgina, el tamao del grfico no se podr aumentar ms para completar la altura de pgina adicional.
Espacio entre los elementos. Controla el espacio entre los elementos impresos. Cada
tabla pivote, grfico y objeto de texto es un elemento diferente. Este ajuste no afecta a la presentacin de los elementos en el Visor.
Numerar las pginas empezando por. Numera las pginas secuencialmente, empezando
296 Captulo 10 Figura 10-13 Pestaa Opciones del cuadro de dilogo Opciones de Preparar pgina:
Almacenamiento de resultados
El contenido del Visor puede guardarse en un documento del Visor. El documento incluir los dos paneles de la ventana del Visor (titulares y contenidos).
Para guardar los resultados en otros formatos externos (por ejemplo, HTML o texto), utilice el comando Exportar del men Archivo. (Esta caracterstica no est disponible en el programa SmartViewer independiente.)
con SPSS Inc. para distribuir SmartViewer. Con el contrato se proporciona un cdigo de licencia OEM.
Nota: deje en blanco el espacio destinado al cdigo OEM a menos que tenga un acuerdo contractual con SPSS Inc. para distribuir SmartViewer.
Visor de borrador
11
Captulo
El Visor de borrador ofrece los resultados a modo de borrador, incluyendo: Resultados de slo texto (en lugar de tablas pivote) Grficos como imgenes de metarchivo (en lugar de objetos de grfico) Puede editar los resultados de texto en el Visor de borrador, cambiar el tamao de los grficos y pegar tanto los resultados de texto como los grficos en otras aplicaciones. Sin embargo, no es posible editar los grficos ni disponer de las funciones interactivas de las tablas pivote y los grficos.
299
en los mens:
Edicin Opciones... E Pulse en la pestaa General. E Seleccione Borrador en Tipo de visor al inicio.
Nota: Los nuevos resultados se muestran siempre en la ventana designada del Visor. Si tiene abiertas una ventana del Visor y una del Visor de borrador, la ventana designada ser la que se haya abierto ms recientemente o la designada mediante el botn Designar ventana (el signo de exclamacin) de la barra de herramientas.
Ancho de columna. Para reducir el ancho de las tablas que contienen etiquetas de gran longitud, seleccione la opcin de mximo de caracteres en Ancho de columna. Las etiquetas que exceden el ancho especificado se ajustan a este valor mximo aplicando lneas de separacin.
303 Visor de borrador Figura 11-3 Resultados de borrador antes y despus de establecer el ancho mximo de columna
Separadores de filas y de columnas. En vez de los caracteres de caja para los bordes de filas y columnas, se pueden utilizar las opciones de Separadores de casillas para controlar la presentacin de los separadores de filas y columnas en los resultados de borrador. Puede especificar diferentes separadores de casillas o introducir espacios en blanco si no desea emplear ningn carcter para marcar las filas y las columnas. Tendr que anular la seleccin de Mostrar caracteres de caja para especificar los separadores de casillas.
304 Captulo 11 Figura 11-4 Resultados de borrador antes y despus de establecer los separadores de casillas
Visor de borrador se ha diseado para presentar los resultados separados por espacios en una fuente de paso fijo (monoespaciada). Si desea pegar los resultados de borrador en otra aplicacin, deber utilizar este tipo de fuente para que las columnas separadas por espacios queden bien alineadas. Si selecciona Tabuladores como separadores de columnas, podr utilizar cualquier fuente que desee en la otra aplicacin y definir los tabuladores para alinear los resultados correctamente. Sin embargo, en el Visor de borrador, los resultados separados por tabuladores no se alinearn correctamente.
305 Visor de borrador Figura 11-5 Resultados separados por tabuladores en el Visor de borrador y formateados en un procesador de textos.
306 Captulo 11
Las opciones de presentacin de resultados del Visor de borrador slo afectan a los resultados producidos tras el cambio de las especificaciones. Los cambios en la configuracin no afectan al resultado mostrado en el Visor de borrador.
Atributos de fuente
Es posible modificar los atributos de fuente (como fuente, tamao y estilo) de los resultados de texto del Visor de borrador. En cualquier caso, si utiliza caracteres de caja para los bordes de las filas y las columnas, para que la alineacin del texto separado por espacio en las columnas sea correcta, ser necesaria una fuente de paso fijo (monoespaciada), por ejemplo, Courier. Asimismo, la modificacin de otros atributos de fuente como el tamao y el estilo (por ejemplo, negrita o cursiva) slo en una parte de la tabla puede afectar tambin a la alineacin de las columnas.
Bordes de filas y columnas. Los bordes de lnea slidos para las filas y las columnas utiliza, por defecto, la fuente SPSS Marker Set. Las dems fuentes no permiten los caracteres de dibujo de lneas utilizados para trazar los bordes.
307 Visor de borrador E Elija en los mens: Archivo Imprimir... E Elija Seleccin.
308 Captulo 11
Los resultados del Visor de borrador se guardan con formato RTF (formato de texto enriquecido).
Puede exportar todo el texto o slo la porcin seleccionada. En los archivos exportados slo se almacenan los resultados de texto (los resultados de las tablas pivote convertidas y los resultados de texto); no se incluyen los grficos.
Tablas pivote
12
Captulo
Muchos de los resultados del Visor se presentan en tablas que se pueden pivotar de forma interactiva. Es decir, puede reorganizar las filas, columnas y capas.
310 Captulo 12 E Repita el proceso para cada tabla pivote que desee editar.
Cada tabla pivote aparecer en una ventana independiente lista para ser editada.
Este procedimiento permite cambiar la disposicin de la tabla. Por ejemplo, suponga que el icono representa una variable con las categoras S y No. Si arrastra el icono desde el panel Fila hasta el panel Columna, S y No se convertirn en etiquetas de columna. Antes de arrastrarlo, S y No eran etiquetas de fila.
311 Tablas pivote E Pulse y mantenga pulsado el botn del ratn en un icono.
Esta operacin tiene el mismo efecto que si se arrastraran todos los iconos de fila hasta el panel Columna y todos los iconos de columna hasta el panel Fila.
Nota: Asegrese de que Arrastrar para copiar en el men Edicin no no est activado (marcado). Si est activada, anule su seleccin.
312 Captulo 12
y arrastre, o bien mantenga pulsada la tecla Mays para seleccionar varias etiquetas.
E Elija en los mens: Edicin Grupo
Se insertar automticamente una etiqueta de grupo. Pulse dos veces en la etiqueta de grupo para editar el texto de la etiqueta.
Figura 12-2 Etiquetas y grupos de filas y columnas
Nota: Para aadir filas o columnas a un grupo existente, deber desagrupar los elementos actuales del grupo y crear despus un nuevo grupo que incluya los elementos adicionales.
desagrupar.
E Elija en los mens: Edicin Desagrupar
o
Rotar etiquetas de fila exterior Figura 12-3 Etiquetas de columna rotadas
Slo se pueden rotar las etiquetas de columna ms al interior y las etiquetas de fila ms al exterior.
Esta operacin slo restablece los cambios que son el resultado de pivotar los elementos de fila, columna y capa entre dimensiones. Esta accin no afecta a cambios tales como la agrupacin, la desagrupacin o el desplazamiento de filas y columnas.
314 Captulo 12
Debe pulsar con el botn derecho del ratn en la propia casilla de etiqueta, no en las casillas de datos de la fila o la columna. La ayuda sensible al contexto no se encuentra disponible para las etiquetas definidas por el usuario, como pueden ser los nombres de variable o las etiquetas de valor.
Cada icono de capa tiene flechas izquierda y derecha. La tabla visible es la tabla de la capa superior.
Figura 12-5 Categoras en capas distintas
o
E Seleccione una categora de la lista desplegable de capas.
Ir a la categora de capa
Ir a la categora de capa permite cambiar las capas de una tabla pivote. Este cuadro de dilogo es particularmente til cuando hay un gran nmero de capas o una capa con muchas categoras.
317 Tablas pivote E En la lista Categora visible, seleccione una dimensin de capa. La lista Categoras
accin cambiar la capa y cerrar el cuadro de dilogo. Para ver otra capa sin cerrar el cuadro de dilogo:
E Seleccione la categora y pulse en Aplicar.
o
E En el men Pivotar, seleccione Mover capas a columnas.
Tambin puede mover las capas a las filas o a las columnas arrastrando sus iconos entre los paneles de pivotado Capa, Fila y Columna.
Sealizadores
Con los sealizadores puede guardar diferentes presentaciones de una tabla pivote. Los sealizadores guardan: Las posiciones de los elementos en las dimensiones de fila, columna y capa El orden de presentacin de los elementos en cada dimensin La capa mostrada actualmente para cada elemento de capa
318 Captulo 12 E Elija en los mens: Pivotar Sealizadores E Escriba un nombre para el sealizador. (Los nombres de los sealizadores no
Cada tabla pivote tiene su propio conjunto de sealizadores. Los nombres no se pueden repetir en la misma tabla pivote, pero s en tablas diferentes.
ocultar.
E Elija en los mens de la tabla pivote: Ver Ocult.
o
E Pulse con el botn derecho del ratn en la fila o columna. E En el men contextual, seleccione Ocultar categora.
Por ejemplo, si la categora Mujer de la dimensin Sexo est oculta, pulse en la categora Hombre.
E Elija en los mens de la tabla pivote: Ver Mostrar todas las categoras en nombre de la dimensin
320 Captulo 12 E Elija en los mens de la tabla pivote: Ver Mostrar todo
Al hacerlo se mostrarn todas las casillas ocultas de la tabla; Si est seleccionada la opcin Ocultar filas y columnas vacas en Propiedades de tabla para esta tabla, las filas o columnas completamente vacas permanecern ocultas.
la dimensin.
E Elija en los mens: Ver Ocultar (o Mostrar) etiqueta de dimensin
Aspectos de tabla
Un aspecto de tabla es un conjunto de propiedades que definen el aspecto de una tabla. Puede seleccionar un aspecto previamente definido o crear uno propio. Antes o despus de aplicar un aspecto de tabla, se pueden cambiar los formatos de casillas individuales o de grupos de casillas utilizando las propiedades de casilla. Los formatos de casilla editados se conservan intactos, aunque se aplique un nuevo aspecto de tabla. Por ejemplo, puede comenzar aplicando el aspecto de tabla 9POINT; a continuacin, seleccionar una columna de datos y, en el cuadro de dilogo Formatos de casilla, cambiar dicha columna a una fuente en negrita. Despus, puede cambiar el aspecto de tabla a BOXED. La columna previamente seleccionada conservar
322 Captulo 12
la fuente en negrita, mientras que el resto de las caractersticas se aplicarn con el aspecto de tabla BOXED. Si lo desea, puede restablecer todas las casillas a los formatos de casilla definidos por el aspecto de tabla actual. De este modo se restablece cualquier casilla que se haya editado. Si la opcin Como se visualiza est seleccionada en la lista de archivos de aspecto de tabla, las casillas editadas se restablecern a las propiedades de tabla actuales.
E Seleccione un aspecto de tabla en la lista de archivos. Para seleccionar un archivo de otro directorio, pulse en Examinar. E Pulse en Aceptar para aplicar el aspecto de tabla a la tabla pivote seleccionada.
lista de archivos.
E Pulse en Editar aspecto. E Edite las propiedades de la tabla seleccionando los atributos que desee y, a continuacin, pulse en Aceptar. E Pulse en Guardar aspecto para guardar el aspecto de tabla editado, o en Guardar como
para guardarlo como un nuevo aspecto de tabla. La edicin de un aspecto de tabla slo afecta a la tabla pivote seleccionada. El aspecto de tabla editado no se aplicar a ninguna otra tabla que utilice ese aspecto, a menos que se seleccione esa tabla y se le vuelva a aplicar el aspecto.
Propiedades de tabla
El cuadro de dilogo Propiedades de tabla permite establecer las propiedades generales de una tabla, definir los estilos de casilla de varias partes de la tabla y guardar un conjunto de esas propiedades como un aspecto de tabla. Utilizando las pestaas de este cuadro de dilogo puede: Controlar las propiedades generales, como ocultar filas o columnas vacas y ajustar las propiedades de impresin. Controlar el formato y la posicin de los marcadores de las notas al pie. Determinar formatos especficos para las casillas en el rea de datos, para las etiquetas de fila y columna y para otras reas de la tabla. Controlar la anchura y el color de las lneas que forman los bordes de cada rea de la tabla.
324 Captulo 12 E Elija una pestaa (General, Notas al pie, Formatos de casilla, Bordes o Impresin). E Seleccione las opciones que desee. E Pulse en Aceptar o Aplicar.
Las nuevas propiedades se aplicarn a la tabla pivote seleccionada. Para aplicar nuevas propiedades de tabla a un aspecto de tabla en lugar de hacerlo a la tabla seleccionada, edite el aspecto de tabla (men Formato, Aspectos de tabla).
325 Tablas pivote Figura 12-9 Pestaa General del cuadro de dilogo Propiedades de tabla
326 Captulo 12 Figura 12-10 Pestaa Notas al pie del cuadro de dilogo Propiedades de tabla
Los formatos de casilla se aplican a las reas (categoras de informacin); no son caractersticas de las casillas individuales. No son caractersticas de casillas individuales. Esta distincin es un aspecto importante a la hora de pivotar una tabla. Por ejemplo: Si especifica una fuente en negrita como formato de casilla de las etiquetas de columna, stas aparecern en negrita independientemente de la informacin que se muestre actualmente en la dimensin de columna; adems, si mueve un elemento de la dimensin de columna a otra dimensin, no conservar la caracterstica de negrita de las etiquetas de columna. Si pone en negrita las etiquetas de columna simplemente resaltando las casillas de una tabla pivote activada y pulsando en el botn Negrita de la barra de herramientas, el contenido de esas casillas permanecer en negrita independientemente de la dimensin a las que las mueva, y las etiquetas de columna no conservarn la caracterstica de negrita para otros elementos movidos a la dimensin de columna.
328 Captulo 12 Figura 12-12 Pestaa Formatos de casilla del cuadro de dilogo Propiedades de tabla
329 Tablas pivote Figura 12-13 Pestaa Bordes del cuadro de dilogo Propiedades de tabla
una lnea del rea de muestra. (Mantenga pulsada la tecla Mays para seleccionar varios nombres o la tecla Ctrl para seleccionar nombres no contiguos).
E Seleccione un estilo de lnea o Ninguno. E Elija un color. E Pulse en Aceptar o Aplicar.
330 Captulo 12
Fuente
Un aspecto de tabla permite especificar las caractersticas de fuente de las distintas reas de la tabla. Puede cambiar asimismo la fuente de una casilla individual. Las opciones de fuente de una casilla incluyen el aspecto, el estilo, el tamao y el color de la fuente. Tambin puede ocultar el texto o subrayarlo. Si especifica las propiedades de fuente de una casilla, stas se aplicarn a todas las capas de la tabla que tengan la misma casilla.
Figura 12-14 Cuadro de dilogo Fuente
Si lo desea, puede seleccionar una fuente, un estilo de fuente y un tamao, elegir un color y un estilo de alfabeto, as como determinar que el texto est oculto o subrayado.
332 Captulo 12
derecho de la columna que desee cambiar. (El puntero cambiar a una flecha con dos puntas.)
E Mantenga pulsado el botn del ratn mientras arrastra el borde hasta su nueva
posicin.
333 Tablas pivote Figura 12-16 Cambio del ancho de una columna
Tambin puede cambiar los bordes de la dimensin y de la categora vertical en el rea de las etiquetas de fila aunque estn ocultos.
E Mueva el puntero del ratn por las etiquetas de fila hasta que aparezca la flecha con
dos puntas.
E Arrastre el borde hasta conseguir el nuevo ancho.
Propiedades de casilla
Las opciones de Propiedades de casilla slo se aplican a una casilla individual seleccionada. Puede cambiar el formato del valor, la alineacin, los mrgenes y el sombreado. Las propiedades de casilla anulan las propiedades de tabla; por tanto, si modifica estas ltimas, no cambiarn las propiedades de casilla aplicadas individualmente.
334 Captulo 12
335 Tablas pivote E Pulse en la pestaa Valor. E Seleccione el formato que desea aplicar a la columna.
Puede utilizar este mtodo para suprimir o aadir signos de porcentaje y de dlar, cambiar el nmero de decimales que se muestran y alternar entre la presentacin numrica regular y la notacin cientfica.
A medida que seleccione las propiedades de alineacin para la casilla, stas se irn reflejando en el rea Muestra.
339 Tablas pivote E Pulse en una etiqueta de fila o de columna. E Elija en los mens: Edicin Seleccione Casillas de datos y etiquetas
o
E Pulse las teclas Ctrl+Alt y en una etiqueta de fila o de columna.
Si la tabla contiene ms de una dimensin en el rea de filas o de columnas, la seleccin resaltada puede abarcar varias casillas no contiguas.
de la casilla.
340 Captulo 12
Tambin puede imprimir cada capa de una tabla pivote en una hoja diferente.
Para especificar las rupturas de filas y columnas para las tablas pivote impresas
E Active la tabla pivote. E Pulse en la etiqueta de la columna situada a la izquierda del lugar donde desee insertar
Para especificar las filas o las columnas que se han de mantener unidas
E Active la tabla pivote. E Seleccione las etiquetas de las filas o columnas que desee mantener unidas. (Pulse y
arrastre, o bien mantenga pulsada la tecla Mays para seleccionar varias etiquetas de fila o columna.)
E Elija en los mens: Formato Mantener juntos
342 Captulo 12
Para ajustar la escala de una tabla pivote para que quepa en el tamao de la pgina
E Active la tabla pivote. E Elija en los mens: Formato Propiedades de tabla E Pulse en la pestaa Impresin. E Seleccione Reducir tabla ancha para caber en la pgina.
y/o
E Seleccione Reducir tabla larga para caber en la pgina.
13
Captulo
SPSS proporciona un lenguaje de comandos eficaz que permite guardar y automatizar muchas tareas habituales. El lenguaje de comandos tambin proporciona algunas funcionalidades no incluidas en los mens y cuadros de dilogo. Puede acceder a la mayora de los comandos desde los mens y cuadros de dilogo. No obstante, algunos comandos y opciones slo estn disponibles mediante el uso del lenguaje de comandos. El lenguaje de comandos tambin permite guardar los trabajos en un archivo de sintaxis, con lo que podr repetir los anlisis en otro momento o ejecutarlos en un trabajo automatizado con la Unidad de produccin. Un archivo de sintaxis es simplemente un archivo de texto que contiene comandos. Aunque es posible abrir una ventana de sintaxis y escribir comandos, suele ser ms sencillo permitir que el programa le ayude a construir un archivo de sintaxis mediante uno de los siguientes mtodos: Pegando la sintaxis de comandos desde los cuadros de dilogo Copiando la sintaxis desde las anotaciones de los resultados Copiando la sintaxis desde el archivo diario La informacin de referencia detallada sobre la sintaxis de comandos est disponible en dos formatos: integrada en el sistema de ayuda global y como un archivo PDF independiente de referencia de sintaxis de comandos de SPSS, denominado en SPSS Command Syntax Reference, igualmente disponible en el men Ayuda. Si pulsa la tecla F1, podr disponer de la ayuda contextual relativa del comando actual en una ventana de sintaxis.
343
344 Captulo 13
Reglas de la sintaxis
Al ejecutar comandos desde una ventana de sintaxis de comandos en el transcurso de una sesin de SPSS, lo har en modo interactivo. Las siguientes reglas se aplican a las especificaciones de los comandos en el modo interactivo: Cada comando debe terminar con un punto como terminador del comando. Sin embargo, es mejor omitir el terminador en BEGIN DATA, para que los datos interactivos se traten como una especificacin continua. El terminador del comando debe ser el ltimo carcter de un comando que no est en blanco. En ausencia de un punto como terminador del comando, las lneas en blanco se interpretan como un terminador del comando. Los comandos pueden comenzar en cualquier columna de una lnea de comandos y continuar en tantas lneas como se precise. Existe una excepcin con el comando END DATA, que debe comenzar en la primera columna de la primera lnea que sigue al final de los datos. Nota: para que exista compatibilidad con otros modos de ejecucin de comandos (incluidos los archivos de comandos que se ejecutan con los comandos INSERT o INCLUDE en una sesin interactiva), la sintaxis de lnea de comandos no debe exceder los 256 bytes. La mayora de los subcomandos estn separados por barras inclinadas (/). La barra inclinada que precede al primer subcomando de un comando, generalmente es opcional. Los nombres de variable deben escribirse completos. El texto incluido entre apstrofos o comillas debe ir contenido en una sola lnea. Debe utilizarse un punto (.) para indicar decimales, independientemente de la configuracin regional. Los nombres de variable que terminen en un punto pueden causar errores en los comandos creados por los cuadros de dilogo. No es posible crear nombres de variable de este tipo en los cuadros de dilogo y en general deben evitarse.
La sintaxis de comandos no distingue las maysculas de las minsculas y permite el uso de abreviaturas de tres o cuatro letras en la mayora de las especificaciones de los comandos. Puede usar tantas lneas como desee para especificar un nico comando. Puede aadir espacios o lneas de separacin en casi cualquier punto donde se permita un nico espacio en blanco, como alrededor de las barras inclinadas, los parntesis, los operadores aritmticos o entre los nombres de variable. Por ejemplo:
FREQUENCIES VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART.
y
freq var=catlab sexo /percent=25 50 75 /bar.
Para los archivos de comandos ejecutados mediante el comando INCLUDE, se aplican las reglas de sintaxis del modo por lotes. Las siguientes reglas se aplican a las especificaciones de los comandos en el modo por lotes o el modo de produccin: Todos los comandos del archivo de comandos deben comenzar en la columna 1. Puede utilizar los signos ms (+) o menos () en la primera columna si desea sangrar la especificacin del comando para facilitar la lectura del archivo de comandos. Si se utilizan varias lneas para un comando, la columna 1 de cada lnea de continuacin debe estar en blanco. Los terminadores de los comandos son opcionales. Las lneas no pueden exceder los 256 bytes; los caracteres adicionales quedarn truncados. A menos que tenga archivos de comandos que ya utilizan el comando INCLUDE, debe utilizar el comando INSERT en su lugar dado que puede adaptar los archivos de comandos que se ajustan a los dos conjuntos de reglas. Si genera la sintaxis de comandos pegando las selecciones del cuadro de dilogo en una ventana de sintaxis, el formato de los comandos es apto para cualquier modo de operacin. Consulte la
346 Captulo 13
referencia de sintaxis de comandos SPSS Command Syntax Reference (disponible en formato PDF en el men Ayuda) si desea obtener ms informacin.
La sintaxis de comandos se pegar en la ventana de sintaxis designada. Si no tiene abierta una ventana de sintaxis, se abrir automticamente una nueva y se pegar la sintaxis en ella.
347 Trabajar con sintaxis de comandos Figura 13-1 Sintaxis de comandos pegada desde un cuadro de dilogo
Nota: Si abre un cuadro de dilogo a partir de los mens de una ventana de proceso, el cdigo para ejecutar la sintaxis desde un proceso se pegar en la ventana de proceso.
Mientras ejecuta los anlisis, los comandos de las selecciones del cuadro de dilogo se graban en la anotacin.
E Abra un archivo de sintaxis previamente guardado o cree uno nuevo. Para crear un
349 Trabajar con sintaxis de comandos E En el Visor, pulse dos veces en un elemento de anotacin para activarlo. E Pulse y arrastre el ratn para resaltar la sintaxis que desee copiar. E Seleccione en los mens del Visor: Edicin Copiar E En una ventana de sintaxis, elija en los mens: Edicin Pegar
temp). En la lista desplegable Archivo de tipo seleccione Todos los archivos (*.*) o escriba *.jnl en el cuadro de texto Nombre de archivo para mostrar los archivos de diario en la lista. Si tiene dificultades para localizar el archivo, consulte las Opciones en el men Edicin para ver dnde se guarda el diario en su sistema.
E Edite el archivo para eliminar los mensajes de error o de advertencia que contenga,
nombre de archivo con la extensin .sps, la extensin por defecto de los archivos de sintaxis.)
Todo. Ejecuta todos los comandos de la ventana de sintaxis. Seleccin. Ejecuta los comandos seleccionados. Esto incluye los comandos
parcialmente resaltados.
Actual. Ejecuta el comando donde se encuentra el cursor. Hasta el final. Ejecuta todos los comandos incluidos desde la posicin actual del
cursor hasta el final del archivo de sintaxis de comandos. El botn Ejecutar de la barra de herramientas del Editor de sintaxis ejecuta los comandos seleccionados o el comando donde se encuentra el cursor si no hay nada seleccionado.
Figura 13-4 Barra de herramientas del Editor de sintaxis.
352 Captulo 13
Si el ltimo comando del archivo de sintaxis es un comando que lee el archivo de datos (como un procedimiento estadstico o grfico), no es necesario ningn comando EXECUTE y se pueden eliminar. Si no est seguro de si el ltimo comando lee el archivo de datos, en la mayora de los casos puede eliminarlos todos menos el ltimo comando EXECUTE del archivo de sintaxis.
Funciones de retardo
Una excepcin importante son los comandos de transformacin que contienen funciones de retardo. En una serie de comandos de transformacin sin intervencin de comandos EXECUTE, ni ningn otro comando que lea datos, las funciones de retardo se calculan despus de las restantes transformaciones, con independencia del orden de los comandos. Por ejemplo:
COMPUTE lagvar=LAG(var1) COMPUTE var1=var1*2
y
COMPUTE lagvar=LAG(var1) EXECUTE COMPUTE var1=var1*2
ofrece resultados muy diferentes para el valor de lagvar dado que el anterior utiliza el valor transformado de var1 mientras que el ltimo utiliza el valor original.
Frecuencias
14
Captulo
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que resultan tiles para describir muchos tipos de variables. El procedimiento Frecuencias es un comienzo para empezar a consultar los datos. Para los informes de frecuencias y los grficos de barras, puede organizar los diferentes valores en orden ascendente o descendente u ordenar las categoras por sus frecuencias. Es posible suprimir el informe de frecuencias cuando una variable posee muchos valores diferentes. Puede etiquetar los grficos con las frecuencias (la opcin por defecto) o con los porcentajes.
Ejemplo. Cul es la distribucin de los clientes de una empresa por tipo de industria?
En los resultados podra observar que el 37,5% de sus clientes pertenece a agencias gubernamentales, el 24,9% a corporaciones, el 28,1% a instituciones acadmicas, y el 9,4% a la industria sanitaria. Con respecto a los datos continuos, cuantitativos, como los ingresos por ventas, podra comprobar que el promedio de ventas de productos es de 3.576 dlares con una desviacin tpica de 1.078 dlares.
Estadsticos y grficos. Frecuencias, porcentajes, porcentajes acumulados, media,
mediana, moda, suma, desviacin tpica, varianza, amplitud, valores mnimo y mximo, error tpico de la media, asimetra y curtosis (ambos con sus errores tpicos), cuartiles, percentiles especificados por el usuario, grficos de barras, grficos de sectores e histogramas.
Datos. Utilice cdigos numricos o cadenas cortas para codificar las variables
los datos de cualquier distribucin, especialmente para las variables con categoras ordenadas o desordenadas. Muchos de los estadsticos de resumen optativos, tales como la media y la desviacin tpica, se basan en la teora normal y son apropiados para las variables cuantitativas con distribuciones simtricas. Los estadsticos
353
354 Captulo 14
robustos, tales como la mediana, los cuartiles y los percentiles son apropiados para las variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
Figura 14-1 Resultados de Frecuencias
Si lo desea, puede: Pulsar en Estadsticos para obtener estadsticos descriptivos para las variables cuantitativas. Pulsar en Grficos para obtener grficos de barras, grficos de sectores e histogramas. Pulsar en Formato para determinar el orden en el que se muestran los resultados.
Frecuencias: Estadsticos
Figura 14-3 Cuadro de dilogo Frecuencias: Estadsticos
356 Captulo 14
Valores percentiles. Los valores de una variable cuantitativa que dividen los datos
ordenados en grupos, de forma que un porcentaje de los casos se encuentre por encima y otro porcentaje se encuentre por debajo. Los cuartiles (los percentiles 25, 50 y 75) dividen las observaciones en cuatro grupos de igual tamao. Si desea un nmero igual de grupos que no sea cuatro, seleccione Puntos de corte para n grupos iguales. Tambin puede especificar percentiles individuales (por ejemplo, el percentil 95, el valor por debajo del cual se encuentran el 95% de las observaciones).
Tendencia central. Los estadsticos que describen la localizacin de la distribucin,
casos; el percentil 50. Cuando el nmero de observaciones es par, la mediana es el promedio de las dos observaciones centrales, una vez que han sido ordenadas de manera ascendente o descendente. La mediana es una medida de tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede resultar afectada por unos pocos valores extremadamente altos o bajos).
Moda. El valor que ocurre con mayor frecuencia. Si varios valores comparten la
mayor frecuencia de aparicin, cada una de ellas es una moda. El procedimiento de frecuencias devuelve slo la ms pequea de esas modas mltiples.
Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
los datos, incluyen: Desviacin tpica, Varianza, Rango, Mnimo, Mximo y Error tpico de la media.
Desviacin tpica. Medida de dispersin en torno a la media. En una distribucin
normal, el 68% de los casos se encuentra dentro de una desviacin tpica respecto a la media y el 95% de los casos se encuentra dentro de dos desviaciones tpicas respecto a la media. Por ejemplo, si la media de edad es 45, con una desviacin tpica de 10, el 95% de los casos estara entre 25 y 65 en una distribucin normal.
Varianza. Medida de dispersin en torno a la media, igual a la suma de los
cuadrados de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable.
357 Frecuencias
Amplitud. Diferencia entre los valores mayor y menor de una variable numrica;
a otra, extradas stas de la misma distribucin. Puede utilizarse para comparar de forma aproximada la media observada con un valor hipotetizado (es decir, podremos concluir que dos valores son distintos si la razn de la diferencia respecto al error tpico es menor que -2 o mayor que +2).
Distribucin. Asimetra y curtosis son estadsticos que describen la forma y la simetra de la distribucin. Estos estadsticos se muestran con sus errores tpicos. Asimetra. Medida de la asimetra de una distribucin. La distribucin normal es
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al
punto central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas.
Los valores son puntos medios de grupos. Si los valores de los datos son puntos medios de grupos (por ejemplo, si las edades de todas las personas entre treinta y cuarenta aos se codifican como 35), seleccione esta opcin para estimar la mediana y los percentiles para los datos originales no agrupados.
358 Captulo 14
Frecuencias: Grficos
Figura 14-4 Cuadro de dilogo Frecuencias: Grficos
todo. Cada sector de un grfico de este tipo corresponde a un grupo, definido por una nica variable de agrupacin. Los grficos de barras muestran la frecuencia de cada valor o categora distinta como una barra diferente, permitiendo comparar las categoras de forma visual. Los histogramas tambin cuentan con barras, pero se representan a lo largo de una escala de intervalos iguales. La altura de cada barra es el recuento de los valores que estn dentro del intervalo para una variable cuantitativa. Los histogramas muestran la forma, el centro y la dispersin de la distribucin. Una curva normal superpuesta en un histograma ayuda a juzgar si los datos estn normalmente distribuidos.
Valores del grfico. Para los grficos de barras, puede etiquetar el eje de escala con las
359 Frecuencias
Frecuencias: Formato
Figura 14-5 Cuadro de dilogo Frecuencias: Formato
Ordenar por. La tabla de frecuencias se puede organizar respecto a los valores actuales de los datos o respecto al recuento (frecuencia de aparicin) de esos valores y la tabla puede organizarse en orden ascendente o descendente. Sin embargo, si solicita un histograma o percentiles, Frecuencias asumir que la variable es cuantitativa y mostrar sus valores en orden ascendente. Mltiples variables. Si desea generar tablas de estadsticos para mltiples variables, podr mostrar todas las variables en una sola tabla (Comparar variables), o bien mostrar una tabla de estadsticos independiente para cada variable (Organizar resultados segn variables). Suprimir tablas con ms de n categoras. Esta opcin impide que se muestren tablas
Descriptivos
15
Captulo
El procedimiento Descriptivos muestra estadsticos de resumen univariados para varias variables en una nica tabla y calcula valores tipificados (puntuaciones z). Las variables se pueden ordenar por el tamao de sus medias (en orden ascendente o descendente), alfabticamente o por el orden en el que se seleccionen las variables (el valor por defecto). Cuando se guardan las puntuaciones z, stas se aaden a los datos del Editor de datos y quedan disponibles para los grficos, el listado de los datos y los anlisis. Cuando las variables se registran en unidades diferentes (por ejemplo, producto interior bruto per cpita y porcentaje de alfabetizacin), una transformacin de puntuacin z pondr las variables en una escala comn para poder compararlas visualmente con ms facilidad.
Ejemplo. Si cada caso de los datos contiene los totales de ventas diarias de cada vendedor (por ejemplo, una entrada para Bob, una para Kim, una para Brian, etc.) recogidas cada da durante varios meses, el procedimiento Descriptivos puede calcular la media diaria de ventas para cada vendedor y ordenar los resultados del promedio de ventas de mayor a menor. Estadsticos. Tamao de muestra, media, mnimo, mximo, desviacin tpica,
varianza, rango, suma, error tpico de la media, curtosis y asimetra con sus errores tpicos.
Datos. Utilice variables numricas despus de haberlas inspeccionado grficamente
para registrar errores, valores atpicos y anomalas de distribucin. El procedimiento Descriptivos es muy eficaz para archivos grandes (de miles de casos).
Supuestos. La mayora de los estadsticos disponibles (incluyendo las puntuaciones z)
se basan en la teora normal y son adecuados para variables cuantitativas (medidas a nivel de razn o de intervalo) con distribuciones simtricas. Se deben evitar las variables con categoras no ordenadas o distribuciones asimtricas. La distribucin
361
362 Captulo 15
de puntuaciones z tiene la misma forma que la de los datos originales; por tanto, el clculo de puntuaciones z no es una solucin para los datos con problemas.
Para obtener estadsticos descriptivos
E Elija en los mens: Analizar Estadsticos descriptivos Descriptivos... Figura 15-1 Cuadro de dilogo Descriptivos
Si lo desea, puede: Seleccionar Guardar valores tipificados como variables para guardar las puntuaciones z como nuevas variables. Pulsar en Opciones para seleccionar estadsticos opcionales y el orden de presentacin.
363 Descriptivos
Descriptivos: Opciones
Figura 15-2 Cuadro de dilogo Descriptivos: Opciones
Media y suma. Se muestra por defecto la media o promedio aritmtico. Dispersin. Los estadsticos que miden la dispersin o variacin en los datos incluyen
normal, el 68% de los casos se encuentra dentro de una desviacin tpica respecto a la media y el 95% de los casos se encuentra dentro de dos desviaciones tpicas respecto a la media. Por ejemplo, si la media de edad es 45, con una desviacin tpica de 10, el 95% de los casos estara entre 25 y 65 en una distribucin normal.
Varianza. Medida de dispersin en torno a la media, igual a la suma de los
cuadrados de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable.
Amplitud. Diferencia entre los valores mayor y menor de una variable numrica;
364 Captulo 15
Mximo. El mayor valor de una variable numrica. E. T. media. Medida de cunto puede variar el valor de la media de una muestra
a otra, extradas stas de la misma distribucin. Puede utilizarse para comparar de forma aproximada la media observada con un valor hipotetizado (es decir, podremos concluir que dos valores son distintos si la razn de la diferencia respecto al error tpico es menor que -2 o mayor que +2).
Distribucin. La curtosis y la asimetra son los estadsticos que caracterizan la forma y simetra de la distribucin. Estos estadsticos se muestran con sus errores tpicos. Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al
punto central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas.
Asimetra. Medida de la asimetra de una distribucin. La distribucin normal es
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
Orden de presentacin. Por defecto, las variables se muestran en el orden en que se hayan seleccionado. Si lo desea, se pueden mostrar las variables alfabticamente, por medias ascendentes o por medias descendentes.
365 Descriptivos
Excluir del anlisis casos con valores perdidos para cualquier variable (mediante el subcomando MISSING). Ordenar las variables de la presentacin por el valor de cualquier estadstico, no slo por la media (mediante el subcomando SORT). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Explorar
16
Captulo
El procedimiento Explorar genera estadsticos de resumen y representaciones grficas, bien para todos los casos o bien de forma separada para grupos de casos. Existen numerosas razones para utilizar este procedimiento: para inspeccionar los datos, identificar valores atpicos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre subpoblaciones (grupos de casos). La inspeccin de los datos puede mostrar que existen valores inusuales, valores extremos, discontinuidades en los datos u otras peculiaridades. La exploracin de los datos puede ayudar a determinar si son adecuadas las tcnicas estadsticas que est teniendo en consideracin para el anlisis de los datos. La exploracin puede indicar que necesita transformar los datos si la tcnica necesita una distribucin normal. O bien, el usuario puede decidir que necesita utilizar pruebas no paramtricas.
Ejemplo. Observe la distribucin de los tiempos de aprendizaje de laberintos de una serie de ratas sometidas a cuatro programas de refuerzo diferentes. Para cada uno de los cuatro grupos, se puede observar si la distribucin de tiempos es aproximadamente normal y si las cuatro varianzas son iguales. Tambin se pueden identificar los casos con los cinco valores de tiempo mayores y los cinco menores. Los diagramas de caja y los grficos de tallo y hojas resumen grficamente la distribucin del tiempo de aprendizaje de cada uno de los grupos. Estadsticos y grficos. Media, mediana, media recortada al 5%, error tpico, varianza,
desviacin tpica, mnimo, mximo, amplitud, amplitud intercuartil, asimetra y curtosis y sus errores tpicos, intervalo de confianza para la media (y el nivel de confianza especificado), percentiles, estimador-M de Huber, estimador en onda de Andrews, estimador-M redescendente de Hampel, estimador biponderado de Tukey, cinco valores mayores y cinco menores, estadstico de Kolmogorov-Smirnov con el nivel de significacin de Lilliefors para contrastar la normalidad y estadstico de Shapiro-Wilk. Diagramas de caja, grficos de tallo y hojas, histogramas, diagramas de normalidad y diagramas de dispersin por nivel con pruebas de Levene y transformaciones.
367
368 Captulo 16
Datos. El procedimiento Explorar se puede utilizar para las variables cuantitativas (nivel de medida de razn o de intervalo). Una variable de factor (utilizada para dividir los datos en grupos de casos) debe tener un nmero razonable de valores distintivos (categoras). Estos valores pueden ser de cadena corta o numricos. La variable de etiquetas de caso, utilizada para etiquetar valores atpicos en los diagramas de caja, puede ser de cadena corta, de cadena larga (los 15 primeros caracteres) o numrica. Supuestos. La distribucin de los datos no tiene que ser simtrica ni normal.
Figura 16-1 Resultados de Explorar
369 Explorar
Si lo desea, puede: Seleccionar una o ms variables de factor, cuyos valores definirn grupos de casos. Seleccionar una variable de identificacin para etiquetar los casos. Pulse en Estadsticos para obtener estimadores robustos, valores atpicos, percentiles y tablas de frecuencias. Pulse en Grficos para obtener histogramas, pruebas y grficos de probabilidad normal y diagramas de dispersin por nivel con estadsticos de Levene. Pulse en Opciones para manipular los valores perdidos.
371 Explorar
Explorar: Estadsticos
Figura 16-3 Cuadro de dilogo Explorar: Estadsticos
Descriptivos. Por defecto se muestran estas medidas de dispersin y de tendencia central. stas ltimas indican la localizacin de la distribucin, e incluyen la media, la mediana y la media recortada al 5%. Las medidas de dispersin muestran la disimilaridad de los valores, incluyen: los errores tpicos, la varianza, la desviacin tpica, el mnimo, el mximo, la amplitud y la amplitud intercuartil. Los estadsticos descriptivos tambin incluyen medidas de la forma de la distribucin: la asimetra y la curtosis se muestran con sus errores tpicos. Tambin se muestra el intervalo de confianza a un nivel del 95%; aunque se puede especificar otro nivel. Estimadores robustos centrales. Alternativas robustas a la mediana y a la media
muestral para estimar la localizacin. Los estimadores calculados se diferencian por las ponderaciones que aplican a los casos. Se muestran los siguientes: el estimador-M de Huber, el estimador en onda de Andrew, el estimador-M redescendente de Hampel y el estimador biponderado de Tukey.
Valores atpicos. Muestra los cinco valores mayores y los cinco menores, con las
etiquetas de caso.
Percentiles. Muestra los valores de los percentiles 5, 10, 25, 50, 75, 90 y 95.
372 Captulo 16
Explorar: Grficos
Figura 16-4 Cuadro de dilogo Explorar: Grficos
caja cuando existe ms de una variable dependiente. Niveles de los factores juntos genera una presentacin para cada variable dependiente. En cada una se muestran diagramas de caja para cada uno de los grupos definidos por una variable de factor. Dependientes juntas genera una presentacin para cada grupo definido por una variable de factor. En cada una se muestran juntos los diagramas de caja de cada variable dependiente. Esta disposicin es particularmente til cuando las variables representan una misma caracterstica medida en momentos distintos.
Descriptivos. La seccin Descriptivos permite seleccionar grficos de tallo y hojas e
histogramas.
Grficos con pruebas de normalidad. Muestra los diagramas de probabilidad normal y de probabilidad sin tendencia. Se muestra el estadstico de Kolmogorov-Smirnov con un nivel de significacin de Lilliefors para contrastar la normalidad. Si se especifican ponderaciones no enteras, se calcular el estadstico de Shapiro-Wilk cuando el tamao de la muestra ponderada est entre 3 y 50. Si no hay ponderaciones o stas son enteras, se calcular el estadstico cuando el tamao muestral est entre 3 y 5000.
373 Explorar
Dispersin por nivel con prueba de Levene. Controla la transformacin de los datos para los diagramas de dispersin por nivel. Para todos los diagramas de dispersin por nivel se muestra la pendiente de la lnea de regresin y las pruebas robustas de Levene sobre la homogeneidad de varianza. Si selecciona una transformacin, las pruebas de Levene se basarn en los datos transformados. Si no selecciona ninguna variable de factor, no se generar ningn diagrama de dispersin por nivel. Estimacin de potencia produce un grfico de los logaritmos naturales de las amplitudes intercuartiles respecto a los logaritmos naturales de las medianas de todas las casillas, as como una estimacin de la transformacin de potencia necesaria para conseguir varianzas iguales en las casillas. Un diagrama de dispersin por nivel ayuda a determinar la potencia que precisa una transformacin para estabilizar (igualar) las varianzas de los grupos. Transformados permite seleccionar una de las alternativas de potencia, quizs siguiendo las recomendaciones de la estimacin de potencia, y genera grficos de los datos transformados. Se trazan la amplitud intercuartil y la mediana de los datos transformados. No transformados genera grficos de los datos brutos. Es equivalente a una transformacin con una potencia de 1.
cuadrada.
Recproco. Se calcula el inverso de cada valor de los datos. Raz cuadrada. Se calcula la raz cuadrada de cada valor de los datos. Cuadrado. Se calcula el cuadrado de cada valor de los datos. Cubo. Se calcula el cubo de cada valor de los datos.
374 Captulo 16
Explorar: Opciones
Figura 16-5 Cuadro de dilogo Explorar: Opciones
Valores perdidos. Controla el tratamiento de los valores perdidos. Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
de factor o variable dependiente se excluyen de todos los anlisis. Este es el mtodo por defecto.
Excluir casos segn pareja. Los casos que no tengan valores perdidos para las
variables de un grupo (casilla) se incluyen en el anlisis de ese grupo. El caso puede tener valores perdidos para las variables utilizadas en otros grupos.
Mostrar los valores. Los valores perdidos para las variables de factor se tratan
como una categora diferente. Todos los resultados se generan para esta categora adicional. Las tablas de frecuencias incluyen categoras para los valores perdidos. Los valores perdidos para una variable de factor se incluyen pero se etiquetan como perdidos.
375 Explorar
Calcular percentiles respecto a cualquiera de los cinco mtodos (con el subcomando PERCENTILES). Especificar una transformacin de potencia para diagramas de dispersin por nivel (con el subcomando PLOT). Especificar el nmero de valores extremos que se van a mostrar (mediante el subcomando STATISTICS). Especificar parmetros para los estimadores robustos centrales, los estimadores robustos de ubicacin (mediante el subcomando MESTIMATORS). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Tablas de contingencia
17
Captulo
El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin para las tablas de doble clasificacin. La estructura de la tabla y el hecho de que las categoras estn ordenadas o no determinan las pruebas o medidas que se utilizaban. Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si especifica una fila, una columna y un factor de capa (variable de control), el procedimiento Tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor de capa (o una combinacin de valores para dos o ms variables de control). Por ejemplo, si sexo es un factor de capa para una tabla de casado (s, no) en funcin de vida (vida emocionante, rutinaria o aburrida), los resultados para una tabla de doble clasificacin para las mujeres se calculan de forma independiente de los resultados de los hombres y se imprimen en paneles uno detrs del otro.
Ejemplo. Es ms probable que los clientes de las empresas pequeas sean ms
rentables en la venta de servicios (por ejemplo, formacin y asesoramiento) que los clientes de las empresas grandes? A partir de una tabla de contingencia podra deducir que la prestacin de servicios a la mayora de las empresas pequeas (con menos de 500 empleados) produce considerables beneficios, mientras que con la mayora de las empresas de gran tamao (con ms de 2.500 empleados), los beneficios obtenidos son mucho menores.
Estadsticos y medidas de asociacin. Chi-cuadrado de Pearson, chi-cuadrado de la
razn de verosimilitud, prueba de asociacin lineal por lineal, prueba exacta de Fisher, chi-cuadrado corregido de Yates, r de Pearson, rho de Spearman, coeficiente de contingencia, phi, V de Cram, lambdas simtricas y asimtricas, tau de Kruskal y Goodman, coeficiente de incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c de Kendall, coeficiente eta, kappa de Cohen, estimacin de riesgo relativo, razn de ventajas, prueba de McNemar y estadsticos de Cochran y Mantel-Haenszel.
377
378 Captulo 17
Datos. Para definir las categoras de cada variable, utilice valores de una variable numrica o de cadena corta (ocho caracteres o menos). Por ejemplo, para sexo, podra codificar los datos como 1 y 2 o como varn y mujer. Supuestos. En algunos estadsticos y medidas se asume que hay unas categoras ordenadas (datos ordinales) o unos valores cuantitativos (datos de intervalos o de proporciones), como se explica en la seccin sobre los estadsticos. Otros estadsticos son vlidos cuando las variables de la tabla tienen categoras no ordenadas (datos nominales). Para los estadsticos basados en chi-cuadrado (phi, V de Cramr y coeficiente de contingencia), los datos deben ser una muestra aleatoria de una distribucin multinomial.
Nota: Las variables ordinales pueden ser cdigos numricos que representen categoras (por ejemplo, 1 = bajo, 2 = medio, 3 = alto) o valores de cadena. Sin embargo, se supone que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio (orden que no es el correcto). Por norma general, se puede indicar que es ms fiable utilizar cdigos numricos para representar datos ordinales.
Figura 17-1 Resultados de las tablas de contingencia
Si lo desea, puede: Seleccionar una o ms variables de control. Pulsar en Estadsticos para obtener pruebas y medidas de asociacin para tablas o subtablas de doble clasificacin. Pulsar en Casillas para obtener porcentajes, residuos y valores esperados y observados. Pulsar en Formato para controlar el orden de las categoras.
380 Captulo 17
Chi-cuadrado. Para las tablas con dos filas y dos columnas, seleccione Chi-cuadrado
para calcular el chi-cuadrado de Pearson, el chi-cuadrado de la razn de verosimilitud, la prueba exacta de Fisher y el chi-cuadrado corregido de Yates (correccin por continuidad). Para las tablas 2 2, se calcula la prueba exacta de Fisher cuando una tabla (que no resulte de perder columnas o filas en una tabla mayor) presente una casilla con una frecuencia esperada menor que 5. Para las restantes tablas 2 2 se calcula el chi-cuadrado corregido de Yates. Para las tablas con cualquier nmero de filas y columnas, seleccione Chi-cuadrado para calcular el chi-cuadrado de Pearson y el chi-cuadrado de la razn de verosimilitud. Cuando ambas variables de tabla son cuantitativas, Chi-cuadrado da como resultado la prueba de asociacin lineal por lineal.
Correlaciones. Para las tablas en las que tanto las columnas como las filas contienen
valores ordenados, Correlaciones da como resultado rho, el coeficiente de correlacin de Spearman (slo datos numricos). La rho de Spearman es una medida de asociacin entre rdenes de rangos. Cuando ambas variables de tabla (factores) son cuantitativas, Correlaciones da como resultado r, el coeficiente de correlacin de Pearson, una medida de asociacin lineal entre las variables.
Nominal. Para los datos nominales (sin orden intrnseco, como catlico, protestante o judo), puede seleccionar el coeficiente Phi y V de Cramr, el Coeficiente de contingencia, Lambda (lambdas simtricas y asimtricas y tau de Kruskal y Goodman) y el Coeficiente de incertidumbre. Coeficiente de contingencia. Medida de asociacin basada en chi-cuadrado.
El valor siempre est comprendido entre 0 y 1. El valor 0 indica que no hay asociacin entre la fila y la columna. Los valores cercanos a 1 indican que hay gran relacin entre las variables. El valor mximo posible depende del nmero de filas y columnas de la tabla.
Desviacin tpica (Funcin de resumen de los grficos). Medida de cunto varan
las observaciones respecto a la media, expresada en las mismas unidades que los datos.
Lambda. Medida de asociacin que refleja la reduccin proporcional en el error
cuando se utilizan los valores de la variable independiente para pronosticar los valores de la variable dependiente. Un valor igual a 1 significa que la variable independiente pronostica perfectamente la variable dependiente. Un valor igual a
382 Captulo 17
proporcional del error cuando los valores de una variable se emplean para pronosticar valores de la otra variable. Por ejemplo, un valor de 0.83 indica que el conocimiento de una variable reduce en un 83% el error al pronosticar los valores de la otra variable. SPSS calcula tanto la versin simtrica como la asimtrica del coeficiente de incertidumbre.
Ordinal. Para las tablas en las que tanto las filas como las columnas contienen valores
ordenados, seleccione Gamma (orden cero para tablas de doble clasificacin y condicional para tablas cuyo factor de clasificacin va de 3 a 10), Tau-b de Kendall y Tau-c de Kendall. Para pronosticar las categoras de columna de las categoras de fila, seleccione d de Somers.
Gamma. Medida de asociacin simtrica entre dos variables ordinales cuyo
valor siempre est comprendido entre -1 y 1. Los valores prximos a 1, en valor absoluto, indican una fuerte relacin entre las dos variables. Los valores prximos a cero indican que hay poca o ninguna relacin entre las dos variables. Para las tablas de doble clasificacin, se muestran las gammas de orden cero. Para las tablas de tres o ms factores de clasificacin, se muestran las gammas condicionales.
d de Somers. Medida de asociacin entre dos variables ordinales que toma un
valor comprendido entre -1 y 1. Los valores prximos a 1, en valor absoluto, indican una fuerte relacin entre las dos variables. Los valores prximos a cero indican que hay poca o ninguna relacin entre las dos variables. La d de Somers es una extensin asimtrica de gamma que difiere slo en la inclusin del nmero de pares no empatados en la variable independiente. Tambin se calcula una versin no simtrica de este estadstico.
Tau-b de Kendall. Medida no paramtrica de la correlacin para variables ordinales
o de rangos que tiene en consideracin los empates. El signo del coeficiente indica la direccin de la relacin y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores valores absolutos indican relaciones ms fuertes. Los valores posibles van de -1 a 1, pero un valor de -1 o +1 slo se puede obtener a partir de tablas cuadradas.
Tau-c de Kendall. Medida no paramtrica de asociacin para variables ordinales
que ignora los empates. El signo del coeficiente indica la direccin de la relacin y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores
valores absolutos indican relaciones ms fuertes. Los valores posibles van de -1 a 1, pero un valor de -1 o +1 slo se puede obtener a partir de tablas cuadradas.
Nominal por intervalo. Cuando una variable es categrica y la otra es cuantitativa,
valor 0 indica que no hay asociacin entre las variables de fila y de columna. Los valores cercanos a 1 indican que hay gran relacin entre las variables. Eta resulta apropiada para una variable dependiente medida en una escala de intervalo (por ejemplo, ingresos) y una variable independiente con un nmero limitado de categoras (por ejemplo, gnero). Se calculan dos valores de eta: uno trata la variable de las filas como una variable de intervalo; el otro trata la variable de las columnas como una variable de intervalo.
Kappa. La kappa de Cohen mide el acuerdo entre las evaluaciones de dos jueces
cuando ambos estn valorando el mismo objeto. Un valor igual a 1 indica un acuerdo perfecto. Un valor igual a 0 indica que el acuerdo no es mejor que el que se obtendra por azar. Kappa slo est disponible para las tablas cuadradas (tablas en las que ambas variables tienen el mismo nmero de categoras).
Riesgo. Pata tablas 2x2, una medida del grado de asociacin entre la presencia de un factor y la ocurrencia de un evento. Si el intervalo de confianza para el estadstico incluye un valor de 1, no se podr asumir que el factor est asociado con el evento. Cuando la ocurrencia del factor es rara, se puede utilizar la razn de las ventajas (odds ratio) como estimacin del riesgo relativo. McNemar. Prueba no paramtrica para dos variables dicotmicas relacionadas.
Contrasta los cambios en las respuestas utilizando la distribucin de chi-cuadrado. Es til para detectar cambios en las respuestas debidas a la intervencin experimental en los diseos del tipo "antes-despus". Para las tablas cuadradas de mayor orden se informa de la prueba de simetra de McNemar-Bowker.
Estadsticos de Cochran y de Mantel-Haenszel. Los estadsticos de Cochran y Mantel-Haenszel pueden utilizarse para contrastar la independencia entre una variable de factor dicotmica y una variable de respuesta dicotmica, condicionadapor los patrones en las covariables, los cuales vienen definidos por la variable o variables de las capas (variables de control). Tenga en cuenta que mientras que otros estadsticos se calculan capa por capa, los estadsticos de Cochran y Mantel-Haenszel se calculan una sola vez para todas las capas.
384 Captulo 17
Para ayudarle a descubrir las tramas en los datos que contribuyen a una prueba de chi-cuadrado significativa, el procedimiento Tablas de contingencia muestra las frecuencias esperadas y tres tipos de residuos (desviaciones) que miden la diferencia entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede contener cualquier combinacin de recuentos, porcentajes y residuos seleccionados.
Recuentos. El nmero de casos realmente observados y el nmero de casos esperados si las variables de fila y columna son independientes entre s. Porcentajes. Los porcentajes se pueden sumar a travs de las filas o a lo largo de las
columnas. Tambin se encuentran disponibles los porcentajes del nmero total de casos representados en la tabla (una capa).
Residuos. Los residuos brutos no tipificados presentan la diferencia entre los valores observados y los esperados. Tambin se encuentran disponibles los residuos tipificados y tipificados corregidos. No tipificados. La diferencia entre un valor observado y el valor pronosticado por
el modelo. El valor pronosticado es el nmero de casos que se esperaran en la casilla si no hubiera relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la casilla de los que habra en ella si las variables de fila y columna fueran independientes.
residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Tipificados corregidos. El residuo de una casilla (valor observado menos valor
pronosticado) dividido por una estimacin de su error tpico. El residuo tipificado resultante viene expresado en unidades de desviacin tpica, por encima o por debajo de la media.
Ponderaciones no enteras. Los recuentos de las casillas suelen ser valores enteros,
ya que representan el nmero de casos de cada casilla. Sin embargo, si el archivo de datos est ponderado en un momento determinado por una variable de ponderacin con valores fraccionarios (por ejemplo, 1,25), los recuentos de las casillas pueden que tambin sean valores fraccionarios. Puede truncar o redondear estos valores antes o despus de calcular los recuentos de las casillas o bien utilizar recuentos de casillas fraccionarios en la presentacin de las tablas y los clculos de los estadsticos.
Redondear las frecuencias de casilla. Las ponderaciones de los casos se utilizan
tal cual, pero las ponderaciones acumuladas en las casillas se redondean antes de calcular cualquiera de los estadsticos.
Truncar las frecuencias de casilla. Las ponderaciones de los casos se utilizan
tal cual, pero las ponderaciones acumuladas en las casillas se truncan antes de calcular cualquiera de los estadsticos.
Redondear las ponderaciones de los casos. Se redondean las ponderaciones de
antes de utilizarlas.
Sin ajustes. Las ponderaciones de los casos se utilizan tal cual y se utilizan las
frecuencias de casilla fraccionales. Sin embargo, cuando se solicitan Estadsticos exactos (disponsibles slo con la opcin Pruebas exactas), los pesos acumulados en las casillas se truncan o redondean antes de calcular los estadsticos de las Pruebas exactas.
386 Captulo 17
Puede ordenar las filas en orden ascendente o descendente de los valores de la variable de fila.
Resmenes de casos
18
Captulo
El procedimiento Resmenes de casos calcula estadsticos de subgrupo para las variables dentro de las categoras de una o ms variables de agrupacin. Se cruzan todos los niveles de las variables de agrupacin. Puede elegir el orden en el que se mostrarn los estadsticos. Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras. Los valores de los datos en cada categora pueden mostrarse en una lista o suprimirse. Con grandes conjuntosde datos, tiene la opcin de listar slo los primeros n casos.
Ejemplo. Cul es la media de las ventas por regiones o por tipo de cliente? Podr
descubrir que el importe medio de las ventas es ligeramente superior en la regin occidental respecto a las dems regiones, y que la media ms alta se da entre los clientes de empresas privadas de la zona occidental.
Estadsticos. Suma, nmero de casos, media, mediana, mediana agrupada, error tpico
de la media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media geomtrica y media armnica.
Datos. Las variables de agrupacin son variables categricas cuyos valores pueden
ser numricos o de cadena corta. El nmero de categoras debe ser razonablemente pequeo. Las otras variables deben poder ordenarse mediante rangos.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y
la desviacin tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones simtricas. Los estadsticos robustos, tales como la mediana y el rango, son adecuados para las variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
387
Si lo desea, puede: Seleccionar una o ms variables de agrupacin para dividir los datos en subgrupos. Pulsar en Opciones para cambiar el ttulo de los resultados, aadir un texto al pie debajo de los resultados o excluir los casos con valores perdidos. Pulsar en Estadsticos para acceder a estadsticos adicionales. Seleccionar Mostrar los casos para listar los casos en cada subgrupo. Por defecto, el sistema enumera slo los 100 primeros casos del archivo. Puede aumentar o disminuir el valor de Limitar los casos a los primeros n o desactivar ese elemento para enumerar todos los casos.
Resumir: Opciones
Figura 18-3 Cuadro de dilogo Resmenes de casos: Opciones
Resumir permite cambiar el ttulo de los resultados o aadir un texto que aparecer debajo de la tabla de resultados. Puede controlar el ajuste de las lneas en los ttulos y textos escribiendo \n en el lugar donde desee insertar una lnea de separacin. Adems, puede elegir entre mostrar o suprimir los subttulos para los totales e incluir o excluir los casos con valores perdidos para cualquiera de las variables utilizadas en cualquiera de los anlisis. A menudo es aconsejable representar los casos perdidos en los resultados con un punto o un asterisco. Introduzca un carcter, frase o cdigo que desee que aparezca cuando haya un valor perdido; de lo contrario, no se aplicar ningn tratamiento especial a los casos perdidos en los resultados.
390 Captulo 18
Resumir: Estadsticos
Figura 18-4 Cuadro de dilogo Resumir los casos: Estadsticos
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables dentro de cada categora de cada variable de agrupacin: suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media geomtrica y media armnica. El orden en el que aparecen los estadsticos en la lista Estadsticos de casilla es el orden en el que se mostrarn en los resultados. Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos. Media geomtrica. La raz ensima del producto de los valores de los datos, donde n
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como 35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando los tamaos de las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras divido por la suma de los inversos de los tamaos de las muestras. Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos. Mximo. El mayor valor de una variable numrica. Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida
casos; el percentil 50. Cuando el nmero de observaciones es par, la mediana es el promedio de las dos observaciones centrales, una vez que han sido ordenadas de manera ascendente o descendente. La mediana es una medida de tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica. N. Nmero de casos (observaciones o registros). Porcentaje del N total. Porcentaje del nmero total de casos en cada categora. Porcentaje de la suma total. Porcentaje de la suma total en cada categora. Amplitud. Diferencia entre los valores mayor y menor de una variable numrica; el
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
392 Captulo 18
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse como contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo para la curtosis indica que las colas son ms largas que las de una distribucin normal; por el contrario, un valor extremo y negativo indica que las colas son ms cortas (llegando a tener forma de caja como en la distribucin uniforme). Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede utilizarse como un contraste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo para la asimetra indica una cola larga a la derecha; un valor extremo y negativo indica una cola larga por la izquierda. Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable.
Medias
19
Captulo
El procedimiento Medias calcula medias de subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras de una o ms variables independientes. Si lo desea, puede obtener el anlisis de varianza de un factor, la eta y pruebas de linealidad.
Ejemplo. Mida la cantidad media de grasa absorbida en funcin de tres tipos distintos
de aceite comestible y realice un anlisis de varianza de un factor para comprobar si difieren las medias.
Estadsticos. Suma, nmero de casos, media, mediana, mediana agrupada, error tpico
de la media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media geomtrica y media armnica. Las opciones incluyen: anlisis de varianza, eta, eta cuadrado y pruebas de linealidad de R y R2.
Datos. Las variables dependientes son cuantitativas y las independientes son
categricas. Los valores de las variables categricas pueden ser numricos o de cadena corta.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y
la desviacin tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones simtricas. Los estadsticos robustos, tales como la mediana son adecuados para las variables cuantitativas que pueden o no cumplir el supuesto de normalidad. El anlisis de varianza es robusto a las desviaciones de la normalidad, aunque los datos de cada casilla deberan ser simtricos. El anlisis de varianza tambin supone que los grupos proceden de poblaciones con la misma varianza. Para comprobar este supuesto, utilice la prueba de homogeneidad de las varianzas de Levene, disponible en el procedimiento ANOVA de un factor.
393
Tabla de ANOVA Suma de cuadrados 1596.000 1530.000 3126.000 gl 2 15 17 Media cuadrtica 798.000 102.000 F 7.824 Sig. .005
(Combinadas)
E Seleccione una o ms variables dependientes. E Utilice uno de los siguientes mtodos para seleccionar variables independientes
categricas: Seleccione una o ms variables independientes. Se mostrarn resultados individuales para cada variable independiente. Seleccione una o ms capas de variables independientes. Cada capa subdivide consecutivamente la muestra. Si tiene una variable independiente en Capa 1 y otra variable independiente en Capa 2, los resultados se mostrarn en una tabla cruzada en contraposicin a tablas individuales para cada variable independiente.
E Si lo desea, pulse en Opciones si desea obtener estadsticos opcionales, una tabla de anlisis de varianza, eta, eta cuadrado, R, y R2.
396 Captulo 19
Medias: Opciones
Figura 19-3 Cuadro de dilogo Medias: Opciones
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables dentro de cada categora de cada variable de agrupacin: suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media geomtrica, media armnica. Se puede cambiar el orden de aparicin de los estadsticos de subgrupo. El orden en el que aparecen en la lista Estadsticos de casilla es el mismo orden que presentarn en los resultados. Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos. Media geomtrica. La raz ensima del producto de los valores de los datos, donde n representa el nmero de casos.
397 Medias
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos.
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como 35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando
los tamaos de las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras divido por la suma de los inversos de los tamaos de las muestras.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos. Mximo. El mayor valor de una variable numrica. Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida por el nmero de casos. Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los
casos; el percentil 50. Cuando el nmero de observaciones es par, la mediana es el promedio de las dos observaciones centrales, una vez que han sido ordenadas de manera ascendente o descendente. La mediana es una medida de tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica. N. Nmero de casos (observaciones o registros). Porcentaje del N total. Porcentaje del nmero total de casos en cada categora. Porcentaje de la suma total. Porcentaje de la suma total en cada categora. Amplitud. Diferencia entre los valores mayor y menor de una variable numrica; el
398 Captulo 19
tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse como contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo para la curtosis indica que las colas son ms largas que las de una distribucin normal; por el contrario, un valor extremo y negativo indica que las colas son ms cortas (llegando a tener forma de caja como en la distribucin uniforme). Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede utilizarse como un contraste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo para la asimetra indica una cola larga a la derecha; un valor extremo y negativo indica una cola larga por la izquierda. Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable.
Estadsticos para la primera capa Tabla de Anova y eta. Muestra una tabla de anlisis de varianza de un factor y calcula
la eta y la eta cuadrado (son medidas de asociacin) para cada variable independiente de la primera capa.
Contrastes de linealidad. Calcula la suma de cuadrados, los grados de libertad y la
media cuadrtica asociados con los componentes lineal y no lineal, as como la razn F, la R y la R cuadrado. Si la variable independiente es una cadena corta entonces la linealidad no se calcula.
Cubos OLAP
20
Captulo
El procedimiento Cubos OLAP (siglas del ingls On-Line Analytic Processing, Procesamiento analtico interactivo ) calcula totales, medias y otros estadsticos univariantes para variables de resumen continuas dentro de las categoras de una o ms variables categricas de agrupacin. En la tabla se crear una nueva capa para cada categora de cada variable de agrupacin.
Ejemplo. El total y el promedio de ventas para diversas regiones y lneas de producto,
de la media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de casos totales, porcentaje de la suma total, porcentaje de casos totales dentro de las variables agrupadas, porcentaje de la suma total dentro de las variables agrupadas, media geomtrica y media armnica.
Datos. Las variables de resumen son cuantitativas (variables continuas medidas en
una escala de intervalo o de razn) y las variables de agrupacin son categricas. Los valores de las variables categricas pueden ser numricos o de cadena corta.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y
la desviacin tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones simtricas. Los estadsticos robustos, tales como la mediana y el rango, son adecuados para las variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
399
E Seleccione una o ms variables de resumen continuas. E Seleccione una o ms variables de agrupacin categricas. E Si lo desea:
Seleccionar diferentes estadsticos de resumen (pulse en Estadsticos). Debe seleccionar una o ms variables de agrupacin para poder seleccionar estadsticos de resumen. Calcule las diferencias existentes entre los pares de variables y los pares de grupos definidos por una variable de agrupacin (pulse en Diferencias). Crear ttulos de tabla personalizados (pulse en Ttulo).
402 Captulo 20
Puede elegir uno o varios de los siguientes estadsticos de subgrupo para las variables de resumen dentro de cada categora de cada variable de agrupacin: Suma, Nmero de casos, Media, Mediana, Mediana agrupada, Error tpico de la media, Mnimo, Mximo, Rango, Valor de la variable para la primera categora de la variable de agrupacin, Valor de la variable para la ltima categora de la variable de agrupacin, Desviacin tpica, Varianza, Curtosis, Error tpico de curtosis, Asimetra, Error tpico de asimetra, Porcentaje de casos totales, Porcentaje de la suma total, Porcentaje de casos totales dentro de las variables de agrupacin, Porcentaje de la suma total dentro de las variables de agrupacin, Media geomtrica y Media armnica. Se puede cambiar el orden de aparicin de los estadsticos de subgrupo. El orden en el que aparecen en la lista Estadsticos de casilla es el mismo orden que presentarn en los resultados. Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos. Media geomtrica. La raz ensima del producto de los valores de los datos, donde n
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos.
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como 35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando los tamaos de las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras divido por la suma de los inversos de los tamaos de las muestras. Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos. Mximo. El mayor valor de una variable numrica. Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida por el nmero de casos. Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los
casos; el percentil 50. Cuando el nmero de observaciones es par, la mediana es el promedio de las dos observaciones centrales, una vez que han sido ordenadas de manera ascendente o descendente. La mediana es una medida de tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica. N. Nmero de casos (observaciones o registros). Porcentaje del N en. Porcentaje del nmero de casos para la variable de agrupacin especificada dentro de las categoras de otras variables de agrupacin. Si slo tiene una variable de agrupacin, este valor es idntico al porcentaje del nmero de casos total. Porcentaje de la suma en. Porcentaje de la suma para la variable de agrupacin
especificada dentro de las categoras de otras variables de agrupacin. Si slo tiene una variable de agrupacin, este valor es idntico al porcentaje de la suma total.
Porcentaje del N total. Porcentaje del nmero total de casos en cada categora.
404 Captulo 20
Porcentaje de la suma total. Porcentaje de la suma total en cada categora. Amplitud. Diferencia entre los valores mayor y menor de una variable numrica; el
de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La varianza se mide en unas unidades que son el cuadrado de las de la propia variable.
Este cuadro de dilogo le permite calcular el porcentaje y las diferencias aritmticas entre las variables de resumen o entre los grupos definidos por una variable de agrupacin. Las diferencias se calculan para todas las medidas seleccionadas en el cuadro de dilogo Cubos OLAP: Estadsticos.
Diferencias entre variables. Calcula las diferencias entre pares de variables. Los valores de los estadsticos de resumen para la segunda variable de cada par (la variable Menos) se restan de los valores de los estadsticos de resumen correspondientes a la primera variable del par. En cuanto a las diferencias de porcentaje, el valor de la variable de resumen para la variable Menos es el que se usa como denominador. Debe seleccionar al menos dos variables de resumen en el cuadro de dilogo principal para poder especificar las diferencias entre las variables. Diferencias entre grupos. Calcula las diferencias entre pares de grupos definidos
por una variable de agrupacin. Los valores de los estadsticos de resumen para la segunda categora de cada par (la variable Menos) se restan de los valores de
406 Captulo 20
los estadsticos de resumen correspondientes a la primera categora del par. Las diferencias de porcentaje utilizan el valor del estadstico de resumen de la categora Menos como denominador. Debe seleccionar una o ms variables de agrupacin en el cuadro de dilogo principal para poder especificar las diferencias entre los grupos.
Puede cambiar el ttulo de los resultados o aadir un texto al pie que aparecer debajo de la tabla de resultados. Tambin puede controlar el ajuste de las lneas de los ttulos y de los textos al pie escribiendo \n en el lugar del texto donde desee insertar una lnea de separacin.
Pruebas T
Hay tres tipos de pruebas t:
21
Captulo
Prueba T para muestras independientes (prueba T para dos muestras). Compara las
medias de una variable para dos grupos de casos. Se ofrecen estadsticos descriptivos para cada grupo y la prueba de Levene sobre la igualdad de las varianzas, as como valores t de igualdad de varianzas y varianzas desiguales y un intervalo de confianza al 95% para la diferencia entre las medias.
Prueba T para muestras relacionadas (prueba T dependiente). Compara las medias de
dos variables en un solo grupo. Esta prueba tambin se utiliza para pares relacionados o diseos de estudio de control de casos. El resultado incluye estadsticos descriptivos de las variables que se van a contrastar, la correlacin entre ellas, estadsticos descriptivos de las diferencias emparejadas, la prueba t y un intervalo de confianza al 95%.
Prueba t para una muestra. Compara la media de una variable con un valor conocido
o hipotetizado. Se muestran estadsticos descriptivos para las variables de contraste junto con la prueba t. Por defecto, en los resultados se incluye un intervalo de confianza al 95% para la diferencia entre la media de la variable de contraste y el valor hipotetizado de la prueba.
408 Captulo 21
entre las medias. Las diferencias de ingresos medios pueden estar sometidas a la influencia de factores como los estudios (y no solamente el sexo).
Ejemplo. Se asigna aleatoriamente un grupo de pacientes con hipertensin arterial a
un grupo con placebo y otro con tratamiento. Los sujetos con placebo reciben una pastilla inactiva y los sujetos con tratamiento reciben un nuevo medicamento del cual se espera que reduzca la tensin arterial. Despus de tratar a los sujetos durante dos meses, se utiliza la prueba t para dos muestras para comparar la tensin arterial media del grupo con placebo y del grupo con tratamiento. Cada paciente se mide una sola vez y pertenece a un solo grupo.
Estadsticos. Para cada variable: tamao muestral, media, desviacin tpica y error
tpico de la media. Para la diferencia entre las medias: media, error tpico e intervalo de confianza (puede especificar el nivel de confianza). Pruebas: prueba de Levene sobre la igualdad de varianzas y pruebas t de varianzas combinadas y separadas sobre la igualdad de las medias.
Datos. Los valores de la variable cuantitativa de inters se hallan en una nica
columna del archivo de datos. El procedimiento utiliza una variable de agrupacin con dos valores para separar los casos en dos grupos. La variable de agrupacin puede ser numrica (valores como 1 y 2, o 6,25 y 12,5) o de cadena corta (como s y no). Tambin puede usar una variable cuantitativa, como la edad, para dividir los casos en dos grupos especificando un punto de corte (el punto de corte 21 divide la edad en un grupo de menos de 21 aos y otro de ms de 21).
Supuestos. Para la prueba t de igualdad de varianzas, las observaciones deben ser
muestras aleatorias independientes de distribuciones normales con la misma varianza de poblacin. Para la prueba t de varianzas desiguales, las observaciones deben ser muestras aleatorias independientes de distribuciones normales. La prueba t para dos muestras es bastante robusta a las desviaciones de la normalidad. Al contrastar las distribuciones grficamente, compruebe que son simtricas y que no contienen valores atpicos.
Figura 21-1 Resultados de la prueba T para muestras independientes
409 Pruebas T
410 Captulo 21
Para las variables de agrupacin numricas, defina los dos grupos de la prueba t especificando dos valores o un punto de corte:
Usar valores especificados. Escriba un valor para el Grupo 1 y otro para el Grupo
2. Los casos con otros valores quedarn excluidos del anlisis. Los nmeros no tienen que ser enteros (por ejemplo, 6,25 y 12,5 son vlidos).
Punto de corte. Escriba un nmero que divida los valores de la variable de
agrupacin en dos conjuntos. Todos los casos con valores menores que el punto de corte forman un grupo y los casos con valores mayores o iguales que el punto de corte forman el otro grupo.
Figura 21-4 Cuadro de dilogo Definir grupos para variables de cadena
Para las variables de agrupacin de cadena corta, escriba una cadena para el Grupo 1 y otra para el Grupo 2; por ejemplo s y no. Los casos con otras cadenas se excluyen del anlisis.
411 Pruebas T
la diferencia entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o
vlidos para las variables contrastadas. Los tamaos muestrales pueden variar de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen
datos vlidos para todas las variables utilizadas en las pruebas t solicitadas. El tamao muestral es constante en todas las pruebas.
pacientes al comienzo del estudio, se les aplica un tratamiento y se les toma la tensin otra vez. De esta manera, a cada paciente le corresponden dos medidas, normalmente denominadas medidas pre y post. Un diseo alternativo para el que se utiliza esta prueba consiste en un estudio de pares relacionados o un estudio de control de casos en el que cada registro en el archivo de datos contiene la respuesta del paciente y de su sujeto de control correspondiente. En un estudio sobre la tensin sangunea, pueden emparejarse pacientes y controles por edad (un paciente de 75 aos con un miembro del grupo de control de 75 aos).
412 Captulo 21
Estadsticos. Para cada variable: media, tamao muestral, desviacin tpica y error
tpico de la media. Para cada pareja de variables: correlacin, diferencia promedio entre las medias, prueba t de intervalo de confianza para la diferencia entre las medias (puede especificarse el nivel de confianza). Desviacin tpica y error tpico de la diferencia entre las medias.
Datos. Especifique dos variables cuantitativas (nivel de medida de intervalo o de
razn) para cada prueba de pares. En un estudio de pares relacionados o de control de casos, la respuesta de cada sujeto de la prueba y su sujeto de control correspondiente debern hallarse en el mismo caso en el archivo de datos.
Supuestos. Las observaciones de cada par deben hacerse en las mismas condiciones.
Las diferencias entre las medias deben estar normalmente distribuidas. Las varianzas de cada variable pueden ser iguales o desiguales.
Figura 21-6 Resultados de la prueba T para muestras relacionadas
Prueba de muestras relacionadas Diferencias relacionadas Error tp. de la media Intervalo de confianza para la diferencia Inferior t gl
Desviacin tp.
Sig. (bilateral)
26.10
19.59
6.19
12.09
4.214
.002
413 Pruebas T
Pulse en cada una de las dos variables. La primera variable aparecer en la seccin Selecciones actuales como Variable 1 y la segunda variable aparecer como Variable 2. Pulse en el botn de flecha para mover el par a la lista Variables relacionadas. Si lo desea, pueden seleccionar ms parejas de variables. Para eliminar una pareja de variables del anlisis, seleccinela en la lista Variables relacionadas y pulse en el botn de flecha.
E Si lo desea, puede pulsar en Opciones para controlar el tratamiento de los datos
414 Captulo 21
la diferencia entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o
datos vlidos para la pareja de variables contrastadas. Los tamaos muestrales pueden variar de una prueba a otra.
Excluir casos segn lista. Cada prueba t utilizar nicamente los casos que
contengan datos vlidos para todas las parejas de variables contrastadas. El tamao muestral es constante en todas las pruebas.
intelectual de un grupo de alumnos difiere de 100. O bien, un fabricante de copos de cereales puede tomar una muestra de envases de la lnea de produccin y comprobar si el peso medio de las muestras difiere de 1 Kg con un nivel de confianza al 95%.
Estadsticos. Para cada variable a contrastar: media, desviacin tpica y error tpico
de la media. La diferencia promedio entre cada valor de los datos y el valor de contraste hipotetizado, una prueba t que contrasta que esta diferencia es 0 y un intervalo de confianza para la diferencia promedio (para el que puede especificarse el nivel de confianza).
415 Pruebas T
Datos. Para contrastar los valores de una variable cuantitativa con un valor de
contraste hipotetizado, elija una variable cuantitativa e introduzca un valor de contraste hipotetizado.
Supuestos. Esta prueba asume que los datos estn normalmente distribuidos; sin embargo, esta prueba es bastante robusto frente a las desviaciones de la normalidad.
Figura 21-9 Resultados de Prueba T para una muestra
416 Captulo 21 Figura 21-10 Cuadro de dilogo Prueba T para una muestra
E Seleccione una o ms variables para contrastarlas con el mismo valor hipotetizado. E Introduzca un valor de contraste numrico para compararlo con cada media muestral. E Si lo desea, puede pulsar en Opciones para controlar el tratamiento de los datos
Intervalo de confianza. Por defecto se muestra un intervalo de confianza al 95% para la diferencia entre la media y el valor de contraste hipotetizado. Introduzca un valor entre 1 y 99 para solicitar otro nivel de confianza. Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o
417 Pruebas T
Excluir casos segn anlisis. Cada prueba t utiliza todos los casos que tienen
datos vlidos para la variable contrastada. Los tamaos muestrales pueden variar de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen
datos vlidos para todas las variables utilizadas en las pruebas t solicitadas. El tamao muestral es constante en todas las pruebas.
ANOVA de un factor
22
Captulo
El procedimiento ANOVA de un factor genera un anlisis de varianza de un factor para una variable dependiente cuantitativa respecto a una nica variable de factor (la variable independiente). El anlisis de varianza se utiliza para contrastar la hiptesis de que varias medias son iguales. Esta tcnica es una extensin de la prueba t para dos muestras. Adems de determinar que existen diferencias entre las medias, es posible que desee saber qu medias difieren. Existen dos tipos de contrastes para comparar medias: a priori y post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y los contrastes post hoc se realizan despus de haber llevado a cabo el experimento. Tambin puede contrastar las tendencias existentes a travs de las categoras.
Ejemplo. Las rosquillas absorben diferentes cantidades de grasa cuando se fren. Se plantea un experimento utilizando tres tipos de grasas: aceite de cacahuete, aceite de maz y manteca de cerdo. El aceite de cacahuete y el aceite de maz son grasas no saturadas y la manteca es una grasa saturada. Adems de determinar si la cantidad de grasa absorbida depende del tipo de grasa utilizada, tambin se podra preparar un contraste a priori para determinar si la cantidad de absorcin de la grasa difiere para las grasas saturadas y las no saturadas. Estadsticos. Para cada grupo: nmero de casos, media, desviacin tpica, error tpico
de la media, mnimo, mximo, intervalo de confianza al 95% para la media. Prueba de Levene sobre la homogeneidad de varianzas, tabla de anlisis de varianza y contrastes robustos de igualdad de medias para cada variable dependiente, contrastes a priori especificados por el usuario y las pruebas de rango y de comparaciones mltiples post hoc: Bonferroni, Sidak, diferencia honestamente significativa de Tukey, GT2 de Hochberg, Gabriel, Dunnett, prueba F de Ryan-Einot-Gabriel-Welsch, (R-E-G-W F), prueba de rango de Ryan-Einot-Gabriel-Welsch (R-E-G-W Q), T2 de Tamhane, T3 de Dunnett, Games-Howell, C, de Dunnett, prueba de rango mltiple de Duncan,
419
420 Captulo 22
poblacin normal. El anlisis de varianza es robusto a las desviaciones de la normalidad, aunque los datos debern ser simtricos. Los grupos deben proceder de poblaciones con varianzas iguales. Para contrastar este supuesto, utilice la prueba de Levene de homogeneidad de varianzas.
Figura 22-1 Resultados del procedimiento ANOVA de un factor
Descriptivos Intervalo de confianza para la media al 95% N Gramos de grasa absorbida Tipo de aceite De Cacahuete Manteca De Maz Total 6 6 6 18 Media 72.00 85.00 62.00 73.00 Desviacin tpica 13.34 7.77 8.22 13.56 Error tpico 5.45 3.17 3.36 3.20 Lmite inferior 58.00 76.84 53.37 66.26 Lmite superior 86.00 93.16 70.63 79.74 Mnimo 56 77 49 49 Mximo 95 97 70 97
Coeficientes de contraste Tipo de aceite Contraste 1 De Cacahuete -.5 Manteca 1 De Maz -.5
Contraste 1 1
t 3.565 3.995
gl 15 12.542
E Seleccione una o ms variables dependientes. E Seleccione una sola variable de factor independiente.
422 Captulo 22
Puede dividir las sumas de cuadrados inter-grupos en componentes de tendencia o especificar contrastes a priori.
Polinmico. Divide las sumas de cuadrados inter-grupos en componentes de tendencia.
Puede contrastar la existencia de tendencia en la variable dependiente a travs de los niveles ordenados de la variable de factor. Por ejemplo, podra contrastar si existe una tendencia lineal (creciente o decreciente) en el salario, a travs de los niveles ordenados de la titulacin mayor obtenida.
Orden. Se puede elegir un orden polinmico 1, 2, 3, 4 o 5. Coeficientes. Contrastes a priori especificados por el usuario que sern contrastados mediante el estadstico t. Introduzca un coeficiente para cada grupo (categora) de la variable factor y pulse en Aadir despus de cada entrada. Cada nuevo valor se aade al final de la lista de coeficientes. Para especificar conjuntos de contrastes adicionales, pulse en Siguiente. Utilice Siguiente y Anterior para desplazarse por los conjuntos de contrastes. El orden de los coeficientes es importante porque se corresponde con el orden ascendente de los valores de las categoras de la variable de factor. El primer coeficiente en la lista se corresponde con el menor de los valores de grupo en la variable de factor y el ltimo coeficiente se corresponde con el valor ms alto. Por ejemplo, si existen seis categoras en la variable factor, los coeficientes 1, 0, 0, 0, 0,5 y 0,5 contrastan el primer grupo con los grupos quinto y sexto. Para la mayora de las
aplicaciones, la suma de los coeficientes debera ser 0. Los conjuntos que no sumen 0 tambin se pueden utilizar, pero aparecer un mensaje de advertencia.
Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por parejas permiten determinar qu medias difieren. Las pruebas de rango identifican subconjuntos homogneos de medias que no se diferencian entre s. Las comparaciones mltiples por parejas contrastan la diferencia entre cada pareja de medias y dan lugar a una matriz donde los asteriscos indican las medias de grupo significativamente diferentes a un nivel alfa de 0,05.
Asumiendo varianzas iguales
La prueba de la diferencia honestamente significativa de Tukey, la GT2 de Hochberg, la prueba de Gabriel y la prueba de Scheff son pruebas de comparaciones mltiples y pruebas de rango. Otras pruebas de rango disponibles son la b de Tukey, S-N-K (Student-Newman-Keuls), Duncan, R-E-G-W F (prueba F de Ryan-Einot-Gabriel-Welsch), R-E-G-W Q (prueba de rango de Ryan-Einot-Gabriel-Welsch) y Waller-Duncan. Las pruebas de comparaciones mltiples disponibles son Bonferroni, Diferencia honestamente significativa de Tukey, Sidak, Gabriel, Hochberg, Dunnett, Scheff y DMS (diferencia menos significativa).
424 Captulo 22
LSD. Utiliza pruebas t para llevar a cabo todas las comparaciones por pares entre
las medias de los grupos. No se efecta ninguna correccin de la tasa de error para el hecho de realizar mltiples comparaciones.
Bonferroni. Utiliza las pruebas de t para realizar comparaciones por pares entre las
medias de los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada prueba sea igual a la tasa de error por experimento dividida entre el nmero total de contrastes. As, se corrige el nivel crtico por el hecho de que se estn realizando mltiples comparaciones.
Sidak. Prueba de comparaciones mltiples por parejas basada en un estadstico
t. La prueba de Sidak corrige el nivel de significacin para las comparaciones mltiples y da lugar a lmites ms estrechos que los de Bonferroni.
Scheff. Realiza comparaciones mltiples conjuntas por parejas para todas las
parejas de combinaciones de las medias posibles. Utiliza la distribucin muestral F. Puede utilizarse para examinar todas las combinaciones lineales de grupos de medias posibles, no slo las comparaciones por parejas.
R-E-G-W F. Procedimiento mltiple por pasos (por tamao de las distancias) de
la distribucin del rango de Student. Con tamaos de grupo iguales, tambin compara pares de medias dentro de subconjuntos homogneos utilizando un procedimiento por pasos. Las medias se ordenan de mayor a menor y se comparan primero las diferencias ms extremas.
Tukey. Utiliza el estadstico del rango estudentizado para realizar todas las
comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las comparaciones por pares.
Tukey-b. Prueba que emplea la distribucin del rango estudentizado para realizar
comparaciones por pares entre los grupos. El valor crtico es el promedio de los valores correspondientes a la diferencia honestamente significativa de Tukey y al mtodo de Student-Newman-Keuls.
Duncan. Realiza comparaciones por pares utilizando un orden por pasos idntico
al orden usado por la prueba de Student-Newman-Keuls, pero establece un nivel de proteccin en la tasa de error para la coleccin de contrastes, en lugar
de usar una tasa de error para los contrastes individuales. Utiliza el estadstico del rango estudentizado.
GT2 de Hochberg. Prueba de comparaciones mltiples y de rango que utiliza
estudentizado y que es generalmente ms potente que la GT2 de Hochberg, cuando los tamaos de las casillas son desiguales. La prueba de Gabriel puede volverse liberal cuando los tamaos de las casillas varan mucho.
Waller-Duncan. Prueba de comparaciones mltiples basada en un estadstico
de tratamientos respecto a una nica media de control. La ltima categora es la categora de control por defecto. Si lo desea, puede seleccionar la primera categora. Para comprobar que la media de cualquier nivel del factor (excepto la categora de control) no es igual a la de la categora de control, utilice una prueba bilateral. Para contrastar si la media en cualquier nivel del factor es menor que la de la categora de control, seleccione < Control. Para contrastar si la media en cualquier nivel del factor es mayor que la de la categora de control, seleccione > Control.
No asumiendo varianzas iguales
Las pruebas de comparaciones mltiples que no suponen varianzas iguales son T2 de Tamhane, T3 de Dunnett, Games-Howell y C de Dunnett.
T2 de Tamhane. Prueba conservadora de comparacin por parejas basada en la
426 Captulo 22
Nota: Posiblemente le resulte ms fcil interpretar el resultado de los contrastes post hoc si desactiva Ocultar filas y columnas vacas en el cuadro de dilogo Propiedades de tabla (en una tabla pivote activada, seleccione Propiedades de tabla en el men Formato).
Estadsticos. Elija uno o ms entre los siguientes: Descriptivos. Calcula los siguientes estadsticos: Nmero de casos, Media,
Desviacin tpica, Error tpico de la media, Mnimo, Mximo y los Intervalos de confianza al 95% de cada variable dependiente para cada grupo.
Efectos fijos y aleatorios. Muestra la desviacin tpica, el error tpico y un
intervalo de confianza del 95% para el modelo de efectos fijos, y el error tpico, un intervalo de confianza del 95% y una estimacin de la varianza entre componentes para el modelo de efectos aleatorios.
Prueba de homogeneidad de las varianzas. Calcula el estadstico de Levene para
contrastar la igualdad de las varianzas de grupo. Esta prueba no depende del supuesto de normalidad.
igualdad de las medias de grupo. Este estadstico es preferible al estadstico F si no se supone la igualdad de las varianzas.
Welch. Calcula el estadstico de Welch para contrastar la igualdad de las medias
dependiente o la variable de factor en un anlisis determinado, no se utiliza en ese anlisis. Adems, los casos fuera del rango especificado para la variable de factor no se utilizan.
Excluir casos segn lista. Se excluyen de todos los anlisis los casos con valores
perdidos para la variable de factor o para cualquier variable dependiente incluida en la lista de variables dependientes en el cuadro de dilogo principal. Si no se han especificado varias variables dependientes, esta opcin no surte efecto.
23
Captulo
El procedimiento MLG Univariante proporciona un anlisis de regresin y un anlisis de varianza para una variable dependiente mediante uno o ms factores o variables. Las variables de factor dividen la poblacin en grupos. Con el procedimiento Modelo lineal general se pueden contrastar hiptesis nulas sobre los efectos de otras variables en las medias de varias agrupaciones de una nica variable dependiente. Se pueden investigar las interacciones entre los factores as como los efectos de los factores individuales, algunos de los cuales pueden ser aleatorios. Adems, se pueden incluir los efectos de las covariables y las interacciones de covariables con los factores. Para el anlisis de regresin, las variables (predictoras) independientes se especifican como covariables. Se pueden contrastar tanto los modelos equilibrados como los no equilibrados. Se considera que un diseo est equilibrado si cada casilla del modelo contiene el mismo nmero de casos. Adems de contrastar hiptesis, MLG Univariante genera estimaciones de los parmetros. Tambin se encuentran disponibles los contrastes a priori de uso ms habitual para contrastar las hiptesis. Adems, si una prueba F global ha mostrado cierta significacin, pueden emplearse las pruebas post hoc para evaluar las diferencias entre las medias especficas. Las medias marginales estimadas ofrecen estimaciones de valores de las medias pronosticados para las casillas del modelo; los grficos de perfil (grficos de interacciones) de estas medias permiten observar fcilmente algunas de estas relaciones. En su archivo de datos puede guardar residuos, valores pronosticados, distancia de Cook y valores de influencia como variables nuevas para comprobar los supuestos. Ponderacin MCP permite especificar una variable usada para aplicar a las observaciones una ponderacin diferente en un anlisis de mnimos cuadrados ponderados (MCP), por ejemplo para compensar la distinta precisin de las medidas.
429
430 Captulo 23
Ejemplo. Se recogen datos de los corredores individuales en el maratn de Chicago durante varios aos. El tiempo final de cada corredor es la variable dependiente. Influyen otros factores como el clima (fro, calor o temperatura agradable), los meses de entrenamiento, el nmero de maratones anteriores y el sexo. La edad se considera una covariable. Observar que el sexo es un efecto significativo y que la interaccin del sexo con el clima es significativa. Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para evaluar las diferentes hiptesis. Tipo III es el valor por defecto. Estadsticos. Las pruebas de rango post hoc y las comparaciones mltiples: Diferencia menos significativa (DMS), Bonferroni, Sidak, Scheff, Mltiples F de Ryan-Einot-Gabriel-Welsch (R-E-G-W-F), Rango mltiple de Ryan-Einot-Gabriel-Welsch, Student-Newman-Keuls (S-N-K), Diferencia honestamente significativa de Tukey, b de Tukey, Duncan, GT2 de Hochberg, Gabriel, Pruebas t de Waller Duncan, Dunnett (unilateral y bilateral), T2 de Tamhane, T3 de Dunnett, Games-Howell y C de Dunnett. Estadsticos descriptivos: medias observadas, desviaciones tpicas y frecuencias de todas las variables dependientes en todas las casillas. Prueba de Levene para la homogeneidad de varianzas. Diagramas. Diagramas de dispersin por nivel, grficos de residuos, grficos de perfil (interaccin). Datos. La variable dependiente es cuantitativa. Los factores son categricos; pueden tener valores numricos o valores de cadena de hasta ocho caracteres. Pueden tener valores numricos o valores de cadena de hasta ocho caracteres. Las covariables son variables cuantitativas que estn relacionadas con la variable dependiente. Supuestos. Los datos son una muestra aleatoria de una poblacin normal; en la poblacin, todas las varianzas de las casillas son iguales. El anlisis de varianza es robusto a las desviaciones de la normalidad, aunque los datos debern ser simtricos. Para comprobar los supuestos, puede utilizar la prueba de homogeneidad de varianzas y los grficos de dispersin por nivel. Tambin puede examinar los residuos y los grficos de residuos.
E Seleccione una variable dependiente. E Seleccione variables para Factores fijos, Factores aleatorios y Covariables, en funcin
de los datos.
E Si lo desea, puede utilizar la Ponderacin MCP para especificar una variable de
ponderacin para el anlisis de mnimos cuadrados ponderados. Si el valor de la variable de ponderacin es cero, negativo o perdido, el caso queda excluido del anlisis. Una variable que ya se haya utilizado en el modelo no puede usarse como variable de ponderacin.
MLG: Modelo
Figura 23-3 Cuadro de dilogo Univariante: Modelo
Especificar modelo. Un modelo factorial completo contiene todos los efectos principales del factor, todos los efectos principales de las covariables y todas las interacciones factor por factor. No contiene interacciones de covariable. Seleccione Personalizado para especificar slo un subconjunto de interacciones o para especificar interacciones factor por covariable. Indique todos los trminos que desee incluir en el modelo. Factores y Covariables. Muestra una lista de los factores y las covariables, etiquetando con (F) los factores fijos y con (C) las covariables. En un anlisis univariante, (R) indica un factor aleatorio. Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar
Personalizado, puede elegir los efectos principales y las interacciones que sean de
los modelos equilibrados y no equilibrados sin casillas perdidas, el mtodo ms utilizado para la suma de cuadrados es el Tipo III.
Incluir la interseccin en el modelo. La interseccin se incluye normalmente en el modelo. Si supone que los datos pasan por el origen, puede excluir la interseccin.
434 Captulo 23
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables
seleccionada.
Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. Crea todas las interacciones cudruples posibles de las variables
seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables
seleccionadas.
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica
de la suma de cuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para: Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier efecto de interaccin de primer orden, cualquier efecto de interaccin de primer orden se especifica antes de cualquier efecto de interaccin de segundo orden, y as sucesivamente. Un modelo de regresin polinmica en el que se especifica cualquier trmino de orden inferior antes que cualquier trmino de orden superior. Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro del segundo efecto especificado, el segundo efecto especificado est anidado dentro del tercero, y as sucesivamente. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis.
Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo
los efectos pertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el que se est examinando. El mtodo Tipo II para la obtencin de sumas de cuadrados se utiliza normalmente para: Un modelo ANOVA equilibrado. Cualquier modelo que slo tenga efectos de factor principal. Cualquier modelo de regresin. Un diseo puramente anidado (esta forma de anidamiento solamente puede especificarse utilizando la sintaxis).
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto del diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre que la forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza normalmente para:
Cualquiera de los modelos que aparecen en los tipos I y II. Cualquier modelo equilibrado o desequilibrado sin casillas vacas.
Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para cualquier efecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV = Tipo III = Tipo II. Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente los contrastes que se realizan entre los parmetros en F a todos los efectos de nivel superior. El mtodo Tipo IV para la obtencin de sumas de cuadrados se utiliza normalmente para:
Cualquiera de los modelos que aparecen en los tipos I y II. Cualquier modelo equilibrado o no equilibrado con casillas vacas.
436 Captulo 23
MLG: Contrastes
Figura 23-4 Cuadro de dilogo Univariante: Contrastes
Los contrastes se utilizan para contrastar las diferencias entre los niveles de un factor. Puede especificar un contraste para cada factor en el modelo (en un modelo de medidas repetidas, para cada factor inter-sujetos). Los contrastes representan las combinaciones lineales de los parmetros. El contraste de hiptesis se basa en la hiptesis nula LB = 0, donde L es la matriz de coeficientes de contraste y B es el vector de parmetros. Cuando se especifica un contraste, SPSS crea una matriz L en la que las columnas correspondientes al factor coinciden con el contraste. El resto de las columnas se corrigen para que la matriz L sea estimable. Los resultados incluyen un estadstico F para cada conjunto de contrastes. Para el contraste de diferencias tambin se muestran los intervalos de confianza simultneos de tipo Bonferroni basados en la distribucin t de Student.
Contrastes disponibles
Los contrastes disponibles son de desviacin, simples, de diferencias, de Helmert, repetidos y polinmicos. En los contrastes de desviacin y los contrastes simples, es posible determinar que la categora de referencia sea la primera o la ltima categora.
Tipos de contrastes
Desviacin. Compara la media de cada nivel (excepto una categora de referencia)
con la media de todos los niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de contraste resulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima categora como referencia. Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los
libertad contiene el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y as sucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.
Los grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el modelo. Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un factor. Los niveles de un segundo factor
438 Captulo 23
se pueden utilizar para generar lneas diferentes. Cada nivel en un tercer factor se puede utilizar para crear un grfico diferente. Todos los factores fijos y aleatorios, si existen, estn disponibles para los grficos. Para los anlisis multivariantes, los grficos de perfil se crean para cada variable dependiente. En un anlisis de medidas repetidas, es posible utilizar tanto los factores inter-sujetos como los intra-sujetos en los grficos de perfil. Las opciones MLG - Multivariante y MLG - Medidas repetidas slo estarn disponibles si tiene instalada la opcin Modelos avanzados. Un grfico de perfil de un factor muestra si las medias marginales estimadas aumentan o disminuyen a travs de los niveles. Para dos o ms factores, las lneas paralelas indican que no existe interaccin entre los factores, lo que significa que puede investigar los niveles de un nico factor. Las lneas no paralelas indican una interaccin.
Figura 23-6 Grfico no paralelo (izquierda) y grfico paralelo (derecha)
Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de manera opcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la lista de grficos.
Pruebas de comparaciones mltiples post hoc Una vez que se ha determinado que
existen diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por parejas permiten determinar qu medias difieren. Las comparaciones se realizan sobre valores sin corregir. Estas pruebas se utilizan nicamente para factores inter-sujetos fijos. En MLG Medidas repetidas, estas pruebas no estn disponibles si no existen factores inter-sujetos y las pruebas de comparacin mltiple post hoc se realizan para la media a travs de los niveles de los factores intra-sujetos. Para MLG - Multivariante, las pruebas post hoc se realizan por separado para cada variable dependiente. Las opciones MLG - Multivariante y MLG - Medidas repetidas slo estarn disponibles si tiene instalada la opcin Modelos avanzados. Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas de comparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de Student, corrige el nivel de significacin observado por el hecho de que se realizan comparaciones mltiples. La prueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms estrechos que los de Bonferroni. La prueba de diferencia honestamente significativa de Tukey utiliza el estadstico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos y establece la tasa de error por experimento como la tasa de error
440 Captulo 23
para el conjunto de todas las comparaciones por pares. Cuando se contrasta un gran nmero de pares de medias, la prueba de la diferencia honestamente significativa de Tukey es ms potente que la prueba de Bonferroni. Para un nmero reducido de pares, Bonferroni es ms potente. GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de Tukey, pero se utiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms potente. La prueba de comparacin por parejas de Gabriel tambin utiliza el mdulo mximo estudentizado y es generalmente ms potente que la GT2 de Hochberg cuando los tamaos de las casillas son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaos de las casillas varan mucho. La prueba t de comparacin mltiple por parejas de Dunnett compara un conjunto de tratamientos con una media de control simple. La ltima categora es la categora de control por defecto. Si lo desea, puede seleccionar la primera categora. Asimismo, puede elegir una prueba unilateral o bilateral. Para comprobar que la media de cualquier nivel del factor (excepto la categora de control) no es igual a la de la categora de control, utilice una prueba bilateral. Para contrastar si la media en cualquier nivel del factor es menor que la de la categora de control, seleccione < Control. Asimismo, para contrastar si la media en cualquier nivel del factor es mayor que la de la categora de control, seleccione > Control. Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos mltiples por pasos. Los procedimientos mltiples por pasos (por tamao de las distancias) contrastan en primer lugar si todas las medias son iguales. Si no son iguales, se contrasta la igualdad en los subconjuntos de medias. R-E-G-W F se basa en una prueba F y R-E-G-W Q se basa en un rango estudentizado. Estas pruebas son ms potentes que la prueba de rangos mltiples de Duncan y Student-Newman-Keuls (que tambin son procedimientos mltiples por pasos), pero no se recomiendan para tamaos de casillas desiguales. Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora de comparacin por parejas basada en una prueba t), T3 de Dunnett (prueba de comparacin por parejas basada en el mdulo mximo estudentizado), prueba de comparacin por parejasGames-Howell (a veces liberal), o C de Dunnett (prueba de comparacin por parejas basada en el rango estudentizado). La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y b de Tukey son pruebas de rango que asignan rangos a medias de grupo y calculan un valor de rango. Estas pruebas no se utilizan con la misma frecuencia que las pruebas anteriormente mencionadas.
La prueba t de Waller-Duncan utiliza la aproximacin bayesiana. Esta prueba de rango emplea la media armnica del tamao muestral cuando los tamaos muestrales no son iguales. El nivel de significacin de la prueba de Scheff est diseado para permitir todas las combinaciones lineales posibles de las medias de grupo que se van a contrastar, no slo las comparaciones por parejas disponibles en esta funcin. El resultado es que la prueba de Scheff es normalmente ms conservadora que otras pruebas, lo que significa que se precisa una mayor diferencia entre las medias para la significacin. La prueba de comparacin mltiple por parejas de la diferencia menos significativa (DMS) es equivalente a varias pruebas t individuales entre todos los pares de grupos. La desventaja de esta prueba es que no se realiza ningn intento de corregir el nivel crtico para realizar las comparaciones mltiples.
Pruebas mostradas. Se proporcionan comparaciones por parejas para DMS, Sidak,
Bonferroni, Games y Howell, T2 y T3 de Tamhane, C de Dunnett y T3 de Dunnett. Tambin se facilitan subconjuntos homogneos para S-N-K, b de Tukey, Duncan, R-E-G-W F, R-E-G-W Q y Waller. La prueba de la diferencia honestamente significativa de Tukey, la GT2 de Hochberg, la prueba de Gabriel y la prueba de Scheff son pruebas de comparaciones mltiples y pruebas de rango.
442 Captulo 23
MLG: Guardar
Figura 23-8 Cuadro de dilogo Univariante: Guardar
Es posible guardar los valores pronosticados por el modelo, los residuos y las medidas relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables se pueden utilizar para examinar supuestos sobre los datos. Si desea almacenar los valores para utilizarlos en otra sesin de SPSS, gurdelos en el archivo de datos actual.
Valores pronosticados. Son los valores que predice el modelo para cada caso. No tipificados. Valor pronosticado por el modelo para la variable dependiente. Ponderados. Los valores pronosticados no tipificados ponderados. Slo estn
dependiente para los casos que tengan los mismos valores en las variables independientes.
Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para los casos y las variables independientes que puedan tener un gran impacto en el modelo.
Distancia de Cook. Medida de cunto cambiaran los residuos de todos los casos si
se excluyera un caso determinado del clculo de los coeficientes de regresin. Una Distancia de Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin har variar substancialmente los coeficientes.
Valores de influencia. Los valores de influencia no centrados. La influencia
modelo.
Ponderados. Los residuos no tipificados ponderados. Slo estn disponibles si se
residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica
que vara de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ese caso se excluye del clculo de los
coeficientes de regresin. Es la diferencia entre el valor de la variable dependiente y el valor pronosticado corregido.
Estadsticos de los coeficientes. Escribe una matriz varianza-covarianza de las
estimaciones de los parmetros del modelo en un nuevo conjunto de datos de la sesin actual o un archivo de datos externo con formato SPSS. Asimismo, para cada variable dependiente habr una fila de estimaciones de los parmetros, una fila de valores de significacin para los estadsticos t correspondientes a las estimaciones de los parmetros y una fila de grados de libertad de los residuos. En un modelo multivariante, existen filas similares para cada variable dependiente. Si lo desea, puede usar este archivo matricial en otros procedimientos que lean un archivo matricial de SPSS.
444 Captulo 23
Opciones MLG
Figura 23-9 Cuadro de dilogo Univariante: Opciones
Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando un modelo de efectos fijos.
Medias marginales estimadas. Seleccione los factores e interacciones para los que
desee obtener estimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen respecto a las covariables, si las hay.
Comparar los efectos principales. Proporciona comparaciones por parejas no
corregidas entre las medias marginales estimadas para cualquier efecto principal del modelo, tanto para los factores inter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible si los efectos principales estn seleccionados en la lista Mostrar las medias para.
Ajuste del intervalo de confianza. Seleccione un ajuste de diferencia menor
significativa (DMS), Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento slo estar disponible si se selecciona Comparar los efectos principales.
Mostrar. Seleccione Estadsticos descriptivos para generar medias observadas, desviaciones tpicas y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones del tamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin de parmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un factor. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis alternativa se ha establecido basndose en el valor observado. Seleccione Estimaciones de los parmetros para generar las estimaciones de los parmetros, los errores tpicos, las pruebas t, los intervalos de confianza y la potencia observada para cada prueba. Seleccione Matriz de coeficientes de contraste para obtener la matriz L. Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos slo para factores inter-sujetos. Las opciones de diagramas de dispersin por nivel y grfico de los residuos son tiles para comprobar los supuestos sobre los datos. Estos elementos no estarn activado si no hay factores. Seleccione Grficos de los residuos para generar un grfico de los residuos observados respecto a los pronosticados respecto a los tipificados para cada variable dependiente. Estos grficos son tiles para investigar el supuesto de varianzas iguales. Seleccione Falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relacin entre la variable dependiente y las variables independientes. La funcin estimable general permite construir pruebas de hiptesis personales basadas en la funcin estimable general. Las filas en las matrices de coeficientes de contraste son combinaciones lineales de la funcin estimable general. Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en
las pruebas post hoc y el nivel de confianza empleado para construir intervalos de confianza. El valor especificado tambin se utiliza para calcular la potencia observada para la prueba. Si especifica un nivel de significacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de confianza.
446 Captulo 23
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING). Especificar criterios EPS (mediante el subcomando CRITERIA). Construir una matriz L, una matriz M o una matriz K (utilizando los subcomandos LMATRIX, MMATRIX y KMATRIX). Especificar una categora de referencia intermedia (utilizando el subcomando CONTRAST para los contrastes de desviacin o simples). Especificar la mtrica para los contrastes polinmicos (utilizando el subcomando CONTRAST). Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando POSTHOC). Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores en la lista de factores (utilizando el subcomando EMMEANS). Especificar nombres para las variables temporales (utilizando el subcomando SAVE). Construir un archivo de datos matricial de correlaciones (utilizando el subcomando OUTFILE). Construir un archivo de datos matricial que contenga estadsticos de la tabla de ANOVA inter-sujetos (utilizando el subcomando OUTFILE). Guardar la matriz del diseo en un nuevo archivo de datos (utilizando el subcomando OUTFILE). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Correlaciones bivariadas
24
Captulo
El procedimiento Correlaciones bivariadas calcula el coeficiente de correlacin de Pearson, la rho de Spearman y la tau-b de Kendall con sus niveles de significacin. Las correlaciones miden cmo estn relacionadas las variables o los rdenes de los rangos. Antes de calcular un coeficiente de correlacin, inspeccione los datos para detectar valores atpicos (que pueden generar resultados equvocos) y evidencias de una relacin lineal. El coeficiente de correlacin de Pearson es una medida de asociacin lineal. Dos variables pueden estar perfectamente relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin de Pearson no ser un estadstico adecuado para medir su asociacin.
Ejemplo. Est el nmero de partidos ganados por un equipo de baloncesto
correlacionado con el nmero medio de puntos anotados por partido? Un diagrama de dispersin indica que existe una relacin lineal. Al analizar los datos de la temporada 19941995 de la NBA, se descubre que el coeficiente de correlacin de Pearson (0,581) es significativo al nivel 0,01. Se puede sospechar que cuantos ms partidos se ganen por temporada, menos puntos habrn anotado los adversarios. Estas variables estn correlacionadas negativamente (0,401) y la correlacin es significativa al nivel 0,05.
Estadsticos. Para cada variable: nmero de casos sin valores perdidos, desviacin
tpica y media. Para cada pareja de variables: coeficiente de correlacin de Pearson, rho de Spearman, tau-b de Kendall, productos cruzados de las desviaciones y covarianzas.
Datos. Utilice variables cuantitativas simtricas para el coeficiente de correlacin de
Pearson y variables cuantitativas o variables con categoras ordenadas para la rho de Spearman y la tau-b de Kendall.
Supuestos. El coeficiente de correlacin de Pearson asume que cada pareja de
Correlacin de Pearson
Partidos ganados Puntos obtenidos por partido Puntos en contra por partido Partidos ganados Puntos obtenidos por partido Puntos en contra por partido
Sig. (bilateral)
Partidos ganados Puntos obtenidos por partido Puntos en contra por partido
**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).
distribuidas, seleccione el coeficiente de correlacin de Pearson. Si los datos no estn normalmente distribuidos o tienen categoras ordenadas, seleccione los correspondientes a la Tau-b de Kendall o Spearman, que miden la asociacin entre rdenes de rangos. Los coeficientes de correlacin pueden estar entre 1 (una relacin negativa perfecta) y +1 (una relacin positiva perfecta). Un valor 0 indica que no existe una relacin lineal. Al interpretar los resultados, se debe evitar extraer conclusiones de causa-efecto a partir de una correlacin significativa.
Prueba de significacin. Se pueden seleccionar las probabilidades bilaterales o
las unilaterales. Si conoce de antemano la direccin de la asociacin, seleccione Unilateral. Si no es as, seleccione Bilateral.
Marcar las correlaciones significativas. Los coeficientes de correlacin
significativos al nivel 0,05 se identifican por medio de un solo asterisco y los significativos al nivel 0,01 se identifican con dos asteriscos.
450 Captulo 24
Estadsticos. Para las correlaciones de Pearson, se puede elegir una o ambas de estas
opciones:
Medias y desviaciones tpicas. Se muestran para cada variable. Tambin se
muestra el nmero de casos que no tienen valores perdidos. Los valores perdidos se consideran segn cada variable individual, sin tener en cuenta la opcin elegida para la manipulacin de los valores perdidos.
Productos cruzados diferenciales y covarianzas. Se muestran para cada pareja de
variables. Cada producto cruzado de las desviaciones es igual a la suma de los productos de las variables corregidas respecto a la media. ste es el numerador del coeficiente de correlacin de Pearson. La covarianza es una medida no tipificada de la relacin entre dos variables, igual al producto cruzado diferencial dividido por N1.
Valores perdidos. Puede elegir uno de los siguientes: Excluir casos segn pareja. Se excluyen del anlisis los casos con valores perdidos
para una o ambas variables de la pareja que forma un coeficiente de correlacin. Debido a que cada coeficiente est basado en todos los casos que tienen cdigos vlidos para esa pareja concreta de variables, en cada clculo se utiliza la mayor cantidad de informacin disponible. Esto puede dar como resultado un grupo de coeficientes basados en un nmero de casos variable.
Excluir casos segn lista. Se excluyen de todas las correlaciones los casos con
Correlaciones parciales
25
Captulo
El procedimiento Correlaciones parciales calcula los coeficientes de correlacin parcial, los cuales describen la relacin lineal existente entre dos variables mientras se controlan los efectos de una o ms variables adicionales. Las correlaciones son medidas de asociacin lineal. Dos variables pueden estar perfectamente relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin no es un estadstico adecuado para medir su asociacin.
Ejemplo. Existe alguna relacin entre la financiacin sanitaria y las tasas de enfermedad? Aunque cabe esperar que dicha relacin sea negativa, un estudio describe una correlacin positiva significativa: si la financiacin sanitaria aumenta, las tasas de enfermedad parecen disminuir. No obstante, el control de la tasa de visitas mdicas elimina virtualmente la correlacin positiva observada. La financiacin sanitaria y las tasas de enfermedad slo parecen estar relacionadas positivamente debido a que ms personas tienen acceso a la sanidad si la financiacin aumenta, lo que tiene como resultado que los mdicos y hospitales informen de ms enfermedades. Estadsticos. Para cada variable: nmero de casos sin valores perdidos, desviacin
tpica y media. Matrices de correlacin de orden cero y parcial, con grados de libertad y niveles de significacin.
Datos. Utilice variables cuantitativas y simtricas. Supuestos. El procedimiento Correlaciones parciales supone que cada par de variables
es normal bivariante.
451
- - -
P A R T I A L
C O R R E L A T I O N
C O E F F I C I E N T S
- - -
Zero Order Partials GEB_RT GEB_RT 1.0000 ( 0) P= . .3670 ( 106) P= .000 -.7674 ( 106) P= .000 STERB_RT .3670 ( 106) P= .000 1.0000 ( 0) P= . -.4015 ( 106) P= .000 LOG_BIP -.7674 ( 106) P= .000 -.4015 ( 106) P= .000 1.0000 ( 0) P= .
STERB_RT
LOG_BIP
(Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed
- - -
P A R T I A L
C O E F F I C I E N T S
- - -
STERB_RT
(Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed \par \par Controlling for.. LOG_BIP \par \par GEB_RT STERB_RT \par \par GEB_RT 1.0000 .1003 \par ( 0) ( 105) \par P= . P= .304 \par \par STERB_RT .1003 1.0000 \par ( 105) ( 0) \par P= .304 P= . \par \par (Coefficient / (D.F.) / 2-tailed Significance) \par \par " . " is printed if a coefficient cannot be computed \par }
E Seleccione dos o ms variables numricas para las que se van a calcular las
correlaciones parciales.
E Elija una o ms variables numricas de control.
los grados de libertad para cada coeficiente de correlacin. Si anula la seleccin de este elemento, los coeficientes significativos al nivel 0,05 se identifican con un asterisco, los coeficientes significativos al nivel 0,01 se identifican con un asterisco doble y se eliminan los grados de libertad. Este ajuste afecta a las matrices de correlacin parcial y de orden cero.
454 Captulo 25
Estadsticos. Puede elegir una o ambas de las siguientes opciones: Medias y desviaciones tpicas. Se muestran para cada variable. Tambin se
valores perdidos para cualquier variable, incluso si es para las variables de control.
Excluir casos segn pareja. Para el clculo de las correlaciones de orden cero,
en las que se basan las correlaciones parciales, no se utilizar un caso si tiene valores perdidos en una o ambas variables de un par. La eliminacin segn pareja aprovecha el mximo de los datos que sean posibles. Sin embargo, el nmero de casos puede variar de unos coeficientes a otros. Cuando se activa esta opcin, los grados de libertad para un coeficiente parcial determinado se basan en el nmero menor de casos utilizado en el clculo de cualquiera de las correlaciones de orden cero necesarias para el clculo de dicho coeficiente parcial.
Obtener correlaciones parciales entre dos listas de variables (mediante la palabra clave WITH en el subcomando VARIABLES). Obtener anlisis mltiples (mediante varios subcomandos VARIABLES). Especificar otros valores para solicitar (por ejemplo, las correlaciones parciales tanto de primer como de segundo orden) cuando tiene dos variables de control (mediante el subcomando VARIABLES). Suprimir coeficientes redundantes (mediante el subcomando FORMAT). Mostrar una matriz de correlaciones simples cuando algunos coeficientes no se pueden calcular (mediante el subcomando STATISTICS). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Distancias
26
Captulo
Este procedimiento calcula una variedad de estadsticos que miden las similitudes o diferencias (distancias), entre pares de variables o entre pares de casos. Estas medidas de similitud o distancia se pueden utilizar despus con otros procedimientos, como anlisis factorial, anlisis de conglomerados o escalamiento multidimensional, para ayudar en el anlisis de conjuntos de datos complejos.
Ejemplo. Es posible medir similaridades entre pares de automviles en funcin de ciertas caractersticas, como tipo de motor, consumo y potencia? Al calcular las similitudes entre los coches, se puede obtener una nocin de qu coches son similares entre s y cules son diferentes. Para un anlisis ms formal, puede considerar la aplicacin de un anlisis de conglomeracin jerrquico o escalamiento multidimensional a las similitudes para explorar la estructura subyacente. Estadsticos. Las medidas de diferencia (distancia) para datos de un intervalo son Distancia eucldea, Distancia eucldea al cuadrado, Chebychev, bloque, Minkowski o personalizada; para datos de recuento, medida de chi-cuadrado o phi-cuadrado; para datos binarios, Distancia eucldea, Distancia eucldea al cuadrado, diferencia de tamao, diferencia de configuracin, varianza, forma o Lance y Williams. Las medidas de similitud para datos de intervalos son correlacin de Pearson o coseno; para datos binarios, Russel y Rao, concordancia simple, Jaccard, Dice, Rogers y Tanimoto, Sokal y Sneath 1, Sokal y Sneath 2, Sokal y Sneath 3, Kulczynski 1, Kulczynski 2, Sokal y Sneath 4, Hamann, Lambda, D de Anderberg, Y de Yule, Q de Yule, Ochiai, Sokal y Sneath 5, correlacin Phi de 4 puntos o dispersin. Para obtener matrices de distancias
E Elija en los mens: Analizar Correlaciones Distancias... 457
E Seleccione al menos una variable numrica para calcular distancias entre casos o
seleccione al menos dos variables numricas para calcular distancias entre variables.
E Seleccione una alternativa en el grupo Calcular distancias para calcular proximidades
459 Distancias
En el grupo Medida, seleccione la alternativa que corresponda al tipo de datos (intervalo, recuento o binario); a continuacin, de la lista desplegable, seleccione una las medidas que corresponda a dicho tipo de datos. Las medidas disponibles, por tipo de dato, son:
Datos de intervalo. Distancia eucldea, Distancia eucldea al cuadrado, Chebychev,
de tamao, Diferencia de configuracin, Varianza, Forma o Lance y Williams. (Introduzca valores para Presente y Ausente para especificar cules son los dos valores representativos; las Distancias ignorarn todos los dems valores.) El grupo Transformar valores permite estandarizar los valores de los datos para casos o variables antes de calcular proximidades. Estas transformaciones no se pueden aplicar a los datos binarios. Los mtodos disponibles de estandarizacin son: Puntuaciones z, Rango 1 a 1, Rango 0 a 1, Magnitud mxima de 1, Media de 1 y Desviacin tpica 1.
460 Captulo 26
El grupo Transformar medidas permite transformar los valores generados por la medida de distancia. Se aplican despus de calcular la medida de distancia. Las opciones disponibles son: Valores absolutos, Cambiar el signo y Cambiar la escala al rango 01.
En el grupo Medida, seleccione la alternativa que corresponda al tipo de datos (intervalo o binario); a continuacin, de la lista desplegable, seleccione una las medidas que corresponda a dicho tipo de datos. Las medidas disponibles, por tipo de dato, son:
Datos de intervalo. Correlacin de Pearson o Coseno. Datos binarios. Russel y Rao, Concordancia simple, Jaccard, Dice, Rogers y
Tanimoto, Sokal y Sneath 1, Sokal y Sneath 2, Sokal y Sneath 3, Kulczynski 1, Kulczynski 2, Sokal y Sneath 4, Hamann, Lambda, D de Anderberg, Y de Yule, Q de Yule, Ochiai, Sokal y Sneath 5, Correlacin Phi de 4 puntos o Dispersin. (Introduzca valores para Presente y Ausente para especificar cules son los dos valores representativos; las Distancias ignorarn todos los dems valores.) El grupo Transformar valores permite estandarizar los valores de los datos para casos o variables antes de calcular proximidades. Estas transformaciones no se pueden aplicar a los datos binarios. Los mtodos disponibles de estandarizacin son: Puntuaciones z, Rango -1 a 1, Rango 0 a 1, Magnitud mxima de 1, Media de 1 y Desviacin tpica 1.
461 Distancias
El grupo Transformar medidas permite transformar los valores generados por la medida de distancia. Se aplican despus de calcular la medida de distancia. Las opciones disponibles son: Valores absolutos, Cambiar el signo y Cambiar la escala al rango 01.
Regresin lineal
27
Captulo
La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms variables independientes, que mejor prediga el valor de la variable dependiente. Por ejemplo, puede intentar predecir el total de ventas anuales de un vendedor (la variable dependiente) a partir de variables independientes tales como la edad, la formacin y los aos de experiencia.
Ejemplo. Estn relacionados el nmero de partidos ganados por un equipo de
baloncesto en una temporada con la media de puntos que el equipo marca por partido? Un diagrama de dispersin indica que estas variables estn relacionadas linealmente. El nmero de partidos ganados y la media de puntos marcados por el equipo adversario tambin estn relacionados linealmente. Estas variables tienen una relacin negativa. A medida que el nmero de partidos ganados aumenta, la media de puntos marcados por el equipo adversario disminuye. Con la regresin lineal es posible modelar la relacin entre estas variables. Puede utilizarse un buen modelo para predecir cuntos partidos ganarn los equipos.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin
tpica. Para cada modelo: coeficientes de regresin, matriz de correlaciones, correlaciones parciales y semiparciales, R multiple, Rcuadrado, Rcuadrado corregida, cambio en Rcuadrado, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados y residuos. Adems, intervalos de confianza al 95% para cada coeficiente de regresin, matriz de varianzas-covarianzas, factor de inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de influencia), DfBeta, DfAjuste, intervalos de pronstico y diagnsticos por caso. Grficos: diagramas de dispersin, grficos parciales, histogramas y grficos de probabilidad normal.
463
464 Captulo 27
variables categricas, como la religin, estudios principales o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otros tipos de variables de contraste.
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable
dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Figura 27-1 Resultados de la regresin lineal
70 60 50
Partidos ganados
40 30 20 10 90
100
110
120
Partidos ganados
40 30 20 10 80
90
100
110
120
Modelo 1
R .9471
1. Variables predictoras: (Constante), Puntos en contra por partido, Puntos obtenidos por partido 2. Variable dependiente: Partidos ganados
ANOVA2 Modelo 1 Suma de cuadrados 4080.533 465.467 4546.000 gl 2 24 26 Media cuadrtica 2040.266 19.394 F 105.198 Sig. .0001
1. Variables predictoras: (Constante), Puntos en contra por partido, Puntos obtenidos por partido 2. Variable dependiente: Partidos ganados
Coeficientes1 Coeficientes no estandarizados Modelo 1 (Constante) Puntos obtenidos por partido Puntos en contra por partido B 28.121 2.539 Error tp. 21.404 .193 Coeficientes estandarizados Beta t 1.314 .965 13.145 Sig. .201 .000
-2.412
.211
-.841
-11.458
.000
466 Captulo 27
467 Regresin lineal E En el cuadro de dilogo Regresin lineal, seleccione una variable numrica
dependiente.
E Seleccione una ms variables numricas independientes.
Si lo desea, puede: Agrupar variables independientes en bloques y especificar distintos mtodos de entrada para diferentes subconjuntos de variables. Elegir una variable de seleccin para limitar el anlisis a un subconjunto de casos que tengan valores particulares para esta variable. Seleccionar una variable de identificacin de casos para identificar los puntos en los diagramas. Seleccione una variable numrica de Ponderacin MCP para el anlisis de mnimos cuadrados ponderados.
MCP (WLS). Permite obtener un modelo de mnimos cuadrados ponderados. Los
puntos de los datos se ponderan por los inversos de sus varianzas. Esto significa que las observaciones con varianzas grandes tienen menor impacto en el anlisis que las observaciones asociadas a varianzas pequeas.
encuentre ya en la ecuacin y que tenga la probabilidad para F ms pequea, si esa probabilidad es suficientemente pequea. Las variables ya introducidas en la ecuacin de regresin se eliminan de ella si su probabilidad para F llega a ser suficientemente grande. El mtodo termina cuando ya no hay ms variables candidatas a ser incluidas o eliminadas.
Eliminar (Seleccin de variables). Procedimiento para la seleccin de variables en
468 Captulo 27
introducen todas las variables en la ecuacin y despus se van excluyendo una tras otra. Aquella variable que tenga la menor correlacin parcial con la variable dependiente ser la primera en ser considerada para su exclusin. Si satisface el criterio de eliminacin, ser eliminada. Tras haber excluido la primera variable, se pondr a prueba aquella variable, de las que queden en la ecuacin, que presente una correlacin parcial ms pequea. El procedimiento termina cuando ya no quedan en la ecuacin variables que satisfagan el criterio de exclusin.
Seleccin hacia adelante. Procedimiento de seleccin de variables en el que
stas son introducidas secuencialmente en el modelo. La primera variable que se considerar para ser introducida en la ecuacin ser aqulla que tenga mayor correlacin, positiva o negativa, con la variable dependiente. Dicha variable ser introducida en la ecuacin slo si satisface el criterio de entrada. Si ha entrado la primera variable, se considerar como prxima candidata la variable independiente que no est en la ecuacin y cuya correlacin parcial sea la mayor. El procedimiento termina cuando ya no quedan variables que satisfagan el criterio de entrada. Los valores de significacin de los resultados se basan en el ajuste de un nico modelo. Por ello, estos valores no suele ser vlidos cuando se emplea un mtodo por pasos (pasos sucesivos, hacia adelante o hacia atrs). Todas las variables deben superar el criterio de tolerancia para que puedan ser introducidas en la ecuacin, independientemente del mtodo de entrada especificado. El nivel de tolerancia por defecto es 0,0001. Tampoco se introduce una variable si esto provoca que la tolerancia de otra ya presente en el modelo se site por debajo del criterio de tolerancia. Todas las variables independientes seleccionadas se aaden a un mismo modelo de regresin. Sin embargo, puede especificar distintos mtodos de introduccin para diferentes subconjuntos de variables. Por ejemplo, puede introducir en el modelo de regresin un bloque de variables que utilice la seleccin por pasos sucesivos, y un segundo bloque que emplee la seleccin hacia adelante. Para aadir un segundo bloque de variables al modelo de regresin, pulse en Siguiente.
Los casos definidos por la regla de seleccin se incluyen en el anlisis. Por ejemplo, si selecciona una variable, elija igual que y escriba 5 para el valor; de este modo, solamente se incluirn en el anlisis los casos para los cuales la variable seleccionada tenga un valor igual a 5. Tambin se permite un valor de cadena.
Los grficos pueden ayudar a validar los supuestos de normalidad, linealidad e igualdad de las varianzas. Tambin son tiles para detectar valores atpicos, observaciones poco usuales y casos de influencia. Tras guardarlos como nuevas variables, dispondr en el Editor de datos de los valores pronosticados, los residuos y
470 Captulo 27
otros valores diagnsticos, con los cuales podr poder crear grficos respecto a las variables independientes. Se encuentran disponibles los siguientes grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas de la
lista siguiente: la variable dependiente, los valores pronosticados tipificados, los residuos tipificados, los residuos eliminados, los valores pronosticados corregidos, los residuos estudentizados o los residuos eliminados estudentizados. Represente los residuos tipificados frente a los valores pronosticados tipificados para contrastar la linealidad y la igualdad de las varianzas.
Lista de variables de origen. Muestra una lista con la variable dependiente
(DEPENDNT) y las siguientes variables pronosticadas y residuales: Valores pronosticados tipificados (*ZPRED), Residuos tipificados (*ZRESID), Residuos eliminados (*DRESID), Valores pronosticados corregidos (*ADJPRED), Residuos estudentizados (*SRESID) y Residuos estudentizados eliminados (*SDRESID).
Generar todos los grficos parciales. Muestra los diagramas de dispersin de los
residuos de cada variable independiente y los residuos de la variable dependiente cuando se regresan ambas variables por separado sobre las restantes variables independientes. En la ecuacin debe haber al menos dos variables independientes para que se generen los grficos parciales.
Grficos de residuos tipificados. Puede obtener histogramas de los residuos tipificados
y grficos de probabilidad normal que comparen la distribucin de los residuos tipificados con una distribucin normal. Si se solicita cualquier grfico, se muestran los estadsticos de resumen para los valores pronosticados tipificados y los residuos tipificados (*ZPRED y *ZRESID).
Puede guardar los valores pronosticados, los residuos y otros estadsticos tiles para los diagnsticos. Cada seleccin aade una o ms variables nuevas a su archivo de datos activo.
Valores pronosticados. Son los valores que el modelo de regresin pronostica para
cada caso.
No tipificados. Valor pronosticado por el modelo para la variable dependiente.
472 Captulo 27
decir, se sustrae el valor pronosticado medio al valor pronosticado y el resultado se divide por la desviacin tpica de los valores pronosticados. Los valores pronosticados tipificados tienen una media de 0 y una desviacin tpica de 1.
Corregidos. Valor pronosticado para un caso cuando dicho caso no se incluye en
de la desviacin tpica del valor promedio de la variable dependiente para los casos que tienen valores iguales en las variables independientes.
Distancias. Son medidas para identificar casos con combinaciones poco usuales de
valores para las variables independientes y casos que puedan tener un gran impacto en el modelo.
Mahalanobis. Medida de cunto difieren los valores de un caso en las variables
independientes respecto al promedio para todos los casos. Una distancia de Mahalanobis grande identificar a un caso que tenga valores extremos en una o ms de las variables independientes.
De Cook. Medida de cunto cambiaran los residuos de todos los casos si se
excluyera un caso determinado del clculo de los coeficientes de regresin. Una Distancia de Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin har variar substancialmente los coeficientes.
Valores de influencia. Medida de la influencia de un punto en el ajuste de la
de confianza para los dos intervalos de prediccin. Debe seleccionar Media o Individuos antes de introducir este valor. Los valores habituales para los intervalos de confianza son 90, 95 y 99.
Residuos. El valor actual de la variable dependiente menos el valor pronosticado por la ecuacin de regresin.
modelo.
Tipificados. El residuo dividido por una estimacin de su error tpico. Los
residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica
que vara de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ese caso se excluye del clculo de los
coeficientes de regresin. Es la diferencia entre el valor de la variable dependiente y el valor pronosticado corregido.
Eliminados estudentizados. Residuo eliminado para un caso dividido por su error
tpico. La diferencia entre un residuo eliminado estudentizado y su residuo estudentizado asociado indica la diferencia que implica el eliminar un caso sobre su propia prediccin.
Estadsticos de influencia. El cambio en los coeficientes de regresin (DfBeta) y en los
valores pronosticados (DfAjuste) que resulta de la exclusin de un caso particular. Tambin estn disponibles los valores tipificados para las DfBeta y para las DfAjuste, junto con la razn entre covarianzas.
Diferencias en las betas (DfBetas). La diferencia en el valor de beta es el cambio
en el valor de un coeficiente de regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
DfBeta tipificada. Valor de la diferencia en beta tipificada. El cambio tipificado
en un coeficiente de regresin cuando se elimina del anlisis un caso particular. Puede interesarle examinar aquellos casos cuyos valores absolutos sean mayores que 2 dividido por la raz cuadrada de N, donde N es el nmero de casos. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
Diferencia en el valor ajustado (DfFit). La diferencia en el valor ajustado es el
tipificado, en el valor pronosticado que resulta de la exclusin de un caso particular. Puede interesarle examinar aquellos valores tipificados cuyo valor
474 Captulo 27
absoluto sea mayor que 2 dividido por la raz cuadrada de p/N, donde p es el nmero de variables independientes en la ecuacin y N es el nmero de casos.
Razn entre covarianzas. Razn del determinante de la matriz de covarianza con un
caso particular excluido del clculo de los coeficientes de regresin, respecto al determinante de la matriz de covarianza con todos los casos incluidos. Si la razn se aproxima a 1, el caso no altera significativamente la matriz de covarianza.
Estadsticos de los coeficientes. Almacena los coeficientes de regresin en un conjunto de datos o en un archivo de datos. Los conjuntos de datos estn disponibles para su uso posterior durante la misma sesin, pero no se guardarn como archivos a menos que se hayan guardado explcitamente antes de que finalice la sesin. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99. Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros
y (si lo desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). SmartScore y servidor de SPSS (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con fines de puntuacin.
B, el error tpico de B, el coeficiente beta tipificado, el valor de t para B y el nivel de significacin bilateral t. Intervalos de confianzamuestra intervalos de confianza al 95% para cada coeficiente de regresin o una matriz de covarianzas. Matriz de covarianzas muestra una matriz de varianzas-covarianzas de los coeficientes de regresin, con las covarianzas fuera de la diagonal y las varianzas en la diagonal. Tambin se muestra una matriz de correlaciones.
Ajuste del modelo. Presenta una lista de las variables introducidas y eliminadas del modelo y muestra los siguientes estadsticos de bondad de ajuste: R mltiple, Rcuadrado y Rcuadrado corregida, error tpico de la estimacin y tabla de anlisis de la varianza.
eliminar una variable independiente. Si es grande el cambio en Rcuadrado asociado a una variable, esto significa que esa variable es un buen predictor de la variable dependiente.
para cada variable en el anlisis. Tambin muestra una matriz de correlaciones con el nivel de significacin unilateral y el nmero de casos para cada correlacin.
Correlacin parcial. La correlacin que permanece entre dos variables despus de eliminar la correlacin que es debida a su relacin mutua con las otras variables. La correlacin entre la variable dependiente y una variable independiente cuando se han eliminado de ambas los efectos lineales de las otras variables independientes presentes en el modelo. Correlacin semi-parcial (Regresin, Tabla pivote). La correlacin entre la variable
dependiente y una variable independiente cuando se han eliminado de la variable independiente los efectos lineales de las otras variables independientes del modelo. Est relacionada con el cambio en R cuadrado cuando una variable se aade a una ecuacin.
Diagnsticos de colinealidad. La colinealidad (o multicolinealidad) es una situacin no deseable en la que una de las variables independientes es una funcin lineal de otras variables independientes. Muestra los autovalores de la matriz de productos cruzados no centrada y escalada, los ndices de condicin y las proporciones de la
476 Captulo 27
descomposicin de la varianza junto con los factores de inflacin de la varianza (FIV) y las tolerancias para las variables individuales.
Residuos. Presenta la prueba de Durbin-Watson sobre la correlacin serial de los
residuos y los diagnsticos por casos para los casos que cumplan el criterio de seleccin (los valores atpicos por encima de n desviaciones tpicas).
significacin de su valor de F es menor que el valor de entrada, y se elimina si el nivel de significacin de su valor de F es mayor que el valor de salida. La entrada debe ser menor que la salida y ambos valores deben ser positivos. Para introducir
ms variables en el modelo, eleve el valor de entrada. Para eliminar ms variables del modelo, disminuya el valor de salida.
Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor
que el valor de entrada, y se elimina si su valor de F es menor que el valor de salida. La entrada debe ser mayor que la salida y ambos valores deben ser positivos. Para introducir ms variables en el modelo, disminuya el valor de entrada. Para eliminar ms variables del modelo, eleve el valor de salida.
Incluir la constante en la ecuacin. Por defecto, el modelo de regresin incluye un
trmino constante. Si se anula la seleccin de esta opcin se obtiene la regresin que pasan por el origen, lo cual se hace raramente. Algunos resultados de la regresin que pasan por el origen no son comparables con los resultados de la regresin que s incluyen una constante. Por ejemplo, Rcuadrado no puede interpretarse de la manera usual.
Valores perdidos. Puede elegir uno de los siguientes: Excluir casos segn lista. Slo se incluirn en el anlisis los casos con valores
variables correlacionadas se utilizan para calcular el coeficiente de correlacin en el cual se basa el anlisis de regresin. Los grados de libertad se basan en el N mnimo de las parejas.
Reemplazar por la media. Se emplean todos los casos en los clculos, sustituyendo
478 Captulo 27
Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Estimacin curvilnea
28
Captulo
El procedimiento Estimacin Curvilnea genera estadsticos de estimacin curvilnea por regresin y grficos relacionados para 11 modelos diferentes de estimacin curvilnea por regresin. Se produce un modelo diferente para cada variable dependiente. Tambin se pueden guardar valores pronosticados, residuos e intervalos pronosticados como nuevas variables.
Ejemplo. Un proveedor de servicios de Internet realiza un seguimiento del porcentaje de trfico de correo electrnico infectado de virus en la red a lo largo del tiempo. Un diagrama de dispersin revela que la relacin es no lineal. Se puede ajustar un modelo lineal a los datos y comprobar la validez de los supuestos y la bondad de ajuste del modelo.
Rcuadrado corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados, residuos e intervalos de pronstico. Modelos: lineal, logartmico, inverso, cuadrtico, cbico, de potencia, compuesto, curva-S, logstico, de crecimiento y exponencial.
Datos. Las variables dependiente e independientes deben ser cuantitativas. Si
selecciona Tiempo del conjunto de datos activo como variable independiente (en lugar de una variable), el procedimiento Estimacin curvilnea generar una variable de tiempo en la que la distancia temporal entre los casos es uniforme. Si se selecciona Tiempo, la variable dependiente debe ser una medida de serie temporal. El anlisis de series temporales requiere una estructura particular para los archivos de datos, de manera que cada caso (cada fila) represente un conjunto de observaciones en un momento determinado del tiempo y que la distancia temporal entre los casos sea uniforme.
Supuestos. Represente los datos grficamente para determinar cmo se relacionan
las variables dependientes e independiente (linealmente, exponencialmente, etc.). Los residuos de un buen modelo deben distribuirse de forma aleatoria y normal. Si
479
480 Captulo 28
se utiliza un modelo lineal, se deben cumplir los siguientes supuestos: Para cada valor de la variable independiente, la distribucin de la variable dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y la variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Figura 28-1 Tabla de resumen de la estimacin curvilnea
Seleccionar una variable para etiquetar los casos en los diagramas de dispersin. Para cada punto en el diagrama de dispersin, se puede utilizar la herramienta de Identificacin de puntos para mostrar el valor de la variable utilizada en Etiquetas de caso. Pulsar en Guardar para guardar los valores pronosticados, los residuos y los intervalos de pronstico como nuevas variables. Tambin se encuentran disponibles las siguientes opciones:
Incluir la constante en la ecuacin. Estima un trmino constante en la ecuacin
modelo seleccionado frente a la variable independiente. Se genera un grfico distinto para cada variable dependiente.
Ver tabla de ANOVA. Muestra una tabla de anlisis de varianza de resumen para
cuadrtico puede utilizarse para modelar una serie que "despega" o una serie que se amortigua.
Cbico. Modelo definido por la ecuacin Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3). Potencia. Modelo cuya ecuacin es Y = b0 * (t**b1) ln(Y) = ln(b0) + (b1 * ln(t)). Compuesto. Modelo cuya ecuacin es Y = b0 * (b1**t) ln(Y) = ln(b0) + (ln(b1) * t). curva-S. Modelo cuya ecuacin es Y = e**(b0 + (b1/t)) ln(Y) = b0 + (b1/t). Logstica. Modelo cuya ecuacin es Y = 1 / (1/u + (b0 * (b1**t))) o ln(1/Y - 1/u)
= ln(b0 + (ln(b1) * t)) donde u es el valor del lmite superior. Tras seleccionar Logstico, especifique un valor para el lmite superior que ser usado en la ecuacin de regresin. El valor debe ser un nmero positivo mayor que el valor mximo de la variable dependiente.
Crecimiento. Modelo cuya ecuacin es Y = e**(b0 + (b1 * t)) ln(Y) = b0 + (b1 * t).
484 Captulo 28
(b1 * t).
Guardar variables. Para cada modelo seleccionado se pueden guardar los valores pronosticados, los residuos (el valor observado de la variable dependiente menos el valor pronosticado por el modelo) y los intervalos de pronstico (sus lmites superior e inferior). En la ventana de resultados, se muestran en una tabla los nombres de las nuevas variables y las etiquetas descriptivas. Pronosticar casos. En el conjunto de datos activo, si se selecciona Tiempo como
variable independiente en lugar de una variable, se puede especificar un perodo de prediccin que vaya ms all del final de la serie temporal. Puede elegir una de las siguientes alternativas:
Desde el perodo de estimacin hasta el ltimo caso. Pronostica los valores para
todos los casos del archivo, basndose en los casos del perodo de estimacin. El perodo de estimacin, que se muestra en la parte inferior del cuadro de dilogo, se define con el subcuadro de dilogo Rango de la opcin Seleccionar casos en el men Datos. Si no se ha definido un perodo de estimacin, se utilizan todos los casos para pronosticar los valores.
Predecir hasta. Predice los valores hasta la fecha especificada, hora o nmero de
observacin, basndose en los casos del perodo de estimacin. Esta caracterstica se puede utilizar para predecir valores ms all del ltimo caso de la serie temporal. Las variables definidas actualmente determinan los cuadros de texto disponibles para especificar el final del perodo de prediccin. Si no existen
variables de fecha definidas, se puede especificar el nmero de la observacin (caso) final. Utilice la opcin de Definir fechas en el men Datos para crear las variables de fecha.
Anlisis discriminante
29
Captulo
El anlisis discriminante resulta til para construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de las caractersticas observadas de cada caso. El procedimiento genera una funcin discriminante (o, para ms de dos grupos, un conjunto de funciones discriminantes) basada en combinaciones lineales de las variables predictoras que proporcionan la mejor discriminacin posible entre los grupos. Las funciones se generan a partir de una muestra de casos para los que se conoce el grupo de pertenencia; posteriormente, las funciones pueden ser aplicadas a nuevos casos que dispongan de medidas para las variables predictoras pero de los que se desconozca el grupo de pertenencia. Nota: La variable de agrupacin puede tener ms de dos valores. Los cdigos de la variable de agrupacin han de ser nmeros enteros y es necesario especificar sus valores mximo y mnimo. Los casos con valores fuera de estos lmites se excluyen del anlisis.
Ejemplo. Por trmino medio, las personas de los pases de zonas templadas consumen
ms caloras por da que las de los trpicos, y una proporcin mayor de la poblacin de las zonas templadas vive en ncleos urbanos. Un investigador desea combinar esta informacin en una funcin para determinar cmo de bien un individuo es capaz de discriminar entre los dos grupos de pases. El investigador considera adems que el tamao de la poblacin y la informacin econmica tambin pueden ser importantes. El anlisis discriminante permite estimar los coeficientes de la funcin discriminante lineal, que tiene el aspecto de la parte derecha de una ecuacin de regresin lineal mltiple. Es decir, utilizando los coeficientes a, b, c y d, la funcin es:
D = a * clima + b * urbanos + c * poblacin + d * producto interior bruto per capita
487
488 Captulo 29
Si estas variables resultan tiles para discriminar entre las dos zonas climticas, los valores de D sern diferentes para los pases templados y para los tropicales. Si se utiliza un mtodo de seleccin de variables por pasos, quizs no se necesite incluir las cuatro variables en la funcin.
Estadsticos. Para cada variable: medias, desviaciones tpicas, ANOVA univariado.
Para cada anlisis: M de Box, matriz de correlaciones intra-grupos, matriz de covarianzas intra-grupos, matriz de covarianzas de los grupos separados, matriz de covarianzas total. Para cada funcin discriminante cannica: autovalores, porcentaje de varianza, correlacin cannica, lambda de Wilks, chi-cuadrado. Para cada paso: probabilidades previas, coeficientes de la funcin de Fisher, coeficientes de funcin no tipificados, lambda de Wilks para cada funcin cannica.
Datos. La variable de agrupacin debe tener un nmero limitado de categoras
distintas, codificadas como nmeros enteros. Las variables independientes que sean nominales deben ser recodificadas a variables dummy o de contraste.
Supuestos. Los casos deben ser independientes. Las variables predictoras deben tener una distribucin normal multivariada y las matrices de varianzas-covarianzas intra-grupos deben ser iguales en todos los grupos. Se asume que la pertenencia al grupo es mutuamente exclusiva (es decir, ningn caso pertenece a ms de un grupo) y exhaustiva de modo colectivo (es decir, todos los casos son miembros de un grupo). El procedimiento es ms efectivo cuando la pertenencia al grupo es una variable verdaderamente categrica; si la pertenencia al grupo se basa en los valores de una variable continua (por ejemplo, un cociente de inteligencia alto respecto a uno bajo), considere el uso de la regresin lineal para aprovechar la informacin ms rica ofrecida por la propia variable continua.
Figura 29-1 Resultados del anlisis discriminante
Autovalores % de varianza 100.0 % acumulad o 100.0 Correlaci n cannica .707
Funcin 1
Autovalor 1.002
Lambda de Wilks Contraste de las funciones 1 Lambda de Wilks .499 Chi-cuadrado 31.934 gl 4 Sig. .000
Funciones en los centroides de los grupos Clima predominante tropical templado Funcin 1 -.869 1.107
E Seleccione una variable de agrupacin con valores enteros y pulse en Definir rango
490 Captulo 29 E Seleccione las variables independientes o predictoras. (Si la variable de agrupacin
no tiene valores enteros, la opcin Recodificacin automtica en el men Transformar crear una variable que los tenga).
E Seleccione el mtodo de introduccin de las variables independientes.
Especifique los valores mnimo y mximo de la variable de agrupacin para el anlisis. Los casos con valores fuera de este rango no se utilizan en el anlisis discriminante, pero s se clasifican en uno de los grupos existentes a partir de los resultados que obtengan en el anlisis. Los valores mnimo y mximo deben ser nmeros enteros.
Slo se utilizan los casos con el valor especificado en la variable de seleccin para derivar las funciones discriminantes. Tanto para los casos seleccionados como para los no seleccionados se generan resultados de clasificaciones y estadsticos. Este proceso ofrece un mecanismo para clasificar casos nuevos basados en datos previos o para dividir los datos en subconjuntos de contraste y comprobacin para realizar procedimientos de validacin en el modelo generado.
Descriptivos. Las opciones disponibles son: Medias (que incluye las desviaciones
factor sobre la igualdad de las medias de grupo para cada variable independiente.
M de Box. Contraste sobre la igualdad de las matrices de covarianza de los grupos.
Para tamaos de muestra suficientemente grandes, un valor de p no significativo quiere decir que no hay evidencia suficiente de que las matrices difieran. Esta prueba es sensible a las desviaciones de la normalidad multivariada.
492 Captulo 29
clasificacin de Fisher que pueden utilizarse directamente para la clasificacin. Se obtiene un conjunto de coeficientes para cada grupo, y se asigna un caso al grupo para el que tiene una mayor puntuacin discriminante.
Sin estandarizar (Anlisis discriminante). Muestra los coeficientes de la funcin
son las de: Correlacin intra-grupos, Covarianza intra-grupos, Covarianza de grupos separados y Covarianza total.
Correlacin intra-grupos. Muestra la matriz de correlaciones intra-grupos
combinada, que se obtiene de promediar las matrices de covarianza individuales para todos los grupos antes de calcular las correlaciones.
Covarianza intra-grupos. Muestra la matriz de covarianza intra-grupos combinada,
la cual puede diferir de la matriz de covarianza total. La matriz se obtiene de promediar, para todos los grupos, las matrices de covarianza individuales.
Covarianza de grupos separados. Muestra las matrices de covarianza de cada
nuevas variables. Las alternativas disponibles son la lambda de Wilks, la varianza no explicada, la distancia de Mahalanobis, la menor razn F y la V de Rao. Con la V de Rao se puede especificar el incremento mnimo de V para introducir una variable.
lambda de Wilks. Mtodo para la seleccin de variables por pasos del anlisis
discriminante que escoge las variables para su introduccin en la ecuacin basndose en cunto contribuyen a disminuir la lambda de Wilks. En cada paso se introduce la variable que minimiza la lambda de Wilks global.
Varianza no explicada. En cada paso se introduce la variable que minimiza la
variables independientes respecto al promedio para todos los casos. Una distancia de Mahalanobis grande identificar a un caso que tenga valores extremos en una o ms de las variables independientes.
Menor razn F. Mtodo para la seleccin de variables en los anlisis por pasos que
se basa en maximizar la razn F, calculada a partir de la distancia de Mahalanobis entre los grupos.
V de Rao. Medida de las diferencias entre las medias de los grupos. Tambin
llamada traza de Lawley-Hotelling. En cada paso, se introduce la variable que maximiza el incremento en la V de Rao. Despus de seleccionar esta opcin, introduzca el valor mnimo que debe tener una variable para entrar en el modelo.
494 Captulo 29
Criterios. Las alternativas disponibles son Usar valor de F y Usar probabilidad de F. Introduzca valores para introducir y eliminar variables. Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor
que el valor de entrada, y se elimina si su valor de F es menor que el valor de salida. La entrada debe ser mayor que la salida y ambos valores deben ser positivos. Para introducir ms variables en el modelo, disminuya el valor de entrada. Para eliminar ms variables del modelo, eleve el valor de salida.
Usar probabilidad de F. Una variable se introduce en el modelo si el nivel de
significacin de su valor de F es menor que el valor de entrada, y se elimina si el nivel de significacin de su valor de F es mayor que el valor de salida. La entrada debe ser menor que la salida y ambos valores deben ser positivos. Para introducir ms variables en el modelo, eleve el valor de entrada. Para eliminar ms variables del modelo, disminuya el valor de salida.
Mostrar. Resumen de los pasos muestra los estadsticos para todas las variables despus de cada paso; F para distancias por parejas muestra una matriz de razones F por parejas para cada pareja de grupos.
Probabilidades previas. Estos valores se utilizan para la clasificacin. Puede especificar que las probabilidades previas sean iguales para todos los grupos (Todos los grupos iguales), o dejar que los tamaos de grupo observados en la muestra determinen las probabilidades de la pertenencia al grupo (Calcular segn tamaos de grupos).
Mostrar. Las opciones de presentacin disponibles son: Resultados por casos, Tabla de resumen y Clasificacin dejando uno fuera. Resultados para cada caso. Se muestran, para cada caso, los cdigos del grupo
real de pertenencia, el grupo pronosticado, las probabilidades posteriores y las puntuaciones discriminantes.
Tabla de resumen. Nmero de casos correcta e incorrectamente asignados a cada
uno de los grupos, basndose en el anlisis discriminante. En ocasiones recibe el nombre de la "Matriz de Confusin".
Clasificacin dejando uno fuera. Se clasifica cada caso del anlisis mediante la
funcin derivada a partir de todos los casos, excepto el propio caso. Tambin conocido como mtodo-U.
Reemplazar los valores perdidos con la media. Seleccione esta opcin para sustituir la media de una variable independiente para un valor perdido slo durante la fase de clasificacin. Usar matriz de covarianzas. Existe la opcin de clasificar los casos utilizando una
de los grupos separados. Dado que la clasificacin se basa en las funciones discriminantes y no en las variables originales, esta opcin no siempre es equivalente a la discriminacin cuadrtica.
Diagramas. Las opciones de grficos disponibles son: Grupos combinados, Grupos separados y Mapa territorial. Grupos combinados. Crea un diagrama de dispersin, con todos los grupos, de los
valores en las dos primeras funciones discriminantes. Si slo hay una funcin, en su lugar se muestra un histograma.
Grupos separados. Crea diagramas de dispersin, de los grupos por separado, para
los valores en las dos primeras funciones discriminantes. Si slo hay una funcin se muestra un histograma en su lugar.
Mapa territorial. Grfico de las fronteras utilizadas para clasificar los casos en
grupos a partir de los valores en las funciones. Los nmeros corresponden a los grupos en los que se clasifican los casos. La media de cada grupo se indica
496 Captulo 29
mediante un asterisco situado dentro de sus fronteras. No se mostrar el mapa si slo hay una funcin discriminante.
Es posible aadir variables nuevas al archivo de datos activo. Las opciones disponibles son las de grupo de pertenencia pronosticado (una nica variable), puntuaciones discriminantes (una variable para cada funcin discriminante en la solucin) y probabilidades de pertenencia al grupo segn las puntuaciones discriminantes (una variable para cada grupo). Tambin se puede exportar informacin del modelo al archivo especificado en formato XML (PMML). SmartScore y servidor de SPSS (un producto independiente) pueden utilizar este archivo de modelo para aplicar la informacin del modelo en otros archivos de datos con fines de puntuacin.
Limitar el nmero de funciones discriminantes extradas (mediante el subcomando FUNCTIONS). Restringir la clasificacin a los casos que estn seleccionados (o no seleccionados) para el anlisis (mediante el subcomando SELECT). Leer y analizar una matriz de correlaciones (mediante el subcomando MATRIX). Escribir una matriz de correlaciones para su anlisis posterior (mediante el subcomando MATRIX). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Anlisis factorial
30
Captulo
El anlisis factorial intenta identificar variables subyacentes, o factores, que expliquen la configuracin de las correlaciones dentro de un conjunto de variables observadas. El anlisis factorial se suele utilizar en la reduccin de los datos para identificar un pequeo nmero de factores que explique la mayora de la varianza observada en un nmero mayor de variables manifiestas. Tambin puede utilizarse para generar hiptesis relacionadas con los mecanismos causales o para inspeccionar las variables para anlisis subsiguientes (por ejemplo, para identificar la colinealidad antes de realizar un anlisis de regresin lineal). El procedimiento de anlisis factorial ofrece un alto grado de flexibilidad: Existen siete mtodos de extraccin factorial disponibles. Existen cinco mtodos de rotacin disponibles, entre ellos el oblimin directo y el promax para rotaciones no ortogonales. Existen tres mtodos disponibles para calcular las puntuaciones factoriales; y las puntuaciones pueden guardarse como variables para anlisis adicionales.
Ejemplo. Qu actitudes subyacentes hacen que las personas respondan a las preguntas de una encuesta poltica de la manera en que lo hacen? Examinando las correlaciones entre los elementos de la encuesta se deduce que hay una superposicin significativa entre los diversos subgrupos de elementos (las preguntas sobre los impuestos tienden a estar correlacionadas entre s, las preguntas sobre temas militares tambin estn correlacionadas entre s, y as sucesivamente). Con el anlisis factorial, se puede investigar el nmero de factores subyacentes y, en muchos casos, se puede identificar lo que los factores representan conceptualmente. Adicionalmente, se pueden calcular las puntuaciones factoriales para cada encuestado, que pueden utilizarse en anlisis subsiguientes. Por ejemplo, es posible construir un modelo de regresin logstica para predecir el comportamiento de voto basndose en las puntuaciones factoriales.
499
500 Captulo 30
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin tpica. Para cada anlisis factorial: matriz de correlaciones de variables, incluidos niveles de significacin, determinante, inversa; matriz de correlaciones reproducida, que incluye anti-imagen; solucin inicial (comunalidades, autovalores y porcentaje de varianza explicada); KMO (medida de la adecuacin muestral de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett; solucin sin rotar, que incluye saturaciones factoriales, comunalidades y autovalores; solucin rotada, que incluye la matriz de configuracin rotada y la matriz de transformacin. Para rotaciones oblicuas: las matrices de estructura y de configuracin rotadas; matriz de coeficientes para el clculo de las puntuaciones factoriales y matriz de covarianzas entre los factores. Grficos: grfico de sedimentacin y grfico de las saturaciones de los dos o tres primeros factores. Datos. Las variables deben ser cuantitativas a nivel de intervalo o de razn. Los datos
categricos (como la religin o el pas de origen) no son adecuados para el anlisis factorial. Los datos para los cuales razonablemente se pueden calcular los coeficientes de correlacin de Pearson, deberan ser adecuados para el anlisis factorial.
Supuestos. Los datos deben tener una distribucin normal bivariada para cada pareja
de variables y las observaciones deben ser independientes. El modelo de anlisis factorial especifica que las variables vienen determinadas por los factores comunes (los factores estimados por el modelo) y por factores nicos (los cuales no se superponen entre las distintas variables observadas); las estimaciones calculadas se basan en el supuesto de que ningn factor nico est correlacionado con los dems, ni con los factores comunes.
502 Captulo 30
Comunalidades Inicial Esperanza de vida femenina Mortalidad infantil (muertes por 1000 nacimientos vivos) Alfabetizacin (%) Tasa de natalidad (por 1.000 habitantes) Nmero promedio de hijos Habitantes en ciudades (%) Log(10) de PIB_CAP Aumento de la poblacin (% anual) Tasa Nacimientos/Defunciones Tasa de mortalidad (por 1.000 habitantes) Log(10) de POBLAC 1.000 Extraccin .950
Matriz de componentes rotados Componente 1 Esperanza de vida femenina Mortalidad infantil (muertes por 1000 nacimientos vivos) Log(10) de PIB_CAP Tasa de natalidad (por 1.000 habitantes) Nmero promedio de hijos Alfabetizacin (%) Aumento de la poblacin (% anual) Habitantes en ciudades (%) Tasa de mortalidad (por 1.000 habitantes) Tasa Nacimientos/Defunciones Log(10) de POBLAC .464 .434 -.964 2
.962 -.937 .910 .906 -.898 .830 -.789 .535 .263 -.876 .861 -.681 .384 .264
Mtodo de extraccin: Anlisis de componentes principales. Mtodo de rotacin: Normalizacin Varimax con Kaiser.
504 Captulo 30
Matriz de transformacin de las componentes Componente 1 2 1 .994 -.107 2 .107 .994
Mtodo de extraccin: Anlisis de componentes principales. Mtodo de rotacin: Normalizacin Varimax con Kaiser.
Grfico de com pone ntes en espaci o rotado
1.0 tas a nacimientos /def
aument o de la poblac .5 habi tantes en ciudad alfabetiz acin (%) esperanz a de v ida fe tas a de natalidad (p nmero promedio de h
-.5
Co mpon ente 2
Co mpo nen te 1
En el anlisis factorial, slo se usarn los casos con ese valor para la variable de seleccin.
506 Captulo 30
y el nmero de casos vlidos para cada variable. La solucin inicial muestra las comunalidades iniciales, los autovalores y el porcentaje de varianza explicada.
Matriz de correlaciones. Las opciones disponibles son: coeficientes, niveles de
Kaiser-Meyer-Olkin contrasta si las correlaciones parciales entre las variables son pequeas. La prueba de esfericidad de Bartlett contrasta si la matriz de correlaciones es una matriz identidad, que indicara que el modelo factorial es inadecuado.
Reproducida. Matriz de correlaciones estimada a partir de la solucin factorial.
Tambin se muestran las correlaciones residuales (la diferencia entre la correlacin observada y la reproducida).
Anti-imagen. La matriz de correlaciones anti-imagen contiene los negativos de
los coeficientes de correlacin parcial y la matriz de covarianza anti-imagen contiene los negativos de las covarianzas parciales. En un buen modelo factorial la mayora de los elementos no diagonales deben ser pequeos. En la diagonal de la matriz de correlaciones anti-imagen se muestra la medida de adecuacin muestral para esa variable.
disponibles son: Componentes principales, Mnimos cuadrados no ponderados, Mnimos cuadrados generalizados, Mxima verosimilitud, factorizacin de Ejes principales, factorizacin Alfa y factorizacin Imagen.
Anlisis de componentes principales (Anlisis factorial). Mtodo para la extraccin
de factores utilizada para formar combinaciones lineales independientes de las variables observadas. La primera componente tiene la varianza mxima. Las componentes sucesivas explican progresivamente proporciones menores de la varianza y no estn correlacionadas las unas con las otras. El anlisis de componentes principales se utiliza para obtener la solucin factorial inicial. Puede utilizarse cuando una matriz de correlaciones es singular.
Mtodo de mnimos cuadrados no ponderados (Anlisis factorial). Mtodo de
extraccin factorial que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlaciones observada y reproducida, ignorando las diagonales.
Mtodo de Mnimos cuadrados generalizados (Anlisis factorial). Mtodo de
extraccin de factores que minimiza la suma de los cuadrados de las diferencias entre las matrices de correlacin observada y reproducida. Las correlaciones se ponderan por el inverso de su unicidad, de manera que las variables que tengan un valor alto de unicidad reciban un peso menor que aqullas que tengan un valor bajo de unicidad.
508 Captulo 30
que proporciona las estimaciones de los parmetros que con mayor probabilidad han producido la matriz de correlaciones observada, si la muestra procede de una distribucin normal multivariada. Las correlaciones se ponderan por el inverso de la unicidad de las variables, y se emplea un algoritmo iterativo.
Factorizacin de ejes principales (Anlisis factorial). Mtodo para la extraccin
de factores que parte de la matriz de correlaciones original con los cuadrados de los coeficientes de correlacin mltiple insertados en la diagonal principal como estimaciones iniciales de las comunalidades. Las saturaciones factoriales resultantes se utilizan para estimar de nuevo las comunalidades y reemplazan a las estimaciones previas en la diagonal de la matriz. Las iteraciones continan hasta que el cambio en las comunalidades, de una iteracin a la siguiente, satisfaga el criterio de convergencia para la extraccin.
Alfa (Anlisis factorial). Mtodo de extraccin factorial que considera a las
variables incluidas en el anlisis como una muestra del universo de las variables posibles. Este mtodo maximiza el Alfa de Cronbach para los factores.
Factorizacin imagen (Anlisis factorial). Mtodo para la extraccin de factores,
desarrollado por Guttman y basado en la teora de las imgenes. La parte comn de una variable, llamada la imagen parcial, se define como su regresin lineal sobre las restantes variables, en lugar de ser una funcin de los factores hipotticos.
Analizar. Permite especificar o una matriz de correlaciones o una matriz de
covarianzas.
Matriz de correlaciones. Es til si las variables de su anlisis se miden sobre
escalas distintas.
Matriz de covarianzas. Es til si se desea aplicar el anlisis factorial a varios
Solucin factorial sin rotar (Anlisis factorial). Muestra las saturaciones factoriales
sin rotar (la matriz de configuracin factorial), las comunalidades y los autovalores de la solucin factorial.
Grfico de sedimentacin. Grfico de la varianza asociada a cada factor. Se utiliza
para determinar cuntos factores deben retenerse. Tpicamente el grfico muestra la clara ruptura entre la pronunciada pendiente de los factores ms importantes y el descenso gradual de los restantes (los sedimentos).
N mximo de iteraciones para convergencia. Permite especificar el nmero mximo
nmero de variables que tienen saturaciones altas en cada factor. Simplifica la interpretacin de los factores.
Criterio Oblimin directo. Mtodo para la rotacin oblicua (no ortogonal). Cuando
delta es igual a cero (el valor por defecto) las soluciones son las ms oblicuas. A medida que delta se va haciendo ms negativo, los factores son menos oblicuos. Para anular el valor por defecto 0 para delta, introduzca un nmero menor o igual que 0,8.
510 Captulo 30
de factores necesarios para explicar cada variable. Simplifica la interpretacin de las variables observadas.
Mtodo equamax (Anlisis factorial). Mtodo de rotacin que es combinacin
del mtodo varimax, que simplifica los factores, y el mtodo quartimax, que simplifica las variables. Se minimiza tanto el nmero de variables que saturan alto en un factor como el nmero de factores necesarios para explicar una variable.
Rotacin Promax. Rotacin oblicua que permite que los factores estn
correlacionados. Esta rotacin puede calcularse ms rpidamente que una rotacin oblimin directa, por lo que es til para conjuntos de datos grandes.
Mostrar. Permite incluir los resultados de la solucin rotada, as como los grficos de
para obtener la solucin rotada. Para las rotaciones ortogonales, se muestran la matriz de configuracin rotada y la matriz de transformacin. Para las rotaciones oblicuas, se muestran las matrices de estructura, de configuracin y de correlaciones entre los factores.
Diagrama de las saturaciones factoriales. Representacin tridimensional de las
saturaciones factoriales para los tres primeros factores. Para una solucin de dos factores, se representa un diagrama bidimensional. No se muestra el grfico si slo se extrae un factor. Si se solicita la rotacin, los diagramas representan las soluciones rotadas.
N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que el algoritmo puede seguir para llevar a cabo la rotacin.
Guardar como variables. Crea una nueva variable para cada factor en la solucin final.
Seleccione uno de los siguientes mtodos alternativos para calcular las puntuaciones factoriales: Regresin, Bartlett o Anderson-Rubin.
Mtodo de regresin (Anlisis factorial). Mtodo para estimar los coeficientes de
las puntuaciones factoriales. Las puntuaciones resultantes tienen de media 0 y varianza igual al cuadrado de la correlacin mltiple entre las puntuaciones factoriales estimadas y los valores factoriales verdaderos. Las puntuaciones pueden estar correlacionadas incluso cuando los factores son ortogonales.
Puntuaciones de Bartlett. Mtodo para estimar los coeficientes de las puntuaciones
factoriales. Las puntuaciones resultantes tienen una media de 0. Se minimiza la suma de cuadrados de los factores nicos sobre el rango de las variables.
Mtodo de Anderson-Rubin (Anlisis factorial). Mtodo para calcular los
coeficientes para las puntuaciones factoriales; es una modificacin del mtodo de Bartlett, que asegura la ortogonalidad de los factores estimados. Las puntuaciones resultantes tienen una media 0, una desviacin tpica de 1 y no correlacionan entre s.
Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestra los coeficientes
por los cuales se multiplican las variables para obtener puntuaciones factoriales. Tambin muestra las correlaciones entre las puntuaciones factoriales.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos. Las selecciones disponibles son: Excluir casos segn lista, Excluir casos segn pareja y Reemplazar por la media.
512 Captulo 30
de resultados. Los coeficientes se ordenan por tamao y se suprimen aquellos cuyos valores absolutos sean menores que el valor especificado.
31
Captulo
Los anlisis de conglomerados se pueden realizar mediante los procedimientos de anlisis de conglomerados en dos fases, jerrquico o de K-medias. Cada uno de estos procedimientos emplea un algoritmo distinto en la creacin de conglomerados y contiene opciones que no estn disponibles en los otros.
Anlisis de conglomerados en dos fases. En algunas aplicaciones, se puede seleccionar como mtodo el procedimiento Anlisis de conglomerados en dos fases. Ofrece una serie de funciones nicas que se detallan a continuacin:
Seleccin automtica del nmero ms apropiado de conglomerados y medidas para la seleccin de los distintos modelos de conglomerado. Posibilidad de crear modelos de conglomerado basados al mismo tiempo en variables categricas y continuas. Posibilidad de guardar el modelo de conglomerados en un archivo XML externo y, a continuacin, leer el archivo y actualizar el modelo de conglomerados con datos ms recientes. Asimismo, el procedimiento Anlisis de conglomerados en dos fases puede analizar archivos de datos grandes.
Anlisis de conglomerados jerrquico. El uso del procedimiento Anlisis de
conglomerados jerrquico se limita a archivos de datos ms pequeos (cientos de objetos por conglomerar) y ofrece una serie de funciones nicas que se detallan a continuacin: Posibilidad de conglomerar casos o variables.
513
514 Captulo 31
Posibilidad de calcular un rango de soluciones posibles y guardar los conglomerados de pertenencia para cada una de dichas soluciones. Distintos mtodos de formacin de conglomerados, transformacin de variables y medida de disimilaridad entre conglomerados. Siempre que todas las variables sean del mismo tipo, el procedimiento Anlisis de conglomerados jerrquico podr analizar variables de intervalo (continuas), de recuento o binarias.
Anlisis de conglomerados de K-medias. El uso del procedimiento Anlisis de
conglomerados de K-medias se limita a datos continuos y requiere que el usuario especifique previamente el nmero de conglomerados y ofrece una serie de funciones nicas que se detallan a continuacin: Posibilidad de guardar las distancias desde los centros de los conglomerados hasta los distintos objetos. Posibilidad de leer los centros de los conglomerados iniciales y guardar los centros de los conglomerados finales desde un archivo SPSS externo. Asimismo, el procedimiento Anlisis de conglomerados de K-medias puede analizar archivos de datos grandes.
32
Captulo
El procedimiento Anlisis de conglomerados en dos fases es una herramienta de exploracin diseada para descubrir las agrupaciones naturales (o conglomerados) de un conjunto de datos que, de otra manera, no sera posible detectar. El algoritmo que emplea este procedimiento incluye varias atractivas funciones que lo hacen diferente de las tcnicas de conglomeracin tradicionales:
Tratamiento de variables categricas y continuas. Al suponer que las variables son
independientes, es posible aplicar una distribucin normal multinomial conjunta en las variables continuas y categricas.
Seleccin automtica del nmero de conglomerados. Mediante la comparacin de
los valores de un criterio de seleccin del modelo para diferentes soluciones de conglomeracin, el procedimiento puede determinar automticamente el nmero ptimo de conglomerados.
Escalabilidad. Mediante la construccin de un rbol de caractersticas de
conglomerados (CF) que resume los registros, el algoritmo en dos fases puede analizar archivos de datos de gran tamao.
Ejemplo. Las empresas minoristas y de venta de productos para el consumidor suelen aplicar tcnicas de conglomeracin a los datos que describen los hbitos de consumo, sexo, edad, nivel de ingresos, etc. de los clientes. Estas empresas adaptan sus estrategias de desarrollo de productos y de marketing en funcin de cada grupo de consumidores para aumentar las ventas y el nivel de fidelidad a la marca. Estadsticos. El procedimiento genera criterios de informacin (AIC o BIC) segn
el nmero de conglomerados de la solucin, las frecuencias de los conglomerados para la conglomeracin final y los estadsticos descriptivos por conglomerado para la conglomeracin final.
515
516 Captulo 32
conglomerados, grficos de sectores para las frecuencias de los conglomerados y grficos de la importancia de las variables.
Figura 32-1 Cuadro de dilogo Anlisis de conglomerados en dos fases
dos conglomerados.
Log-verosimilitud. La medida de la verosimilitud realiza una distribucin de
probabilidad entre las variables. Las variables continuas se supone que tienen una distribucin normal, mientras que las variables categricas se supone que son multinomiales. Se supone que todas las variables son independientes.
Eucldea. La medida eucldea es la distancia segn una lnea recta entre dos
conglomerados. Slo se puede utilizar cuando todas las variables son continuas.
Nmero de conglomerados. Esta opcin permite especificar cmo se va a determinar
el nmero de conglomerados.
nmero ptimo de conglomerados, utilizando el criterio especificado en el grupo Criterio de conglomeracin. Si lo desea, introduzca un entero positivo para especificar el nmero mximo de conglomerados que el procedimiento debe tener en cuenta.
Especificar nmero fijo. Permite fijar el nmero de conglomerados de la solucin.
conglomeracin determina el nmero de conglomerados. Se puede especificar tanto el criterio de informacin bayesiano (BIC) como el criterio de informacin de Akaike (AIC).
Datos. Este procedimiento trabaja tanto con variables continuas como categricas.
Los casos representan los objetos que se van a conglomerar y las variables representan los atributos en los que se va a basar la conglomeracin.
Orden de casos. Observe que el rbol de caractersticas de conglomerados y la
solucin final pueden depender del orden de los casos. Para minimizar los efectos del orden, ordene los casos aleatoriamente. Puede que desee obtener varias soluciones distintas con los casos ordenados en distintos rdenes aleatorios para comprobar la estabilidad de una solucin determinada. En situaciones en que esto resulta difcil debido a unos tamaos de archivo demasiado grandes, se pueden sustituir varias ejecuciones por una muestra de casos ordenados con distintos rdenes aleatorios.
Supuestos. La medida de la distancia de la verosimilitud supone que las variables del
modelo de conglomerados son independientes. Adems, se supone que cada variable continua tiene una distribucin normal (de Gauss) y que cada variable categrica tiene una distribucin multinomial. Las comprobaciones empricas internas indican que este procedimiento es bastante robusto frente a las violaciones tanto del supuesto de independencia como de las distribuciones, pero an as es preciso tener en cuenta hasta qu punto se cumplen estos supuestos. Utilice el procedimiento Correlaciones bivariadas para comprobar la independencia de dos variables continuas. Utilice el procedimiento Tablas de contingencia para comprobar la independencia de dos variables categricas. Utilice el procedimiento
518 Captulo 32
Medias para comprobar la independencia existente entre una variable continua y otra categrica. Utilice el procedimiento Explorar para comprobar la normalidad de una variable continua. Utilice el procedimiento Prueba de chi-cuadrado para comprobar si una variable categrica tiene una determinada distribucin multinomial.
Para obtener un anlisis de conglomerados en dos fases
E Elija en los mens: Analizar Clasificar Conglomerado en dos fases... E Seleccione una o varias variables categricas o continuas.
Si lo desea, puede: Ajustar los criterios utilizados para generar los conglomerados. Seleccionar los ajustes para el tratamiento del ruido, la asignacin de memoria, la tipificacin de las variables y la entrada del modelo de conglomerados. Solicitar grficos y tablas opcionales. Guardar los resultados del modelo en el archivo de trabajo o en un archivo XML externo.
Tratamiento de valores atpicos. Este grupo permite tratar los valores atpicos de
manera especial durante la conglomeracin si se llena el rbol de caractersticas de los conglomerados (CF). El rbol CF se considera lleno si no puede aceptar ningn caso ms en un nodo hoja y no hay ningn nodo hoja que se pueda dividir. Si selecciona el tratamiento del ruido y el rbol CF se llena, se har volver a crecer despus de colocar los casos existentes en hojas poco densas en una hoja de ruido. Se considera que una hoja es poco densa si contiene un nmero de casos inferior a un determinado porcentaje de casos del mximo tamao de hoja. Tras volver a hacer crecer el rbol, los valores atpicos se colocarn en el rbol CF en caso de que sea posible. Si no es as, se descartarn los valores atpicos. Si no selecciona el tratamiento del ruido y el rbol CF se llena, se har volver a crecer utilizando un umbral del cambio en distancia mayor. Tras la conglomeracin final, los valores que no se puedan asignar a un conglomerado
520 Captulo 32
se considerarn como valores atpicos. Al conglomerado de valores atpicos se le asigna un nmero de identificacin de 1 y no se incluir en el recuento del nmero de conglomerados.
Asignacin de memoria. Este grupo permite especificar la cantidad mxima de memoria en megabytes (MB) que puede utilizar el algoritmo de conglomeracin. Si el procedimiento supera este mximo, utilizar el disco para almacenar la informacin que no se pueda colocar en la memoria. Especifique un nmero mayor o igual que 4.
Consulte con el administrador del sistema si desea conocer el valor mximo que puede especificar en su sistema. Si este valor es demasiado bajo, es posible que el algoritmo no consiga obtener el nmero correcto o deseado de conglomerados.
Tipificacin de variables. El algoritmo de conglomeracin trabaja con variables
continuas tipificadas. Todas las variables continuas que no estn tipificadas deben dejarse como variables en la lista Para tipificar. Para ahorrar algn tiempo y trabajo para el ordenador, puede seleccionar todas las variables continuas que ya haya tipificado como variables en la lista Asumidas como tipificadas.
Opciones avanzadas Criterios de ajuste del rbol CF. Los siguientes ajustes del algoritmo de conglomeracin
se aplican especficamente al rbol de caractersticas de conglomerados (CF) y debern cambiarse con cuidado:
Umbral del cambio en distancia inicial. ste es el umbral inicial que se utiliza para
hacer crecer el rbol CF. Si se ha insertado una determinada hoja en el rbol CF que producira una densidad inferior al umbral, la hoja no se dividir. Si la densidad supera el umbral, se dividir la hoja.
N mximo de ramas (por nodo hoja). Nmero mximo de nodos filiales que puede
rbol CF.
Mximo nmero posible de nodos. Indica el nmero mximo de nodos del rbol CF
que puede generar potencialmente el procedimiento, de acuerdo con la funcin (bd+1 1) / (b 1), donde b es el nmero mximo de ramas y d es la profundidad mxima del rbol. Tenga en cuenta que un rbol CF excesivamente grande
puede agotar los recursos del sistema y afectar negativamente al rendimiento del procedimiento. Como mnimo, cada nodo requiere 16 bytes.
Actualizacin del modelo de conglomerados. Este grupo permite importar y actualizar
un modelo de conglomerados generado en un anlisis anterior. El archivo de entrada contiene el rbol CF en formato XML. A continuacin, se actualizar el modelo con los datos existentes en el archivo activo. Debe seleccionar los nombres de variable en el cuadro de dilogo principal en el mismo orden en que se especificaron en el anlisis anterior. El archivo XML permanecer inalterado, a no ser que escriba especficamente la nueva informacin del modelo en el mismo nombre de archivo. Si desea obtener ms informacin, consulte Resultados de anlisis de conglomerados en dos fases en p. 523. Si se ha especificado una actualizacin del modelo de conglomerados, se utilizarn las opciones pertenecientes a la generacin del rbol CF que se especificaron para el modelo original. Concretamente, se utilizarn los ajustes del modelo guardado acerca de la medida de distancia, el tratamiento del ruido, la asignacin de memoria y los criterios de ajuste del rbol CF, por lo que se ignorarn todos los ajustes de estas opciones que se hayan especificado en los cuadros de dilogo. Nota: Al realizar una actualizacin del modelo de conglomerados, el procedimiento supone que ninguno de los casos seleccionados en el conjunto de datos activo se utiliz para crear el modelo de conglomerados original. El procedimiento tambin supone que los casos utilizados en la actualizacin del modelo proceden de la misma poblacin que los casos utilizados para crear el modelo; es decir, se supone que las medias y las varianzas de las variables continuas y los niveles de las variables categricas son los mismos en ambos conjuntos de casos. Si los conjuntos de casos nuevo y antiguo proceden de poblaciones heterogneas, deber ejecutar el procedimiento Anlisis de conglomerados en dos fases para los conjuntos combinados de casos para obtener los resultados ptimos.
522 Captulo 32
variacin dentro del conglomerado de cada variable. Para cada variable categrica, se genera un grfico de barras agrupado, mostrando la frecuencia de la categora por identificador de conglomerado. Para cada variable continua, se genera un grfico de barras de error, indicando las barras de error por identificador de conglomerado.
Grfico de sectores de los conglomerados. Muestra un grfico de sectores que
indican la importancia de cada variable dentro de cada conglomerado. Los resultados se ordenan segn el nivel de importancia de cada variable.
Ordenar variables. Esta opcin determina si los grficos que se crearn para cada
importancia de las variables que se va a representar en el grfico. Chi-cuadrado o prueba t de significacin muestra un estadstico chi-cuadrado de Pearson como la
importancia de una variable categrica y un estadstico t como importancia de una variable continua. Significacin muestra uno menos el valor p para la prueba de igualdad de las medias para una variable continua y la frecuencia esperada del conjunto de datos global para una variable categrica.
Nivel de confianza. Esta opcin permite establecer el nivel de confianza para la
prueba de igualdad de la distribucin de una variable dentro de un conglomerado frente a la distribucin global de la variable. Especifique un nmero inferior a 100 y superior o igual a 50. El valor del nivel de confianza se muestra como una lnea vertical en los grficos de la importancia de las variables, si los grficos se crean por variable o si se representa grficamente la medida de la significacin.
Omitir variables no significativas. Las variables que no son significativas para el
los resultados de la conglomeracin. Se generan los estadsticos descriptivos y las frecuencias de los conglomerados para el modelo de conglomerados final, mientras
524 Captulo 32
que la tabla de criterio de informacin muestra los resultados correspondientes a varias soluciones de conglomerados.
Descriptivos por conglomerado. Muestra dos tablas que describen las variables de
cada conglomerado. En una tabla, se informa de las medias y las desviaciones tpicas para las variables continuas por conglomerado. La otra tabla informa de las frecuencias de las variables categricas por conglomerado.
Frecuencias de los conglomerados. Muestra una tabla que informa del nmero de
AIC o BIC, dependiendo del criterio elegido en el cuadro de dilogo principal, para diferentes nmeros de conglomerados. Slo se proporciona esta tabla cuando el nmero de conglomerados se determina automticamente. Si el nmero de conglomerados es fijo, se ignora este ajuste y no se proporciona la tabla.
Conjunto de datos activo. Este grupo permite guardar las variables en el conjunto de
datos activo.
Crear variable del conglomerado de pertenencia. Esta variable contiene un nmero
de identificacin de conglomerado para cada caso. El nombre de esta variable es tsc_n, donde n es un nmero entero positivo que indica el ordinal de la operacin de almacenamiento del conjunto de datos activo realizada por este procedimiento en una determinada sesin.
Archivos XML. El modelo de conglomerados final y el rbol CF son dos tipos de
final al archivo especificado en formato XML (PMML). SmartScore y servidor de SPSS (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con fines de puntuacin.
Exportar rbol CF. Esta opcin permite guardar el estado actual del rbol de
33
Captulo
Este procedimiento intenta identificar grupos relativamente homogneos de casos (o de variables) basndose en las caractersticas seleccionadas, mediante un algoritmo que comienza con cada caso (o cada variable) en un conglomerado diferente y combina los conglomerados hasta que slo queda uno. Es posible analizar las variables brutas o elegir de entre una variedad de transformaciones de estandarizacin. Las medidas de distancia o similaridad se generan mediante el procedimiento Proximidades. Los estadsticos se muestran en cada etapa para ayudar a seleccionar la mejor solucin.
Ejemplo. Existen grupos identificables de programas televisivos que atraigan a
audiencias similares dentro de cada grupo? Con el anlisis de conglomerados jerrquico, podra agrupar los programas de TV (los casos) en grupos homogneos basados en las caractersticas del espectador. Esto se puede utilizar para identificar segmentos de mercado. Tambin puede agrupar ciudades (los casos) en grupos homogneos, de manera que se puedan seleccionar ciudades comparables para probar diversas estrategias de marketing.
Estadsticos. Historial de conglomeracin, matriz de distancias (o similaridades) y
pertenencia a los conglomerados para una solucin nica o una serie de soluciones. Grficos: dendrogramas y diagramas de tmpanos.
Datos. Las variables pueden ser cuantitativas, binarias o datos de recuento (frecuencias). El escalamiento de las variables es un aspecto importante, ya que las diferencias en el escalamiento pueden afectar a las soluciones de conglomeracin. Si las variables muestran grandes diferencias en el escalamiento (por ejemplo, una variable se mide en dlares y la otra se mide en aos), debera considerar la posibilidad de estandarizarlas (esto puede llevarse a cabo automticamente mediante el propio procedimiento Anlisis de conglomerados jerrquico).
525
526 Captulo 33
Orden de casos. Si hay distancias empatadas o similitudes en los datos de entrada o si stas se producen entre los conglomerados actualizados durante la unin, la solucin de conglomerado resultante puede depender del orden de los casos del archivo. Puede que desee obtener varias soluciones distintas con los casos ordenados en distintos rdenes aleatorios para comprobar la estabilidad de una solucin determinada. Supuestos. Las medidas de distancia o similaridad empleadas deben ser adecuadas
para los datos analizados (vase el procedimiento Proximidades para obtener ms informacin sobre la eleccin de las medidas de distancia y similaridad). Asimismo, debe incluir todas las variables relevantes en el anlisis. Si se omiten variables de inters la solucin obtenida puede ser equvoca. Debido a que el anlisis de conglomerados jerrquico es un mtodo exploratorio, los resultados deben considerarse provisionales hasta que sean confirmados mediante otra muestra independiente.
Figura 33-1 Resultados del procedimiento Anlisis de conglomerados jerrquico
Nmero de conglomerados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X X X X X X X X X X X X X X X
X X X X X X X X
XX XXX XXX X X XXX XXX X X XXX XXX X X XXX XXX X X XXX XXX X X XXX XXX X X XXX XXX X X XXX XXX X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X
X X X X X X X X X X X X X X
XXX XXX XXX XX XXX XXX XXX XX X X XXX XXX XX X X XX XXX XX X X X XXX XX X X X XXX X X X X XXX X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X
3:Chile 3 1:Argentina
9 7:Canada 7
10:Japan 10 9:Italy
14:India
X X X X X X X X
X X X X X X X X
X X X X X X X X
XXX XXX X X X X X X X X X X
528 Captulo 33
* * * * * * * * * * * * * ANLISIS DE CONGLOMERADOS JERRQUICO * * * * * * * * * * * Dendrograma que utiliza Vinculacin promedio (Inter-grupos) Combinacin de conglomerados y distancias con cambio de escala CASO Etiqueta LIFEEXPF BABYMORT LITERACY BIRTH_RT FERTILTY URBAN LOG_GDP POP_INCR B_TO_D DEATH_RT LOG_POP Nm. 2 5 3 6 10 1 8 4 9 7 11 0 5 10 15 20 25 +---------+---------+---------+---------+---------+
aglomerando variables, seleccione al menos tres variables numricas. Si lo desea, puede seleccionar una variable de identificacin para etiquetar los casos.
Vinculacin intra-grupos, Vecino ms prximo, Vecino ms lejano, Agrupacin de centroides, Agrupacin de medianas y Mtodo de Ward.
Medida. Permite especificar la medida de distancia o similaridad que ser empleada en la aglomeracin. Seleccione el tipo de datos y la medida de distancia o similaridad adecuada: Intervalo. Distancia eucldea, Distancia eucldea al cuadrado, Coseno, Correlacin
de phi-cuadrado.
Binaria. Las opciones disponibles son: Distancia eucldea, Distancia eucldea
al cuadrado, Diferencia de tamao, Diferencia de configuracin, Varianza, Dispersin, Forma, Concordancia simple, Correlacin phi de 4 puntos, Lambda, D de Anderberg, Dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2, Lance y Williams, Ochiai, Rogers y Tanimoto, Russel y Rao, Sokal y Sneath 1, Sokal y Sneath 2, Sokal y Sneath 3, Sokal y Sneath 4, Sokal y Sneath 5, Y de Yule y Q de Yule.
530 Captulo 33
Transformar valores. Permite estandarizar los valores de los datos, para los casos
o las variables, antes de calcular las proximidades (no est disponible para datos binarios). Los mtodos disponibles de estandarizacin son: Puntuaciones z, Rango -1 a 1, Rango 0 a 1, Magnitud mxima de 1, Media de 1 y Desviacin tpica 1.
Transformar medidas. Permite transformar los valores generados por la medida de
distancia. Se aplican despus de calcular la medida de distancia. Las opciones disponibles son: Valores absolutos, Cambiar el signo y Cambiar la escala al rango 01.
cada etapa, las distancias entre los casos o los conglomerados que se combinan, as como el ltimo nivel del proceso de aglomeracin en el que cada caso (o variable) se uni a su conglomerado correspondiente.
Matriz de distancias. Proporciona las distancias o similaridades entre los elementos. Conglomerado de pertenencia. Muestra el conglomerado al cual se asigna cada caso en una o varias etapas de la combinacin de los conglomerados. Las opciones disponibles son: Solucin nica y Rango de soluciones.
para evaluar la cohesin de los conglomerados que se han formado y proporcionar informacin sobre el nmero adecuado de conglomerados que deben conservarse.
Tmpanos. Muestra un diagrama de tmpanos, que incluye todos los conglomerados
o un rango especificado de conglomerados. Los diagramas de tmpanos muestran informacin sobre cmo se combinan los casos en los conglomerados, en cada iteracin del anlisis. La orientacin permite seleccionar un diagrama vertical u horizontal.
532 Captulo 33
para una solucin nica o un rango de soluciones. Las variables guardadas pueden emplearse en anlisis posteriores para explorar otras diferencias entre los grupos.
34
Captulo
Este procedimiento intenta identificar grupos de casos relativamente homogneos basndose en las caractersticas seleccionadas y utilizando un algoritmo que puede gestionar un gran nmero de casos. Sin embargo, el algoritmo requiere que el usuario especifique el nmero de conglomerados. Puede especificar los centros iniciales de los conglomerados si conoce de antemano dicha informacin. Puede elegir uno de los dos mtodos disponibles para clasificar los casos: la actualizacin de los centros de los conglomerados de forma iterativa o slo la clasificacin. Asimismo, puede guardar la pertenencia a los conglomerados, informacin de la distancia y los centros de los conglomerados finales. Si lo desea, puede especificar una variable cuyos valores sean utilizados para etiquetar los resultados por casos. Tambin puede solicitar los estadsticos F de los anlisis de varianza. Aunque estos estadsticos son oportunistas (ya que el procedimiento trata de formar grupos que de hecho difieran), el tamao relativo de los estadsticos proporciona informacin acerca de la contribucin de cada variable a la separacin de los grupos.
Ejemplo. Cules son los grupos identificables de programas de televisin que atraen audiencias parecidas dentro de cada grupo? Con el anlisis de conglomerados de k-medias, podra agrupar los programas de televisin (los casos) en k grupos homogneos, basados en las caractersticas del televidente. Este proceso se puede utilizar para identificar segmentos de mercado. Tambin puede agrupar ciudades (los casos) en grupos homogneos, de manera que se puedan seleccionar ciudades comparables para probar diversas estrategias de marketing. Estadsticos. Para la solucin completa: centros iniciales de los conglomerados, tabla
de ANOVA. Para cada caso: informacin del conglomerado, distancia desde el centro del conglomerado.
533
534 Captulo 34
Datos. Las variables deben ser cuantitativas en el nivel de intervalo o de razn. Si las variables son binarias o recuentos, utilice el procedimiento Anlisis de conglomerados jerrquicos. Orden de casos y centro de conglomerados iniciales. El algoritmo por defecto
para elegir centros de conglomerados iniciales no es invariable con respecto a la ordenacin de casos. La opcin Usar medias actualizadas del cuadro de dilogo Iterar hace que la solucin resultante dependa potencialmente del orden de casos con independencia de cmo se eligen los centros de conglomerados iniciales. Si va a utilizar alguno de estos mtodos, puede que desee obtener varias soluciones distintas con los casos ordenados en distintos rdenes aleatorios para comprobar la estabilidad de una solucin determinada. La especificacin de los centros de conglomerados iniciales y la no utilizacin de la opcin Usar medias actualizadas evita los problemas relacionados con el orden de casos. No obstante, la ordenacin de los centros de conglomerados iniciales puede afectar a la solucin en caso de haber distancias empatadas desde los casos a los centros de conglomerados. Para evaluar la estabilidad de una solucin determinada, puede comparar los resultados de los anlisis con las distintas permutaciones de los valores de centros iniciales.
Supuestos. Las distancias se calculan utilizando la distancia eucldea simple. Si desea
utilizar otra medida de distancia o de similaridad, utilice el procedimiento Anlisis de conglomerados jerrquicos. El escalamiento de las variables es una consideracin importante. As, si sus variables utilizan diferentes escalas (por ejemplo, una variable se expresa en dlares y otra, en aos), los resultados podran ser equvocos. En estos casos, debera considerar la estandarizacin de las variables antes de realizar el anlisis de conglomerados de k-medias (esta tarea se puede hacer en el procedimiento Descriptivos). Este procedimiento supone que ha seleccionado el nmero apropiado de conglomerados y que ha incluido todas las variables relevantes. Si ha seleccionado un nmero inapropiado de conglomerados o ha omitido variables relevantes, los resultados podran ser equvocos.
535 Anlisis de conglomerados de K-medias Figura 34-1 Resultados del anlisis de conglomerados de K-medias
Historial de iteraciones Cambio en los centros de los conglomerados Iteracin 1 2 3 4 5 6 7 8 9 10 1 1.932 .000 .861 .604 .000 .000 .623 .000 .000 .000 2 1.596 .314 .195 .150 .167 .071 .000 .074 .077 .000 3 3.343 .466 .172 .000 .237 .287 .000 .000 .000 .185 4 2.724 .471 .414 .337 .253 .199 .160 .084 .080 .097
536 Captulo 34
Centros de los conglomerados finales Conglomerado ZURBANA ZESPVIDA ZALFABET ZINC_POB ZMORTINF ZTASA_NA ZTASA_M ZLOG_PIB ZNAC_DEF ZFERTILI ZLOG_POB 1 -1.70745 -2.52826 -2.30833 .59747 2.43210 1.52607 2.10314 -1.77704 -.29856 1.51003 .83475 2 .62767 .80611 .73368 -.95175 -.80817 -.99285 .31319 .94249 -.84758 -.87669 -.22199 3 .16816 -.28417 -.81671 1.45301 .25622 1.13716 -.71414 -.16871 1.45251 1.27010 -.49499 4 -.30863 -.15939 .13880 .13400 .22286 .12929 -.44640 -.58745 .19154 -.12150 .34577
Distancias entre los centros de los conglomerados finales Conglomerado 1 2 3 4 1 7.924 5.640 5.627 5.246 3.249 2.897 2 7.924 3 5.640 5.246 4 5.627 3.249 2.897
ZURBANA ZESPVIDA ZALFABET ZINC_POB ZMORTINF ZTASA_NA ZTASA_M ZLOG_PIB ZNAC_DEF ZFERTILI ZLOG_POB
Media gl cuadrtica 3 .541 3 3 3 3 3 3 3 3 3 3 .210 .229 .219 .239 .167 .444 .287 .288 .168 .877
Las pruebas F slo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles crticos no son corregidos, por lo que no pueden interpretarse como pruebas de la hiptesis de que los centros de los conglomerados son iguales.
E Seleccione las variables que se van a utilizar en el anlisis de conglomerados. E Especifique el nmero de conglomerados. (Este nmero no debe ser inferior a 2 ni
Para conseguir la mxima eficacia, tome una muestra de los casos y seleccione el mtodo Iterar y clasificar para determinar los centros de los conglomerados. Seleccione Escribir finales en. A continuacin, restaure el archivo de datos completo, seleccione el mtodo Slo clasificar y seleccione Leer iniciales de para clasificar el archivo completo utilizando los centros estimados a partir de la muestra. Puede escribir en un archivo o conjunto de datos, as como leer desde stos. Los conjuntos de datos estn disponibles para su uso posterior durante la misma sesin, pero no se guardarn como archivos a menos que se hayan guardado explcitamente antes de que finalice la sesin. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99.
Nota: estas opciones slo estn disponibles si se selecciona el mtodo Iterar y clasificar en el cuadro de dilogo Anlisis de conglomerados de K-medias.
N mximo de iteraciones. Limita el nmero de iteraciones en el algoritmo k-medias.
La iteracin se detiene despus de este nmero de iteraciones, incluso si no se ha satisfecho el criterio de convergencia. Este nmero debe estar entre el 1 y el 999. Para reproducir el algoritmo utilizado por el comando Quick Cluster en las versiones previas a la 5.0, establezca Mximo de iteraciones en 1.
Criterio de convergencia. Determina cundo cesa la iteracin. Representa una
proporcin de la distancia mnima entre los centros iniciales de los conglomerados, por lo que debe ser mayor que 0 pero no mayor que 1. Por ejemplo, si el criterio es igual a 0,02, la iteracin cesar si una iteracin completa no mueve ninguno de los centros de los conglomerados en una distancia superior al dos por ciento de la distancia menor entre cualquiera de los centros iniciales.
540 Captulo 34
Usar medias actualizadas. Permite solicitar la actualizacin de los centros de los conglomerados tras la asignacin de cada caso. Si no selecciona esta opcin, los nuevos centros de los conglomerados se calcularn despus de la asignacin de todos los casos.
Puede guardar informacin sobre la solucin como nuevas variables para que puedan ser utilizadas en anlisis subsiguientes:
Conglomerado de pertenencia. Crea una nueva variable que indica el conglomerado final al que pertenece cada caso. Los valores de la nueva variable van desde el 1 hasta el nmero de conglomerados. Distancia desde centro del conglomerado. Crea una nueva variable que indica la distancia eucldea entre cada caso y su centro de clasificacin.
variables para cada uno de los conglomerados. Por defecto se selecciona entre los datos un nmero de casos debidamente espaciados igual al nmero de conglomerados. Los centros iniciales de los conglomerados se utilizan como criterio para una primera clasificacin y, a partir de ah, se van actualizando.
Tabla de ANOVA (Conglomerado de K-medias, Opciones). Muestra una tabla de
anlisis de varianza que incluye las pruebas F univariadas para cada variable de aglomeracin. Las pruebas F son slo descriptivas y las probabilidades resultantes no deben ser interpretadas. La tabla de ANOVA no se mostrar si se asignan todos los casos a un nico conglomerado.
Informacin del conglomerado para cada caso. Muestra, para cada caso, el
conglomerado final asignado y la distancia eucldea entre el caso y el centro del conglomerado utilizado para clasificar el caso. Tambin muestra la distancia eucldea entre los centros de los conglomerados finales.
Valores perdidos. Las opciones disponibles son: Excluir casos segn lista o Excluir
casos segn pareja.
Excluir casos segn lista. Excluye los casos con valores perdidos para cualquier
distancias que se calculan desde todas las variables con valores no perdidos.
Pruebas no paramtricas
35
Captulo
El procedimiento Pruebas no paramtricas proporciona varias pruebas que no necesitan supuestos sobre la forma de la distribucin subyacente.
Prueba de chi-cuadrado. Tabula una variable en categoras y calcula un estadstico de chi-cuadrado basndose en las diferencias entre las frecuencias observadas y las esperadas. Prueba binomial. Compara la frecuencia observada en cada categora de una variable
es aleatorio.
Prueba de Kolmogorov-Smirnov para una muestra. Compara la funcin de distribucin
acumulativa observada de una variable con una distribucin terica especificada, que puede ser normal, uniforme, exponencial o de Poisson.
Pruebas para dos muestras independientes. Compara dos grupos de casos en una
variable. Se encuentran disponibles la prueba U de Mann-Whitney, la prueba de Kolmogorov-Smirnov para dos muestras, la prueba de Moses de reacciones extremas y la prueba de rachas de Wald-Wolfowitz.
Pruebas para dos muestras relacionadas. Compara las distribuciones de dos variables.
La prueba de Wilcoxon de los rangos con signo, la prueba de signos y la prueba de McNemar.
Pruebas para varias muestras independientes. Compara dos o ms grupos de casos en una variable. Se encuentran disponibles la prueba de Kruskal-Wallis, la prueba de la mediana y la prueba de Jonckheere-Terpstra. Pruebas para varias muestras relacionadas. Compara las distribuciones de dos o ms variables. Se encuentran disponibles la prueba de Friedman, la W de Kendall y la Q de Cochran.
543
544 Captulo 35
Adems, para todas las pruebas citadas anteriormente estn disponibles los cuartiles y la media, la desviacin tpica, el mnimo, el mximo y, por ltimo, el nmero de casos no perdidos.
Prueba de chi-cuadrado
El procedimiento Prueba de chi-cuadrado tabula una variable en categoras y calcula un estadstico de chi-cuadrado. Esta prueba de bondad de ajuste compara las frecuencias observadas y esperadas en cada categora para contrastar que todas las categoras contengan la misma proporcin de valores o que cada categora contenga una proporcin de valores especificada por el usuario.
Ejemplos. La prueba de chi-cuadrado podra utilizarse para determinar si una bolsa
de caramelos contiene en igualdad de proporcin caramelos de color azul, marrn, verde, naranja, rojo y amarillo. Tambin podra utilizarse para ver si una bolsa de caramelos contiene un 5% de color azul, un 30% de color marrn, un 10% de color verde, un 20% de color naranja, un 15% de color rojo y un 15% de color amarillo.
Estadsticos. Media, desviacin tpica, mnimo, mximo y cuartiles. Nmero y
porcentaje de casos perdidos y no perdidos; nmero de casos observados y esperados de cada categora; residuos y estadstico de chi-cuadrado.
Datos. Use variables categricas numricas ordenadas o no ordenadas (niveles de medida ordinal o nominal). Para convertir las variables de cadena en variables numricas, utilice el procedimiento Recodificacin automtica, disponible en el men Transformar. Supuestos. Las pruebas no paramtricas no requieren supuestos sobre la forma de la
distribucin subyacente. Se asume que los datos son una muestra aleatoria. Las frecuencias esperadas para cada categora debern ser 1 como mnimo. No ms de un 20% de las categoras debern tener frecuencias esperadas menores que 5.
545 Pruebas no paramtricas Figura 35-1 Resultados del procedimiento Prueba de chi-cuadrado
Color de la jalea N observado 6 33 9 17 22 26 113 N esperado 5.9 35.7 11.9 23.8 17.8 17.8
Color de la jalea N observado 6 33 9 17 22 26 113 N esperado 18.8 18.8 18.8 18.8 18.8 18.8 Residual -12.8 14.2 -9.8 -1.8 3.2 7.2
546 Captulo 35
Estadsticos de contraste Chi-cuadrado1 gl Sig. asintt. Color 27.973 5 .000
1. 0 casillas (.0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mnima es 18.8.
independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
categora. Para establecer categoras dentro de un rango especfico, seleccione Usarrango especificado e introduzca valores enteros para los lmites inferior y superior. Se establecern categoras para cada valor entero dentro del rango inclusivo y los casos con valores fuera de los lmites se excluirn. Por ejemplo, si se especifica 1 como lmite inferior y 4 como lmite superior, nicamente se utilizarn los valores enteros entre 1 y 4 para la prueba de chi-cuadrado.
Valores esperados. Por defecto, todas las categoras tienen valores esperados iguales.
Las categoras pueden tener proporciones esperadas especificadas por el usuario. Seleccione Valores, introduzca un valor mayor que 0 para cada categora de la variable de contraste y, a continuacin, pulse en Aadir. Cada vez que se aade un valor, ste aparece al final de la lista de valores. El orden de los valores es importante; corresponde al orden ascendente de los valores de categora de la variable de contraste. El primer valor de la lista corresponde al valor de grupo mnimo de la variable de contraste y el ltimo valor corresponde al valor mximo. Los elementos de la lista de valores se suman y, a continuacin, cada valor se divide por esta suma para calcular la proporcin de casos esperados en la categora correspondiente. Por ejemplo, una lista de valores de 3, 4, 5, 4 especifica unas proporciones esperadas de 3/16, 4/16, 5/16 y 4/16.
548 Captulo 35
Prueba binomial
El procedimiento Prueba binomial compara las frecuencias observadas de las dos categoras de una variable dicotmica con las frecuencias esperadas en una distribucin binomial con un parmetro de probabilidad especificado. Por defecto, el parmetro de probabilidad para ambos grupos es 0,5. Para cambiar las probabilidades, puede introducirse una proporcin de prueba para el primer grupo. La probabilidad del segundo grupo ser 1 menos la probabilidad especificada para el primer grupo.
Ejemplo. Si se lanza una moneda al aire, la probabilidad de que salga cara es 1/2.
Basndose en esta hiptesis, se lanza una moneda al aire 40 veces y se anotan los resultados (cara o cruz). De la prueba binomial, podra deducir que en 3/4 de los lanzamientos sali cara y que el nivel crtico es pequeo (0,0027). Estos resultados indican que no es verosmil que la probabilidad de que salga cara sea 1/2; probablemente la moneda presenta una tendencia a caer por un sentido determinado.
y cuartiles.
Datos. Las variables de contraste deben ser numricas y dicotmicas. Para
convertir las variables de cadena en variables numricas, utilice el procedimiento Recodificacin automtica, disponible en el men Transformar. Una variable dicotmica es una variable que slo puede tomar dos valores posibles: s o no, verdadero o falso, 0 1, etc. Si las variables no son dicotmicas, debe especificar un punto de corte. El punto de corte asigna a un grupo los casos con valores mayores que el punto de corte y el resto de los casos a otro grupo.
Supuestos. Las pruebas no paramtricas no requieren supuestos sobre la forma de la
distribucin subyacente. Se asume que los datos son una muestra aleatoria.
Figura 35-4 Resultados del procedimiento Prueba binomial
Prueba binomial Proporcin observada .75 .25 1.00 Prop. de prueba .50 Sig. asintt. (bilateral) .0031
Moneda
N 30 10 40
1. Basado en la aproximacin Z.
E Seleccione una o ms variables de contraste numricas. E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
Estadsticos. Puede elegir uno o los dos estadsticos de resumen. Descriptivos. Muestra la media, la desviacin tpica, el mnimo, el mximo y el
Valores perdidos. Controla el tratamiento de los valores perdidos. Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Prueba de rachas
El procedimiento Prueba de rachas contrasta si es aleatorio el orden de aparicin de dos valores de una variable. Una racha es una secuencia de observaciones similares. Una muestra con un nmero excesivamente grande o excesivamente pequeo de rachas sugiere que la muestra no es aleatoria.
Ejemplos. Suponga que se realiza una encuesta a 20 personas para saber si compraran
un producto. Si todas estas personas fueran del mismo sexo, se pondra seriamente en duda la supuesta aleatoriedad de la muestra. La prueba de rachas se puede utilizar para determinar si la muestra fue extrada de manera aleatoria.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
y cuartiles.
Datos. Las variables deben ser numricas. Para convertir las variables de cadena en
552 Captulo 35
E Seleccione una o ms variables de contraste numricas. E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
seleccionadas. Puede utilizar como punto de corte los valores observados para la media, la mediana o la moda, o bien un valor especificado. Los casos con valores menores que el punto de corte se asignarn a un grupo y los casos con valores mayores o iguales que el punto de corte se asignarn a otro grupo. Se lleva a cabo una prueba para cada punto de corte seleccionado.
Estadsticos. Puede elegir uno o los dos estadsticos de resumen. Descriptivos. Muestra la media, la desviacin tpica, el mnimo, el mximo y el
554 Captulo 35
forma normal. La prueba de Kolmogorov-Smirnov para una muestra se puede utilizar para comprobar que una variable (por ejemplo ingresos) se distribuye normalmente.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
y cuartiles.
Datos. Utilice variables cuantitativas (a nivel de medida de razn o de intervalo). Supuestos. La prueba de Kolmogorov-Smirnov asume que los parmetros de la distribucin de contraste se han especificado previamente. Este procedimiento estima los parmetros a partir de la muestra. La media y la desviacin tpica de la muestra son los parmetros de una distribucin normal, los valores mnimo y mximo de la muestra definen el rango de la distribucin uniforme, la media muestral es el parmetro de la distribucin de Poisson y la media muestral es el parmetro de la distribucin exponencial. La capacidad de la prueba para detectar desviaciones a partir de la distribucin hipotetizada puede disminuir gravemente. Para contrastarla con una distribucin normal con parmetros estimados, considere la posibilidad de utilizar la prueba de K-S Lillliefors (disponible en el procedimiento Explorar).
555 Pruebas no paramtricas Figura 35-10 Resultados del procedimiento Prueba de Kolmogorov-Smirnov para una muestra
Prueba de Kolmogorov-Smirnov para una muestra Ingresos 20 Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov .760 Sig. asintt. (bilateral) 1. La distribucin de contraste es la Normal. 2. Se han calculado a partir de los datos. .611 56250.00 45146.40 .170 .170 -.164
556 Captulo 35 Figura 35-11 Cuadro de dilogo Prueba de Kolmogorov-Smirnov para una muestra
prueba independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
Funciones adicionales del comando NPAR TESTS (Prueba de Kolmogorov-Smirnov para una muestra)
El lenguaje de comandos de SPSS tambin permite especificar los parmetros de la distribucin de contraste (con el subcomando K-S). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
cmodos y estticos, as como para facilitar un progreso ms rpido en la realineacin de la dentadura. Para averiguar si el nuevo corrector debe llevarse tanto tiempo como el modelo antiguo, se eligen 10 nios al azar para que lleven este ltimo y otros 10 nios para que usen el nuevo. Mediante la prueba U de Mann-Whitney podra descubrir que, de media, los nios que llevaban el nuevo corrector tenan que llevarlo puesto menos tiempo que los que llevaban el antiguo.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
558 Captulo 35
Supuestos. Utilice muestras independientes y aleatorias. La prueba U de Mann-Whitney requiere que las dos muestras probadas sean similares en la forma.
Figura 35-13 Resultados del procedimiento Dos muestras independientes
Rangos Aparato Tipo Antiguo Tipo Nuevo Total N 10 10 20 Rango promedio 14.10 6.90 Suma de rangos 141.00 69.00
Das de utilizacin
Estadsticos de contraste Das de utilizacin U de Mann-Whitney W de Wilcoxon Z Sig. asintt. (bilateral) Sig. exacta [2*(Sig. unilateral)] 14.000 69.000 -2.721 .007
.005
559 Pruebas no paramtricas Figura 35-14 Cuadro de dilogo Pruebas para dos muestras independientes
E Seleccione una o ms variables numricas. E Seleccione una variable de agrupacin y pulse en Definir grupos para segmentar el
560 Captulo 35
los rangos del grupo denominado primero en el cuadro de dilogo Dos muestras independientes: Definir grupos. La prueba Z de Kolmogorov-Smirnov y la prueba de rachas de Wald-Wolfowitz son pruebas ms generales que detectan las diferencias entre las posiciones y las formas de las distribuciones. La prueba de Kolmogorov-Smirnov se basa en la diferencia mxima absoluta entre las funciones de distribucin acumulada observadas para ambas muestras. Cuando esta diferencia es significativamente grande, se consideran diferentes las dos distribuciones. La prueba de rachas de Wald-Wolfowitz combina y ordena las observaciones de ambos grupos. Si las dos muestras proceden de una misma poblacin, los dos grupos deben dispersarse aleatoriamente en la ordenacin de los rangos. La prueba de reacciones extremas de Moses presupone que la variable experimental afectar a algunos sujetos en una direccin y a otros sujetos en la direccin opuesta. La prueba contrasta las respuestas extremas comparndolas con un grupo de control. Esta prueba se centra en la amplitud del grupo de control y supone una medida de la influencia de los valores extremos del grupo experimental en la amplitud al combinarse con el grupo de control. El grupo de control se define en el cuadro Grupo 1 del cuadro de dilogo Dos muestras independientes: Definir grupos. Las observaciones de ambos grupos se combinan y ordenan. La amplitud del grupo de control se calcula como la diferencia entre los rangos de los valores mayor y menor del grupo de control ms 1. Debido a que los valores atpicos ocasionales pueden distorsionar fcilmente el rango de la amplitud, de manera automtica se recorta de cada extremo un 5% de los casos de control.
Para segmentar el archivo en dos grupos o muestras, introduzca un valor entero para el Grupo 1 y otro valor para el Grupo 2. Los casos con otros valores se excluyen del anlisis.
Estadsticos. Puede elegir uno o los dos estadsticos de resumen. Descriptivos. Muestra la media, la desviacin tpica, el mnimo, el mximo y el
562 Captulo 35
Ejemplo. En general, cuando una familia vende su casa logra obtener la cantidad que
pide inicialmente? Si aplica la prueba de Wilcoxon de los rangos con signo a 10 casas, podra descubrir que siete familias reciben menos cantidad de la solicitada, una recibe ms y dos familias reciben el precio solicitado.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
Rangos N Precio de salida Precio de venta Rangos negativos Rangos positivos Empates Total 1 7 2
1
2 3
10
1. Precio de salida < Precio de venta 2. Precio de salida > Precio de venta 3. Precio de venta = Precio de salida
Estadsticos de contraste
1. Basado en los rangos negativos. 2. Prueba de los rangos con signo de Wilcoxon
Pulse en cada una de las dos variables. La primera variable aparecer en la seccin Selecciones actuales como Variable 1 y la segunda variable aparecer como Variable 2. Pulse en el botn de flecha para mover el par hasta la lista Contrastar pares. Si lo desea, pueden seleccionar ms parejas de variables. Para eliminar un par de variables del anlisis, seleccione el par en la lista Contrastar pares y pulse en el botn de flecha.
Estadsticos. Puede elegir uno o los dos estadsticos de resumen. Descriptivos. Muestra la media, la desviacin tpica, el mnimo, el mximo y el
566 Captulo 35
Ejemplo. Es diferente el tiempo medio en que se fundirn las bombillas de 100 vatios de tres marcas distintas? A partir del anlisis de varianza de un factor de Kruskal-Wallis, puede comprobar que las tres marcas s se diferencian en su vida media. Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
567 Pruebas no paramtricas Figura 35-21 Cuadro de dilogo Pruebas para varias muestras independientes
E Seleccione una o ms variables numricas. E Seleccione una variable de agrupacin y pulse en Definir rango para especificar los
568 Captulo 35
de la respuesta aumenta. La hiptesis alternativa se encuentra aqu ordenada; por tanto, la prueba de Jonckheere-Terpstra es la prueba ms apropiada. La prueba de Jonckheere-Terpstra estar disponible slo si ha instalado Pruebas exactas de SPSS.
Para definir el rango, introduzca valores enteros para el mnimo y el mximo que se correspondan con las categoras mayor y menor de la variable de agrupacin. Se excluyen los casos con valores fuera de los lmites. Por ejemplo, si indica un valor mnimo de 1 y un valor mximo de 3, nicamente se utilizarn los valores enteros entre 1 y 3. Debe indicar ambos valores y el valor mnimo ha ser menor que el mximo.
policas y profesores? Se pide a diez personas que ordenen estas cuatro profesiones por orden de prestigio. La prueba de Friedman indica que la gente asocia diferentes niveles de prestigio con estas cuatro profesiones.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
570 Captulo 35 Figura 35-24 Resultados del procedimiento Pruebas para varias muestras relacionadas
Rangos Rango medio Doctor Abogado Polica Profesor 1.50 2.50 3.40 2.60
572 Captulo 35
36
Captulo
Se ofrecen dos procedimientos para analizar los conjuntos de categoras mltiples y de dicotomas mltiples. El procedimiento Frecuencias de respuestas mltiples muestra tablas de frecuencias. El procedimiento Tablas de contingencia de respuestas mltiples muestra tablas de contingencia de dos y tres dimensiones. Antes de utilizar cualquiera de estos procedimientos, deber definir conjuntos de respuestas mltiples.
Ejemplo. Este ejemplo ilustra el uso de elementos de respuestas mltiples en un
estudio de investigacin de mercado. Los datos son ficticios y no deben interpretarse como reales. Una lnea area podra hacer una encuesta a los pasajeros que realicen una determinada ruta para evaluar las lneas areas de la competencia. En este ejemplo, American Airlines desea conocer el uso que hacen sus pasajeros de otras lneas areas en la ruta Chicago-Nueva York y la importancia relativa del horario y el servicio a la hora de seleccionar una lnea area. El encargado del vuelo proporciona a cada pasajero un breve cuestionario durante el embarque. La primera pregunta dice: Rodee con un crculo todas las lneas areas con la que haya volado al menos una vez en los ltimos seis meses en este mismo trayecto: American, United, TWA, USAir, Otras. Se trata de una pregunta de respuestas mltiples, ya que el pasajero puede marcar ms de una respuesta. Sin embargo, la pregunta no se puede codificar directamente, ya que una variable slo puede tener un valor para cada caso. Deber utilizar distintas variables para asignar respuestas a cada pregunta. Existen dos formas de hacerlo. Una consiste en definir una variable para cada una de las opciones (por ejemplo, American, United, TWA, USAir y Otras). Si el pasajero marca United, a la variable united se le asignar el cdigo 1; en caso contrario se le asignar 0. ste es un mtodo de dicotomas mltiples de asignacin de variables. La otra forma de asignar respuestas es el mtodo de categoras mltiples, en el que se estima el nmero mximo de posibles respuestas a la pregunta y se configura el mismo nmero de variables, con cdigos para especificar la lnea area utilizada. Examinando una muestra de cuestionarios, podra observarse que ningn usuario ha volado en ms de tres lneas areas diferentes en esta ruta durante los ltimos seis meses. An ms,
573
574 Captulo 36
se observar que debido a la liberalizacin de las lneas areas, aparecen otras 10 en la categora Otras. Con el mtodo de respuestas mltiples, definira tres variables, cada una codificada como 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta y as sucesivamente. Si un pasajero determinado marca American y TWA, la primera variable tendr el cdigo 1, la segunda el 3 y la tercera un cdigo de valor perdido. Otro pasajero podra haber marcado American e introducido Delta. As, la primera variable tendr el cdigo 1, la segunda el 5 y la tercera un cdigo de valor perdido. Por el contrario, si utiliza el mtodo de dicotomas mltiples, terminar con 14 variables independientes. Aunque cualquiera de los mtodos de asignacin anteriores es viable para este estudio, el mtodo seleccionado depender de la distribucin de respuestas.
procedimientos. Si lo desea, puede introducir una etiqueta de variable descriptiva para el conjunto de respuestas mltiples. La etiqueta puede tener hasta 40 caracteres.
Para definir conjuntos de respuestas mltiples
E Elija en los mens: Analizar Respuesta mltiple Definir conjuntos... Figura 36-1 Cuadro de dilogo Definir conjuntos de respuestas mltiples
E Seleccione dos o ms variables. E Si las variables estn codificadas como dicotomas, indique qu valor desea contar. Si
las variables estn codificadas como categoras, defina el rango de las categoras.
E Introduzca un nombre distintivo para cada conjunto de respuestas mltiples. E Pulse Aadir para agregar el conjunto de respuestas mltiples a la lista de conjuntos
definidos.
576 Captulo 36
valores perdidos en cualquier variable de la tabulacin del conjunto de dicotomas mltiples. Esto slo se aplica a conjuntos de respuestas mltiples definidos como conjuntos de dicotomas. Por defecto, un caso se considera perdido para un conjunto de dicotomas mltiples si ninguna de sus variables que lo componen contiene el valor contado. Los casos con valores perdidos en algunas variables, pero no en todas, se incluyen en las tabulaciones del grupo si al menos una variable contiene el valor contado.
Excluir los casos segn lista dentro de las categoras. Excluye los casos con
valores perdidos en cualquier variable de la tabulacin del conjunto de categoras mltiples. Esto slo se aplica a conjuntos de respuestas mltiples definidos como conjuntos de categoras. Por defecto, un caso se considera perdido para un conjunto de categoras mltiples slo si ninguno de sus componentes tiene valores vlidos dentro del rango definido.
Ejemplo. Cada variable creada a partir de una pregunta de una encuesta es una variable
elemental. Para analizar un elemento de respuestas mltiples, deber combinar las variables en uno o dos tipos de conjuntos de respuestas mltiples: un conjunto de dicotomas mltiples o un conjunto de categoras mltiples. Por ejemplo, si una encuesta sobre lneas areas preguntara al encuestado cul de las tres lneas (American, United, TWA) ha utilizado durante los seis ltimos meses y usted utilizara variables dicotmicas y definiera un conjunto de dicotomas mltiples, cada una de las tres variables del conjunto se convertira en una categora de la variable de
grupo. Las frecuencias y los porcentajes de las tres lneas areas se muestran en una tabla de frecuencias. Si observa que ningn encuestado ha mencionado ms de dos lneas areas, podra crear dos variables, cada una con tres cdigos, uno para cada lnea area. Si define un conjunto de categoras mltiples, los valores se tabulan aadiendo los mismos cdigos en las variables elementales juntas. El conjunto de valores resultantes es igual a los de cada una de las variables elementales. Por ejemplo, 30 respuestas para United son la suma de las cinco respuestas de United para la lnea area 1 y las 25 respuestas de United para la lnea area 2. Las frecuencias y los porcentajes de las tres lneas areas se muestran en una tabla de frecuencias.
Estadsticos. Tablas de frecuencias que muestran recuentos, porcentajes de respuestas,
menos una vez en los seis ltimos meses (American, United, TWA). Qu considera ms importante a la hora de seleccionar un vuelo, el horario o el servicio? Seleccione slo uno. Despus de introducir los datos como dicotomas o categoras mltiples y combinarlos en un conjunto, puede presentar en forma de tabla de contingencia las selecciones de lnea area con la pregunta relativa al servicio o al horario.
Estadsticos. Tabla de contingencia con recuentos de casilla, fila, columna y totales, as como porcentajes de casilla, fila, columna y totales. Los porcentajes de casilla se basan en casos o respuestas. Datos. Utilice conjuntos de respuestas mltiples o variables categricas numricas. Supuestos. Las frecuencias y los porcentajes proporcionan una til descripcin de los
580 Captulo 36 Figura 36-5 Cuadro de dilogo Tablas de contingencia de respuestas mltiples
Si lo desea, puede obtener una tabla de contingencia de doble clasificacin para cada categora de una variable de control o conjunto de respuestas mltiples. Seleccione uno o varios elementos para la lista Capas.
Los rangos de valores deben definirse para cualquier variable elemental de la tabla de contingencia. Introduzca los valores enteros de categora mximos y mnimos que desee tabular. Las categoras que estn fuera del rango se excluyen del anlisis. Se entiende que los valores que estn dentro del rango inclusivo son enteros (los no enteros quedan truncados).
Porcentajes de casilla. Las frecuencias de la casilla siempre se muestran. Puede elegir entre mostrar los porcentajes de fila, los de columna o los de tabla de doble clasificacin (totales). Porcentajes basados en. Los porcentajes de casilla pueden basarse en casos (o
encuestados). Esta opcin no estar disponible si selecciona la concordancia de variables en conjuntos de categoras mltiples. Tambin se pueden basar en las respuestas. Para los conjuntos de dicotomas mltiples, el nmero de respuestas es igual al nmero de valores contados por los casos. Para los conjuntos de categoras mltiples, el nmero de respuestas es el nmero de valores del rango definido.
Valores perdidos. Puede elegir una o ambas de las siguientes opciones: Excluir los casos segn lista dentro de las dicotomas. Excluye los casos con
valores perdidos en cualquier variable de la tabulacin del conjunto de dicotomas mltiples. Esto slo se aplica a conjuntos de respuestas mltiples definidos como conjuntos de dicotomas. Por defecto, un caso se considera perdido para un conjunto de dicotomas mltiples si ninguna de sus variables que lo componen contiene el valor contado. Los casos con valores perdidos para algunas variables, pero no todas, se incluyen en las tabulaciones del grupo si al menos una variable contiene el valor contado.
Excluir los casos segn lista dentro de las categoras. Excluye los casos con
valores perdidos en cualquier variable de la tabulacin del conjunto de categoras mltiples. Esto slo se aplica a conjuntos de respuestas mltiples definidos como conjuntos de categoras. Por defecto, un caso se considera perdido para
582 Captulo 36
un conjunto de categoras mltiples slo si ninguno de sus componentes tiene valores vlidos dentro del rango definido. Por defecto, cuando se presentan dos conjuntos de categoras mltiples en forma de tabla de contingencia, el procedimiento tabula cada variable del primer grupo con cada variable del segundo y suma las frecuencias de cada casilla; de esta forma, algunas respuestas pueden aparecer ms de una vez en una tabla. Puede seleccionar la opcin siguiente:
Emparejar las variables entre los conjuntos de respuesta. Empareja la primera variable
del primer grupo con la primera variable del segundo, y as sucesivamente. Si selecciona esta opcin, el procedimiento basar los porcentajes de casilla en las respuestas en lugar de hacerlo en los encuestados. El emparejamiento no est disponible para conjuntos de dicotomas mltiples o variables elementales.
37
Captulo
Los listados de casos y los estadsticos descriptivos son herramientas bsicas para estudiar y presentar los datos. Puede obtener listados de casos con el Editor de datos o el procedimiento Resumir, frecuencias y estadsticos descriptivos con el procedimiento Frecuencias, y estadsticos de subpoblacin con el procedimiento Medias. Cada uno utiliza un formato diseado para que la informacin sea clara. Si desea ver la informacin con otro formato, las opciones Informe de estadsticos en filas e Informe de estadsticos en columnas le ofrecen el control que precisa para presentar los datos.
incluyendo el salario, el cargo, la tienda y la seccin en la que trabaja cada uno. Se podra generar un informe que proporcione los datos individuales de cada empleado (listado) desglosados por tienda y seccin (variables de ruptura), con estadsticos de resumen (por ejemplo, el salario medio) por tienda, seccin y seccin dentro de cada tienda.
Columnas de datos. Muestra una lista de las variables del informe para las que desea obtener el listado de los casos o los estadsticos de resumen y controla el formato de presentacin de las columnas de datos. Romper columnas por. Muestra una lista de las variables de ruptura opcionales que
dividen el informe en grupos y controla los estadsticos de resumen y los formatos de presentacin de las columnas de ruptura. Si hay varias variables de ruptura, se crear un grupo distinto para cada una de las categoras de las variables de ruptura
583
584 Captulo 37
dentro de las categoras de la variable de ruptura anterior en la lista. Las variables de ruptura deben ser variables categricas discretas que dividan los casos en un nmero limitado de categoras con sentido. Los valores individuales de cada variable de ruptura aparecen ordenados en una columna distinta situada a la izquierda de todas las columnas de datos.
Informe. Controla las caractersticas globales del informe, incluyendo los estadsticos de resumen globales, la presentacin de los valores perdidos, la numeracin de las pginas y los ttulos. Mostrar casos. Muestra los valores reales (o etiquetas de valor) de las variables de
la columna de datos para cada caso. Esto genera un informe a modo de listado, que puede ser mucho ms largo que un informe de resumen.
Presentacin preliminar. Muestra slo la primera pgina del informe. Esta opcin
es til para ver una presentacin preliminar del formato del informe sin tener que procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de
datos se debe ordenar por los valores de estas variables antes de generar el informe. Si el archivo de datos ya est ordenado por estos valores, se puede ahorrar tiempo de procesamiento seleccionando esta opcin. Esta opcin es especialmente til despus de generar la presentacin preliminar de un informe.
Resultados de muestra
Figura 37-1 Informe combinado con listado de los casos y estadsticos de resumen
586 Captulo 37 E Para los informes con estadsticos de resumen para los subgrupos definidos por las
variables de ruptura, seleccione la variable de ruptura de la lista Romper columnas por y pulse en Resumen, en la seccin Romper columnas por, para especificar las medidas de resumen.
E Para los informes con estadsticos de resumen globales, pulse en Resumen, en la
587 Informes de los resultados Figura 37-3 Cuadro de dilogo Informe: Formato de columna de datos
Los ttulos largos se ajustan de forma automtica dentro de la columna. Utilice la tecla Intro para insertar manualmente lneas de separacin donde desee ajustar los ttulos.
Posicin de valor en la columna. Para la variable seleccionada, controla la alineacin de los valores de los datos o de las etiquetas de valor dentro de la columna. La alineacin de los valores o de las etiquetas no afecta a la alineacin de los encabezados de las columnas. Puede sangrar el contenido de la columna por un nmero especfico de caracteres o centrar el contenido. Contenido de la columna. Para la variable seleccionada, controla la presentacin de los
valores de los datos o de las etiquetas de valor definidas. Los valores de los datos siempre se muestran para cualquier valor que no tenga etiquetas de valor definidas. No se encuentra disponible para las columnas de datos en los informes estadsticos en columnas.
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor mximo, nmero de casos, porcentaje de casos por encima y por debajo de un valor especificado, porcentaje de casos dentro de un rango de valores especificado, desviacin tpica, curtosis, varianza y asimetra.
Control de pgina. Controla el espaciado y la paginacin para las categoras de la variable de ruptura seleccionada. Puede especificar un nmero de lneas en blanco entre las categoras de ruptura o empezar cada categora de ruptura en una pgina nueva.
entre las etiquetas o los datos de la categora de ruptura y los estadsticos de resumen. Esta opcin es especialmente til para los informes combinados que incluyan tanto el listado de los casos individuales como los estadsticos de resumen para las categoras de ruptura; en estos informes puede insertar un espacio entre el listado de los casos y los estadsticos de resumen.
Excluir casos con valores perdidos segn lista. Elimina (del informe) cualquier caso con valores perdidos para cualquier variable del informe. Los valores perdidos aparecen como. Permite especificar el smbolo que representa los
valores perdidos en el archivo de datos. Este smbolo slo puede tener un carcter y se utiliza para representar tanto los valores perdidos del sistema como los valores perdidos definidos por el usuario.
Numerar las pginas desde la. Permite especificar un nmero de pgina para la
Diseo de pgina. Controla los mrgenes de las pginas expresados en lneas (extremos superior e inferior) y caracteres (a la izquierda y a la derecha) y la alineacin del informe entre los mrgenes. Ttulos y pies de pgina. Controla el nmero de lneas que separan los ttulos y los
especifican diversas variables de ruptura, pueden situarse en columnas diferentes o en la primera columna. Si se colocan todas en la primera columna, se generar un informe ms estrecho.
Ttulos de columna. Controla la presentacin de los ttulos de columna, incluyendo
el subrayado de ttulos, el espacio entre los ttulos y el cuerpo del informe y la alineacin vertical de los ttulos de columna.
Filas de col. datos y etiquetas de ruptura. Controla la ubicacin de la informacin de
las columnas de datos (valores de datos o estadsticos de resumen) en relacin con las etiquetas de ruptura al principio de cada categora de ruptura. La primera fila de informacin puede empezar en la misma lnea que la etiqueta de categora de ruptura o en un nmero de lneas posterior especificado. Esta seccin no se encuentra disponible para los informes de estadsticos en columnas.
Si inserta variables en los ttulos o en los pies de pgina, la etiqueta de valor o el valor de la variable actual aparecer en el ttulo o en el pie de pgina. Para los ttulos se mostrar la etiqueta de valor correspondiente al valor de la variable al principio de la pgina; para los pies de pgina, esta etiqueta se mostrar al final de la pgina. Si no hay etiqueta de valor, se mostrar el valor real.
Variables especiales. Las variables especiales DATE y PAGE permiten insertar la
fecha actual o el nmero de pgina en cualquier lnea de un encabezado o pie del informe. Si el archivo de datos contiene variables llamadas DATE o PAGE, no podr utilizar estas variables en los ttulos ni en los pies del informe.
592 Captulo 37
empleados, incluyendo el salario, el cargo y la seccin en la que trabaja cada uno. Se podra generar un informe que proporcione los estadsticos de salario resumidos (por ejemplo, media, mnimo y mximo) para cada seccin.
Columnas de datos. Muestra una lista de las variables del informe para las que se
desea obtener estadsticos de resumen y controla el formato de presentacin y los estadsticos de resumen mostrados para cada variable.
Romper columnas por. Muestra una lista de las variables de segmentacin opcionales
que dividen el informe en grupos y controla los formatos de presentacin de las columnas de ruptura. Si hay varias variables de ruptura, se crear un grupo distinto para cada una de las categoras de las variables de ruptura dentro de las categoras de la variable de ruptura anterior en la lista. Las variables de ruptura deben ser variables categricas discretas que dividan los casos en un nmero limitado de categoras con sentido.
Informe. Controla las caractersticas globales del informe, incluyendo la presentacin de los valores perdidos, la numeracin de las pginas y los ttulos. Presentacin preliminar. Muestra slo la primera pgina del informe. Esta opcin
es til para ver una presentacin preliminar del formato del informe sin tener que procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de datos se debe ordenar por los valores de estas variables antes de generar el informe. Si el archivo de datos ya est ordenado por estos valores, se puede ahorrar tiempo de procesamiento seleccionando esta opcin. Esta opcin es especialmente til despus de generar la presentacin preliminar de un informe.
Resultados de muestra
Figura 37-9 Informe de resumen con estadsticos de resumen en columnas
Media Division __________ Carpeting Appliances Furniture Hardware Annual Age Media Salary ________ ________ 30,75 31,11 36,87 36,20 $11.754 $12.508 $13.255 $17.580 Mnimo Annual Salary ________ $9.200 $7.500 $8.975 $7.450 Mximo Annual Salary ________ $19.500 $28.300 $17.050 $22.500
en la lista de origen y desplcela hasta la lista Columnas de datos varias veces, una para cada medida que desee obtener.
E Para mostrar una columna con la suma, la media, la razn o cualquier otra funcin de las columnas existentes, pulse en Insertar total. Al hacerlo se situar una variable
594 Captulo 37 Figura 37-10 Cuadro de dilogo Informe: Estadsticos en las columnas
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor mximo, nmero de casos, porcentaje de casos por encima y por debajo de un valor especificado, porcentaje de casos dentro de un rango de valores especificado, desviacin tpica, varianza, curtosis y asimetra.
de resumen.
Media de columnas. La columna total es la media de las columnas de la lista Columna
de resumen.
Mnimo de columnas. La columna total es el mnimo de las columnas de la lista
Columna de resumen.
Mximo de columnas. La columna total es el mximo de las columnas de la lista
Columna de resumen.
1 columna 2 columna. La columna total es la resta de las columnas de la lista
596 Captulo 37
1 columna / 2 columna. La columna total es el cociente de las columnas de la lista Columna de resumen. Esta lista debe contener, exactamente, dos columnas. % 1 columna / 2 columna. La columna total es el porcentaje de la primera columna
dividido por la segunda columna de la lista Columna de resumen. Esta lista debe contener, exactamente, dos columnas.
Producto de columnas. La columna total es el producto de las columnas de la lista
Columna de resumen.
Control de pgina. Controla el espaciado y la paginacin para las categoras de la variable de ruptura seleccionada. Puede especificar un nmero de lneas en blanco entre las categoras de ruptura o empezar cada categora de ruptura en una pgina nueva. Lneas en blanco antes del subtotal. Controla el nmero de lneas en blanco entre los
Total final. Muestra y etiqueta un total global para cada columna que aparece al final
de la columna.
Valores perdidos. Permite excluir los valores perdidos del informe o seleccionar un
598 Captulo 37
Anlisis de fiabilidad
38
Captulo
El anlisis de fiabilidad permite estudiar las propiedades de las escalas de medicin y de los elementos que componen las escalas. El procedimiento Anlisis de fiabilidad calcula un nmero de medidas de fiabilidad de escala que se utilizan normalmente y tambin proporciona informacin sobre las relaciones entre elementos individuales de la escala. Se pueden utilizar los coeficientes de correlacin intraclase para calcular estimaciones de la fiabilidad inter-evaluadores.
Ejemplo. El cuestionario mide la satisfaccin del cliente de manera til? El anlisis
de fiabilidad le permitir determinar el grado en que los elementos del cuestionario se relacionan entre s, obtener un ndice global de la replicabilidad o de la consistencia interna de la escala en su conjunto e identificar elementos problemticos que deberan ser excluidos de la escala.
Estadsticos. Descriptivos para cada variable y para la escala, estadsticos de resumen
comparando los elementos, correlaciones y covarianzas inter-elementos, estimaciones de la fiabilidad, tabla de ANOVA, coeficientes de correlacin intraclase, Tcuadrado de Hotelling y prueba de aditividad de Tukey.
Modelos. Estn disponibles los siguientes modelos de fiabilidad: Alfa (Cronbach). Este modelo es un modelo de consistencia interna, que se basa en
verdadera.
Paralelo. Este modelo asume que todos los elementos tienen varianzas iguales y
600 Captulo 38
Datos. Los datos pueden ser dicotmicos, ordinales o de intervalo, pero deben estar
codificados numricamente.
Supuestos. Las observaciones deben ser independientes y los errores no deben estar correlacionados entre los elementos. Cada par de elementos debe tener una distribucin normal bivariada. Las escalas deben ser aditivas, de manera que cada elemento est linealmente relacionado con la puntuacin total. Procedimientos relacionados. Si desea explorar la dimensionalidad de los elementos
de la escala (para comprobar si es necesario ms de un constructo para explicar el patrn de puntuaciones en los elementos), utilice el Anlisis factorial o el Escalamiento multidimensional. Para identificar grupos homogneos de variables, use el anlisis de conglomerados jerrquico para agrupar las variables.
Para obtener un anlisis de fiabilidad
E Elija en los mens: Analizar Escala Anlisis de fiabilidad... Figura 38-1 Cuadro de dilogo Anlisis de fiabilidad
E Seleccione dos o ms variables como componentes potenciales de una escala aditiva. E Elija un modelo de la lista desplegable Modelo.
Puede seleccionar diversos estadsticos que describen la escala y sus elementos. Los estadsticos de los que se informa por defecto incluyen el nmero de casos, el nmero de elementos y las estimaciones de la fiabilidad, segn se explica a continuacin: Modelos Alfa: coeficiente alfa. Para datos dicotmicos, ste es equivalente al coeficiente 20 de Kuder-Richardson (KR20). Modelos de Dos mitades: correlacin entre formas, fiabilidad de dos mitades de Guttman, fiabilidad de Spearman-Brown (longitud igual y desigual) y coeficiente alfa para cada mitad. Modelos de Guttman: coeficientes de fiabilidad lambda 1 a lambda 6. Modelos de Paralelo y Paralelo estricto: prueba de bondad de ajuste del modelo; estimaciones de la varianza error, varianza comn y varianza verdadera; correlacin comn inter-elementos estimada; fiabilidad estimada y estimacin de la fiabilidad insesgada.
Descriptivos para. Genera estadsticos descriptivos para las escalas o los elementos a
602 Captulo 38
Escala. Genera estadsticos descriptivos para las escalas. Escala si se elimina el elemento. Muestra estadsticos de resumen para comparar
cada elemento con la escala compuesta por otros elementos. Los estadsticos incluyen la media de escala y la varianza si el elemento fuera a eliminarse de la escala, la correlacin entre el elemento y la escala compuesta por otros elementos, y alfa de Cronbach si el elemento fuera a eliminarse de la escala.
Resmenes. Proporciona estadsticos descriptivos sobre las distribuciones de los elementos a travs de todos los elementos de la escala. Medias (Fiabilidad). Estadsticos de resumen para las medias de los elementos. Se
muestran el mximo, el mnimo y el promedio de las medias de los elementos, el rango y la varianza de las medias de los elementos, y la razn de la mayor media sobre la menor media de los elementos.
Varianzas. Estadsticos de resumen de las varianzas de los elementos (tems). Se
muestran: la menor, la mayor y el promedio de las varianzas de los tems, el rango y la varianza de las varianzas de los tems, y la razn de la mayor varianza sobre la menor varianza de los tems.
Covarianzas. Estadsticos de resumen para las covarianzas entre los elementos. Se
muestran el mximo, el mnimo y el promedio de las covarianzas inter-elementos, el rango y la varianza de las covarianzas inter-elementos, y la razn de la mayor covarianza sobre la menor covarianza inter-elementos.
Correlaciones. Estadsticos de resumen para las correlaciones entre los elementos.
Se muestran el mximo, el mnimo y el promedio de las correlaciones inter-elementos, el rango y la varianza de las correlaciones inter-elementos, y la razn de la mayor correlacin sobre la menor correlacin inter-elementos.
Inter-elementos. Genera las matrices de correlaciones o covarianzas entre los
elementos.
Tabla de ANOVA. Produce pruebas de medias iguales. Prueba F. Muestra la tabla de un anlisis de varianza de medidas repetidas.
de concordancia de Kendall. Esta opcin es adecuada para datos que se encuentren en el formato de rangos. La prueba de chi-cuadrado sustituye a la prueba F habitual en la tabla de ANOVA.
Chi-cuadrado de Cochran. Muestra la Q de Cochran. Esta opcin es adecuada
para datos que son dicotmicos. El estadstico Q sustituye a la F habitual en la tabla de ANOVA.
T-cuadrado de Hotelling. Genera un contraste multivariado sobre la hiptesis nula de
intraclase. Los modelos disponibles son: Dos factores, efectos mixtos; Dos factores, efectos aleatorios y Un factor, efectos aleatorios. Seleccione Dos factores, efectos mixtos, si los efectos de personas son aleatorios y los efectos de elementos son fijos, Dos factores, efectos aleatorios, si los efectos de personas y los efectos de elementos son aleatorios. Seleccione Un factor, efectos aleatorios si los efectos de personas son aleatorios.
Tipo. Seleccione el tipo de ndice. Los tipos disponibles son: Los tipos disponibles
contraste de hiptesis. Este valor es el valor con el que se compara el valor observado. El valor por defecto es 0.
604 Captulo 38
Escribir una matriz de correlaciones para su anlisis posterior. Especificar una divisin distinta de la de dos mitades iguales, para el mtodo de dos mitades. Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
Escalamiento multidimensional
39
Captulo
El escalamiento multidimensional trata de encontrar la estructura de un conjunto de medidas de distancia entre objetos o casos. Esta tarea se logra asignando las observaciones a posiciones especficas en un espacio conceptual (normalmente de dos o tres dimensiones) de modo que las distancias entre los puntos en el espacio concuerden al mximo con las disimilaridades dadas. En muchos casos, las dimensiones de este espacio conceptual son interpretables y se pueden utilizar para comprender mejor los datos. Si las variables se han medido objetivamente, puede utilizar el escalamiento multidimensional como tcnica de reduccin de datos (el procedimiento Escalamiento multidimensional permitir calcular las distancias a partir de los datos multivariados, si es necesario). El escalamiento multidimensional puede tambin aplicarse a valoraciones subjetivas de disimilaridad entre objetos o conceptos. Adems, el procedimiento Escalamiento multidimensional puede tratar datos de disimilaridad procedentes de mltiples fuentes, como podran ser mltiples evaluadores o mltiples sujetos evaluados por un cuestionario.
Ejemplo. Cmo percibe el pblico las diferencias entre distintos coches? Si posee
datos de las valoraciones de similaridad emitidas por los sujetos sobre las diferentes marcas y modelos de coches, puede utilizar el escalamiento multidimensional para identificar las dimensiones que describan las preferencias de los consumidores. Puede encontrar, por ejemplo, que el precio y el tamao de un vehculo definen un espacio de dos dimensiones, capaz de explicar las similaridades de las que informan los encuestados.
Estadsticos. Para cada modelo: Matriz de datos, Matriz de datos escalada
ptimamente, S-stress (de Young), Stress (de Kruskal), R, Coordenadas de los estmulos, Stress promedio y R para cada estmulo (modelos RMDS). Para modelos de diferencias individuales (INDSCAL): ponderaciones del sujeto e ndice de peculiaridad para cada sujeto. Para cada matriz en los modelos de escalamiento multidimensional replicado: stress y R para cada estmulo. Grficos: coordenadas de
605
606 Captulo 39
los estmulos (de dos o tres dimensiones), diagrama de dispersin de las disparidades frente a las distancias.
Datos. Si los datos son de disimilaridad, todas las disimilaridades deben ser cuantitativas y deben estar medidas en la misma mtrica. Si los datos son datos multivariantes, las variables pueden ser datos cuantitativos, binarios o de recuento. El escalamiento de las variables es un tema importante, ya que las diferencias en el escalamiento pueden afectar a la solucin. Si las variables tienen grandes diferencias en el escalamiento (por ejemplo, una variable se mide en dlares y otra en aos), debe considerar la posibilidad de tipificarlas (este proceso puede llevarse a cabo automticamente con el propio procedimiento Escalamiento multidimensional). Supuestos. El procedimiento Escalamiento multidimensional est relativamente
libre de supuestos distribucionales. Compruebe que selecciona el nivel de medida adecuado (ordinal, de intervalo, o de razn) en el cuadro de dilogo Escalamiento multidimensional: Opciones para asegurar que los resultados se calculan correctamente.
Procedimientos relacionados. Si su objetivo es la reduccin de los datos, un mtodo alternativo a tener en cuenta es el anlisis factorial, sobre todo si las variables son cuantitativas. Si desea identificar grupos de casos similares, considere complementar el anlisis de escalamiento multidimensional con un anlisis de conglomerados jerrquico o de k-medias. Para obtener un anlisis de escalamiento multidimensional
E Elija en los mens: Analizar Escala Escalamiento multidimensional...
E En Distancias, seleccione Los datos son distancias o Crear distancias a partir de datos. E Si los datos son distancias, seleccione al menos cuatro variables numricas para el anlisis. (Tambin puede pulsar en Forma para indicar la forma de la matriz de
distancias.)
E Si desea que SPSS cree las distancias antes de analizarlas, seleccione al menos un valor numrico. (Tambin puede pulsar en Medida para indicar el tipo de medida de
distancia que desea.) Cada variable de agrupacin puede ser numrica o de cadena, y puede crear matrices distintas para cada categora de una variable de agrupacin moviendo esa variable a la lista Matrices individuales para.
608 Captulo 39
Si el conjunto de datos activo representa distancias entre uno o dos conjuntos de objetos, especifique la forma de la matriz de datos para obtener los resultados correctos. Nota: No puede seleccionar Cuadrada simtrica si el cuadro de dilogo Modelo especifica la condicionalidad de filas.
El escalamiento multidimensional utiliza datos de disimilaridad para crear una solucin de escalamiento. Si los datos son datos multivariantes (los valores de las variables que se han medido), debe crear los datos de disimilaridad para poder calcular una solucin de escalamiento multidimensional. Puede especificar los detalles para la creacin de las medidas de disimilaridad a partir de los datos.
Medida. Le permite especificar la medida de disimilaridad para el anlisis.
Seleccione una opcin del grupo Medida que se corresponda con el tipo de datos y, a continuacin, elija una de las medidas de la lista desplegable correspondiente a ese tipo de medida. Las opciones disponibles son:
Intervalo. Distancia eucldea, Distancia eucldea al cuadrado, Chebychev, Bloque,
Minkowski o Personalizada.
Contar apariciones. Medida de chi-cuadrado o Medida de phi-cuadrado. Binaria. Distancia eucldea, Distancia eucldea al cuadrado, Diferencia de tamao,
en escalas muy distintas, puede que desee tipificar los valores antes de calcular las proximidades (no es aplicable a datos binarios). Seleccione un mtodo de estandarizacin en la lista desplegable Estandarizar. Si no se requiere la estandarizacin, seleccione Ninguno.
La estimacin correcta de un modelo de escalamiento multidimensional depende de aspectos que ataen a los datos y al modelo en s.
Nivel de medida. Permite especificar el nivel de medida de los datos. Las opciones son Ordinal, Intervalo y Razn. Si las variables son ordinales, al seleccionar Desempatar observaciones empatadas se solicitar que sean consideradas como variables continuas, de forma que los empates (valores iguales para casos diferentes) se resuelvan ptimamente. Condicionalidad. Permite especificar qu comparaciones tienen sentido. Las opciones
610 Captulo 39
Dimensiones. Permite especificar la dimensionalidad de la solucin o soluciones del escalamiento. Se calcula una solucin para cada nmero del rango especificado. Especifique nmeros enteros entre 1 y 6; se permite un mnimo de 1 slo si selecciona Distancia eucldea como modelo de escalamiento. Para una solucin nica, especifique el mismo nmero para el mnimo y el mximo. Modelo de escalamiento. Permite especificar los supuestos bajo los que se realiza el escalamiento. Las opciones disponibles son Distancia eucldea o Distancia eucldea de diferencias individuales (tambin conocida como INDSCAL). Para el modelo de Distancia eucldea de diferencias individuales, puede seleccionar Permitir ponderaciones negativas de los sujetos, si es adecuado para los datos.
Grficos de grupo, Grficos para los sujetos individuales, Matriz de datos y Resumen del modelo y de las opciones.
Criterios. Permite determinar cundo debe detenerse la iteracin. Para cambiar los valores por defecto, introduzca valores para la Convergencia de s-stress, el Valor mnimo de s-stress y el N mximo de iteraciones.
Tratar distancias menores que n como perdidas. Las distancias menores que este valor
Estadsticos de la razn
40
Captulo
El procedimiento Estadsticos de la razn proporciona una amplia lista de estadsticos de resumen para describir la razn entre dos variables de escala. Se pueden ordenar los resultados por los valores de una variable de agrupacin, en orden ascendente o descendente. Se puede eliminar de los resultados el informe de los estadsticos de la razn y almacenar los resultados en un archivo externo.
Ejemplo. Existe una buena uniformidad en la razn entre el precio de tasacin y el
precio de venta de viviendas en cada una de las cinco regiones? En los resultados, se puede descubrir que la distribucin de las razones vara considerablemente entre regiones.
Estadsticos. Mediana, media, media ponderada, intervalos de confianza, coeficiente
de dispersin (CDD), coeficiente de variacin centrado en la mediana, coeficiente de variacin centrado en la media, el diferencial de precio (DRV), desviacin tpica, desviacin absoluta promedio (DAP), rango, valores mnimos y mximos y el ndice de concentracin calculado dentro de un rango o porcentaje (especificados por el usuario) respecto a la razn mediana.
Datos. Utilice cdigos numricos o cadenas cortas para codificar las variables de agrupacin (medidas de nivel nominal u ordinal). Supuestos. Las variables que definen el numerador y el denominador de la razn
Seleccione una variable de agrupacin y especificar el orden de los grupos en los resultados. Elija si desea mostrar los resultados en el Visor. Elija si desea guardar los resultados en un archivo externo para un uso posterior y especificar el nombre del archivo en el que se van a guardar los resultados.
Estadsticos de la razn
Figura 40-2 Cuadro de dilogo Estadsticos de la razn
Tendencia central. Las medidas de tendencia central son estadsticos que describen
total de razones.
Media ponderada. El resultado de dividir la media del numerador entre la media
del denominador. La media ponderada es tambin la media de las razones ponderadas por el denominador.
Intervalos de confianza. Muestra los intervalos de confianza para la media, la
mediana y la media ponderada (si se solicita). Especifique un valor mayor o igual que 0 y menor que 100 como nivel de confianza.
Dispersin. Estos estadsticos miden la cantidad de variacin o de dispersin entre los valores observados.
616 Captulo 40
absolutas de las razones respecto a la mediana y dividir el resultado entre el nmero total de razones.
CDD. El coeficiente de dispersin es el resultado de expresar la desviacin
es el resultado de expresar la raz de la media cuadrtica de las desviaciones respecto a la mediana como un porcentaje de la mediana.
CDV centrado en la media. El coeficiente de variacin centrado en la media es el
cuadrticas de las razones respecto a la media, dividir la suma por el nmero total de razones menos uno y extraer la raz cuadrada positiva.
Rango. El rango es el resultado de restar la razn mnima de la razn mxima. Mnimo. El mnimo es la razn menor. Mximo. El mximo es la razn mayor. ndice de concentracin. El coeficiente de concentracin mide el porcentaje de
especificando los valores superior e inferior del intervalo. Introduzca valores para las proporciones superior e inferior y pulse en Aadir para obtener un intervalo.
Razones en. En este caso, el intervalo se define de forma implcita al especificar el
porcentaje de la mediana. Introduzca un valor entre 0 y 100 y pulse en Aadir. El lmite inferior del intervalo ser igual a (1 0.01 valor) mediana, y el lmite superior ser igual a (1 + 0.01 valor) mediana.
41
Captulo
Se pueden crear grficos de alta resolucin mediante los procedimientos del men Grficos y mediante muchos de los procedimientos del men Analizar. Este captulo explica los conceptos bsicos de la utilidad de grficos.
617
El cuadro de dilogo Generador de grficos se utiliza para los tipos de grficos ms habituales, que aparecen en la pestaa Galera. Si debe crear un grfico que no est disponible en el generador de grficos, tambin puede seleccionar un tipo de grfico especfico en el men Grficos.
E En el generador de grficos, arrastre el icono correspondiente al grfico al lienzo,
619 Conceptos bsicos de la utilidad de grficos E Arrastre las variables desde la lista Variables a las zonas de arrastre del eje. (Si desea obtener ms informacin acerca del generador de grficos, pulse en Ayuda.)
Cuando se haya terminado de definir el grfico, el resultado ser similar al siguiente grfico.
Figura 41-2 Cuadro de dilogo Generador de grficos con las zonas de arrastre rellenadas
E Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas, pulse en Propiedades del elemento.
E En la lista Editar propiedades de, seleccione el elemento que desea cambiar. (Si desea obtener informacin acerca de propiedades especficas, pulse en Ayuda.) E Pulse en Aceptar en el cuadro de dilogo Generador de grficos para crear el grfico.
621 Conceptos bsicos de la utilidad de grficos Figura 41-4 Grfico de barras en la ventana Visor
Modificacin de grficos
Para modificar un grfico, pulse dos veces en cualquier parte del grfico que aparece en el Visor. Al hacer esto, aparecer el grfico en el Editor de grficos.
Puede modificar cualquier parte del grfico o cambiar a otro tipo de grfico que represente los mismos datos. Puede aadir elementos, as como ocultarlos o mostrarlos utilizando los mens del Editor de grficos.
Para modificar un elemento de un grfico
E Seleccione el elemento que desea modificar. E Elija en los mens: Edicin Propiedades...
Se abrir la ventana Propiedades. Las pestaas que aparecen en la ventana Propiedades dependen de la seleccin realizada. La ayuda en pantalla explica cmo hacer que aparezcan las pestaas que necesita.
Entre las modificaciones habituales se incluyen: Edicin del texto del grfico. Cambio del color y la trama de relleno de las barras. Adicin de texto al grfico, como por ejemplo un ttulo o una anotacin. Cambio de la posicin de la lnea de origen de las barras. A continuacin, se muestra un grfico modificado.
Las modificaciones realizadas al grfico se guardan al cerrar la ventana del grfico y el grfico modificado se muestra en el Visor.
Opciones
El cuadro de dilogo Opciones ofrece una serie de opciones para el grfico que va a crear. Este cuadro de dilogo est disponible si pulsa en Opciones.
Valores perdidos
Variables de segmentacin
Si hay valores perdidos en los datos para las variables que se utilizan para definir categoras o subgrupos, seleccione Incluir para que la categora o categoras de los valores perdidos definidos por el usuario (valores identificados como perdidos por el usuario) se incluyan en el grfico. Estas categoras tambin actan como variables de segmentacin para calcular el estadstico. Las categoras perdidos aparecen en el eje de categoras o en la leyenda, aadiendo, por ejemplo, una barra adicional o un
sector a un grfico de sectores. Si no hay ningn valor perdido, no aparecern las categoras perdidos. Si selecciona esta opcin y quiere suprimir la presentacin despus de que se dibuje el grfico, seleccione el grfico y, a continuacin, seleccione Propiedades en el men Edicin. Pulse en la pestaa Categoras y mueva las categoras que desee suprimir a la lista Excluidos.
Estadsticos de resumen y valores de casos
Puede seleccionar una de las siguientes alternativas para excluir los casos que contienen valores perdidos:
Excluir segn lista para obtener una base de casos coherente para el grfico. Si
alguna de las variables del grfico tiene un valor perdido para un determinado caso, se excluir el caso completo del grfico.
Excluir por variable para maximizar el uso de los datos. Si una variable seleccionada
tiene algn valor perdido, los casos que tengan estos valores perdidos se excluirn al analizar dicha variable. Para ver la diferencia existente entre la exclusin por lista y la exclusin por variables de los valores perdidos, observe las siguientes figuras, que muestran un grfico de barras para cada una de las dos opciones.
Figura 41-9 Exclusin por lista de los valores perdidos
628 Captulo 41 Figura 41-10 Exclusin por variables de los valores perdidos
Estos grficos se crearon a partir de una versin del archivo Employee data.sav que se edit para que tuviese algunos valores perdidos por el sistema (en blanco) para las variables correspondientes al salario actual y a la categora laboral. En otros casos, se introdujo el valor 0 y se defini como perdido. En ambos grficos, se ha seleccionado la opcin Mostrar los grupos definidos por los valores perdidos, que aade la categora Perdidos al resto de las categoras laborales mostradas. En cada grfico, los valores de la funcin de resumen, Nmero de casos, se muestran en las etiquetas de las barras. En ambos grficos, 26 casos tienen un valor perdido del sistema para la categora laboral y 13 casos tienen el valor perdido definido por el usuario (0). En el grfico por lista, el nmero de casos es el mismo para ambas variables en cada agrupacin de barras ya que siempre que haba un valor perdido se excluy el caso de todas las variables. En el grfico por variables, el nmero de casos no perdidos de cada variable de una categora se representa sin tener en cuenta los valores perdidos en las otras variables.
Plantillas grficas
Puede aplicar muchos de los atributos y elementos de texto de un grfico a otro. Esta posibilidad permite modificar un grfico, guardar dicho grfico como una plantilla y utilizar posteriormente dicha plantilla para crear una serie de grficos similares.
Para utilizar una plantilla al crear un grfico, pulse en Aadir en el grupo Plantillas. Se abrir un cuadro de dilogo estndar de seleccin de archivos. Si aade varias plantillas, stas se aplican siguiendo el orden en el que aparecen en la lista Archivos de plantilla. Si lo desea, puede cambiar el orden. Para aplicar una plantilla a un grfico que ya se encuentra en el Editor de grficos, elija en los mens:
Archivo Aplicar plantilla grfica...
Se abrir un cuadro de dilogo estndar de seleccin de archivos. Seleccione el archivo que desea utilizar como plantilla. Si est creando un nuevo grfico, el nombre del archivo seleccionado aparecer en el grupo Plantilla cuando regrese al cuadro de dilogo de definicin del grfico. Las plantillas toman el formato de un grfico y lo aplican al nuevo grfico que se est generando. En general, se aplicar automticamente toda la informacin acerca del formato del antiguo grfico que sea posible aplicar al nuevo formato. Por ejemplo, si el antiguo grfico es un grfico de barras agrupadas en el que los colores de las barras son el amarillo y el verde, si el nuevo grfico es un grfico de lneas mltiples, las lneas sern amarillas y verdes. Si el antiguo grfico es un grfico de barras simple con sombras verticales y el nuevo grfico es un grfico de lneas simple, las lneas no tendrn sombras verticales, ya que las sombras verticales no se aplican a los grficos de lneas. Si hay ttulos en el grfico de plantilla pero no los hay en el nuevo grfico, se tomarn dichos ttulos del grfico de plantilla. Si hay ttulos definidos en el nuevo grfico, se utilizarn en lugar de los ttulos del grfico de plantilla.
Para crear una plantilla grfica
E Cree un grfico. E Edite el grfico para que contenga los atributos que desea tener en la plantilla. E En los mens del Editor de grficos, seleccione: Archivo Guardar plantilla grfica... E En el cuadro de dilogo Guardar plantilla grfica, especifique las caractersticas del
grfico que desea guardar en la plantilla. La ayuda en pantalla describe con detalle las opciones disponibles.
630 Captulo 41 E Pulse en Continuar. E Escriba el nombre del archivo y la ubicacin de la nueva plantilla. La extensin de
la plantilla es .sgt.
Curvas COR
42
Captulo
Este procedimiento es un mtodo til para evaluar la realizacin de esquemas de clasificacin en los que exista una variable con dos categoras por las que se clasifiquen los sujetos.
Ejemplo. Un banco tiene inters en clasificar a sus clientes dependiendo de si se
retrasarn o no en el pago de sus prstamos; por tanto, se desarrollan mtodos especiales para tomar estas decisiones. Las curvas COR se pueden utilizar para evaluar el grado de acierto de estos mtodos.
Estadsticos. Es un rea situada bajo la curva COR con un intervalo de confianza y
631
E Seleccione una o ms variables de probabilidad de contraste. E Elija una variable de estado. E Identifique el valor positivo para la variable de estado.
634 Captulo 42
positiva.
Parmetros para el error tpico del rea. Permite especificar el mtodo de estimacin
del error tpico del rea situada bajo la curva. Los mtodos disponibles son el no paramtrico y el exponencial binegativo. Tambin se puede establecer el nivel para el intervalo de confianza. El rango disponible es entre el 50,1% y el 99,9%.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos.
Utilidades
43
Captulo
En este captulo se describen las funciones del men Utilidades as como las opciones para posibilidad de reordenar las listas de variables de destino usando los mens de sistema de Windows.
636 Captulo 43
sintaxis designada. Para modificar la definicin de una variable, utilice la Vista de variables en el Editor de datos.
Para obtener informacin sobre la variable
E Elija en los mens: Utilidades Variables... E Seleccione la variable cuya informacin de definicin desee mostrar.
Los comentarios admiten cualquier longitud, aunque estn limitados a 80 bytes (por regla general, 80 caracteres en idiomas de un solo byte) por lnea; las lneas se dividen automticamente en 80 caracteres. Los comentarios se muestran en la misma fuente que los resultados de texto para reflejar de forma precisa el modo en que aparecen al mostrarlos en el Visor. Se aade de forma automtica una anotacin de fecha (la fecha actual entre parntesis) al final de la lista de comentarios siempre que se aaden o modifican los comentarios. Esto puede dar lugar a cierta ambigedad por lo que respecta a las fechas asociadas a los comentarios si modifica un comentario existente o introduce un comentario nuevo entre los comentarios existentes.
637 Utilidades
Conjuntos de variables
Puede restringir las variables que aparecen en las listas de variables de origen de un cuadro de dilogo, definiendo y utilizando los conjuntos de variables. Es especialmente til en archivos de datos con un amplio nmero de variables. Los conjuntos de variables pequeos hacen que la bsqueda y la seleccin de variables para los anlisis sea ms fcil y pueden incluso mejorar el rendimiento. Si el archivo de datos contiene un elevado nmero de variables y cuadros de dilogo que se abren con lentitud, restringir las listas de origen de un cuadro de dilogo a subconjuntos de variables ms pequeos reducira la cantidad de tiempo empleado en abrirlos.
Nombre del conjunto. Los nombres de los conjuntos pueden tener hasta 12 caracteres. Puede utilizar cualquier carcter, incluso los espacios en blanco. Los nombres de los conjuntos no distinguen maysculas de minsculas.
638 Captulo 43
de variables numricas, de cadena corta y cadena larga. El orden de las variables del conjunto no tiene ningn efecto en el orden de presentacin de las variables en las listas de origen del cuadro de dilogo. Una variable puede pertenecer a varios conjuntos.
Para definir conjuntos de variables
E Elija en los mens: Utilidades Definir conjuntos... E Seleccione las variables que desee incluir en el conjunto. E Introduzca un nombre para el conjunto (hasta 12 caracteres). E Pulse en Aadir conjunto.
Usar conjuntos
El cuadro de dilogo Usar conjuntos restringe las variables mostradas en las listas de origen de los cuadros de dilogo a los conjuntos seleccionados que haya definido.
Figura 43-3 Cuadro de dilogo Usar conjuntos
variables de origen en los cuadros de dilogo. Las variables aparecen ordenadas en las listas de origen por nombre o por archivo. El orden de conjuntos y de variables en
639 Utilidades
un conjunto no tiene ningn efecto en el orden de las variables de la lista de origen. Por defecto, se utilizan dos conjuntos definidos por el sistema:
ALLVARIABLES. Este conjunto contiene todas las variables del archivo de datos,
la sesin. Puede eliminar estos conjuntos de la lista y seleccionar otros, si bien debe haber al menos un conjunto en la lista. Si no elimina el conjunto ALLVARIABLES de la lista Conjuntos en uso, cualquier otro conjunto que incluya no tendr efecto alguno.
Para restringir las listas de origen de los cuadros de dilogo a los conjuntos de variables definidos
E Elija en los mens: Utilidades Usar conjuntos... E Seleccione los conjuntos de variables definidos que contengan las variables que desee
640 Captulo 43 Figura 43-4 Para acceder al mismo, pulse en la esquina superior izquierda del cuadro de dilogo). Men de sistema de Windows con reordenacin de la lista de destino
Mover seleccin arriba. Mover seleccin arriba. Mover seleccin abajo. Mueve las variables seleccionadas una posicin hacia abajo en
la lista de destino. Puede mover mltiples variables simultneamente si son contiguas (es decir, si estn agrupadas unas junto a otras). No es posible mover grupos de variables no contiguas.
Opciones
Controla una gran variedad de opciones, entre ellas:
44
Captulo
El diario de la sesin, que guarda un registro de todos los comandos ejecutados en cada sesin El orden en que aparecen las variables en las listas de origen de los cuadros de dilogo Los elementos mostrados y ocultos en los nuevos resultados Aspecto de tabla para las nuevas tablas pivote y Aspecto de grfico para los nuevos grficos interactivos Formatos de moneda personalizados Archivos de autoproceso y funciones de autoproceso para personalizar los resultados
Para modificar la configuracin de las opciones
E Elija en los mens: Edicin Opciones... E Pulse en las pestaas de las selecciones que desee cambiar. E Cambie las selecciones. E Pulse en Aceptar o Aplicar.
641
642 Captulo 44
General: Opciones
Figura 44-1 Pestaa general del cuadro de dilogo Opciones
Listas de variables. Controla la presentacin de las variables en las listas de los cuadros de dilogo. Es posible mostrar los nombres o las etiquetas de las variables. Estos nombres o etiquetas pueden presentarse por orden alfabtico o por orden de archivo, que es el orden en el que figuran en el archivo de datos (y en el que se muestran en la ventana Editor de datos). El orden de presentacin afecta slo a las listas de variables de origen. Las listas de variables de destino siempre reflejan el orden en el que las variables han sido seleccionadas. Diario de la sesin. El archivo de diario que registra todos los comandos ejecutados en una sesin. Incluye comandos introducidos y ejecutados en ventanas de sintaxis y comandos generados por elecciones de cuadros de dilogo. Puede editar este archivo y volver a utilizar los comandos en otras sesiones. Puede activar o desactivar el registro de sesin, aadir o sustituir el archivo diario y seleccionar el nombre y la ubicacin del
643 Opciones
mismo. Tambin es posible copiar la sintaxis de comandos de este archivo y guardarla en un archivo de sintaxis para utilizarla con la unidad de produccin automatizada.
Directorio temporal. Controla la ubicacin de los archivos temporales creados durante
una sesin. En el anlisis en modo distribuido (disponible con la versin de servidor), esto no afecta a la ubicacin de los archivos de datos temporales. En el modo distribuido, la ubicacin de los archivos de datos temporales est controlada por la variable de entorno SPSSTMPDIR, la cual se puede definir slo en el ordenador que ejecuta la versin del servidor del software. Si necesita cambiar la ubicacin del directorio temporal, pngase en contacto con el administrador del sistema.
Lista de archivos recientes. Controla el nmero de archivos utilizados recientemente
de la notacin cientfica para valores decimales pequeos en el resultado. Los valores decimales muy pequeos se muestran como 0 (o 0,000).
Tipo de visor al inicio. Determina el tipo de Visor que debe utilizarse y el formato de
los resultados. El Visor genera tablas pivote interactivas y grficos interactivos. El Visor de borrador convierte las tablas pivote en resultados de texto, y los grficos en metarchivos.
Sistema de medida. El sistema de medida utilizado (puntos, pulgadas o centmetros) para especificar atributos tales como los mrgenes de casillas de las tablas pivote, los anchos de casilla y el espacio entre las tablas para la impresin. Idioma. Determina el idioma que se utiliza para los resultados. No se aplica a
resultados en formato de slo texto, grficos interactivos ni mapas (disponibles con el mdulo adicional Mapas). Esta lista de idiomas disponibles depende de los archivos de idioma que estn instalados actualmente.
644 Captulo 44
Nota: Es posible que, en los procesos personalizados que se basan en cadenas de texto de un idioma especfico, estas cadenas no se ejecuten correctamente cuando se cambie el idioma de los resultados. Si desea obtener ms informacin, consulte Procesos: Opciones en p. 661.
Notificacin. Determina cmo debe notificar el programa al usuario que ha finalizado
645 Opciones
Estado inicial de los resultados. Controla los elementos que se muestran y se ocultan automticamente cada vez que se ejecuta un procedimiento, adems de la alineacin inicial de los elementos. Puede controlar la presentacin de los siguientes elementos: registro, advertencias, notas, ttulos, tablas pivote, grficos y resultados de texto (los resultados no se muestran en las tablas pivote). Tambin se puede activar o desactivar la muestra de los comandos en el registro. Se pueden copiar comandos de sintaxis del registro y guardarlos en un archivo de sintaxis para utilizarlos con la utilidad de produccin automtica.
Nota: Todos los elementos de resultados aparecen alineados a la izquierda en el Visor. Las selecciones de justificacin slo afectarn a la alineacin de los resultados impresos. Los elementos con alineacin centrada y a la derecha se identifican por un pequeo smbolo situado encima y a la izquierda del elemento.
Fuente del ttulo. Controla el estilo, el tamao y el color de la fuente de los nuevos ttulos de resultados. Fuente del ttulo de pgina. Controla el estilo, el tamao y el color de la fuente de los
nuevos ttulos de pgina y de los ttulos de pgina generados mediante la sintaxis de comandos TITLE y SUBTITLE o creados mediante Nuevo ttulo de pgina en el men Insertar.
Tamao de pgina de los resultados de texto. En los resultados de texto, controla el
ancho de pgina (expresado en nmero de caracteres) y el largo de pgina (expresado en nmero de lneas). En algunos procedimientos, algunos estadsticos se muestran slo en formato ancho.
Fuentes de los resultados de texto. Fuente utilizada para los resultados de texto. Los resultados de texto se han diseado para utilizarlos con fuentes de paso fijo. Si selecciona una fuente no monoespaciada, los resultados tabulares no se alinearn adecuadamente. La fuente de los resultados de texto se utiliza con el Asistente para la importacin de texto para mostrar el contenido de los archivos, que no se alinear si la fuente no es monoespaciada
646 Captulo 44 Figura 44-3 Pestaa Visor de borrador del cuadro dilogo Opciones
automticamente cada vez que se ejecuta un procedimiento. Puede controlar la presentacin de los siguientes elementos: el registro, las advertencias, las notas, los ttulos, los resultados tabulados y los resultados de texto (resultados separados por espacios). Tambin se puede activar o desactivar la muestra de los comandos en el registro. Se pueden copiar comandos de sintaxis del registro y guardarlos en un archivo de sintaxis para utilizarlos con la utilidad de produccin automtica.
Saltos de pgina entre. Inserta saltos de pgina entre los resultados de diferentes procedimientos y entre elementos de resultados individuales. Fuente. La fuente utilizada en los nuevos resultados. Slo se encuentran disponibles
las fuentes de paso fijo (monoespaciadas) porque los resultados de texto separados por espacios no pueden alinearse correctamente si se emplea una fuente proporcional.
647 Opciones
Resultados tabulares. Controla las opciones de los resultados de las tablas pivote
convertidos a resultados tabulares. Las especificaciones de ancho de columna y separadores de columna slo se encuentran disponibles si se selecciona Espacios como separador de columnas. En los resultados tabulares separados por espacios se eliminan por defecto todas las lneas de separacin y el ancho de cada columna queda determinado por la etiqueta o al valor ms largo contenido en la columna. Para limitar el ancho de las columnas y ajustar las etiquetas largas, especifique un nmero de caracteres para el ancho de la columna. Nota: Sin embargo, en el Visor de borrador, los resultados separados por tabuladores no se alinearn correctamente. Este formato resulta de utilidad para copiar y pegar resultados en aplicaciones de procesamiento de texto en las que se pueda utilizar cualquier fuente (y no slo las de paso fijo) y se puedan establecer tabuladores para alinear correctamente el resultado.
Resultados de texto. En los resultados de texto que no sean resultados de tablas pivote convertidos, controla el ancho de pgina (expresado en nmero de caracteres) y la longitud de pgina (expresada en nmero de lneas). En algunos procedimientos, algunos estadsticos se muestran slo en formato ancho.
648 Captulo 44 Figura 44-4 Pestaa Etiquetas de los resultados del cuadro de dilogo Opciones
Las opciones de etiquetas de los resultados afectan slo a los nuevos resultados que se producen despus de cambiar las selecciones. A los resultados que ya se muestran en el Visor no les afectan los cambios en la configuracin. Esta configuracin slo afecta a los resultados de las tablas pivote. Los resultados de texto no se vern afectados por estas selecciones.
649 Opciones
Opciones de grfico
Figura 44-5 Pestaa Grficos del cuadro de dilogo Opciones
Plantilla grfica. Los grficos nuevos pueden utilizar tanto las opciones seleccionadas
aqu, como las opciones de un archivo de plantilla grfica. Pulse en Examinar para seleccionar un archivo de plantilla grfica. Para crear un archivo de plantilla grfica, cree un grfico con los atributos que desee y gurdelo como una plantilla (seleccione Guardar plantilla grfica en el men Archivo).
Relacin de aspecto de los grficos. La relacin ancho-alto del marco exterior de los nuevos grficos. Puede especificar una relacin ancho-alto entre los valores 0,1 y 10,0. Los valores inferiores a 1 generan grficos que son ms altos que anchos. Los valores mayores que 1 producen grficos que son ms anchos que altos. Un valor de 1 produce un grfico cuadrado. Una vez creado un grfico, no es posible cambiar su relacin de aspecto.
650 Captulo 44
Ejecutar JVM al iniciar. Las funciones de los grficos requieren la mquina virtual Java (JVM). Por defecto, la JVM se lanza cuando se inicia una sesin de SPSS. Si anula la seleccin (desactiva) de esta opcin, SPSS se iniciar ms rpido, pero se producirn pequeos retrasos al lanzar la JVM la primera vez que utilice el generador de grficos o cree un grfico en una sesin. Fuente. La fuente utilizada para todo el texto en los nuevos grficos. Preferencia de ciclos de estilo. La asignacin inicial de colores y tramas para nuevos
grficos. Mostrar sucesivamente slo los colores utiliza nicamente colores para diferenciar los elementos grficos y no utiliza tramas. Mostrar sucesivamente slo las tramas slo utiliza estilos de lnea, smbolos de marcador o tramas de relleno para diferenciar los elementos grficos y no utiliza color.
Marco. Controla la presentacin de los marcos interno y externo en los nuevos
grficos.
Lneas de cuadrcula. Controla la presentacin de las lneas de cuadrcula de los ejes
tramas de relleno para los grficos nuevos. Puede cambiar el orden de los colores o tramas utilizados al crear un grfico nuevo. Nota: Estas opciones no afectan a los grficos interactivos (men Grficos, submen Interactivo).
651 Opciones
categoras. Para cambiar el color de una categora, seleccinela y elija un color en la paleta para dicha categora. Si lo desea, puede: Insertar una nueva categora por encima de la categora seleccionada. Desplazar una categora seleccionada. Eliminar una categora seleccionada. Restablecer la secuencia por defecto. Editar un color mediante la seleccin de su casilla y pulsando en Editar.
con categoras. Para cambiar el estilo de lnea de una categora, seleccinela y elija un estilo de lnea en la paleta para dicha categora.
652 Captulo 44
Si lo desea, puede: Insertar una nueva categora por encima de la categora seleccionada. Desplazar una categora seleccionada. Eliminar una categora seleccionada. Restablecer la secuencia por defecto.
categoras. Para cambiar el smbolo de marcador de una categora, seleccinela y elija un smbolo en la paleta para dicha categora. Si lo desea, puede: Insertar una nueva categora por encima de la categora seleccionada. Desplazar una categora seleccionada. Eliminar una categora seleccionada. Restablecer la secuencia por defecto.
653 Opciones
categoras. Para cambiar la trama de relleno de una categora, seleccinela y elija una trama de relleno en la paleta para dicha categora. Si lo desea, puede: Insertar una nueva categora por encima de la categora seleccionada. Desplazar una categora seleccionada. Eliminar una categora seleccionada. Restablecer la secuencia por defecto.
654 Captulo 44
Para los grficos interactivos (men Grficos, submen Interactivo) se encuentran disponibles las siguientes opciones:
Aspecto de grfico. Seleccione un aspecto de grfico en la lista de archivos y pulse en
Aceptar o Aplicar. Por defecto, la lista muestra los aspectos de grfico guardados en el directorio Looks del directorio donde se instal el programa. Puede utilizar uno de los aspectos de grfico que se incluyen en SPSS, o bien crear uno propio en el Editor de grficos interactivos (men Formato, Aspectos de grfico con un grfico activado).
655 Opciones
Datos guardados con el grfico. Controla la informacin que se guarda con los grficos interactivos cuando dejan de estar anexados al archivo de datos que los cre (por ejemplo, si abre un archivo del Visor guardado en una sesin anterior). El almacenamiento de los datos con el grfico permite utilizar la mayora de las funciones interactivas disponibles para los grficos anexados al archivo de datos que los cre (exceptuando la adicin de variables no incluidas en el grfico original). Sin embargo, esta opcin puede aumentar considerablemente el tamao de los archivos del Visor, especialmente el de los archivos de datos de gran tamao. Resolucin de impresin. Determina la resolucin de impresin de los grficos
interactivos. En la mayora de los casos, Metarchivo de vectores imprimir ms rpido y proporcionar los mejores resultados. Para mapas de bits, los grficos de baja resolucin se imprimen con mayor rapidez; los de alta resolucin son de mejor calidad.
Unidades de medida. Sistema de medida utilizado (puntos, pulgadas o centmetros) para especificar atributos tales como el tamao de la regin de datos de un grfico. Lectura de archivos de datos anteriores a 8.0. Para los archivos de datos creados en versiones anteriores de SPSS, los datos ledos de los formatos de archivo externos y las variables nuevas creadas en una sesin, es posible especificar el nmero mnimo de valores de datos que deben considerarse en una variable numrica para clasificarla como variable de escala o nominal. Las variables con un nmero de valores nicos inferior al especificado se clasificarn como nominales.
Nota: Con la excepcin del nivel de medida, estas opciones slo afectan a los grficos interactivos (men Grficos, submen Interactivo).
656 Captulo 44 Figura 44-7 Pestaa Tablas pivote del cuadro de dilogo Opciones
directorio Looks del directorio donde se instal el programa. Puede utilizar uno de los aspectos de tabla que se incluye en SPSS, o bien crear uno propio en el editor de tablas pivote (men Formato, Aspectos de tabla).
Examinar. Permite seleccionar un aspecto de tabla de otro directorio. Establecer directorio de aspectos. Le permite cambiar el directorio de aspectos
por defecto.
Ajustar los anchos de columna para. Controla el ajuste automtico de los anchos de
657 Opciones
columna. As se generan tablas ms compactas, pero no se mostrarn los valores de los datos ms anchos que la etiqueta (los asteriscos indican valores demasiado anchos para ser mostrados).
Etiquetas y Datos. Ajusta el ancho de columna al ms ancho de entre la etiqueta de
columna y el mayor de los valores de los datos. As se generan tablas ms anchas, pero se asegura que se mostrarn todos los valores.
Modo de edicin por defecto. Controla la activacin de las tablas pivote en la ventana
del Visor o en una ventana independiente. Por defecto, cuando se pulsa dos veces en una tabla pivote, sta se activa en la ventana del Visor. Puede elegir entre activar las tablas pivote en una ventana independiente o seleccionar una opcin de tamao que abra las tablas pivote ms pequeas en la ventana del Visor y las ms grandes en una ventana independiente.
658 Captulo 44
Datos: Opciones
Figura 44-8 Pestaa Datos del cuadro de dilogo Opciones
Opciones de transformacin y fusin. Cada vez que SPSS ejecuta un comando, lee
el archivo de datos. Algunas transformaciones de datos (tales como Calcular y Recodificar) no requieren una lectura diferente de los datos; esto permite postergar su ejecucin hasta que el programa lea los datos para ejecutar otro comando, como puede ser un procedimiento estadstico. Para los archivos de datos largos, seleccione Calcular los valores antes de usarlos para retrasar la ejecucin y ganar tiempo de procesamiento.
Formato de presentacin para las nuevas variables numricas. Controla la presentacin
por defecto del ancho y el nmero de posiciones decimales de las nuevas variables numricas. No existe formato de presentacin por defecto para las nuevas variables de cadena. Si un valor es demasiado largo para el formato de presentacin especificado, primero se redondean las posiciones decimales y despus los valores se convierten a notacin cientfica. Los formatos de presentacin no afectan a los valores de datos
659 Opciones
internos. Por ejemplo, el valor 123456,78 se puede redondear a 123457 para la presentacin, pero se utilizar el valor original sin redondear en cualquier clculo.
Definir rango de siglo para aos de dos dgitos. Define el rango de aos para las
variables con formato de fecha introducidas o mostradas con un ao de dos dgitos (por ejemplo, 10/28/86, 29-OCT-87). La opcin de rango automtico se basa en el ao actual; es decir, comienza 69 aos antes del actual y finaliza 30 aos despus (sumando el ao en curso hace un total de 100 aos). En el rango personalizado, el ao final se establece de forma automtica en funcin del valor introducido en el ao inicial.
Generador de nmeros aleatorios. Hay dos generadores de nmeros aleatorios
disponibles:
Compatible con SPSS 12. El generador de nmeros aleatorios utilizado en SPSS 12
y versiones anteriores. Utilice este generador de nmeros aleatorios si necesita reproducir los resultados aleatorizados generados por versiones previas basadas en una semilla de aleatorizacin especificada.
Tornado de Mersenne. Un generador de nmeros aleatorios nuevo que es ms
fiable en los procesos de simulacin. Utilice este generador de nmeros aleatorios si no es necesario reproducir resultados aleatorizados correspondientes a SPSS 12 o anteriores.
Moneda: Opciones
Puede crear hasta cinco formatos de presentacin de moneda personalizados que pueden incluir caracteres de prefijo y sufijo especiales adems de un tratamiento especial para los valores negativos. Los nombres de los cinco formatos de moneda personalizados son MPA, MPB, MPC, CCD y MPE. No se pueden cambiar los nombres de los formatos ni aadir otros nuevos. Para modificar un formato de moneda personalizado, seleccione el nombre del formato de la lista de origen y realice los cambios que desee.
660 Captulo 44 Figura 44-9 Pestaa Moneda del cuadro de dilogo Opciones
Los prefijos, los sufijos y los separadores decimales definidos para los formatos monetarios personalizados slo afectan a la presentacin en la pantalla. No es posible introducir valores en el Editor de datos utilizando caracteres de moneda personalizados.
661 Opciones
Procesos: Opciones
Utilice la pestaa Procesos para especificar el archivo de procedimientos global y el archivo de autoproceso, y para seleccionar las subrutinas de autoproceso que desee utilizar. Puede utilizar procesos para automatizar muchas funciones, incluyendo la personalizacin de tablas pivote.
Procedimientos globales. Un archivo de procedimientos globales es una biblioteca de
subrutinas de proceso y funciones que pueden ser invocadas por archivos de proceso, incluyendo los archivos de autoproceso. Nota: los procedimientos globales que acompaan al programa son los que aparecen seleccionados por defecto. Muchos de los procesos que se ofrecen utilizan funciones y subrutinas de este archivo de procedimientos global y no funcionarn si se especifica un archivo de procedimientos diferente.
Autoprocesos. Un archivo de autoproceso es un conjunto de subrutinas de proceso
que se ejecutan automticamente cada vez que se ejecutan procedimientos que crean ciertos tipos de objetos de resultados.
662 Captulo 44 Figura 44-10 Pestaa Procesos del cuadro de dilogo Opciones
Muestra todas las subrutinas del archivo de autoprocesos actual, permitiendo activar y desactivar subrutinas individuales.
45
Captulo
Puede personalizar los mens utilizando el Editor de mens. Con el Editor de mens es posible: Aadir elementos de men que ejecuten procesos personalizados. Aadir elementos de men que ejecuten archivos de sintaxis de comandos. Aadir elementos de men que ejecuten otras aplicaciones y enven los datos automticamente a otras aplicaciones. Puede enviar datos a otras aplicaciones en los siguientes formatos: SPSS, Excel 4.0, Lotus 1-2-3 versin 3, SYLK, delimitado por tabuladores y dBASE IV.
664 Captulo 45 E Pulse en Examinar para seleccionar un archivo que sea anexionado al elemento de
men.
Figura 45-1 Cuadro de dilogo Editor de mens
Tambin se pueden aadir mens completamente nuevos y separadores entre los elementos de men. Si lo desea, puede enviar automticamente el contenido del Editor de datos a otra aplicacin cuando seleccione esa aplicacin en los mens.
pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos.
Figura 45-2 Cuadro de dilogo Mostrar barras de herramientas
herramientas, seleccione las ventanas en las que desea que aparezca y pulse en Personalizar.
E Seleccione un elemento en la lista Categoras para que se visualicen las herramientas
en el cuadro de dilogo.
666 Captulo 45 E Para eliminar una herramienta de la barra de herramientas, arrstrela a cualquier punto
fuera de la barra de herramientas que aparece en el cuadro de dilogo. Para crear una herramienta personalizada que abra un archivo, ejecute un archivo de sintaxis de comandos o ejecute un proceso:
E Pulse en Nueva herramienta en el cuadro de dilogo Personalizar barra de herramientas. E Introduzca una etiqueta descriptiva para la herramienta. E Seleccione la accin que desee realizar con la herramienta (abrir un archivo, ejecutar
herramienta. Las nuevas herramientas se muestran en la categora Personales, que adems contiene los elementos de men definidos por el usuario.
668 Captulo 45
669 Personalizacin de mens y barras de herramientas Figura 45-6 Editor de mapa de bits
Unidad de produccin
46
Captulo
La Unidad de produccin ofrece la posibilidad ejecutar el programa en modo automtico. El programa se ejecuta por su cuenta y finaliza tras ejecutar el ltimo comando, de esta forma podr realizar mientras tanto otras tareas. Modo de produccin es til si se ejecuta a menudo el mismo conjunto de anlisis que consumen mucho tiempo, tales como los informes semanales. La unidad de produccin utiliza archivos de sintaxis de comandos para indicarle al programa qu hacer. Un archivo de sintaxis de comandos es un archivo de slo texto que contiene sintaxis de comandos. Puede utilizar cualquier editor de textos para crearlo. Tambin puede generar la sintaxis de comandos pegando las selecciones del cuadro de dilogo en una ventada de sintaxis o editando el archivo de diario. Despus de crear los archivos de sintaxis y de incluirlos en un trabajo de produccin, puede revisarlos y editarlos en la propia Unidad de produccin.
671
para el trabajo:
Interactivo. Cada comando debe finalizar con un punto. Los puntos pueden
aparecer en cualquier parte del comando y los comandos pueden continuar en varias lneas, aunque un punto como ltimo carcter no en blanco en una lnea se interpreta como el final del comando. Las lneas de continuacin y los comandos nuevos pueden empezar en cualquier parte de una lnea nueva. Se trata de reglas interactivas que surten efecto al seleccionar y ejecutar comandos en una ventana de sintaxis.
Lote. Cada comando debe comenzar al principio de una lnea nueva (sin espacios
en blanco antes del inicio del comando) y las lneas de continuacin se deben sangrar como mnimo un espacio. Si desea sangrar comandos nuevos, puede utilizar un signo ms o un punto como primer carcter al inicio de la lnea y, a continuacin, sangrar el comando. El punto del final del comando es opcional. Este ajuste es compatible con las reglas de sintaxis para los archivos de comandos incluidos con el comando INCLUDE.
Comportamiento de errores de sintaxis. Controla el tratamiento de errores en el trabajo: Continuar. Los errores del trabajo no detienen automticamente el procesamiento
de los comandos. Los comandos de los archivos de trabajo de produccin se tratan como parte de la secuencia de comandos normal y el procesamiento de comandos contina del modo normal.
Detener. El procesamiento de comandos se detiene si se detecta un primer error en
el archivo de trabajo de produccin. Esto es compatible con el comportamiento de los archivos de comandos incluidos con el comando INCLUDE.
Resultados del trabajo de produccin. Cada ejecucin de produccin crea un archivo de
resultados con el mismo nombre que el trabajo de produccin y la extensin .spo. Por ejemplo, un archivo de trabajo de produccin llamado trabprod.spp crear un archivo de resultados llamado trabprod.spo. El archivo de resultados es un documento del Visor.
Tipos de resultados. Los resultados del Visor generan tablas pivote y grficos interactivos de alta resolucin. Los resultados del Visor de borrador producen resultados de texto e imgenes de metarchivo de grficos. Los resultados de texto se pueden editar en el Visor de borrador, pero no los grficos.
674 Captulo 46
Opciones de exportacin
Exportar resultados guarda las tablas pivote y los resultados de texto en formato HTML, de texto, Word/RTF y Excel y guarda los grficos en una amplia variedad de formatos comunes utilizados por otras aplicaciones.
Figura 46-2 Cuadro de dilogo de opciones de exportacin
Exportar
de texto y grficos. Para los formatos HTML y de texto, los grficos se exportan en el formato de exportacin de grficos seleccionado actualmente. Si se trata de documentos HTML, los grficos se incrustan mediante referencias y deben exportarse a un formato adecuado para incluirlos en los documentos HTML. En el caso de documentos de texto se inserta una lnea en el archivo de texto para cada grfico, indicando el nombre de archivo del grfico exportado. Para los formatos Word o RTF, los grficos se exportan en formato de metarchivo de Windows y se incrustan en el documento de Word. No se incluyen grficos en los documentos de Excel.
Documento de resultados (sin grficos). Exporta tablas pivote y resultados de texto. Se
y PICT de Macintosh. Para documentos de Word o RTF, los grficos siempre se exportan en formato de metarchivo de Windows (WMF).
Formato de exportacin
Para los documentos de resultados, las opciones disponibles son HTML, texto, Word/RTF y Excel; para los formatos HTML y de texto, los grficos se exportan en el formato de grfico seleccionado actualmente. Para Slo grficos, seleccione un formato de exportacin del grfico en la lista desplegable. Para exportar documentos de resultados, tablas pivote y texto, siga las instrucciones siguientes:
Archivo HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los
por tabuladores o por espacios. Todos los resultados de texto se exportan en formato separado por espacios.
Archivo de Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan
como filas, columnas y casillas de Excel, con todos los atributos de formato intactos (por ejemplo, bordes de casilla, estilos de fuente, colores de fondo, etc.). Los resultados de texto se exportan con todos los atributos de fuente intactos. Cada lnea del resultado de texto constituye una fila del archivo de Excel y se incluye todo su contenido en una sola casilla.
Archivo de Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word,
con todos los atributos de formato intactos (por ejemplo, bordes de casilla, estilos de fuente, colores de fondo, etc.). Los resultados de texto se exportan en formato RTF. Los resultados de texto siempre se muestran en SPSS con un tipo de letra de paso fijo (monoespaciadas) y se exportan con los mismos atributos de fuente. Es necesario utilizar una fuente de paso fijo para que los resultados de texto separado por espacios queden correctamente alineados; por defecto, la mayora de los navegadores de Web utilizan una fuente de paso fijo para el texto con formato previo.
Formato de imagen
Formato de imagen controla el formato de exportacin de los grficos. Los formatos disponibles son: Metarchivo mejorado (EMF), metarchivo de Windows (WMF), mapa de bits de Windows (BMP), PostScript encapsulado (EPS), JPEG, TIFF, PNG o PICT de Macintosh.
676 Captulo 46
Los nombres de los grficos exportados se basan en el nombre de archivo del trabajo de produccin, un nmero secuencial y la extensin del formato seleccionado. Por ejemplo, si el trabajo de produccin prodjob.spp exporta grficos al formato de metarchivo de Windows, los nombres del grfico seran prodjob1.wmf, prodjob2.wmf, prodjob3.wmf y as sucesivamente.
Opciones de texto e imgenes
Las opciones de exportacin de texto (por ejemplo, separado por tabuladores o por espacios) y las opciones de exportacin de grficos (como el color, el tamao y la resolucin) estn predefinidas en SPSS y no se pueden cambiar en la Unidad de produccin. Utilice la opcin Exportar del men Archivo en SPSS para modificarlas.
Exportacin del Visor de borrador
El Visor de borrador slo permite exportar los resultados en formato de slo texto. No se pueden exportar los grficos de los resultados.
677 Unidad de produccin Figura 46-3 Cuadro de dilogo de entradas del usuario
de comandos para invocar la macro que solicita informacin al usuario. El nombre de smbolo de macro debe comenzar por @. Nota: Estos smbolos de macro no guardan relacin con las macros creadas mediante la funcin de macros SPSS usando DEFINE-!ENDDEFINE.
Prompt (Entrada). Etiqueta descriptiva que se muestra cuando el trabajo de produccin solicita al usuario que introduzca informacin. Por ejemplo, podra utilizar la frase Qu archivo de datos desea utilizar? para identificar un campo que requiera el nombre de un archivo de datos. Default (Por defecto). Valor que utiliza por defecto el trabajo de produccin si no se introduce un valor nuevo. Este valor se muestra cuando el trabajo de produccin solicita informacin al usuario. Puede sustituir o modificar el valor en el momento de la ejecucin. Enclose Value in Quotes (Desea poner el valor entre comillas?) Introduzca Y o Yes (S) si desea que el valor aparezca entre comillas. En caso contrario, deje el campo en blanco o introduzca N o No. Por ejemplo, para especificar un nombre de archivo
678 Captulo 46
debe escribir Yes (S) ya que las especificaciones de nombres de archivos deben ir entre comillas.
Figura 46-4 Entradas de macro en un archivo de sintaxis de comandos
679 Unidad de produccin Figura 46-5 Cuadro de dilogo de solicitud de entrada del usuario para las macros de produccin
Nota: Estos smbolos de macro no guardan relacin con las macros creadas mediante la funcin de macros de SPSS usando DEFINE-!ENDDEFINE, y el trabajo de produccin informar de estos valores incluso cuando ninguno de los archivos de sintaxis de comandos en el trabajo incluyan referencias a las macros definidas.
Opciones de produccin
Las opciones de produccin permiten: Especificar un editor de textos por defecto para los archivos de sintaxis a los que se accede mediante el botn Edit (Editar) del cuadro de dilogo principal. Ejecutar el trabajo de produccin como un proceso invisible en segundo plano o ver los resultados generados a medida que se ejecuta el trabajo. Especifique un servidor remoto, un nombre de dominio, un ID de usuario y una contrasea para el anlisis en modo distribuido (slo si tiene acceso de red a la versin de SPSS del servidor). Si no especifica estos ajustes, se utilizarn los ajustes por defecto del cuadro de dilogo Acceso al servidor SPSS. Slo se pueden seleccionar servidores remotos que se hayan definido previamente en el cuadro de dilogo Aadir servidor en SPSS (men Archivo, Cambiar servidor, Aadir).
pivote activada), podr controlar muchos de los atributos de las tablas pivote. Puede especificar tamaos y estilos de fuente, colores y bordes. Para asegurarse de que las tablas anchas no se dividen en varias pginas, seleccione Reducir tabla ancha para caber en la pgina en la pestaa Impresin del cuadro de dilogo Propiedades de tabla.
Edicin, Opciones, pestaa Etiquetas de los resultados) controlan la presentacin de la informacin de las variables y los valores de los datos en las tablas pivote. Puede mostrar los nombres de variable o las etiquetas de variable definidas, los valores actuales de los datos o las etiquetas de valor definidas. Generalmente, las etiquetas descriptivas de variable y de valor suelen facilitar la interpretacin de los resultados, pero en algunas tablas puede que las etiquetas largas estorben.
Ancho de columna. Las opciones de las tablas pivote (men Edicin, Opciones,
pestaa Tablas pivote) determinan el Aspecto de tabla por defecto y el ajuste automtico de los anchos de columna en las tablas pivote.
Slo las etiquetas. Ajusta el ancho de columna al ancho de la etiqueta de la
columna. As se generan tablas ms compactas, pero no se mostrarn los valores de los datos ms anchos que la etiqueta (los asteriscos indican valores demasiado anchos para ser mostrados).
Etiquetas y Datos. Ajusta el ancho de columna al ms ancho de entre la etiqueta de
columna y el mayor de los valores de los datos. As se generan tablas ms anchas, pero se asegura que se mostrarn todos los valores. Los trabajos de produccin utilizan el Aspecto de tabla actual y las opciones vigentes. Puede establecer el Aspecto de tabla y la configuracin de las opciones antes de ejecutar el trabajo de produccin, o utilizar los comandos SET dentro de los archivos de sintaxis para controlar estas particularidades. El empleo de los comandos SET en los archivos de sintaxis permite utilizar varios aspectos de tabla y configuraciones de las opciones en un mismo trabajo.
682 Captulo 46 E Pulse en Guardar aspecto o en Guardar como para guardar el aspecto de tabla y, despus, en Aceptar. E Elija en los mens: Edicin Opciones... E Pulse en la pestaa Tablas pivote. E Elija el aspecto de tabla en la lista y pulse en Aceptar.
Puede definir el Aspecto de tabla por defecto, las opciones de las etiquetas de los resultados y el ajuste automtico del ancho de columna en el cuadro de dilogo Opciones. Los ajustes realizados en Opciones se guardarn con el programa. Cuando se ejecuta un trabajo de produccin, se aplican los ajustes de Opciones vigentes la ltima vez que se ejecut el programa.
como en:
SET TLOOK = 'c:\trabsprod\mitabla.tlo'.
SET ONUMBER. Controla la presentacin de los valores de los datos o las etiquetas de valor en las nuevas tablas pivote.
SET ONUMBER = LABELS muestra las etiquetas de valor. SET ONUMBER = VALUES muestra los valores de datos. SET ONUMBER = BOTH muestra los valores de datos y las etiquetas de valor.
SET TFIT. Controla el ajuste automtico del ancho de columna para las nuevas tablas
pivote.
SET TFIT = LABELS ajusta el ancho de columna al ancho de la etiqueta de
la columna.
SET TFIT = BOTH ajusta el ancho de columna al ancho de etiqueta de columna
advertencia. Se utilizan automticamente los valores de entrada del usuario por defecto.
Anlisis distribuidos. Si dispone de acceso de red a la versin de SPSS en el servidor,
tambin podr utilizar los siguientes modificadores para ejecutar la unidad de produccin en los anlisis en modo distribuido:
-x. Nombre o direccin IP del servidor remoto. -n. Nmero de puerto. -d. Nombre del dominio. -u. ID del usuario para acceder al servidor de remoto.
684 Captulo 46
Si especifica algn modificador de las lneas de comando cuando realiza un anlisis distribuido, debe especificar tambin todos los modificadores de lnea de comando en el anlisis distribuido (-x, -n, -d, -u y -p). Debe indicar la ruta completa tanto para la unidad de produccin (spssprod.exe) como para el trabajo de produccin, y ambos deben ir entre comillas, como en:
"c:\archivos de programa\spss\spssprod.exe" "c:\spss\datostrabajo\trabprod.spp" -s -r
En aquellos casos en los que los modificadores de lnea de comandos requieren especificaciones adicionales, detrs del modificador debe ir un signo igual y, a continuacin, la especificacin. Si la especificacin contiene espacios (como un nombre de servidor con dos palabras), el valor debe ir entre comillas o apstrofos, como por ejemplo:
-x="HAL 9000" -u="palabra secreta"
el servidor por defecto y la informacin relacionada (si no se especifica en los modificadores de la lnea de comandos) es el servidor especificado por defecto en el cuadro de dilogo Acceso al servidor SPSS. Si no se especific ningn servidor por defecto, el trabajo se ejecutar en el modo local. Si desea ejecutar un trabajo de produccin en modo local pero el ordenador local no es el servidor por defecto, especifique cadenas entre comillas nulas para todos los modificadores de la lnea de comandos en el anlisis distribuido, como por ejemplo:
"c:\archivos de programa\spss\spssprod.exe" "c:\spss\datostrabajo\trabprod.spp" -x="" -n="" -d="" -u="" -p=""
Si utiliza un archivo por lotes (.bat) o una unidad similar para ejecutar varios trabajos de produccin, utilice el comando Start de Windows con el modificador /wait para controlar la ejecucin de cada trabajo e impedir as que los trabajos posteriores se inicien antes de que finalice el trabajo anterior como ocurre en:
cd \program files\spss start /wait spssprod.exe prodjob1.spp -s start /wait spssprod.exe prodjob2.spp -s
Publicar en Web
La opcin Publicar en Web exporta los resultados al servidor web SmartViewer para su publicacin. Las tablas e informes publicados en SmartViewer se pueden visualizar y manipular a travs de la Web, en tiempo real utilizando un explorador estndar. Las tablas pivote se publican como tablas dinmicas que se pueden manipular a travs de la Web para obtener diferentes vistas de los datos. Los grficos se publican como archivos grficos JPEG o PNG. Los resultados de texto se publican como formato previo de HTML. (Por defecto, la mayora de los navegadores Web utilizan un tipo de letra de anchura fija para mostrar el texto con formato.)
Publicar. Permite especificar los resultados que se desea publicar: Documento de salida. Publica todo el documento de resultados, incluyendo los
el trabajo de produccin (archivo .spp), los resultados se publicarn cada vez que ejecute el trabajo de produccin a no ser que seleccione Nada. Esta opcin
686 Captulo 46
desactiva la publicacin pero no la generacin de otros tipos de salidas (archivos del Visor, archivos HTML) especificadas en el trabajo de produccin.
Publicar tablas como. Controla el modo de publicacin de las tablas pivote: Interactivo. Las tablas son objetos dinmicos que se pueden manipular desde la
publicacin.
Configurar. Abre la pgina Configurar publicacin automtica del servidor web SmartViewer en una ventana del navegador. Se requiere cuando se crea un nuevo trabajo de produccin para publicar en la Web. Tambin es necesario una identificacin de usuario y una contrasea para acceder al servidor web SmartViewer. Cuando cree un nuevo trabajo de produccin para publicar en la Web, se le solicitar una identificacin de usuario y una contrasea. Esta informacin se almacena en el trabajo de produccin con un formato encriptado.
Nota: Publicar en web slo est disponible para sitios que tengan instalado el servidor web SmartViewer y es necesario un complemento para activar la funcin de publicacin. Pngase en contacto con su administrador del sistema o administrador del servidor web para obtener instrucciones sobre la descarga del complemento. Si SmartViewer no est disponible en su sitio web, utilice Exportar resultados para guardar los resultados en formato HTML.
47
Captulo
La utilidad de procesamiento permite automatizar tareas, entre las que se incluyen: Apertura y almacenamiento de archivos de datos. Visualizacin de cuadros de dilogo y trabajo con ellos. Ejecucin de transformaciones de datos y procedimientos estadsticos utilizando la sintaxis de comandos. Exportacin de grficos como archivos de grficos en diversos formatos. Personalizacin de los resultados en el Visor. Con el programa se incluyen varios procesos, entre ellos algunos autoprocesos que se ejecutan automticamente siempre que se produce un tipo concreto de resultado. Puede utilizar estos procesos tal y como son o personalizarlos segn sus necesidades. Si desea crear sus propios procesos, puede empezar por elegir entre un nmero de procesos de iniciacin.
687
Si desea obtener ms informacin, consulte Personalizacin de mens y barras de herramientas en Captulo 45 en p. 663.
los casos no seleccionados en un anlisis anterior. Antes de ejecutar el proceso se debe seleccionar una tabla Notas producida por una ejecucin anterior del anlisis factorial o discriminante.
Cambiar sig a p. Cambia Sig. a p= en las etiquetas de columna de cualquier tabla
Antes de ejecutar el proceso el documento debe estar abierto en la ventana del Visor designada.
Pie de pgina frec. Inserta los estadsticos mostrados en una tabla de estadsticos de frecuencias como notas al pie en la tabla de frecuencias correspondiente para cada variable. Antes de ejecutar el proceso se debe seleccionar la tabla de estadsticos de frecuencia. Totales en negrita. Aplica el formato negrita y el color azul a cualquier fila, columna
o capa de datos con la etiqueta Total en una tabla pivote. Se debe seleccionar la tabla antes de ejecutar el proceso.
Informe de medias. Extrae informacin de una tabla Medias y escribe los resultados en
varios archivos de resultados ASCII. Antes de ejecutar el proceso se debe seleccionar la tabla Medias.
Eliminar etiquetas. Elimina todas las etiquetas de fila y columna de la tabla pivote
de negrita y el color azul a la fila correspondiente al modelo que maximiza la Rcuadrado corregida. Se debe seleccionar la tabla de resumen del modelo antes de ejecutar el proceso. Si desea obtener ms informacin, consulte Opciones en Captulo 44 en p. 641. Nota: esta lista puede estar incompleta.
Autoprocesos
Los autoprocesos se ejecutan automticamente al ser activados cuando se crea una pieza especfica de resultados con un procedimiento dado. Por ejemplo, uno de los autoprocesos elimina automticamente la diagonal superior y resalta los coeficientes de correlacin inferiores a una significacin determinada siempre que se genera una tabla de correlaciones mediante el procedimiento Correlaciones bivariadas. La pestaa Procesos del cuadro de dilogo Opciones (men Edicin) muestra los autoprocesos que estn disponibles en el sistema y permite activar o desactivar procesos individuales.
690 Captulo 47 Figura 47-2 Pestaa Procesos del cuadro de dilogo Opciones
Los autoprocesos son especficos para un procedimiento y un tipo de resultados concreto. Un autoproceso que da formato a las tablas de ANOVA producidas por ANOVA de un factor no se activa con las tablas de ANOVA generadas por otros procedimientos estadsticos (aunque puede utilizar procedimientos globales para crear distintos autoprocesos para estas otras tablas que comparten buena parte del mismo cdigo). Sin embargo, puede disponer de un autoproceso diferente para cada tipo de resultado producido por el mismo procedimiento. Por ejemplo, Frecuencias genera tanto una tabla de frecuencias como una tabla de estadsticos y puede tener un autoproceso diferente para cada uno. Si desea obtener ms informacin, consulte Opciones en Captulo 44 en p. 641.
Si prefiere crear sus propios procesos, puede comenzar eligiendo entre varios procesos iniciales.
E Seleccione la carpeta de procesos Scripts. E En Tipo de archivos, seleccione Proceso de SPSS (*.sbs). E Seleccione el proceso que desee.
Ventana de proceso
La ventana de proceso es un entorno de programacin completo que utiliza el lenguaje Sax BASIC e incluye un editor de cuadros de dilogo, un Visor de objetos, funciones de depuracin y ayuda sensible al contexto.
Segn mueva el cursor, el nombre del procedimiento actual aparecer en la parte superior de la ventana. Los trminos en color azul son palabras reservadas en BASIC (por ejemplo, Sub, End Sub y Dim). Puede acceder a la ayuda sensible al contexto para estos trminos pulsando en ellos y, a continuacin, en F1. Los trminos en color magenta son objetos, propiedades o mtodos de SPSS. Tambin puede pulsar en ellos y, despus, en F1 para obtener ayuda, pero slo cuando aparezcan en instrucciones vlidas y en color magenta. Si pulsa en el nombre de un objeto en un comentario, acceder a la ayuda sobre el lenguaje Sax BASIC en lugar de a la ayuda sobre los objetos de SPSS. Los comentarios se muestran en color verde. Pulse F2 en cualquier momento para abrir el Visor de objetos, que muestra objetos, propiedades y mtodos de SPSS.
694 Captulo 47
Procesos de iniciacin
Si desea crear un proceso nuevo, puede comenzar eligiendo uno de los diversos procesos de iniciacin que se ofrecen.
695 Utilidad de procesamiento de SPSS Figura 47-7 Cuadro de dilogo Utilizar proceso de iniciacin
Cada proceso de iniciacin proporciona el cdigo para uno o varios procedimientos comunes, e incluye comentarios con consejos sobre cmo personalizar el proceso segn sus necesidades particulares.
Borrar por etiqueta. Elimina filas o columnas de una tabla pivote en funcin del
contenido de RowLabels o ColumnLabels. Para que funcione este proceso, la opcin Ocultar filas y columnas vacas del cuadro de dilogo Propiedades de tabla debe estar seleccionada.
Borrar elementos del navegador. Elimina elementos del Visor basndose en diferentes
criterios.
Pie de pgina. Vuelve a dar formato a una nota al pie de una tabla pivote, modifica el
696 Captulo 47
Adems, puede utilizar cualquiera de los otros procesos disponibles como procesos de iniciacin, aunque quizs no sea tan fcil personalizarlos. Slo tiene que abrir el proceso y guardarlo con un nombre de archivo diferente.
Creacin de autoprocesos
La creacin de un autoproceso empieza por el objeto de resultados que se desea utilizar como desencadenante. Por ejemplo, para crear un autoproceso que se ejecute siempre que se produzca una tabla de frecuencias, genere una tabla de frecuencias de la manera habitual y pulse en la tabla en el Visor para seleccionarla. A continuacin, pulse con el botn derecho del ratn o srvase del men Utilidades para crear un nuevo autoproceso que se active al generar ese tipo de tabla.
Figura 47-8 Creacin de un nuevo autoproceso
Por defecto, cada autoproceso que se crea se aade al archivo actual de autoprocesos (autscript.sbs) como un nuevo procedimiento. El nombre del procedimiento hace referencia al evento que sirve como desencadenante. Por
ejemplo, si crea un autoproceso que se activa cuando el procedimiento Explorar genera una tabla Descriptivos, el nombre de la subrutina de autoproceso sera Explore_Table_Descriptives_Create.
Figura 47-9 Nuevo procedimiento de autoproceso en la ventana de proceso
Esto facilita el desarrollo de los autoprocesos porque no es necesario escribir el cdigo para obtener el objeto en el que se quiere operar, pero requiere que los autoprocesos sean especficos para una pieza dada de procedimiento estadstico y de resultados.
Si no existe ningn autoproceso para el objeto seleccionado, se crear uno nuevo. Si existe uno, se mostrar en la pantalla.
E Escriba el cdigo. E En el men Edicin, seleccione Opciones para activar o desactivar el autoproceso.
698 Captulo 47
Creacin de ttulo. Hace referencia al procedimiento estadstico que lo cre: Correlations_Title_Create. Creacin de notas. Hace referencia al procedimiento que lo cre: Correlations_Notes_Create. Creacin de advertencias. Hace referencia al procedimiento que lo cre.
Tambin puede utilizar un proceso para desencadenar un autoproceso de forma indirecta. Por ejemplo, puede escribir un proceso que invoque al procedimiento Correlaciones, lo que desencadena a su vez el autoproceso registrado en la tabla de correlaciones resultante.
Archivo de autoproceso
Todos los autoprocesos se guardan en un nico archivo (a diferencia de otros procesos que se guardan en archivos diferentes). Tambin se aade a este archivo cualquier autoproceso nuevo que se crea. El nombre del archivo de autoproceso actual se muestra en la pestaa Procesos del cuadro de dilogo Opciones (men Edicin).
Figura 47-11 Subrutinas de autoproceso mostradas en el cuadro de dilogo Opciones
El cuadro de dilogo Opciones tambin muestra todos los autoprocesos del archivo de autoproceso actualmente seleccionado, permitindole activar o desactivar procesos individuales.
700 Captulo 47
El archivo de autoproceso por defecto es autscript.sbs. Puede especificar un archivo de autoproceso diferente, pero slo puede hacer uno activo.
La utilizacin de objetos es un proceso que consta de dos fases. En primer lugar, se crea una referencia al objeto (que se denomina obtencin del objeto). Despus, se utilizan propiedades y mtodos para realizar algo. Se obtienen objetos explorando la jerarqua de objetos y utilizando en cada paso propiedades o mtodos de los objetos superiores en la jerarqua para obtener los objetos ubicados por debajo. Por ejemplo, para obtener un objeto de tabla pivote, primero debe obtener el documento de resultados que contiene la tabla pivote y, despus, los elementos de ese documento de resultados. Cada objeto que obtiene se almacena en una variable. (Recuerde que lo que realmente almacena en la variable es una referencia al objeto). A menudo, uno de los primeros pasos en la creacin de un proceso consiste en declarar variables para los objetos que necesite. Sugerencia: Es difcil entender cmo funcionan los procesos si no se conoce el funcionamiento del programa. Antes de escribir un proceso, utilice el ratn para realizar la tarea varias veces de la forma habitual. En cada paso, considere qu objetos est utilizando y qu propiedades de cada objeto va a cambiar.
Declaracin de variables
Aunque no siempre es necesario, es una buena idea declarar todas las variables antes de utilizarlas. Esto se realiza principalmente empleando instrucciones de declaracin Dim:
Dim objOutputDoc As ISpssOutputDoc Dim objPivotTable As PivotTable Dim intType As Integer Dim strLabel As String
Cada declaracin especifica el nombre y el tipo de variable. Por ejemplo, la primera declaracin de arriba crea una variable de objeto que se llama objOutputDoc y la asigna a la clase de objeto ISpssOutputDoc. La variable an no tiene un valor porque no se ha establecido para un documento de resultados determinado. Lo que hace la instruccin es declarar que la variable existe. (A este proceso se le ha denominado renombrar los objetos que desea utilizar.)
702 Captulo 47
Convenciones de denominacin de variables. Por convencin, el nombre de cada variable indica su tipo. Los nombres de las variables de objeto empiezan por obj, las variables de enteros por int y las variables de cadena por str. Se trata de simples
convenciones (puede dar a sus variables el nombre que desee), pero si las sigue, resultar ms fcil entender su cdigo.
Clases de objetos de SPSS. ISpssOutputDoc y PivotTable son nombres de clases
de objetos de SPSS. Cada clase representa un tipo de objeto que SPSS puede crear, tales como un documento de resultados o una tabla pivote. Adems cada una de estas clases posee propiedades y mtodos especficos asociados a ella. El conjunto de todas las clases (o tipos) de objetos de SPSS se conoce como biblioteca de tipos de SPSS.
Nombre de variable
objSpssApp, la variable es
objSpssOptions objSpssInfo objDocuments objDataDoc objSyntaxDoc objOutputDoc objPrintOptions objOutputItems objOutputItem objSPSSChart objSPSSText objPivotTable
Conjunto de elementos de ISpssItems resultados Elemento de resultados ISpssItem Grfico Texto Tabla pivote
ISpssRtf PivotTable
ISpssChart
Objeto Notas al pie Casillas de datos Etiquetas de capa Etiquetas de columna Etiquetas de fila
Tipo o Clase
ISpssFootnotes ISpssDataCells ISpssLayerLabels ISpssLabels ISpssLabels
Nombre de variable
objFootnotes objDataCells objLayerLabels objColumnLabels objRowLabels objPivotMgr objDimension
Se utilizan propiedades y mtodos de objetos superiores en la jerarqua de objetos para llegar hasta los objetos de debajo. La segunda de las instrucciones anteriores obtiene el documento de resultados designado utilizando GetDesignatedOutputDoc, un mtodo asociado al objeto de aplicacin, que es el objeto del nivel ms alto. De modo similar, para obtener un objeto de tabla pivote, en primer lugar se obtiene el documento de resultados que contiene la tabla pivote, despus el conjunto de elementos de ese documento y as sucesivamente.
704 Captulo 47 Sub Main Dim objOutputDoc As ISpssOutputDoc'Declara las variables del objeto Dim objOutputItems As ISpssItems Dim objOutputItem As ISpssItem Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc'Obtiene referencia para el documento de resultados designado Set objOutputItems = objOutputDoc.Items() 'Obtiene la coleccin de elementos del documento Set objOutputItem = objOutputItems.GetItem(2) 'Obtiene el tercer elemento de resultados '(los nmeros de elemento empiezan en 0, as que "2" corresponde al tercero) objOutputItem.Activate 'Activa el elemento de resultados End sub
705 Utilidad de procesamiento de SPSS Set objPivotTable = objOutputItem.Activate()'si el elemento es una tabla pivote, actvela Exit For End If Next index End sub
Tambin dispone de ejemplos en la ayuda en pantalla. Puede probarlos usted mismo pegando el cdigo de la Ayuda en la ventana de proceso.
706 Captulo 47
Visor de objetos
El Visor de objetos muestra todas las clases de objetos y los mtodos y propiedades asociados a cada una. Tambin puede acceder a la ayuda sobre propiedades y mtodos especficos y pegar los que seleccione en su proceso.
pegarlos en su proceso.
708 Captulo 47
puede contener pocas instrucciones, aparte de llamadas a subrutinas que realizan la mayor parte del trabajo.
Figura 47-14 Cuadro de dilogo Procedimiento nuevo
Los procedimientos pueden ser subrutinas o funciones. Un procedimiento comienza con una instruccin que especifica el tipo de procedimiento y el nombre (por ejemplo, Sub Main o Function DialogMonitor( )) y concluye con la instruccin End (End Sub o End Function) adecuada. Segn se desplaza por la ventana de proceso, el nombre del procedimiento actual se muestra en la parte superior de dicha ventana. Dentro de un proceso, puede invocar cualquier procedimiento tantas veces como desee. Tambin puede invocar cualquier procedimiento del archivo global de procesos, lo cual hace posible compartir procedimientos entre los procesos.
Si lo desea, puede crear un nuevo procedimiento escribiendo las instrucciones que lo definen directamente en el proceso.
El archivo global de procesos por defecto es global.sbs. Puede aadir los procedimientos que desee a este archivo. Tambin puede especificar otro archivo global en la pestaa Procesos del cuadro de dilogo Opciones (men Edicin), pero slo puede haber un archivo activo como archivo global en un momento dado. Esto significa que si crea un nuevo archivo global y lo define como el archivo global, los procedimientos y funciones de global.sbs ya no estarn disponibles. Puede ver el archivo global de procesos en cualquier ventana de proceso (pulse en la pestaa 2 en el lateral izquierdo de la ventana justo debajo de la barra de herramientas), pero slo puede editarlo en una ventana cada vez.
710 Captulo 47
Los procedimientos globales deben ser invocados por otros procedimientos de proceso. No se pueden ejecutar procesos globales directamente desde el men Utilidades ni desde una ventana de proceso.
La descripcin debe poseer formato de comentario, es decir, cada lnea debe comenzar con un apstrofo.
711 Utilidad de procesamiento de SPSS Figura 47-16 Creacin de un cuadro de dilogo en el Editor de cuadros de dilogo personalizados
El editor muestra al principio un cuadro de dilogo en blanco. Puede aadir controles, tales como botones de radio y casillas de verificacin, seleccionando la herramienta apropiada y arrastrando con el ratn. (Site el ratn sobre cada herramienta para obtener su descripcin.) Tambin puede arrastrar los lados y las esquinas para cambiar el tamao del cuadro de dilogo. Despus de aadir un control, pulse en l con el botn derecho para definir sus propiedades.
Funcin de control del cuadro de dilogo. Para crear esta funcin, pulse con el botn
derecho del ratn en el cuadro de dilogo (asegrese de que no hay ningn control seleccionado en l) y escriba un nombre para la funcin en el campo correspondiente (Dialog Function). Las instrucciones que definen la funcin se aadirn a su proceso, aunque tendr que editar manualmente la funcin para definir el funcionamiento de cada accin. Cuando termine, pulse en el botn para guardar y salir (situado en el extremo derecho de la barra de herramientas) y se aadir el cdigo para el cuadro de dilogo a su proceso.
cuadro de dilogo.
E Elija en los mens: Proceso Editor de cuadros de dilogo...
712 Captulo 47 E Seleccione herramientas de la paleta y pulse en el nuevo cuadro de dilogo para
aadir los controles, tales como botones y casillas de verificacin (arrstrelos hasta la posicin que desee).
E Modifique el tamao del cuadro de dilogo arrastrando los tiradores de los lados y
las esquinas.
E Pulse con el botn derecho en el cuadro (sin ningn control seleccionado) y escriba un
nombre para la funcin de control del cuadro de dilogo en el campo correspondiente (Dialog Function).
E Cuando termine, pulse en el botn para guardar y salir (en el extremo derecho de la
barra de herramientas). Es necesario editar manualmente la funcin de control del cuadro de dilogo para definir el funcionamiento del cuadro de dilogo.
Parmetros. La funcin debe ser capaz de cumplir tres parmetros: Una cadena (strDlgItem) y dos enteros (intAction e intSuppValue). Los parmetros son valores pasados entre la funcin y el cuadro de dilogo, dependiendo de la accin que se elija.
Por ejemplo, cuando un usuario pulsa en un control del cuadro de dilogo, el nombre del control se pasa a la funcin como strDlgItem (el nombre del campo se especifica en la definicin del cuadro de dilogo). El segundo parmetro, intAction, es un valor numrico que indica qu accin tuvo lugar en el cuadro de dilogo. El tercer parmetro se utiliza para ofrecer informacin adicional en algunos casos. Debe incluir los tres parmetros en la definicin de la funcin incluso aunque no vaya a utilizarlos todos.
Select Case intAction. El valor de intAction indica la accin que tuvo lugar en el cuadro de dilogo. Por ejemplo, cuando el cuadro de dilogo se abre, intAction = 1. Si el usuario pulsa en un botn, intAction cambia a 2, etc. Existen cinco
acciones posibles y se pueden especificar instrucciones que se ejecuten para cada accin del modo abajo indicado. No es necesario especificar los cinco casos posibles, slo los aplicables. Por ejemplo, si no desea que se ejecute ninguna instruccin para ejecutarla en la inicializacin, omita Case 1.
Case intAction = 1. Especifica las instrucciones que deben ejecutarse cuando se
inicializa el cuadro de dilogo. Por ejemplo, podra desactivar uno o varios controles o aadir una seal sonora. La cadena strDlgItem es una cadena nula; intSuppValue es 0.
Case 2. Se ejecuta al pulsar en un botn o cuando un valor cambia en un control CheckBox, DropListBox, ListBox u OptionGroup. Si se pulsa en un botn, strDlgItem es el botn, intSuppValue no posee significado y debe definir DialogFunc = True para evitar que el cuadro de dilogo se cierre. Si un valor cambia, strDlgItem es el elemento cuyo valor ha cambiado e intSuppValue
es el nuevo valor.
Case 3. Se ejecuta cuando un valor cambia en un control TextBox o ComboBox. La cadena strDlgItem es el control cuyo texto cambi y est perdiendo foco; intSuppValue es el nmero de caracteres. Case 4. Se ejecuta cuando el foco cambia en el cuadro de dilogo. La cadena strDlgItem gana foco e intSuppValue es el elemento que pierde foco (el
acciones inactivas. Si desea obtener ms informacin, consulte los ejemplos y el prototipo DialogFunc en el archivo de ayuda de referencia sobre el lenguaje Sax BASIC.
714 Captulo 47
Sub Main Call BuildDialog End Sub 'define el cuadro de dilogo Sub BuildDialog Begin Dialog UserDialog 580,70,"Abrir archivo de datos",.DialogFunc Text 40,7,280,21,"Archivo de datos para abrir:",.txtDialogTitle TextBox 40,28,340,21,.txtFilename OKButton 470,7,100,21,.cmdOK CancelButton 470,35,100,21,.cmdCancel End Dialog Dim dlg As UserDialog Dialog dlg End Sub 'define la funcin que determina el comportamiento del cuadro de dilogo Function DialogFunc(strDlgItem As String, intAction As Integer, intSuppValue As Integer) As Boolean Select Case intAction Case 1' emite una seal sonora cuando se inicializa el cuadro de dilogo Beep Case 2' cambia el valor o pulsa en el botn Select Case strDlgItem Case "cmdOK"'si el usuario pulsa en Aceptar, abre el archivo de datos con el nombre de archivos especificado strFilename = DlgText("txtFilename") Call OpenDataFile(strFilename) DialogFunc = False
715 Utilidad de procesamiento de SPSS Case "cmdCancel"'Si el usuario pulsa en Cancelar, cierra el cuadro de dilogo DialogFunc = False End Select End Function Sub OpenDataFile(strFilename As Variant)'Abre el archivo de datos con el nombre de archivo especificado Dim objDataDoc As ISpssDataDoc Set objDataDoc = objSpssApp.OpenDataDoc(strFilename) End Sub
Tambin dispone de ejemplos en la ayuda en pantalla. Puede probarlos usted mismo pegando el cdigo de la Ayuda en la ventana de proceso.
Depuracin de procesos
EL men Depurar permite recorrer el cdigo paso a paso, ejecutando una lnea o subrutina por separado y viendo el resultado. Tambin puede insertar un punto de interrupcin en el proceso para detener la ejecucin en la lnea que contiene dicho punto de interrupcin. Para depurar un autoproceso, abra el archivo de autoproceso en una ventana de proceso, inserte los puntos de interrupcin en el procedimiento que desee depurar y, seguidamente, ejecute el procedimiento estadstico que desencadena el autoproceso.
Paso hacia dentro. Ejecuta la lnea actual. Si la lnea actual es una subrutina o una
716 Captulo 47
cdigo, una lnea o una subrutina por vez. Las pestaas Immediate, Watch, Stack y Loaded aparecern en la ventana de proceso, junto con la barra de herramientas de depuracin.
E Utilice la barra de herramientas (o las teclas de aceleracin) para continuar con los
717 Utilidad de procesamiento de SPSS Figura 47-18 Panel depuracin mostrado en la ventana de proceso
para ver el valor actual de la variable. Tambin puede evaluar una expresin, asignar una variable o invocar una subrutina. Escriba ?expr y pulse Intro para mostrar el valor de expr. Escriba var = expr y pulse Intro para cambiar el valor de var. Escriba subname args y pulse Intro para invocar una subrutina o una instruccin pre-incorporada. Escriba Trace y pulse Intro para activar o desactivar el modo de traza. El modo de traza imprime cada instruccin en la ventana inmediata cuando hay un proceso en ejecucin.
Pestaa Watch. Para mostrar una variable, una funcin o una expresin, pulse en ella
y seleccione Aadir vista en el men Depurar. Los valores mostrados se actualizan cada vez que se detiene la ejecucin. Puede editar la expresin a la izquierda de ->. Pulse en Entrar para actualizar todos los valores de manera inmediata. Pulse Ctrl-Y para eliminar la lnea.
Pestaa Stack. Muestra las lneas que invocaron la instruccin actual. La primera lnea es la instruccin actual, la segunda lnea es la que invoc a la primera, y as sucesivamente. Pulse en cualquier lnea para resaltarla en la ventana de edicin.
718 Captulo 47
Pestaa Loaded. Presenta una lista de los procesos activos actualmente. Pulse en una lnea para ver ese proceso.
719 Utilidad de procesamiento de SPSS Figura 47-19 Pegado de sintaxis de comandos en un proceso
Al abrir los cuadros de dilogo mediante los mens de la ventana de proceso, el botn Pegar insertar todo el cdigo necesario para ejecutar el comando desde un proceso. Nota: Debe utilizar los mens de la ventana de proceso para abrir el cuadro de dilogo; de otro modo, los comandos se pegarn en una ventana de sintaxis en lugar de en la ventana de proceso.
Nota: Debe utilizar los mens de la ventana de proceso para abrir el cuadro de dilogo; de otro modo, los comandos se pegarn en una ventana de sintaxis en lugar de en la ventana de proceso.
Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).
48
Captulo
El Sistema de gestin de resultados (SGR) ofrece la posibilidad de escribir de forma automtica las categoras de resultados seleccionadas en diferentes archivos de resultados y en distintos formatos. Los formatos incluyen:
Formato de archivo de datos de SPSS (.sav). Los resultados que se muestran en
tablas pivote en el Visor se pueden almacenar en forma de un archivo de datos de SPSS, permitiendo de esta manera utilizar los resultados como entrada de posteriores comandos.
XML. Las tablas, los resultados de texto e incluso muchos tipos de grficos se
HTML. Los grficos normales (no interactivos) y los diagramas de modelo de rbol (opcin rbol de clasificacin) se pueden incluir como archivos de imagen. Los archivos de imagen se guardan en un subdirectorio (carpeta) independiente.
Texto. Las tablas y los resultados de texto se pueden almacenar como texto
721
722 Captulo 48 Figura 48-1 Panel de control del Sistema de gestin de resultados
Puede utilizar el panel de control para iniciar y detener el envo de los resultados a los distintos destinos. Cada solicitud de SGR permanece activa hasta que finaliza de forma explcita o hasta el final de la sesin. Un archivo de destino especificado en una solicitud de SGR no estar disponible para otros procedimientos de SPSS y otras aplicaciones hasta que finalice la solicitud de SGR. Mientras que una solicitud de SGR est activa, los archivos de destino especificados se almacenan en la memoria (RAM) y, por consiguiente, las solicitudes de SGR activas que escriben una gran cantidad de resultados en archivos externos pueden consumir una cantidad considerable de memoria. Las distintas solicitudes de SGR son independientes. Un mismo resultado se puede enviar a distintas ubicaciones en formatos diversos que dependen de las especificaciones de las distintas solicitudes de SGR.
El orden de los objetos de resultados en un destino concreto equivale al orden en que se han creado, lo cual se determina mediante el orden y el funcionamiento de los procedimientos que generan los resultados. SGR no puede enviar objetos de grfico o advertencias creados mediante procedimientos de grficos interactivos (men Grficos, submen Interactivos) ni mapas creados mediante procedimientos de mapas (men Grficos, submen Mapa).
Para aadir solicitudes de SGR nuevas
E Seleccione los tipos de resultados (tablas, grficos, etc.) que desee incluir. (Si desea
seleccione todos los elementos de la lista. (Si desea obtener ms informacin, consulte Identificadores de comandos y subtipos de tabla en p. 728.)
E En el caso de los comandos que generan resultados de tablas pivote, seleccione los
tipos de tabla concretos que desee incluir. La lista muestra slo las tablas disponibles en los comandos seleccionados; cualquier tipo de tabla disponible en uno o ms comandos seleccionados se muestra en la lista. Si no se selecciona ningn comando, se muestran todos los tipos de tabla. (Si desea obtener ms informacin, consulte Identificadores de comandos y subtipos de tabla en p. 728.)
E Para seleccionar tablas basadas en etiquetas de texto en lugar de subtipos, pulse en Etiquetas. (Si desea obtener ms informacin, consulte Etiquetas en p. 729.) E Pulse en Opciones para especificar el formato del resultado (por ejemplo, archivo
de datos de SPSS, XML o HTML). (Por defecto, se utiliza el formato XML con los resultados. Si desea obtener ms informacin, consulte Opciones de SGR en p. 731.)
E Especifique un destino de resultados:
Archivo. Todos los resultados seleccionados se envan a un nico archivo. Basado en nombres de objetos. Los resultados se envan a varios archivos de
destino segn los nombres de objetos. Se crea un archivo independiente para cada objeto de resultados, con un nombre de archivo basado o en los nombres de
724 Captulo 48
datos de SPSS, puede enviar los resultados a un conjunto de datos. El conjunto de datos est disponible para su uso posterior durante la misma sesin, pero no se guardar a menos que se haya guardado explcitamente antes de que finalice la sesin. Esta opcin slo est disponible para los resultados con formato de archivo de datos de SPSS. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 en p. 99.
E Si lo desea:
Excluya los resultados seleccionados del Visor. Si selecciona Excluir del Visor, los tipos de resultados de la solicitud de SGR no se mostrarn en la ventana del Visor. Si varias solicitudes SGR activas incluyen los mismos tipos de resultados, la presentacin de dichos tipos de resultados en el Visor se determina mediante la solicitud de SGR ms reciente que contiene los tipos de resultados. Si desea obtener ms informacin, consulte Exclusin de presentacin de resultados del Visor en p. 737. Asigne una cadena de ID a la solicitud. A todas las solicitudes se les asigna automticamente un valor de ID; puede anular la cadena de ID por defecto del sistema con un ID descriptivo, que puede resultar til si dispone de varias solicitudes activas que desea identificar fcilmente. Los valores de ID que asigne no pueden empezar por un signo de dlar ($). Los siguientes consejos son tiles para seleccionar varios elementos de una lista: Pulse Ctrl-A para seleccionar todos los elementos de una lista. Mantenga pulsada la tecla Mays para seleccionar varios elementos contiguos. Mantenga pulsada la tecla Ctrl para seleccionar varios elementos no contiguos.
Para finalizar y eliminar solicitudes de SGR
Las solicitudes de SGR activas y nuevas se muestran en la lista Solicitudes con la solicitud ms reciente en la parte superior. Puede cambiar los anchos de las columnas de informacin si pulsa y arrastra los bordes, y puede desplazar la lista horizontalmente para ver ms informacin sobre una solicitud en concreto.
Un asterisco (*) despus de la palabra Activa en la columna Estado indica que se ha creado una solicitud de SGR con una sintaxis de comandos que incluye funciones no disponibles en el panel de control. Para finalizar una solicitud de SGR activa concreta:
E Pulse en cualquier casilla de la fila para dicha solicitud en la lista Solicitudes. E Pulse en Terminar.
Para eliminar una solicitud nueva (una solicitud que se ha aadido pero que an no est activa):
E Pulse en cualquier casilla de la fila para dicha solicitud en la lista Solicitudes. E Pulse en Eliminar.
Nota: las solicitudes de SGR activas no finalizan hasta que pulsa en Aceptar.
determinados tipos de mensajes error y advertencia. Dependiendo de la configuracin de las opciones (men Edicin, Opciones, pestaa Visor), los objetos de logaritmo pueden contener tambin la sintaxis de comandos que se ha ejecutado durante la sesin. Los objetos de logaritmo tienen la etiqueta Logaritmo en el panel de titulares del Visor.
Tablas. Objetos de resultados que son tablas pivote en el Visor (incluye tablas de notas). Las tablas son los nicos objetos de resultados que se pueden dirigir al formato del archivo de datos de SPSS (.sav).
726 Captulo 48
Texto. Objetos de texto que no son logaritmos ni encabezados (incluye los objetos con
clasificacin. Los objetos de rbol slo se incluyen con los formatos de destino XML y HTML.
Encabezados. Objetos de texto con la etiqueta Ttulo en el panel de titulares del
Visor. Para el formato XML con los resultados, no se incluyen objetos de texto de encabezado.
Advertencias. Objetos de advertencias. Los objetos de advertencias contienen
728 Captulo 48
Los identificadores de comandos estn disponibles para todos los procedimientos estadsticos y de grficos y para cualquier otro comando que genere bloques de resultados con su propio encabezado identificable en el panel de titulares del Visor. Estos identificadores son por lo general (aunque no siempre) iguales o similares a los nombres de procedimiento de los mens y los ttulos de los cuadros de dilogo, los cuales son por lo general (aunque no siempre) similares a los nombres de los comandos de SPSS subyacentes. Por ejemplo, el identificador de comandos para el procedimiento Frecuencias es Frecuencias y el nombre del comando subyacente es tambin el mismo. No obstante, hay algunos casos en que el nombre del procedimiento y el identificador de comandos o el nombre del comando no son en absoluto similares. Por ejemplo, todos los procedimientos del submen Pruebas no paramtricas (del men Analizar) utilizan el mismo comando subyacente y el identificador de comandos es el mismo que el nombre de comando subyacente: Pruebas no paramtricas.
Subtipos de tabla
Los subtipos de tabla son los diferentes tipos de tablas pivote que se pueden generar. Algunos subtipos slo estn generados por un comando; otros subtipos se pueden generar mediante varios comandos (aunque las tablas pueden no presentar un aspecto similar). Aunque los nombres de subtipos de tabla suelen ser bastante descriptivos, puede haber muchos entre los que elegir (sobre todo si ha seleccionado un nmero considerable de comandos); adems, dos subtipos pueden tener nombres muy similares.
Para buscar identificadores de comandos y subtipos de tabla
En caso de duda, puede buscar los nombres de los identificadores de comandos y los subtipos de tabla en la ventana del Visor:
E Ejecute el procedimiento para generar algunos resultados en el Visor. E Pulse con el botn derecho del ratn en el elemento del panel de titulares del Visor. E Seleccione Copiar identificador de comandos de SGR o Copiar subtipo de tablas de SGR.
729 Sistema de gestin de resultados E Pegue el nombre del identificador de comandos o del subtipo de tabla copiado en
Etiquetas
En lugar de los nombres de subtipos de tabla, puede seleccionar tablas basadas en el texto mostrado en el panel de titulares del Visor. Tambin puede seleccionar otros tipos de objeto basados en las etiquetas. Las etiquetas resultan tiles para diferenciar varias tablas del mismo tipo en las que el texto del titular refleja algn atributo del objeto de resultados concreto como las etiquetas o los nombres de las variables. Hay, no obstante, ciertos factores que pueden afectar al texto de la etiqueta: Si el procesamiento de segmentacin del archivo est activado, es posible que se aada a la etiqueta una identificacin con el grupo de segmentacin del archivo. Las etiquetas que incluyen informacin sobre las variables o los valores se ven afectadas por la configuracin actual de las opciones de las etiquetas de resultados (men Edicin, Opciones, pestaa Etiquetas de los resultados). Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados (men Edicin, Opciones, pestaa General).
Para especificar las etiquetas que se van a utilizar para identificar los objetos de resultados
E En el panel de control del Sistema de gestin de resultados, seleccione uno o ms
del Visor. Tambin puede pulsar con el botn derecho del ratn en el elemento del titular, elegir Copiar etiqueta de SGR y pegar la etiqueta copiada en el campo de texto Etiqueta.
E Pulse en Aadir. E Repita el proceso con cada etiqueta de tabla que desee incluir. E Pulse en Continuar.
Comodines
Puede utilizar un asterisco (*) como ltimo carcter de la cadena de etiqueta y como carcter comodn. Se seleccionarn todas las etiquetas que empiecen por la cadena especificada (excepto el asterisco). Este proceso slo funciona si el asterisco es el ltimo carcter, ya que los asteriscos pueden aparecer como caracteres vlidos en una etiqueta.
Opciones de SGR
Puede utilizar el cuadro de dilogo Opciones de SGR para: Especificar el formato del resultado. Incluir o excluir los resultados del diagrama de modelo de rbol y especificar el formato grfico. Especificar qu elementos de la dimensin de tabla deben tener la dimensin de las filas. En el caso del formato de archivo de datos de SPSS, incluya una variable que identifique el nmero de tabla secuencial que sea el origen en cada caso.
Para especificar las opciones de SGR
E Pulse en Opciones en el panel de control del Sistema de gestin de resultados. Figura 48-4 Cuadro de dilogo SGR: Opciones
732 Captulo 48
Formato XML con los resultados. XML que se adapta al esquema de resultados de SPSS. Los
grficos normales se incluyen como XML adaptado al esquema vizml. Adems, puede exportar todos los grficos y mapas como archivos independientes en el formato grfico seleccionado.
HTML. Objetos de resultados que son tablas pivote en el Visor y se convierten en tablas
HTML simples. No se admite ningn atributo de aspecto de tabla (caractersticas de fuente, estilos de borde, colores, etc.). Los objetos de resultados de texto tienen la etiqueta <PRE> en HTML. Si opta por incluir grficos, estos se exportan como archivos independientes en el formato grfico seleccionado y se incrustan mediante referencias (<IMG SRC = 'filename.ext'>) en el documento HTML. Los archivos de imagen se guardan en un subdirectorio (carpeta) independiente.
Archivo de datos de SPSS. Este formato es un formato de archivo binario. Todos los
tipos de objetos de resultados distintos de las tablas se excluyen. Cada columna de una tabla se convierte en una variable en el archivo de datos. Para utilizar un archivo de datos creado con SGR en la misma sesin, deber finalizar la solicitud de SGR activa si quiere abrir el archivo de datos. Si desea obtener ms informacin, consulte Envo de resultados a archivos de datos de SPSS en p. 737.
SVWS XML. XML utilizado por el servidor Web de SmartViewer. Se trata en realidad
de un archivo JAR/ZIP que contiene XML, CSV y otros archivos. El servidor Web de SmartViewer es un producto independiente basado en un servidor.
Texto. Texto separado por espacios. Los resultados se escriben como texto con los
resultados tabulares alineados con espacios para las fuentes de paso fijo. Se excluyen todos los grficos y mapas.
Texto con tabulaciones. Texto delimitado por tabulaciones. Para los resultados que se muestran como tablas pivote en el Visor, las tabulaciones delimitan los elementos de columnas de tabla. Las lneas de bloque de texto se escriben sin cambios; no se realiza ningn intento de dividirlas con tabulaciones en las posiciones tiles. Se excluyen todos los grficos y mapas.
Imgenes de grficos
Para el formato HTML, puede incluir grficos (excluyendo los grficos interactivos) y diagramas de modelo de rbol como archivos de imagen. Se crea un archivo de imagen independiente para cada grfico o rbol, y se incluyen etiquetas <IMG SRC='filename'> estndar en HTML para cada archivo de imagen. Los archivos de imagen se guardan en un subdirectorio (carpeta) independiente. El nombre del subdirectorio es el nombre del archivo de destino HTML sin ninguna extensin y con _files aadido al final. Por ejemplo, si el archivo de destino HTML es julydata.htm, el subdirectorio de imgenes se llamar julydata_files.
Formato. Los formatos de imagen disponibles son PNG, JPG, EMF y BMP. Tamao. Puede ajustar la escala del tamao de imagen del 10% al 200%. Pivotes de tabla
Para los resultados de las tablas pivote, puede especificar los elementos de dimensin que deben aparecer en las columnas. El resto de los elementos de dimensin aparecen en las filas. Para el formato de archivo de datos de SPSS, las columnas de tabla se convierten en variables y las filas en casos. Si especifica varios elementos de dimensin para las columnas, estos se anidan en las columnas en el orden en que aparecen. Para el formato de archivo de datos de SPSS, los nombres de variable se generan mediante elementos de columna anidados. Si desea obtener ms informacin, consulte Nombres de variable en los archivos de datos generados por SGR en p. 745. Si la tabla no contiene ninguno de los elementos de dimensin que aparecen, todos los elementos de dimensin para dicha tabla aparecern en las filas. Los pivotes de tabla especificados aqu no surtirn ningn efecto en las tablas que se muestran en el Visor. Cada dimensin de una tabla (fila, columna, capa) puede contener cero o ms elementos. Por ejemplo, una tabla de contingencia sencilla de dos dimensiones contiene un nico elemento de dimensin de fila y un nico elemento de dimensin de columna, cada uno de los cuales contiene una de las variables utilizadas en la tabla. Puede utilizar argumentos de posicin o nombres de elementos de dimensin para especificar los elementos de dimensin que desea colocar en la dimensin de columna.
734 Captulo 48
Todas las dimensiones en filas. Crea una fila nica para cada tabla. Para los archivos de datos con formato SPSS, significa que cada tabla es un caso nico y que todos los elementos de tabla son variables. Lista de posiciones. El formato general de un argumento de posicin es una letra que
indica la posicin por defecto del elemento (C para columna, R para fila o L para capa) seguida de un nmero entero positivo que indica la posicin por defecto en la dimensin. Por ejemplo, R1 indica el elemento de dimensin de fila ms exterior. Para especificar varios elementos de diversas dimensiones, separe cada dimensin con un espacio: por ejemplo, R1 C2. La letra de dimensin seguida de ALL indica todos los elementos de dicha dimensin en el orden por defecto. Por ejemplo, CALL equivale al comportamiento por defecto (utilizando todos los elementos de columna en el orden por defecto para generar columnas). CALL RALL LALL (o RALL CALL LALL, etc.) coloca los elementos de dimensin en las columnas. Para el formato de archivo de datos de SPSS, se genera de este modo una fila o caso por tabla en el archivo de datos.
Figura 48-5 Argumentos de posicin de filas y columnas
nombres de elementos de dimensin, que son las etiquetas de texto que aparecen en la tabla. Por ejemplo, una tabla de contingencia sencilla de do s dimensiones contiene un nico elemento de dimensin de fila y un nico elemento de dimensin de columna, cada uno de los cuales incluye etiquetas basadas en las variables de dichas
dimensiones adems de un nico elemento de dimensin de capa con la etiqueta Estadsticos (si el idioma de los resultados es el ingls). Los nombres de elementos de dimensin pueden variar segn el idioma de los resultados y la configuracin que influye en la presentacin de los nombres de variable o las etiquetas de las tablas. Cada nombre de elemento de dimensin debe aparecer entre comillas simples o dobles. Para especificar varios nombres de elementos de dimensin, incluya un espacio entre cada nombre entre comillas. Las etiquetas asociadas con los elementos de dimensin pueden no ser siempre evidentes.
Para ver todos los elementos de dimensin y sus etiquetas para una tabla pivote
E Active (pulse dos veces en) la tabla en el Visor. E Elija en los mens: Ver Mostrar todo
y/o
E Si los paneles de pivotado no se muestran, elija en los mens: Pivotar Paneles de pivotado E Site el puntero sobre cada icono en los paneles de pivotado para mostrar la etiqueta.
736 Captulo 48 Figura 48-6 Nombres de elementos de dimensin mostrados en la tabla y los paneles de pivotado
Registro
Puede registrar la actividad de SGR en un registro de XML o formato de texto. El registro realiza un seguimiento de todas las solicitudes de SGR nuevas para la sesin, pero no incluye las solicitudes de SGR activas antes de solicitar un registro. El archivo de registro actual finaliza si especifica un nuevo archivo de registro o si anula seleccin (desactiva) Registrar actividad de SGR.
en blanco.
E Pulse en Aadir.
Los resultados seleccionados se excluyen del Visor, mientras que el resto de los resultados se muestran en el Visor del modo normal.
738 Captulo 48
En el archivo de datos se incluyen automticamente tres variables de identificador de tabla: Comando_, Subtipo_ y Etiqueta_. Las tres son variables de cadena. Las dos primeras variables se corresponden con los identificadores de comandos y subtipos. Si desea obtener ms informacin, consulte Identificadores de comandos y subtipos de tabla en p. 728. Etiqueta_ contiene el texto de ttulo de tabla. Las filas de la tabla se convierten en casos en el archivo de datos.
Las primeras tres variables identifican la tabla de origen por comando, subtipo y etiqueta. Los dos elementos que definen las filas de la tabla (valores de la variable Sexo y medidas estadsticas) reciben los nombres de variable genrica Var1 y Var2. Estas dos variables son variables de cadena. Las etiquetas de columna de la tabla se utilizan para crear nombres de variable vlidos. En este caso, dichos nombres de variable se basan en las etiquetas de variable de las tres variables de escala resumidas en la tabla. Si las variables no tienen etiquetas de variable definidas o bien ha optado por mostrar los nombres de variable en lugar de las etiquetas de variable como las etiquetas de columna en la tabla, los nombres de variable del nuevo archivo de datos deben ser los mismos que los del archivo de datos de origen.
En la tabla, la variable con la etiqueta Clasificacin tnica define las capas. En el archivo de datos, se crean dos variables adicionales: una que identifica el elemento de capa y otra que identifica las categoras del elemento de capa. Al igual que en el caso de las variables creadas a partir de elementos de fila, las variables creadas a partir de elementos de capa son variables de cadena con nombres de variable genrica (el prefijo Var seguido de un nmero secuencial).
Cada tabla siguiente aade siempre casos al archivo de datos. Si las etiquetas de columna de las tablas difieren, cada tabla puede aadir variables al archivo de datos con valores perdidos para los casos de otras tablas que no tienen una columna con un etiquetado idntico.
Ejemplo: Varias tablas con las mismas etiquetas de columna
Las tablas que contienen las mismas etiquetas de columna suelen generar los archivos de datos ms tiles de inmediato (archivos de datos que no requieren manipulacin adicional). Por ejemplo, dos o ms tablas de frecuencia del procedimiento Frecuencias tienen etiquetas de columna idnticas.
Figura 48-9 Dos tablas con etiquetas de columna idnticas
742 Captulo 48
La segunda tabla contribuye con casos adicionales (filas) al archivo de datos, pero no aporta ninguna variable nueva, dado que las etiquetas de columna son exactamente iguales; por consiguiente, no hay ningn archivo de revisin de datos perdidos de gran tamao. Aunque los valores para Comando_ y Subtipo_ son los mismos, el valor Etiqueta_ identifica la tabla de origen para cada grupo de casos dado que las dos tablas de frecuencia tienen distintos ttulos.
Ejemplo: Varias tablas con distintas etiquetas de columna
Se crea una variable nueva en el archivo de datos para cada etiqueta de columna nica en las tablas que se envan al archivo de datos. Este proceso ofrece como resultado bloques de valores perdidos si las tablas contienen distintas etiquetas de columna.
Figura 48-10 Dos tablas con distintas etiquetas de columna
La primera tabla tiene columnas con las etiquetas Salario inicial y Salario actual, no presentes en la segunda tabla, lo que resulta en una serie de valores perdidos para dichas variables en los casos de la segunda tabla. Por el contrario, la segunda tabla tiene columnas con las etiquetas Nivel de formacin acadmica y Meses desde el contrato, no presentes en la primera tabla, lo que resulta en una serie de valores perdidos para dichas variables en los casos de la primera tabla. Las variables discordantes como las de este ejemplo se pueden generar incluso con tablas del mismo subtipo. En este ejemplo, ambas tablas son del mismo subtipo.
Ejemplo: Archivos de datos no creados a partir de varias tablas
Si alguna tabla no tiene el mismo nmero de elementos de fila que otras tablas, no se crear ningn archivo de datos. El nmero de filas no tiene que ser el mismo; el nmero de elementos de fila que se convierten en variables en el archivo de datos debe ser el mismo. Por ejemplo, una tabla de contingencia de dos variables y una tabla de contingencia de tres variables contienen distintos nmeros de elementos de fila dado que la variable capa est anidada en la variable de fila de la presentacin de la tabla de contingencia de tres variables por defecto.
Figura 48-11 Tablas con distintos nmeros de elementos de fila
744 Captulo 48
Control de elementos de columna para las variables de control del archivo de datos
En el cuadro de dilogo Opciones del panel de control del Sistema de gestin de resultados puede especificar qu elementos de dimensin deben estar en las columnas y, por tanto, se utilizan para crear variables en el archivo de datos generado. Este proceso es equivalente al pivotado de la tabla en el Visor. Por ejemplo, el procedimiento Frecuencias genera una tabla de estadsticos descriptivos con estadsticos en las filas, mientras que el procedimiento Descriptivos genera una tabla de estadsticos descriptivos con estadsticos en las columnas. Para incluir ambos tipos de tabla en el mismo archivo de datos de forma significativa, debe cambiar la dimensin de columna de uno de los tipos de tabla. Dado que ambos tipos de tabla utilizan el nombre de elemento Estadsticos para la dimensin de estadsticos, podemos colocar los estadsticos de la tabla de estadsticos Frecuencias en las columnas si especifica Estadsticos (entre comillas) en la lista de nombres de dimensiones del cuadro de dilogo Opciones de SGR.
Figura 48-12 Cuadro de dilogo SGR: Opciones
745 Sistema de gestin de resultados Figura 48-13 Combinacin de distintos tipos de tablas en un archivo de datos mediante el pivotado de elementos de dimensin
Algunas de las variables incluyen valores perdidos, dado que las estructuras de tabla an no son exactamente iguales a los estadsticos de las columnas.
746 Captulo 48
Los caracteres no permitidos en los nombres de variable (por ejemplo, espacios, parntesis, etc.) se eliminan. Por ejemplo, Esta etiqueta (columna) se convierte en una variable con el nombre EstaEtiquetaColumna. Si la etiqueta empieza por un carcter permitido en los nombres de variable, pero no permitido como primer carcter (por ejemplo, un nmero), se inserta @ como prefijo. Por ejemplo, 2 se convierte en una variable llamada @2. Los caracteres de subrayado o los puntos al final de las tablas se eliminan de los nombres de variable resultantes. (Los caracteres de subrayado al final de las variables generadas automticamente Comando_, Subtipo_ y Etiqueta_ no se eliminan.) Si hay ms de un elemento en la dimensin de columna, los nombres de variable se generan mediante la combinacin de etiquetas de categora con caracteres de subrayado entre dichas etiquetas. Las etiquetas de grupo no se incluyen. Por ejemplo, si VarB se anida bajo VarA en las columnas, obtendr variables como CatA1_CatB1, pero no VarA_CatA1_VarB_CatB1.
Figura 48-14 Nombres de variable generados a partir de elementos de tabla
Los valores de los atributos command y subType de SGR no se ven afectados por el idioma de los resultados o la configuracin de presentacin para los nombres de variable y etiquetas o para los valores y etiquetas de valor. XML distingue entre maysculas y minsculas. El valor del atributo subType de frequencies no es igual al valor del atributo subType de Frequencies. Toda la informacin mostrada en la tabla se incluye en los valores de atributo de OXML. En el nivel de casillas individuales, OXML consta de elementos vacos que contienen atributos, pero no incluye ningn contenido distinto del que se incluye en los valores de atributo. La estructura de tablas en OXML se representa por filas; los elementos que representan las columnas se anidan en las filas y las casillas individuales se anidan en los elementos de columna:
<pivotTable...> <dimension axis=row...> <dimension axis=column...> <category...> <cell text=... number=... decimals=.../> </category> <category...> <cell text=... number=... decimals=.../> </category> </dimension>
El ejemplo anterior es una representacin simplificada de la estructura que muestra las relaciones descendentes/ascendentes de estos elementos. Sin embargo, el ejemplo no muestra las relaciones parentales/filiales, ya que suele haber niveles de elementos anidados intercalados. La siguiente figura muestra una tabla de frecuencias simple y la representacin completa de XML con los resultados de dicha tabla.
Figura 48-15 Tabla de frecuencias simple
Figura 48-16 XML con los resultados para la tabla de frecuencias simple <?xml version="1.0" encoding="UTF-8" ?> <outputTreeoutputTree xmlns="http://xml.spss.com/spss/oms" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://xml.spss.com/spss/oms http://xml.spss.com/spss/oms/spss-output-1.0.xsd"> <command text="Frequencies" command="Frequencies" displayTableValues="label" displayOutlineValues="label" displayTableVariables="label" displayOutlineVariables="label"> <pivotTable text="Gender" label="Gender" subType="Frequencies" varName="gender" variable="true"> <dimension axis="row" text="Gender" label="Gender" varName="gender" variable="true"> <group text="Valid"> <group hide="true" text="Dummy"> <category text="Female" label="Female" string="f" varName="gender"> <dimension axis="column" text="Statistics"> <category text="Frequency">
749 Sistema de gestin de resultados <cell text="216" number="216"/> </category> <category text="Percent"> <cell text="45.6" number="45.569620253165" decimals="1"/> </category> <category text="Valid Percent"> <cell text="45.6" number="45.569620253165" decimals="1"/> </category> <category text="Cumulative Percent"> <cell text="45.6" number="45.569620253165" decimals="1"/> </category> </dimension> </category> <category text="Male" label="Male" string="m" varName="gender"> <dimension axis="column" text="Statistics"> <category text="Frequency"> <cell text="258" number="258"/> </category> <category text="Percent"> <cell text="54.4" number="54.430379746835" decimals="1"/> </category> <category text="Valid Percent"> <cell text="54.4" number="54.430379746835" decimals="1"/> </category> <category text="Cumulative Percent"> <cell text="100.0" number="100" decimals="1"/> </category> </dimension> </category> </group> <category text="Total"> <dimension axis="column" text="Statistics"> <category text="Frequency"> <cell text="474" number="474"/> </category> <category text="Percent"> <cell text="100.0" number="100" decimals="1"/> </category> <category text="Valid Percent"> <cell text="100.0" number="100" decimals="1"/> </category> </dimension>
Como puede observar, una tabla sencilla de dimensiones reducidas genera una cantidad considerable de XML. Esto se debe en parte a que XML contiene informacin no evidente en la tabla original, informacin que puede no estar disponible en la tabla original y una cantidad determinada de redundancia. El contenido de la tabla tal y como aparece (o podra aparecer) en una tabla pivote en el Visor se incluye en los atributos de texto. A continuacin se muestra un ejemplo:
<command text="Frequencies" command="Frequencies"...>
Los atributos de texto se pueden ver afectados por el idioma de los resultados y la configuracin que influyen en la presentacin de los nombres de variable y etiquetas o valores y etiquetas de valor. En este ejemplo, el valor del atributo de texto difiere en funcin del idioma de los resultados, mientras que el valor del atributo de comando permanece igual independientemente del idioma de los resultados. Siempre que las variables o los valores se utilicen en las etiquetas de fila o columna, XML contiene un atributo de texto y uno o ms valores de atributo adicionales. A continuacin se muestra un ejemplo:
<dimension axis="row" text="Gender" label="Gender" varName="gender"> ...<category text="Female" label="Female" string="f" varName="gender">
Para una variable numrica, hay un atributo de nmero en lugar de un atributo de cadena. El atributo de etiqueta est presente slo si la variable o los valores tienen etiquetas definidas. Los elementos <cell> que contienen valores de casilla para los nmeros contienen el atributo de texto y uno o ms valores de atributo adicionales. A continuacin se muestra un ejemplo:
<cell text="45.6" number="45.569620253165" decimals="1"/>
El atributo de nmero es el valor numrico real sin redondear, mientras que el atributo de decimales indica el nmero de decimales que se muestran en la tabla. Dado que las columnas se anidan en las filas, el elemento de categora que identifica cada columna se repite para cada fila. Por ejemplo, dado que los estadsticos se muestran en las columnas, el elemento <category text="Frequency"> aparece tres veces en XML: una vez para la fila de hombre, una vez para la fila de mujer y una vez para la fila total.
Identificadores SGR
El objetivo del cuadro de dilogo Identificadores SGR es ofrecerle asistencia en la escritura de la sintaxis del comando OMS. Se puede utilizar este cuadro de dilogo para pegar los identificadores de subtipos y comandos seleccionados en una ventana de sintaxis de comandos.
La lista de subtipos disponibles depende de los comandos seleccionados en ese momento. Si se seleccionan varios comandos, la lista de subtipos disponibles es la unin de todos los subtipos que estn disponibles para cualquiera de los comandos seleccionados. Si no se selecciona ningn comando, en la lista aparecern todos los subtipos. Los identificadores se pegan en la posicin actual del cursor dentro de la ventana de sintaxis de comandos designada. Si no hay abierta ninguna ventana de sintaxis de comandos, se abrir automticamente una nueva ventana de sintaxis.
Cuando se pega un identificador de subtipos y/o comandos, ste aparece entre comillas, ya que la sintaxis del comando OMS exige que as sea. Las listas de identificadores de las palabras clave COMMANDS y SUBTYPES deben ir entre corchetes, por ejemplo:
/IF COMMANDS=['Crosstabs' 'Descriptives'] SUBTYPES=['Crosstabulation' 'Descriptive Statistics']
panel de titulares.
E Seleccione Copiar identificador de comandos de SGR o Copiar subtipo de tablas de SGR.
Este mtodo presenta una diferencia respecto al del cuadro de dilogo Identificadores de SGR: el identificador copiado no se pega automticamente en una ventana de sintaxis de comandos. Slo tiene que copiar el identificador en el Portapapeles y, a continuacin, podr pegarlo donde desee. Como los valores de los identificadores de subtipos y comandos son idnticos a los correspondientes valores de los atributos de subtipos y comandos de los resultados con formato XML (OXML), este mtodo de copiar y pegar puede resultar muy til para escribir transformaciones XSLT.
Copia de etiquetas SGR
En vez de identificadores, puede copiar etiquetas para utilizarlas con la palabra clave LABELS. Las etiquetas se pueden utilizar para diferenciar varios grficos o varias tablas del mismo tipo en las que el texto del titular refleja algn atributo del objeto de resultados concreto como las etiquetas o los nombres de las variables. Hay, no obstante, ciertos factores que pueden afectar al texto de la etiqueta: Si el procesamiento de segmentacin del archivo est activado, es posible que se aada a la etiqueta una identificacin con el grupo de segmentacin del archivo.
754 Captulo 48
Las etiquetas que incluyen informacin acerca de variables o valores se ven afectadas por la configuracin de la presentacin de nombres de variables/etiquetas y valores/etiquetas de valor del panel de titulares (men Edicin, Opciones, pestaa Etiquetas de los resultados). Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados (men Edicin, Opciones, pestaa General).
Para copiar etiquetas SGR
E Pulse con el botn derecho del ratn en la entrada del titular del elemento en el
panel de titulares.
E Seleccione Copiar etiqueta de SGR.
Al igual que ocurra con los identificadores de subtipos y comandos, las etiquetas deben ir entre comillas y toda la lista debe ir entre corchetes, por ejemplo:
/IF LABELS=['Employment Category' 'Education Level']
Apndice
El Administrador de acceso a bases de datos es una utilidad diseada para simplificar las fuentes de datos demasiado extensas o confusas a fin de utilizarlas con el Asistente para bases de datos. El Administrador de acceso a bases de datos permite a los usuarios y a los administradores personalizar sus orgenes de datos de las formas siguientes: Creando alias para las tablas y los campos de la base de datos. Creando nombres de variable para los campos. Ocultando las tablas y los campos no pertinentes. El Administrador de acceso a bases de datos no modifica su base de datos. En su lugar, genera archivos que contienen toda la informacin. Estos archivos actan como vistas de la base de datos. Puede utilizar este Administrador para especificar hasta tres vistas diferentes por base de datos: nivel de empresa, nivel de departamento y nivel personal. Tanto el Administrador como el Asistente para bases de datos reconocen estos archivos por los nombres siguientes: Nivel de empresa: dba01.inf Nivel de departamento: dba02.inf Nivel personal: dba03.inf Cada archivo contiene informacin especfica del nivel sobre un nmero cualquiera de fuentes de datos. Por ejemplo, su archivo dba03.inf puede contener informacin de la vista personal para una base de datos de contabilidad corporativa, para la base de datos de registro de horarios de su empresa y para una base de datos donde registre su coleccin de CD.
755
756 Apndice A
Cuando abra el Administrador, ste buscar la ruta de acceso de su sistema para estos archivos y mostrar automticamente informacin de cualquier origen de datos que haya configurado en las tres vistas.
Herencia y prioridades. Siempre que se utiliza el Asistente para bases de datos, ste
presenta la vista de nivel ms bajo de su origen de datos que encuentra en la ruta de acceso de su sistema, donde los niveles son (del ms alto al ms bajo) el de empresa, el de departamento y el personal. El archivo de cada nivel contiene informacin sobre todas las fuentes de datos para ese nivel. Por ejemplo, su departamento de marketing tendr un archivo, dba02.inf, con informacin sobre los alias de todas las vistas de base de datos establecidas para el departamento de marketing. Cada persona de este departamento tendr un archivo, dba03.inf, que contenga vistas personalizadas de todas las bases de datos que utilice. En el Administrador de acceso a bases de datos, los alias, los nombres de variable y el orden de ocultacin se heredan desde el nivel superior hacia abajo. Ejemplos: Si se oculta la tabla Regiones en el nivel de empresa, no podr verse en el nivel de departamento ni en el nivel personal. Esta tabla no se mostrara en el Asistente para bases de datos. El campo JOBCAT de la tabla VentasEmpleados no tiene un alias en el nivel de empresa, pero tiene el alias Categoras de trabajo en el nivel de departamento. Aparecer como Categoras de trabajo en el nivel personal. Adems, si a esta tabla se le asignara el alias Informacin sobre empleados en el nivel personal, el campo original (VentasEmpleados.JOBCAT) aparecera en el Asistente para bases de datos como Informacin sobre empleados.Categoras de trabajo. Para iniciar el Administrador de acceso a bases de datos, ejecute el archivo spssdbca.exe, que est instalado en el directorio de SPSS. Si desea obtener ms informacin sobre el Administrador de acceso a bases de datos, consulte la Ayuda en pantalla.
Apndice
Puede aadir automticamente un cdigo HTML personalizado a los documentos exportados al formato HTML, incluyendo: Ttulos de documentos HTML Especificacin de tipos de documentos Metaetiquetas y cdigo de procesos (por ejemplo, JavaScript) Texto mostrado antes y despus de los resultados exportados
un editor de texto.
E Sustituya los comentarios de los campos en las lneas entre dos corchetes angulares
de apertura (<<), por el texto o el cdigo HTML que desee insertar en sus documentos HTML exportados.
E Guarde el archivo como un archivo de texto.
Nota: Si cambia el nombre o la ubicacin del archivo de texto, deber modificar el registro del sistema para que utilice el archivo para personalizar los resultados HTML exportados.
757
758 Apndice B
759 Personalizacin de documentos HTML E En el panel de la izquierda del Editor del registro de configuraciones, seleccione: HHKEY_CURRENT_USER Software SPSS SPSS para Windows 14.0 Spsswin E En el panel derecho, pulse dos veces en la cadena HTMLFormatFile. E En Informacin del valor, escriba la ruta completa y el nombre del archivo de
texto que contenga las especificaciones de HTML personalizadas (por ejemplo, c:\misarchivos\htmlpersonal.txt).
760 Apndice B NVI Sales, Inc. </TITLE> <META NAME="keywords" CONTENT="gizmos, gadgets, gimcracks"> </HEAD> <BODY bgcolor="#FFFFFF"> <h2 align=center>NVI Sales</h2> <h3 align=center>Regional Data</h3> [Resultado exportado] <H4 align=center>This page made possible by... <br><br> <IMG SRC="spss2.gif" align=center></H4> </BODY> </HTML>
ndice
acceso a un servidor, 85 Access (Microsoft), 31 adicin de etiquetas de grupo, 312 agregacin de datos, 225 agregacin de funciones, 228 nombres y etiquetas de variable, 229 agrupacin de categoras, 149 agrupacin de filas o columnas, 312 ajuste, 324 control de la anchura de la columna para el texto ajustado, 324 etiquetas de variable y de valor, 105 alfa de Cronbach en Anlisis de fiabilidad, 599, 601 algoritmos, 17 alineacin, 107, 267, 335, 644 en el Editor de datos, 107 en las casillas, 335 resultados, 267, 644 almacenamiento de archivos, 68, 7273, 89 archivos de datos, 7273, 89 archivos de datos de SPSS, 68 consultas del archivo de base de datos, 47 almacenamiento de grficos, 277, 283288, 654, 674 almacenamiento de grficos interactivos con datos, 654 archivos BMP, 277, 283, 285, 674 archivos EPS, 277, 283, 287, 674 archivos JPEG, 277, 283284, 674 archivos PICT, 277, 283, 285, 674 archivos PNG, 286 archivos PostScript, 287 archivos TIFF, 286 archivos WMF, 277, 283, 288 formato WMF, 674 metarchivos, 277, 283, 674 almacenamiento de resultados, 277, 281282, 297, 308, 674, 686 almacenamiento de los resultados de borrador como texto, 308 formato de texto, 277, 282, 674 formato Excel, 277, 280 Formato PowerPoint, 277, 281 formato Word, 277, 280 HTML, 277, 280, 674 proteccin de contrasea, 297 publicacin en Web, 686 resultados de borrador, 308 almacenamiento de vistas de tablas pivote, 317 almacenamiento en la cach, 79 archivo activo, 79 anlisis alfa, 507 anlisis de componentes principales, 499, 507 anlisis de conglomerados Anlisis de conglomerados de K-medias, 533 anlisis de conglomerados jerrquico, 525 eficacia, 538 Anlisis de conglomerados de K-medias, 533 almacenamiento de informacin de conglomerados, 540 conceptos bsicos, 533
761
762 ndice
conglomerado de pertenencia, 540 criterios de convergencia, 539 distancias entre conglomerados, 540 eficacia, 538 ejemplos, 533 estadsticos, 533, 540 funciones adicionales del comando, 541 iteraciones, 539 mtodos, 533 valores perdidos, 540 Anlisis de conglomerados en dos fases, 515 almacenamiento en el archivo de trabajo, 523 almacenamiento en un archivo externo, 523 estadsticos, 523 grficos, 522 opciones, 519 anlisis de conglomerados jerrquico, 525 almacenamiento de nuevas variables, 531 casos de conglomerado, 525 conglomerado de pertenencia, 530531 dendrogramas, 531 diagramas de tmpanos, 531 ejemplo, 525 estadsticos, 525, 530 funciones adicionales del comando, 532 historial de conglomerado, 530 matrices de distancias, 530 medidas de distancia, 529 medidas de similaridad, 529 mtodos de conglomeracin, 529 orientacin de los grficos, 531 transformacin de medidas, 529 transformacin de valores, 529 variables de conglomerado, 525 anlisis de datos, 14 pasos bsicos, 14
Anlisis de fiabilidad, 599 coeficiente de correlacin intraclase, 601 correlaciones y covarianzas inter-elementos, 601 descriptivos, 601 ejemplo, 599 estadsticos, 599, 601 funciones adicionales del comando, 603 Kuder-Richardson 20, 601 Prueba de aditividad de Tukey, 601 tabla de ANOVA, 601 Tcuadrado de Hotelling, 601 anlisis de la varianza en ANOVA de un factor, 419 en Estimacin curvilnea, 479 en Medias, 396 en Regresin lineal, 474 anlisis de respuestas mltiples Frecuencias de respuestas mltiples, 576 tabla de contingencia, 578 Tablas de contingencia de respuestas mltiples, 578 tablas de frecuencias, 576 anlisis de series temporales prediccin, 484 prediccin de casos, 484 Anlisis discriminante, 487 almacenamiento de variables de clasificacin, 496 anlisis de casos de reserva, 688 coeficientes de la funcin, 491 criterios, 493 definicin de rangos, 490 Distancia de Mahalanobis, 493 ejemplo, 487 estadsticos, 487, 491 estadsticos descriptivos, 491
763 ndice
exportacin de informacin del modelo, 496 funciones adicionales del comando, 496 grficos, 494 lambda de Wilks, 493 matrices, 491 matriz de covarianzas, 494 mtodos de inclusin por pasos, 487 mtodos discriminantes, 493 opciones de presentacin, 493494 probabilidades previas, 494 seleccin de casos, 490 V de Rao , 493 valores perdidos, 494 variables de agrupacin, 487 variables independientes, 487 anlisis factorial, 499 anlisis de casos de reserva, 688 conceptos bsicos, 499 convergencia, 507, 509 descriptivos, 506 ejemplo, 499 estadsticos, 499, 506 formato de presentacin de los coeficientes, 511 funciones adicionales del comando, 512 grficos de saturaciones, 509 mtodos de extraccin, 507 mtodos de rotacin, 509 puntuaciones factoriales, 510 seleccin de casos, 505 valores perdidos, 511 anlisis imagen, 507 ancho de columna, 107, 324, 332, 655 control de la anchura mxima, 324 control de la anchura para el texto ajustado, 324 control de la anchura por defecto, 655 en el Editor de datos, 107
tablas pivote, 332 aos, 658 valores de dos dgitos, 658 ANOVA en ANOVA de un factor, 419 en Medias, 396 en MLG Univariante, 429 modelo, 433 ANOVA de un factor, 419 comparaciones mltiples, 423 contrastes, 422 contrastes polinmicos, 422 contrastes post hoc, 423 estadsticos, 426 funciones adicionales del comando, 427 opciones, 426 valores perdidos, 426 variables del factor, 419 apertura de archivos, 2530, 49 archivos de datos, 2526 archivos de datos de texto, 49 archivos de dBASE, 25, 28 archivos de Excel, 25, 27 archivos de hoja de clculo, 25, 28 archivos de Lotus 1-2-3, 25 archivos de Stata, 29 archivos delimitados por tabuladores, 25 archivos SYSTAT, 25 archivo activo, 77, 79 almacenamiento en la cach, 79 archivo activo virtual, 77 creacin de un archivo activo temporal, 79 archivo activo temporal, 79 archivo de diario, 642
764 ndice
archivo de modelo carga de modelos guardados para puntuar datos, 209 archivos, 271 adicin de un archivo de texto al Visor, 271 apertura, 25 archivos BMP, 277, 283, 285, 674 exportacin de grficos, 277, 283, 285, 674 archivos de bases de datos, 2931, 3435, 3739, 42, 45, 47 acceso a una base de datos, 34 almacenamiento de consultas, 47 clusula Where, 39 consultas de parmetros, 39, 42 conversin de cadenas en variables numricas, 45 creacin de relaciones, 37 definicin de variables, 45 especificacin de criterios, 39 expresiones condicionales, 39 lectura, 2931, 35 Microsoft Access, 31 muestreo aleatorio, 39 pedir el valor al usuario, 42 propiedades de la relacin, 38 seguridad de la base de datos, 34 seleccin de campos de datos, 35 seleccin de una fuente de datos, 31 sintaxis de SQL, 47 uniones entre tablas, 3738 verificacin de los resultados, 47 archivos de datos, 2526, 49, 6768, 7273, 76, 79, 8890, 238 adicin de comentarios, 636 almacenamiento, 68, 7273
almacenamiento de resultados como archivos de datos con formato SPSS, 721 almacenamiento de subconjuntos de variables, 76 apertura, 2526 Dimensions, 62 informacin sobre el archivo, 6768 informacin sobre el diccionario, 6768 mejora del rendimiento para archivos grandes, 79 mrInterview, 62 proteccin, 77 Quancept, 62 Quanvert, 62 reestructuracin, 238 servidores remotos, 8890 texto, 49 transposicin, 217 varios archivos de datos abiertos, 119 volteado, 217 archivos de dBASE, 25, 28, 7273 almacenamiento, 7273 apertura, 25, 28 archivos de Excel, 25, 27, 7273, 663 adicin de elementos de men para enviar datos a Excel, 663 almacenamiento, 7273 apertura, 25, 27 archivos de hoja de clculo, 25, 2728, 77 apertura, 28 escritura de nombres de variable, 77 lectura de nombres de variables, 27 rangos de lectura, 27 archivos de Lotus 1-2-3, 25, 7273, 663 adicin de elementos de men para enviar datos a Lotus, 663
765 ndice
almacenamiento, 7273 apertura, 25 archivos de SAS almacenamiento, 72 apertura, 25 archivos de Stata, 29 almacenamiento, 72 apertura, 29 lectura, 25 archivos delimitados por tabuladores, 25, 27, 49, 7273, 77 almacenamiento, 7273 apertura, 25 escritura de nombres de variable, 77 lectura de nombres de variables, 27 archivos EPS, 277, 283, 287, 674 exportacin de grficos, 277, 283, 287, 674 archivos JPEG, 277, 283284, 674 exportacin de grficos, 277, 283284, 674 archivos PICT, 277, 283, 285, 674 exportacin de grficos, 277, 283, 285, 674 archivos PNG, 277, 286 exportacin de grficos, 277, 286 archivos porttiles por defecto, 73 archivos PostScript (encapsulado), 277, 287, 674 exportacin de grficos, 277, 287, 674 archivos SYSTAT, 25 apertura, 25 archivos TIFF, 286 exportacin de grficos, 277, 283, 286, 674 archivos WMF, 277, 283, 288, 674 exportacin de grficos, 277, 283, 288, 674 Asesor estadstico, 15 asignacin de memoria en Anlisis de conglomerados en dos fases, 519
asignacin de rangos a los casos, 176 percentiles, 177 puntuaciones de Savage, 177 rangos fraccionales, 177 valores empatados, 179 asimetra en Cubos OLAP, 402 en Descriptivos, 363 en el Informe de estadsticos en columnas, 594 en el Informe de estadsticos en filas, 587 en Explorar, 371 en Frecuencias, 355 en Medias, 396 en Resumir, 390 asociacin lineal por lineal en Tablas de contingencia, 380 Aspectos de tabla, 321323 aplicacin, 322 creacin, 323 atributos de variable, 107108 copia y pegado, 107108 automatizacin OLE, 687, 700, 702703, 705706 conceptos bsicos, 700, 702703, 706 convenciones de denominacin de variables, 702 mtodos, 705 procesamiento con, 687 propiedades, 705 uso de objetos, 700, 703, 706 autoprocesos, 661, 696, 698 archivo de autoproceso, 699 creacin, 696 eventos de activacin, 698 autovalores en Anlisis factorial, 506507 en Regresin lineal, 474
766 ndice
ayuda contextual, 314 bsqueda de definiciones de etiqueta en las tablas pivote, 314 ayuda en pantalla, 17 Asesor estadstico, 15 barra de estado, 9 ocultacin, 10 presentacin, 10 barras de herramientas, 664, 666668 creacin, 664, 667 creacin de nuevas herramientas, 668 edicin de iconos de mapa de bits, 668 personalizacin, 664, 667 presentacin en distintas ventanas, 666 presentacin y ocultacin, 664 Bonferroni en ANOVA de un factor, 423 en MLG, 439 bordes, 301, 328, 330 presentacin de bordes ocultos, 330 Visor de borrador, 301 bordes de casillas, 301 Visor de borrador, 301 botn Aceptar, 11 botn Ayuda, 11 botn Cancelar, 11 botn Pegar, 11 botn Restablecer, 11 botones, 668 edicin de iconos de mapa de bits de las barras de herramientas, 668 C de Dunnett en ANOVA de un factor, 423 en MLG, 439
clculo de variables, 161 clculo de variables de cadena nuevas, 164 cambio del nombre de los conjuntos de datos, 122 cambio del orden de filas y columnas, 311 cambio del tamao de los grficos exportados, 283 capas, 289, 314316, 324, 330 cambio, 315 creacin, 314 en las tablas pivote, 314 en Tablas de contingencia, 380 impresin, 289, 324, 330 presentacin, 314, 316 casillas de las tablas pivote, 320, 326, 331332, 334337, 339 alineacin, 335 anchuras, 332 formatos, 326 formatos de valores, 334 fuentes, 331 mrgenes, 336 modificacin de texto, 339 ocultacin, 319 presentacin, 319 sombreado, 337 titulares, 337 casos, 113, 115, 238 bsqueda de duplicados, 146 bsqueda en el Editor de datos, 115 insercin de nuevos casos, 113 ordenacin, 216 ponderacin, 236 restructuracin en variables, 238 seleccin de subconjuntos, 231, 233, 235 casos de reserva, 688 anlisis, 688
767 ndice
casos duplicados (registros) bsqueda y filtrado, 146 casos filtrados, 116 en el Editor de datos, 116 categora de referencia en MLG, 436 CCI. Vase coeficiente de correlacin intraclase, 601 centrado de resultados, 267, 644 chi-cuadrado, 544 asociacin lineal por lineal, 380 correccin por continuidad de Yates, 380 en Tablas de contingencia, 380 estadsticos, 547 opciones, 547 para la independencia, 380 Pearson, 380 prueba exacta de Fisher, 380 prueba para una muestra, 544 rango esperado, 547 razn de verosimilitud, 380 valores esperados, 547 valores perdidos, 547 chi-cuadrado de la razn de verosimilitud en Tablas de contingencia, 380 chi-cuadrado de Pearson en Tablas de contingencia, 380 clasificacin en Curva COR..., 631 coeficiente alfa en Anlisis de fiabilidad, 599, 601 coeficiente de contingencia en Tablas de contingencia, 380 coeficiente de correlacin de los rangos en Correlaciones bivariadas, 447
coeficiente de correlacin de Spearman en Correlaciones bivariadas, 447 en Tablas de contingencia, 380 coeficiente de correlacin intraclase (CCI) en Anlisis de fiabilidad, 601 coeficiente de correlacin r en Correlaciones bivariadas, 447 en Tablas de contingencia, 380 coeficiente de dispersin (CDD) en Estadsticos de la razn, 615 coeficiente de incertidumbre en Tablas de contingencia, 380 coeficiente de variacin (CDV) en Estadsticos de la razn, 615 coeficientes beta en Regresin lineal, 474 coeficientes de regresin en Regresin lineal, 474 colores en las tablas pivote, 328, 331, 337 bordes, 328 fondo de la casilla, 337 fuente, 331 mscara de la casilla, 337 columna total en informes, 595 columnas, 332, 338 cambio de la anchura en tablas pivote, 332 seleccin en tablas pivote, 338 comando EXECUTE pegado desde cuadros de dilogo, 351 comparacin de grupos en Cubos OLAP, 405 comparacin de variables en Cubos OLAP, 405 comparaciones mltiples en ANOVA de un factor, 423
768 ndice
comparaciones mltiples post hoc, 423 conceptos bsicos, 755 conglomeracin seleccin de procedimientos, 513 conjuntos de datos cambio del nombre, 122 conjuntos de respuestas mltiples categoras mltiples, 132 definicin, 132 dicotomas mltiples, 132 conjuntos de variables, 637638 definicin, 637 utilizacin, 638 consejos sobre los procesos, 687, 692, 694, 700701, 703, 705707, 710, 715 adicin de una descripcin, 710 cuadros de dilogo personalizados, 710 declaraciones de variables, 701 depuracin, 715 funcionamiento de los procesos, 700 obtencin de objetos de automatizacin, 703 procedimientos, 707 procesos de iniciacin, 694 propiedades y mtodos, 705 ventana de proceso, 692 visor de objetos, 706 construccin de trminos, 434 contrastes en ANOVA de un factor, 422 en MLG, 436 contrastes de desviacin en MLG, 436 contrastes de diferencia en MLG, 436 Contrastes de Helmert en MLG, 436
contrastes de linealidad en Medias, 396 contrastes polinmicos en ANOVA de un factor, 422 en MLG, 436 contrastes repetidos en MLG, 436 contrastes simples en MLG, 436 control de pgina en el informe de estadsticos en columnas, 596 en informes de estadsticos en filas, 589 convergencia en Anlisis de conglomerados de K-medias, 539 en Anlisis factorial, 507, 509 copia, 267, 273 grficos, 273 resultados, 267 tablas pivote, 273 correccin por continuidad de Yates en Tablas de contingencia, 380 Correlacin de Pearson en Correlaciones bivariadas, 447 en Tablas de contingencia, 380 correlaciones de orden cero, 454 en Correlaciones bivariadas, 447 en Correlaciones parciales, 451 en Tablas de contingencia, 380 Correlaciones bivariadas coeficientes de correlacin, 447 estadsticos, 449 funciones adicionales del comando, 450 nivel de significacin, 447 opciones, 449 valores perdidos, 449
769 ndice
correlaciones de orden cero en Correlaciones parciales, 454 Correlaciones parciales, 451 correlaciones de orden cero, 454 en Regresin lineal, 474 estadsticos, 454 funciones adicionales del comando, 454 opciones, 454 valores perdidos, 454 cuadros de dilogo, 12, 637638, 642, 710, 712 controles, 11 definicin de conjuntos de variables, 637 especificaciones opcionales, 12 iconos de variable, 13 informacin sobre la variable, 13 orden de presentacin de variables, 642 presentacin de etiquetas de variable, 11, 642 presentacin de nombres de variable, 11, 642 procesamiento, 710, 712 reordenacin de listas de destino, 639 seleccin de variables, 12 subcuadros de dilogo, 12 utilizacin de conjuntos de variables, 638 variables, 10 cuartiles en Frecuencias, 355 Cubos OLAP, 399 estadsticos, 402 ttulos, 406 curtosis en Cubos OLAP, 402 en Descriptivos, 363 en el Informe de estadsticos en columnas, 594 en el Informe de estadsticos en filas, 587 en Explorar, 371 en Frecuencias, 355
en Medias, 396 en Resumir, 390 Curva COR, 631 estadsticos y grficos, 634 d en Tablas de contingencia, 380 d de Somers en Tablas de contingencia, 380 Data List, 77 frente al comando Get Data, 77 datos categricos, 129 conversin de datos de intervalo en categoras discretas, 149 datos con formato CSV, 49 Datos de Dimensions, 62 datos de serie temporal creacin de nuevas variables de serie temporal, 203 definicin de variables de datos, 201 funciones de transformacin, 204 sustitucin de valores perdidos, 206 transformaciones de los datos, 200 datos delimitados por comas, 49 datos delimitados por espacios, 49 datos ponderados, 260 y de datos reestructurados, 260 declaraciones de variables, 701702 convenciones de denominacin, 702 en procesos, 701702 definicin de variables, 98, 101, 103105, 107108, 124 aplicacin de un diccionario de datos, 135 copia y pegado de atributos, 107108 etiquetas de valor, 104, 124 etiquetas de variable, 103
770 ndice
plantillas, 107108 tipos de datos, 101 valores perdidos, 105 definir conjuntos de respuestas mltiples, 574 categoras, 574 dicotomas, 574 etiquetas del conjunto, 574 nombres del conjunto, 574 dendrogramas en Anlisis de conglomerados jerrquico, 531 depuracin de procesos, 715716 avance por los procesos, 715 panel de depuracin, 716 puntos de interrupcin, 715 descomposicin jerrquica, 434 Descriptivos, 361 almacenamiento de puntuaciones z, 361 estadsticos, 363 funciones adicionales del comando, 364 orden de presentacin, 363 desplazamiento de filas y columnas, 311 desviacin absoluta promedio (DAP) en Estadsticos de la razn, 615 desviacin tpica en Cubos OLAP, 402 en Descriptivos, 363 en el Informe de estadsticos en columnas, 594 en el Informe de estadsticos en filas, 587 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 en Medias, 396 en MLG Univariante, 444 en Resumir, 390 DfAjuste en Regresin lineal, 471
DfBeta en Regresin lineal, 471 diagnsticos de colinealidad en Regresin lineal, 474 diagnsticos por caso en Regresin lineal, 474 diagramas de caja comparacin de niveles del factor, 372 comparacin de variables, 372 en Explorar, 372 diagramas de dispersin en Regresin lineal, 469 diagramas de dispersin por nivel en Explorar, 372 en MLG Univariante, 444 diagramas de tmpanos en Anlisis de conglomerados jerrquico, 531 diario de la sesin, 642 diccionario, 6768 diccionario de datos aplicar desde otro archivo, 135 diferencia honestamente significativa de Tukey en ANOVA de un factor, 423 en MLG, 439 diferencia menos significativa en ANOVA de un factor, 423 en MLG, 439 diferencial relativo al precio (DRP) en Estadsticos de la razn, 615 diferencias entre grupos en Cubos OLAP, 405 diferencias entre variables en Cubos OLAP, 405 directorio temporal, 642 definir ubicacin en modo local, 642 variable de entorno SPSSTMPDIR, 642
771 ndice
distancia chi-cuadrado en Distancias, 459 distancia de bloques en Distancias, 459 distancia de Chebychev en Distancias, 459 Distancia de Cook en MLG, 442 en Regresin lineal, 471 Distancia de Mahalanobis en Anlisis discriminante, 493 en Regresin lineal, 471 distancia de Minkowski en Distancias, 459 Distancia eucldea en Distancias, 459 distancia eucldea al cuadrado en Distancias, 459 Distancias, 457 clculo de distancias entre casos, 457 clculo de distancias entre variables, 457 ejemplo, 457 estadsticos, 457 funciones adicionales del comando, 461 medidas de disimilaridad, 459 medidas de similaridad, 460 transformacin de medidas, 459460 transformacin de valores, 459460 divisin divisin entre columnas del informe, 595 divisor de paneles Editor de datos, 116 divisor de ventanas Editor de datos, 116 DMS de Fisher en MLG, 439
edicin de datos, 111112 Editor de datos, 95, 98, 107, 109117, 663 alineacin, 107 ancho de columna, 107 bsqueda de casos, 115 cambiar tipo de datos, 115 casos filtrados, 116 definicin de variables, 98 desplazamiento de variables, 114 edicin de datos, 111112 envo de datos a otras aplicaciones, 663 impresin, 117 insercin de nuevas variables, 114 insercin de nuevos casos, 113 introduccin de datos, 109 introduccin de datos no numricos, 110 introduccin de datos numricos, 110 opciones de presentacin, 116 restricciones de los valores de datos, 111 varias vistas/paneles, 116 varios archivos de datos abiertos, 119 Vista de datos, 96 Vista de variables, 97 eliminacin de etiquetas de grupo, 312 eliminacin de resultados, 266 eliminacin de varios comandos EXECUTE en archivos de sintaxis, 351 eliminacin hacia atrs en Regresin lineal, 467 encabezados, 292293 entrada de datos, 109 error tpico en Curva COR..., 634 en Descriptivos, 363 en Explorar, 371 en Frecuencias, 355
772 ndice
en MLG, 442, 444 error tpico de la asimetra en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 error tpico de la curtosis en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 error tpico de la media en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 escala, 99 en Anlisis de fiabilidad, 599 en Escalamiento multidimensional, 605 nivel de medida, 99, 129 escalamiento de tablas pivote, 324, 330 Escalamiento multidimensional, 605 condicionalidad, 609 creacin de matrices de distancias, 608 criterios, 610 definicin de la forma de los datos, 607 dimensiones, 609 ejemplo, 605 estadsticos, 605 funciones adicionales del comando, 611 medidas de distancia, 608 modelos de escalamiento, 609 niveles de medida, 609 opciones de presentacin, 610 transformacin de valores, 608 espacio en disco, 77, 79 temporal, 77, 79 espacio temporal en disco, 77, 79
estadstico de Brown-Forsythe en ANOVA de un factor, 426 estadstico de Cochran en Tablas de contingencia, 380 estadstico de Mantel-Haenszel en Tablas de contingencia, 380 estadstico de Welch en ANOVA de un factor, 426 estadstico Durbin-Watson en Regresin lineal, 474 estadstico R en Medias, 396 en Regresin lineal, 474 Estadsticos de la razn, 613 estadsticos, 615 estadsticos descriptivos en Anlisis de conglomerados en dos fases, 523 en Descriptivos, 361 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 en MLG Univariante, 444 en Resumir, 390 Estimacin curvilnea, 479 almacenamiento de intervalos de pronstico, 484 almacenamiento de residuos, 484 almacenamiento de valores pronosticados, 484 anlisis de la varianza, 479 inclusin de constante, 479 modelos, 483 prediccin, 484 estimaciones de Blom, 177 estimaciones de los parmetros en MLG Univariante, 444 estimaciones de potencia en MLG Univariante, 444
773 ndice
estimaciones de proporcin en la asignacin de rangos a los casos, 177 estimaciones de Rankit, 177 estimaciones de tamao de efecto en MLG Univariante, 444 estimaciones de Tukey, 177 estimaciones de Van der Waerden, 177 estimador biponderado de Tukey en Explorar, 371 estimador en onda de Andrews en Explorar, 371 estimador-M de Huber en Explorar, 371 Estimador-M redescendente de Hampel en Explorar, 371 Estimadores robustos centrales en Explorar, 371 estudio de control de casos Prueba T para muestras relacionadas, 411 estudio de pares relacionados en Prueba T para muestras relacionadas, 411 eta en Medias, 396 en Tablas de contingencia, 380 eta-cuadrado en Medias, 396 en MLG Univariante, 444 etiquetas, 312 eliminacin, 312 frente a nombres de subtipos en SGR, 729 insercin de etiquetas de grupo, 312 etiquetas de grupo, 312 etiquetas de valor, 104, 111, 116, 124, 647 aplicacin a varias variables, 130 copia, 130 en archivos de datos fusionados, 222
en el Editor de datos, 116 en el panel de titulares, 647 en las tablas pivote, 647 insercin de saltos de lnea, 105 uso para entrada de datos, 111 etiquetas de variable, 103, 642, 647 de los cuadros de dilogo, 11, 642 en archivos de datos fusionados, 222 en el panel de titulares, 647 en las tablas pivote, 647 insercin de saltos de lnea, 105 eventos de activacin, 698 autoprocesos, 698 exclusin de resultados del Visor con SGR, 737 Explorar, 367 estadsticos, 371 funciones adicionales del comando, 374 grficos, 372 opciones, 374 transformaciones de potencia, 373 valores perdidos, 374 exportacin de datos, 663 adicin de elementos de men para exportar datos, 663 exportacin de grficos, 277, 283288, 671, 674 produccin automatizada, 671 tamao del grfico, 283 exportacin de resultados, 277, 281282, 674, 686 formato Excel, 277, 280 Formato PowerPoint, 277 formato Word, 277, 280 HTML, 280 publicacin en Web, 686 SGR, 721
774 ndice
F mltiple de Ryan-Einot-Gabriel-Welsch en ANOVA de un factor, 423 en MLG, 439 factor de inflacin de la varianza en Regresin lineal, 474 factorizacin de ejes principales, 507 fiabilidad de dos mitades en Anlisis de fiabilidad, 599, 601 fiabilidad de Spearman-Brown en Anlisis de fiabilidad, 601 filas, 338 seleccin en tablas pivote, 338 formato, 301 columnas en informes, 586 resultados de borrador, 301 formato con comas, 101, 103 Formato de archivo de datos de SPSS envo de resultados a un archivo de datos, 731, 737 formato de archivo SAV envo de resultados a un archivo de datos de SPSS, 731, 737 formato de cadena, 101 formato de columnas, 334 cambio en las tablas pivote, 334 formato de dlar, 101, 103 formato de puntos, 101, 103 formato Excel exportacin de resultados, 277, 280 formato fijo, 49 formato libre, 49 formato numrico, 101, 103 Formato PowerPoint exportacin de resultados, 277 formato Word exportacin de resultados, 277, 280
formatos de entrada, 103 formatos de fecha, 101, 103, 658 aos de dos dgitos, 658 formatos de moneda, 659 formatos de moneda personalizados, 101, 659 formatos de presentacin, 103 Frecuencias, 353 estadsticos, 355 formatos, 359 grficos, 358 orden de presentacin, 359 supresin de tablas, 359 frecuencias de los conglomerados en Anlisis de conglomerados en dos fases, 523 Frecuencias de respuestas mltiples, 576 valores perdidos, 576 fuentes, 116, 271, 306, 331 colores, 331 en el Editor de datos, 116 en el panel de resultados, 271 en las casillas, 331 en Visor de borrador, 306 funcin de adelanto, 204 funcin de diferencia, 204 funcin de diferencia estacional, 204 funcin de media mvil anterior, 204 funcin de media mvil centrada, 204 funcin de medianas mviles, 204 funcin de suavizado, 204 funcin de suma acumulada, 204 funciones, 164 tratamiento de los valores perdidos, 165 fusin de archivos de datos archivos con casos distintos, 218 archivos con distintas variables, 222 cambio de nombre de las variables, 221
775 ndice
informacin sobre el diccionario, 222 gamma en Tablas de contingencia, 380 gamma de Goodman y Kruskal en Tablas de contingencia, 380 Get Data, 77 frente al comando Data List, 77 frente al comando Get Capture, 77 grficos, 265, 273274, 277, 649, 674 conceptos bsicos, 617 copia, 273 copia en otras aplicaciones, 273 creacin, 617 en Curva COR..., 631 etiquetas de caso, 479 exportacin, 277, 674 modificacin, 621 notas al pie, 625 ocultacin, 265 pegado en otras aplicaciones, 274 plantillas, 628, 649 relacin de aspecto, 649 subttulos, 625 ttulos, 625 valores perdidos, 626 grficos de barras en Frecuencias, 358 grficos de importancia en Anlisis de conglomerados en dos fases, 522 grficos de la importancia de las variables en Anlisis de conglomerados en dos fases, 522 grficos de los residuos en MLG Univariante, 444 grficos de perfil en MLG, 437
grficos de probabilidad normal en Explorar, 372 en Regresin lineal, 469 grficos de saturaciones en Anlisis factorial, 509 grficos de sectores en Frecuencias, 358 ttulos, 625 grficos de tallo y hojas en Explorar, 372 grficos interactivos, 273, 654 almacenamiento de datos con grficos, 654 copia en otras aplicaciones, 273 incrustacin como objetos ActiveX, 273 opciones, 654 grficos normales sin tendencia en Explorar, 372 grficos parciales en Regresin lineal, 469 GT2 de Hochberg en ANOVA de un factor, 423 en MLG, 439 H de Kruskal-Wallis en Pruebas para dos muestras independientes, 565 histogramas en Explorar, 372 en Frecuencias, 358 en Regresin lineal, 469 HTML, 277, 280, 674, 757 adicin de cdigo personalizado, 757 exportacin de resultados, 277, 280, 674 iconos, 668 de los cuadros de dilogo, 13
776 ndice
edicin de iconos de mapa de bits de las barras de herramientas, 668 identificadores de comandos, 728 impresin, 117, 289290, 292293, 295, 306307, 324, 330, 341 capas, 289, 324, 330 control de las rupturas de tabla, 341 datos, 117 encabezados y pies, 292293 escalamiento de tablas, 324, 330 espacio entre los elementos de resultados, 295 grficos, 289 nmeros de pginas, 295 preparar pgina, 292 presentacin preliminar, 290 resultados de borrador, 306307 resultados de texto, 289 tablas pivote, 289 tamao del grfico, 295 incrustacin grficos interactivos, 273 tablas pivote, 273 ndice de concentracin en Estadsticos de la razn, 615 informacin sobre el archivo, 6768 informacin sobre la variable, 635 informe de estadsticos en columnas, 592 Informe de estadsticos en columnas, 592 columnas totales, 595 control de pgina, 596 diseo de pgina, 589 formato de columnas, 586 funciones adicionales del comando, 598 numeracin de pginas, 597 subtotales, 596 total final, 597
valores perdidos, 597 Informe de estadsticos en filas, 583 columnas de datos, 583 columnas de ruptura, 583 control de pgina, 588 diseo de pgina, 589 espaciado de ruptura, 588 formato de columnas, 586 funciones adicionales del comando, 598 numeracin de pginas, 589 ordenacin de secuencias, 583 pies, 591 ttulos, 591 valores perdidos, 589 variables en los ttulos, 591 informes columnas totales, 595 comparacin de columnas, 595 divisin de valores de las columnas, 595 informe de estadsticos en columnas, 592 informes de estadsticos en filas, 583 multiplicacin de valores de las columnas, 595 totales compuestos, 595 insercin de etiquetas de grupo, 312 intervalos de confianza almacenamiento en Regresin lineal, 471 en ANOVA de un factor, 426 en Curva COR..., 634 en Explorar, 371 en MLG, 436, 444 en Prueba T para muestras relacionadas, 414 en Prueba t para una muestra, 416 en Pruebas t para muestras independientes, 411 en Regresin lineal, 474 intervalos de pronstico almacenamiento en Estimacin curvilnea, 484
777 ndice
almacenamiento en Regresin lineal, 471 introduccin de datos, 109111 no numricos, 110 numricos, 110 uso de etiquetas de valor, 111 iteraciones en Anlisis de conglomerados de K-medias, 539 en Anlisis factorial, 507, 509 justificacin, 267, 644 resultados, 267, 644 kappa en Tablas de contingencia, 380 kappa de Cohen en Tablas de contingencia, 380 KR20 en Anlisis de fiabilidad, 601 Kuder-Richardson 20 (KR20) en Anlisis de fiabilidad, 601 LAG (funcin), 204 lambda en Tablas de contingencia, 380 lambda de Goodman y Kruskal en Tablas de contingencia, 380 lambda de Wilks en Anlisis discriminante, 493 lengua cambio del idioma de los resultados, 642 lenguaje de comandos, 343 lneas de cuadrcula, 330 tablas pivote, 330 listado de casos, 387 listas de destino, 639
listas de variables, 639 reordenacin de listas de destino, 639 mrgenes, 292, 336 en las casillas, 336 mrgenes de la pgina, 292 matriz de configuracin en Anlisis factorial, 499 matriz de correlaciones en Anlisis discriminante, 491 en Anlisis factorial, 499, 506 matriz de covarianzas en Anlisis discriminante, 491, 494 en MLG, 442 en Regresin lineal, 474 matriz de transformacin en Anlisis factorial, 499 mxima verosimilitud en Anlisis factorial, 507 mximo comparacin de columnas del informe, 595 en Cubos OLAP, 402 en Descriptivos, 363 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 en Medias, 396 en Resumir, 390 media de varias columnas del informe, 595 en ANOVA de un factor, 426 en Cubos OLAP, 402 en Descriptivos, 363 en el Informe de estadsticos en columnas, 594 en el Informe de estadsticos en filas, 587 en Estadsticos de la razn, 615
778 ndice
en Explorar, 371 en Frecuencias, 355 en Medias, 396 en Resumir, 390 subgrupo, 393, 399 media armnica en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 media geomtrica en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 media ponderada en Estadsticos de la razn, 615 media recortada en Explorar, 371 mediana en Cubos OLAP, 402 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 en Medias, 396 en Resumir, 390 mediana agrupada en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 Medias, 393, 688 estadsticos, 396 opciones, 396 resultados en ASCII, 688 medias de grupo, 393, 399 medias de subgrupo, 393, 399 medias marginales estimadas en MLG Univariante, 444
medias observadas en MLG Univariante, 444 medida de diferencia de configuracin en Distancias, 459 medida de diferencia de tamao en Distancias, 459 medida de disimilaridad de Lance y Williams, 459 en Distancias, 459 medida de distancia de phi cuadrado en Distancias, 459 medidas de dispersin en Descriptivos, 363 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 medidas de distancia en Anlisis de conglomerados jerrquico, 529 en Distancias, 459 medidas de distribucin en Descriptivos, 363 en Frecuencias, 355 medidas de similaridad en Anlisis de conglomerados jerrquico, 529 en Distancias, 460 medidas de tendencia central en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 memoria, 642 mens, 9, 663 personalizacin, 663 metarchivos, 277, 283, 674 exportacin de grficos, 277, 283, 674 mtodos, 705 objetos de automatizacin OLE, 705
779 ndice
mtodos de seleccin, 338 seleccin de filas y columnas en tablas pivote, 338 Microsoft Access, 31 mnimo comparacin de columnas del informe, 595 en Cubos OLAP, 402 en Descriptivos, 363 en Estadsticos de la razn, 615 en Explorar, 371 en Frecuencias, 355 en Medias, 396 en Resumir, 390 mnimos cuadrados generalizados en Anlisis factorial, 507 mnimos cuadrados no ponderados en Anlisis factorial, 507 mnimos cuadrados ponderados en Regresin lineal, 463 MLG almacenamiento de matrices, 442 almacenamiento de variables, 442 contrastes post hoc, 439 grficos de perfil, 437 modelo, 433 suma de cuadrados, 433 MLG Univariante, 429, 445 contrastes, 436 diagnsticos, 444 medias marginales estimadas, 444 opciones, 444 presentacin, 444 moda en Frecuencias, 355 modelo compuesto en Estimacin curvilnea, 483
modelo cuadrtico en Estimacin curvilnea, 483 modelo cbico en Estimacin curvilnea, 483 modelo de crecimiento en Estimacin curvilnea, 483 modelo de curva S en Estimacin curvilnea, 483 modelo de Guttman en Anlisis de fiabilidad, 599, 601 modelo de potencia en Estimacin curvilnea, 483 modelo estrictamente paralelo en Anlisis de fiabilidad, 599, 601 modelo exponencial en Estimacin curvilnea, 483 modelo inverso en Estimacin curvilnea, 483 modelo lineal en Estimacin curvilnea, 483 modelo logartmico en Estimacin curvilnea, 483 modelo logstico en Estimacin curvilnea, 483 modelo paralelo en Anlisis de fiabilidad, 599, 601 modelos factoriales completos en MLG, 433 modelos personalizados en MLG, 433 modificadores de la lnea de comando, 683 Unidad de produccin, 683 modo distribuido, 83, 85, 8890, 92, 679 acceso a un archivo de datos, 88, 90 almacenamiento de archivos de datos, 89 procedimientos disponibles, 92
780 ndice
rutas de acceso UNC, 92 Unidad de produccin, 679 mrInterview, 62 muestra aleatoria, 39 archivos de bases de datos, 39 seleccin, 234 semilla de aleatorizacin, 165 muestras relacionadas, 561, 569 muestreo muestra aleatoria, 234 multiplicacin multiplicacin entre columnas del informe, 595 Newman-Keuls en MLG, 439 nivel de medida, 99, 129 definicin, 99 iconos de los cuadros de dilogo, 13 nominal, 99 nivel de medida, 99, 129 notacin cientfica, 101, 334, 642 en las tablas pivote, 334 supresin en resultados, 642 notas al pie, 325, 337338, 340 adicin a una tabla, 340 en los grficos, 625 marcadores, 325, 337 renumerar, 338 nuevas funciones SPSS 14.0, 2 numeracin de pginas, 292, 295 en el informe de estadsticos en columnas, 597 en informes de estadsticos en filas, 589 nmero de casos en Cubos OLAP, 402 en Medias, 396
en Resumir, 390 nmero mximo de ramas en Anlisis de conglomerados en dos fases, 519 nmeros de puerto, 85 objetos, 700, 702703, 706 conceptos bsicos, 700, 702 convenciones de denominacin de variables, 702 uso en procesos, 700, 703, 706 objetos ActiveX, 273 objetos de automatizacin, 700, 702703, 705706 convenciones de denominacin de variables, 702 mtodos, 705 propiedades, 705 tipos, 702 uso en procesos, 700, 703, 706 visor de objetos, 706 ocultacin, 265266, 319320, 664 barras de herramientas, 664 etiquetas de dimensin, 320 filas y columnas, 319 notas al pie, 320 resultados de un procedimiento, 266 textos al pie, 320 ttulos, 320 ocultacin (exclusin) de resultados del Visor con SGR, 737 opciones, 642, 644645, 647, 649, 654655, 658659, 661 aos de dos dgitos, 658 aspecto de tablas pivote, 655 datos, 658 directorio temporal, 642 etiquetas de los resultados, 647 generales, 642 grficos, 649
781 ndice
grficos interactivos, 654 moneda, 659 procesos, 661 Visor, 644 Visor de borrador, 645 opciones del grfico, 649 orden de presentacin, 311 ordenacin de casos, 216 ordinal, 99 nivel de medida, 99, 129 OXML, 753 pares de variables, 238 creacin, 238 pegado, 274276 grficos, 274 objetos especiales, 276 tablas pivote, 274275 tablas pivote como tablas, 275 percentiles en Explorar, 371 en Frecuencias, 355 permisos, 92 pestaa Immediate, 716 ventana de proceso, 716 pestaa Loaded, 716 ventana de proceso, 716 pestaa Stack, 716 ventana de proceso, 716 pestaa Watch, 716 ventana de proceso, 716 phi en Tablas de contingencia, 380 pies, 292293 pivotado control con SGR para resultados exportados, 744
plantillas, 107108, 649 definicin de variables, 107108 en los grficos, 628, 649 uso de un archivo de datos externo como plantilla, 135 ponderacin de casos, 236 ponderaciones fraccionarias en Tablas de contingencia, 236 por defecto, 99, 642 ajuste de los nombres largos de variable en los resultados, 99 archivos porttiles, 73 de los cuadros de dilogo, 11, 642 generados por SGR, 745 nombres de variable de casos mixtos, 99 reglas, 99 truncado de nombres de variable largos en versiones anteriores, 73 porcentajes en Tablas de contingencia, 384 porcentajes de fila en Tablas de contingencia, 384 porcentajes de la columna en Tablas de contingencia, 384 porcentajes totales en Tablas de contingencia, 384 PowerPoint, 281 exportacin de resultados como PowerPoint, 281 prediccin en Estimacin curvilnea, 484 preparar pgina, 292293, 295 encabezados y pies, 293 tamao del grfico, 295 presentacin, 265, 319320, 664 barras de herramientas, 664 etiquetas de dimensin, 320
782 ndice
filas o columnas, 319 notas al pie, 320 resultados, 265 textos al pie, 320 ttulos, 320 primera en Cubos OLAP, 402 en Medias, 396 en Resumir, 390 procedimientos, 707 procesos, 707 procedimientos de funcin, 707 procedimientos de subrutinas, 707 procedimientos globales, 661, 709 procesamiento de segmentacin del archivo, 230 procesos, 661, 663, 668, 687689, 691, 694, 696, 710, 715 adicin a mens, 663 adicin de una descripcin, 710 archivo de autoproceso, 661, 699 archivo de procedimientos globales, 661, 709 autoprocesos, 689, 696, 699 conceptos bsicos, 687 creacin, 691, 696 cuadros de dilogo, 710, 712 declaracin de variables, 701702 depuracin, 715716 ejecucin, 687 ejecucin mediante los botones de la barra de herramientas, 668 mediante sintaxis de comandos, 718, 720 procesos de iniciacin, 694 uso de objetos de automatizacin, 700, 702703, 706 ventana de proceso, 692, 694 procesos de iniciacin, 694
procesos globales, 709 produccin automatizada, 671 profundidad del rbol en Anlisis de conglomerados en dos fases, 519 programacin con lenguaje de comandos, 343 propiedades, 323324, 705 objetos de automatizacin OLE, 705 tablas, 324 tablas pivote, 323 proteccin de contrasea, 297 Proximidades en Anlisis de conglomerados jerrquico, 525 prueba b de Tukey en ANOVA de un factor, 423 en MLG, 439 Prueba binomial, 548 dicotomas, 548 estadsticos, 550 funciones adicionales del comando, 551 opciones, 550 valores perdidos, 550 Prueba de aditividad de Tukey en Anlisis de fiabilidad, 599, 601 Prueba de comparacin por parejas de Gabriel en ANOVA de un factor, 423 en MLG, 439 Prueba de comparacin por parejas de Games y Howell en ANOVA de un factor, 423 en MLG, 439 prueba de esfericidad de Bartlett en Anlisis factorial, 506 prueba de Friedman en pruebas para varias muestras relacionadas, 571
783 ndice
Prueba de Kolmogorov-Smirnov para una muestra, 554 distribucin de contraste, 554 estadsticos, 556 funciones adicionales del comando, 557 opciones, 556 valores perdidos, 556 prueba de la mediana en Pruebas para dos muestras independientes, 565 prueba de Levene en ANOVA de un factor, 426 en Explorar, 372 en MLG Univariante, 444 prueba de Lilliefors en Explorar, 372 prueba de los signos en Pruebas para dos muestras relacionadas, 561 prueba de McNemar en Pruebas para dos muestras relacionadas, 561 en Tablas de contingencia, 380 Prueba de rachas, 551 estadsticos, 553 funciones adicionales del comando, 554 opciones, 553 puntos de corte, 551, 553 valores perdidos, 553 prueba de rangos mltiples de Duncan en ANOVA de un factor, 423 en MLG, 439 prueba de reacciones extremas de Moses en Pruebas para dos muestras independientes, 559 prueba de Scheff en ANOVA de un factor, 423 en MLG, 439
prueba de Shapiro-Wilk en Explorar, 372 prueba de Wilcoxon de los rangos con signo en Pruebas para dos muestras relacionadas, 561 prueba exacta de Fisher en Tablas de contingencia, 380 Prueba M de Box en Anlisis discriminante, 491 prueba t en MLG Univariante, 444 en Prueba T para muestras relacionadas, 411 en Prueba t para una muestra, 414 en Pruebas t para muestras independientes, 407 prueba t de Dunnett en ANOVA de un factor, 423 en MLG, 439 prueba t de Sidak en ANOVA de un factor, 423 en MLG, 439 prueba t de Student, 407 prueba t de Waller-Duncan en ANOVA de un factor, 423 en MLG, 439 prueba t dependiente en Prueba T para muestras relacionadas, 411 prueba t para dos muestras en Pruebas t para muestras independientes, 407 Prueba T para muestras independientes, 407 definicin de grupos, 410 intervalos de confianza, 411 opciones, 411 valores perdidos, 411 variables de agrupacin, 410 variables de cadena, 410 Prueba T para muestras relacionadas, 411 opciones, 414
784 ndice
seleccin de variables relacionadas, 411 valores perdidos, 414 Prueba T para una muestra, 414 funciones adicionales del comando, 417 intervalos de confianza, 416 opciones, 416 valores perdidos, 416 pruebas de homogeneidad de las varianzas en ANOVA de un factor, 426 en MLG Univariante, 444 pruebas de normalidad en Explorar, 372 pruebas no paramtricas chi-cuadrado, 544 Prueba de Kolmogorov-Smirnov para una muestra, 554 Prueba de rachas, 551 Pruebas para dos muestras independientes, 557 Pruebas para dos muestras relacionadas, 561 Pruebas para varias muestras independientes, 565 Pruebas para varias muestras relacionadas, 569 Pruebas para dos muestras independientes, 557 definicin de grupos, 560 estadsticos, 561 funciones adicionales del comando, 561 opciones, 561 tipos de pruebas, 559 valores perdidos, 561 variables de agrupacin, 560 Pruebas para dos muestras relacionadas, 561 estadsticos, 565 funciones adicionales del comando, 565 opciones, 565 tipos de pruebas, 564 valores perdidos, 565
pruebas para la independencia chi-cuadrado, 380 Pruebas para varias muestras independientes, 565 definicin de rango, 568 estadsticos, 568 funciones adicionales del comando, 569 opciones, 568 tipos de pruebas, 567 valores perdidos, 568 variables de agrupacin, 568 Pruebas para varias muestras relacionadas, 569 estadsticos, 571 funciones adicionales del comando, 572 tipos de pruebas, 571 publicacin de resultados, 686 mediante la Unidad de produccin, 685 puntos de interrupcin, 715 en procesos, 715 puntuacin, 208 carga de modelos guardados, 209 visualizacin de modelos cargados, 212 puntuaciones de Savage, 177 puntuaciones factoriales, 510 puntuaciones factoriales de Anderson-Rubin, 510 puntuaciones factoriales de Bartlett, 510 puntuaciones normales en la asignacin de rangos a los casos, 177 puntuaciones z almacenamiento como variables, 361 en Descriptivos, 361 en la asignacin de rangos a los casos, 177 Q de Cochran en pruebas para varias muestras relacionadas, 571 Quancept, 62
785 ndice
Quanvert, 62 R mltiple en Regresin lineal, 474 R-E-G-W F en ANOVA de un factor, 423 en MLG, 439 R-E-G-W Q en ANOVA de un factor, 423 en MLG, 439 R2 Cambio en R2, 474 en Medias, 396 en Regresin lineal, 474 R2 ajustado en Regresin lineal, 474 Rachas de Wald-Wolfowitz en Pruebas para dos muestras independientes, 559 rango en Cubos OLAP, 402 en Descriptivos, 363 en Estadsticos de la razn, 615 en Frecuencias, 355 en Medias, 396 en Resumir, 390 rango mltiple de Ryan-Einot-Gabriel-Welsch en ANOVA de un factor, 423 en MLG, 439 razn entre covarianzas en Regresin lineal, 471 recodificacin de los valores, 149, 169170, 172173, 180 recuento de apariciones, 167 recuento esperado en Tablas de contingencia, 384
recuento observado en Tablas de contingencia, 384 reduccin de grficos exportados, 283 reestructuracin de los datos, 238, 241244, 247, 249250, 252253, 255256, 258, 260 conceptos bsicos, 238 creacin de una nica variable de ndice para variables a casos, 250 creacin de variables de ndice para variables a casos, 247 creacin de varias variables de ndice para variables a casos, 252 ejemplo de casos a variables, 242 ejemplo de dos ndices para variables a casos, 249 ejemplo de un ndice para variables a casos, 249 ejemplo de variables a casos, 241 grupos de variables para variables a casos, 243 opciones para casos a variables, 258 opciones para variables a casos, 253 ordenacin de los datos para reestructurar casos a variables, 256 seleccin de datos para reestructurar casos a variables, 255 seleccin de datos para reestructurar variables a casos, 244 tipos de reestructuracin, 238 y datos ponderados, 260 regresin grficos, 469 Regresin lineal, 463 regresin mltiple, 463 Regresin lineal, 463 almacenamiento de nuevas variables, 471 bloques, 463 estadsticos, 474
786 ndice
exportacin de informacin del modelo, 471 funciones adicionales del comando, 477 grficos, 469 mtodos de seleccin de variables, 467, 476 ponderaciones, 463 residuos, 471 valores perdidos, 476 variable de seleccin, 469 regresin mltiple en Regresin lineal, 463 relacin de aspecto, 649 rendimiento, 79 cach de datos, 79 residuos almacenamiento en Estimacin curvilnea, 484 almacenamiento en Regresin lineal, 471 en Tablas de contingencia, 384 residuos eliminados en MLG, 442 en Regresin lineal, 471 residuos estudentizados en Regresin lineal, 471 residuos no tipificados en MLG, 442 residuos tipificados en MLG, 442 en Regresin lineal, 471 Respuesta mltiple funciones adicionales del comando, 582 resultados, 263, 265267, 272273, 275, 277, 296, 299, 339, 644, 674 alineacin, 267, 644 almacenamiento, 296 borrador, 299 cambio del idioma de los resultados, 642 centrado, 267, 644
copia, 266267 copia en otras aplicaciones, 273 copia y pegado de mltiples elementos, 275 desplazamiento, 266 eliminacin, 266 exportacin, 277, 674 modificacin, 339 ocultacin, 265 pegado en otras aplicaciones, 272 presentacin, 265 Visor, 263 Resmenes de casos, 387 Resumir estadsticos, 390 opciones, 389 rho en Correlaciones bivariadas, 447 en Tablas de contingencia, 380 riesgo en Tablas de contingencia, 380 riesgo relativo en Tablas de contingencia, 380 rotacin de etiquetas, 313 rotacin equamax en Anlisis factorial, 509 rotacin oblimin directa en Anlisis factorial, 509 rotacin quartimax en Anlisis factorial, 509 rotacin varimax en Anlisis factorial, 509 rupturas de tabla, 341 S-stress en Escalamiento multidimensional, 605
787 ndice
saltos de lnea etiquetas de variable y de valor, 105 seleccin de casos, 231 muestra aleatoria, 234 rango de casos, 235 rango de fechas, 235 rango de horas, 235 segn criterios de seleccin, 233 seleccin hacia delante en Regresin lineal, 467 seleccin por pasos en Regresin lineal, 467 semilla de aleatorizacin, 165 sealizacin de vistas de tablas pivote, 317 sealizadores, 317 separacin de tablas, 341 control de las rupturas de tabla, 341 servidores, 85 acceso, 85 adicin, 85 edicin, 85 nombres, 85 nmeros de puerto, 85 servidores remotos, 83, 85, 8890, 92, 679 acceso, 85 acceso a un archivo de datos, 88, 90 adicin, 85 almacenamiento de archivos de datos, 89 edicin, 85 procedimientos disponibles, 92 rutas de acceso UNC, 92 Unidad de produccin, 679 SGR, 721, 751 control de pivotes de tabla, 731, 744 exclusin de resultados del Visor, 737 Formato de archivo de datos de SPSS, 731, 737
formato de archivo SAV, 731, 737 formato de texto, 731 identificadores de comandos, 728 nombres de variable en los archivos SAV, 745 subtipos de tabla, 728 tipos de objetos de resultados, 725 Uso de XSLT con OXML, 753 XML, 731, 747 signo de porcentaje, 334 en las tablas pivote, 334 signo dlar, 334 en las tablas pivote, 334 sintaxis, 343, 351, 642, 644645, 667, 671, 718, 720 acceso a SPSS Command Syntax Reference, 17 anotaciones de los resultados, 347 archivo de diario, 349, 351, 642 ejecucin, 351 ejecucin de sintaxis de comandos mediante botones de las barras de herramientas, 667 log, 644645 mediante procesos, 718, 720 pegado, 346 pegado en los procesos, 719 reglas de la Unidad de produccin, 671 reglas de sintaxis, 344 sintaxis de comandos, 343, 351, 642, 644645, 663, 668, 671 acceso a SPSS Command Syntax Reference, 17 adicin a mens, 663 anotaciones de los resultados, 347 archivo de diario, 349, 351, 642 ejecucin, 351 ejecucin mediante los botones de la barra de herramientas, 668 formato de la Unidad de produccin, 682
788 ndice
log, 644645 pegado, 346 reglas de la Unidad de produccin, 671 reglas de sintaxis, 344 Sistema de gestin de resultados (SGR), 721, 751 sistema de medida, 642 sombreado, 337 en las casillas, 337 SPSS pasos bsicos, 14 stress en Escalamiento multidimensional, 605 Student-Newman-Keuls en ANOVA de un factor, 423 en MLG, 439 suavizado T4253H, 204 subconjuntos de casos muestra aleatoria, 234 seleccin, 231, 233, 235 subtipos, 728 frente a etiquetas, 729 subtipos de tabla, 728 frente a etiquetas, 729 subttulos en los grficos, 625 subtotales en el informe de estadsticos en columnas, 596 suma en Cubos OLAP, 402 en Descriptivos, 363 en Frecuencias, 355 en Medias, 396 en Resumir, 390 suma de cuadrados, 434 en MLG, 433
sustitucin de valores perdidos interpolacin lineal, 207 media de la serie, 207 media de los puntos adyacentes, 207 mediana de los puntos adyacentes, 207 tendencia lineal, 207 T2 de Tamhane en ANOVA de un factor, 423 en MLG, 439 T3 de Dunnett en ANOVA de un factor, 423 en MLG, 439 tabla de contingencia en Tablas de contingencia, 377 respuesta mltiple, 578 tablas, 341 control de las rupturas de tabla, 341 tablas de contingencia, 377 Tablas de contingencia, 377 capas, 380 estadsticos, 380 formatos, 386 grficos de barras agrupadas, 380 ponderaciones fraccionarias, 236 presentacin de casillas, 384 supresin de tablas, 377 variables de control, 380 Tablas de contingencia de respuestas mltiples, 578 definicin de rangos de valores, 580 emparejamiento de las variables entre los conjuntos de respuestas, 581 porcentajes basados en casos, 581 porcentajes basados en respuestas, 581 porcentajes de casilla, 581 valores perdidos, 581
789 ndice
tablas de frecuencias en Explorar, 371 en Frecuencias, 353 tablas pivote, 265, 272275, 277, 289, 309314, 319, 321, 323326, 328, 330, 332, 338339, 341, 655, 674, 680 adicin de texto al pie, 339 agrupacin de filas o columnas, 312 ajustes en la anchura de columna por defecto, 655 anchuras de casillas, 332 aspecto por defecto para las tablas nuevas, 655 bordes, 328 bsqueda de definiciones de etiqueta, 314 cambio del aspecto, 321 cambio del orden de presentacin, 311 capas, 314 control de las rupturas de tabla, 341 control del formato en los trabajos de produccin, 680 copia, 273 copia en otras aplicaciones, 273 copia y pegado de mltiples tablas, 275 desagrupacin de filas o columnas, 312 desplazamiento de filas y columnas, 311 edicin, 309 edicin de dos o ms, 309 eliminacin de etiquetas de grupo, 312 escalamiento para ajustarse a la pgina, 324, 330 exportacin como HTML, 277, 674 formatos de casilla, 326 gestin, 309 identificacin de dimensiones, 310 impresin de capas, 289 impresin de tablas grandes, 341 incrustacin como objetos ActiveX, 273
insercin de etiquetas de grupo, 312 lneas de cuadrcula, 330 ocultacin, 265 pegado como metarchivos, 274 pegado como tablas, 272, 275 pegado como texto, 275 pegado en otras aplicaciones, 272 pivotado, 309310 presentacin de bordes ocultos, 330 presentacin y ocultacin de casillas, 319 propiedades, 323 propiedades de las notas al pie, 325 propiedades generales, 324 restablecimiento de los valores por defecto, 313 rotacin de etiquetas, 313 seleccin de filas y columnas, 338 texto de continuacin, 330 transposicin de filas y columnas, 311 utilizando iconos, 310 tamaos, 270 en titulares, 270 tau de Goodman y Kruskal en Tablas de contingencia, 380 tau de Kruskal en Tablas de contingencia, 380 tau-b en Tablas de contingencia, 380 Tau-b de Kendall en Correlaciones bivariadas, 447 en Tablas de contingencia, 380 tau-c en Tablas de contingencia, 380 Tau-c de Kendall , 380 en Tablas de contingencia, 380 Tcuadrado de Hotelling en Anlisis de fiabilidad, 599, 601
790 ndice
trminos de interaccin, 434 texto, 49, 271, 277, 282, 299, 308, 339, 674 adicin al Visor, 271 adicin de un archivo de texto al Visor, 271 archivos de datos, 49 creacin de resultados de texto, 299 en las casillas, 339 exportacin de resultados como texto, 277, 282, 674 exportacin de resultados de borrador como texto, 308 texto de continuacin, 330 para tablas pivote, 330 texto de etiqueta vertical, 313 textos al pie, 339 adicin a una tabla, 339 tipificacin en Anlisis de conglomerados en dos fases, 519 tipos de datos, 101, 103, 115, 659 cambio, 115 definicin, 101 formatos de entrada, 103 formatos de presentacin, 103 moneda personalizada, 101, 659 tipos de objetos de resultados en SGR, 725 titulares, 268270 cambio de los niveles, 270 contraccin, 269 en el Visor, 268 expansin, 269 ttulos, 271 adicin al Visor, 271 en Cubos OLAP, 406 en los grficos, 625
tolerancia en Regresin lineal, 474 totales, 688 aplicacin automtica de la negrita en los resultados, 688 totales finales en el informe de estadsticos en columnas, 597 transformaciones condicionales, 163 transformaciones de archivos, 238 agregacin de datos, 225 fusin de archivos de datos, 218, 222 ordenacin de casos, 216 ponderacin de casos, 236 procesamiento de segmentacin del archivo, 230 reestructuracin de los datos, 238 transposicin de variables y casos, 217 transformaciones de los datos, 658 asignacin de rangos a los casos, 176 clculo de variables, 161 funciones, 164 recodificacin de los valores, 169170, 172173, 180 retraso de la ejecucin, 658 transformaciones condicionales, 163 variables de cadena, 164 variables de series temporales, 200, 203 transposicin de filas y columnas, 311 transposicin de variables y casos, 217 tratamiento del ruido en Anlisis de conglomerados en dos fases, 519 U de Mann-Whitney en Pruebas para dos muestras independientes, 559 ltima en Cubos OLAP, 402
791 ndice
en Medias, 396 en Resumir, 390 umbral inicial en Anlisis de conglomerados en dos fases, 519 Unidad de produccin, 642, 644645, 671, 674, 676, 678680, 683, 685 archivos de resultados, 671 control del formato en las tablas pivote, 680 control del formato mediante sintaxis de comandos, 682 ejecucin de varios trabajos de produccin, 683 entrada de macro, 678 especificacin de un servidor remoto, 679 exportacin de grficos, 671, 674 exportacin de resultados, 674 modificadores de la lnea de comando, 683 opciones, 679 programacin de trabajos de produccin, 683 publicacin de resultados, 685 publicacin en Web, 685 reglas de sintaxis, 671 sustitucin de valores en archivos de sintaxis, 676 uso de la sintaxis de comandos de archivos de diario, 642 uso de la sintaxis de comandos de la anotacin, 644645 unidades compartidas, 92 V en Tablas de contingencia, 380 V de Cramr en Tablas de contingencia, 380 V de Rao en Anlisis discriminante, 493
valores, 334 formato de presentacin de las tablas pivote, 334 valores atpicos en Anlisis de conglomerados en dos fases, 519 en Explorar, 371 en Regresin lineal, 469 valores de datos de categorizacin, 149 valores de influencia en MLG, 442 en Regresin lineal, 471 valores definidos por el usuario como perdidos, 105 valores extremos en Explorar, 371 valores perdidos, 105 definicin, 105 en Anlisis factorial, 511 en ANOVA de un factor, 426 en Correlaciones bivariadas, 449 en Correlaciones parciales, 454 en Curva COR..., 634 en el informe de estadsticos en columnas, 597 en el Informe de estadsticos en filas, 589 en Explorar, 374 en la prueba de chi-cuadrado, 547 en las frecuencias de respuestas mltiples, 576 en las funciones, 165 en las tablas de contingencia de respuestas mltiples, 581 en los grficos, 626 en Prueba binomial, 550 en Prueba de Kolmogorov-Smirnov para una muestra, 556 en Prueba de rachas, 553 en Prueba T para muestras relacionadas, 414 en Prueba t para una muestra, 416
792 ndice
en Pruebas para dos muestras independientes, 561 en Pruebas para dos muestras relacionadas, 565 en Pruebas para varias muestras independientes, 568 en Pruebas t para muestras independientes, 411 en Regresin lineal, 476 reemplazo en datos de serie temporal, 206 variables de cadena, 105 valores pronosticados almacenamiento en Estimacin curvilnea, 484 almacenamiento en Regresin lineal, 471 valores pronosticados ponderados en MLG, 442 valores tipificados en Descriptivos, 361 variable de entorno SPSSTMPDIR, 642 variable de seleccin en Regresin lineal, 469 variables, 12, 98, 114, 238, 635, 637, 642 cambio de nombre de los archivos de datos fusionados, 221 de los cuadros de dilogo, 10 definicin, 98 definicin de conjuntos de variables, 637 desplazamiento, 114 informacin sobre la definicin, 635 informacin sobre variables en los cuadros de dilogo, 13 insercin de nuevas variables, 114 orden de presentacin de los cuadros de dilogo, 642 recodificacin, 169170, 172173, 180 restructuracin en casos, 238 seleccin en los cuadros de dilogo, 12
variables de agrupacin, 238 creacin, 238 variables de cadena, 105, 110 clculo de variables de cadena nuevas, 164 de los cuadros de dilogo, 10 fragmentacin de cadenas largas en versiones anteriores, 73 introduccin de datos, 110 recodificacin a valores enteros consecutivos, 180 valores perdidos, 105 variables de control en Tablas de contingencia, 380 variables de entorno, 642 SPSSTMPDIR, 642 variables de escala categorizacin para la generacin de variables categricas, 149 variables de fecha adicin o sustraccin de variables de fecha/hora, 183 creacin de variable de fecha/hora a partir de conjunto de variables, 183 creacin de variable de fecha/hora a partir de una cadena, 183 definicin para datos de serie temporal, 201 extraccin de parte de variable de fecha/hora, 183 variables de segmentacin en Agregar datos, 225 varianza en Cubos OLAP, 402 en Descriptivos, 363 en el Informe de estadsticos en columnas, 594 en el Informe de estadsticos en filas, 587 en Explorar, 371
793 ndice
en Frecuencias, 355 en Medias, 396 en Resumir, 390 varias vistas/paneles Editor de datos, 116 varios archivos de datos abiertos, 119 velocidad, 79 cach de datos, 79 ventana activa, 8 ventana de proceso, 692, 694, 706 men Depurar, 715 pestaa Immediate, 716 pestaa Loaded, 716 pestaa Stack, 716 pestaa Watch, 716 propiedades, 694 visor de objetos, 706 ventana designada, 8 ventanas, 7 ventana activa, 8 ventana designada, 8 ventanas de ayuda, 17 Visor, 263, 265271, 276, 295296, 644, 647 almacenamiento de documentos, 296 cambio de las fuentes de los titulares, 271 cambio de los niveles de titulares, 270 cambio de los tamaos de los titulares, 270 contraccin de titulares, 269 copia de resultados, 267 desplazamiento de los resultados, 266 eliminacin de resultados, 266 espacio entre los elementos de resultados, 295 exclusin de tipos de resultados con SGR, 737 expansin de titulares, 269 muestra de los valores de datos, 647 ocultacin de resultados, 265
opciones de presentacin, 644 paneles de resultados, 263 paneles de titulares, 263 pegado de objetos especiales, 276 presentacin de etiquetas de valor, 647 presentacin de etiquetas de variable, 647 presentacin de nombres de variable, 647 titulares, 268 Visor de borrador, 299301, 306308, 642, 645 almacenamiento de resultados, 308 bordes de casillas, 301 bordes de columnas, 301 bordes de filas, 301 cambio de fuentes, 306 caracteres de caja, 301 control de la presentacin de los resultados por defecto, 642 establecimiento del tipo de Visor por defecto, 300 formato de resultados, 301 impresin, 306307 opciones de presentacin, 645 visor de objetos, 706 Vista de datos, 96 Vista de variables, 97 W de Kendall en pruebas para varias muestras relacionadas, 571 Web, 686 publicacin de resultados en, 686 XML almacenamiento de resultados como XML, 721 envo de resultados a XML, 731
794 ndice
estructura de tablas en OXML, 747 Resultados OXML del SGR, 753 XSLT uso con OXML, 753 Z de Kolmogorov-Smirnov en Prueba de Kolmogorov-Smirnov para una muestra, 554 en Pruebas para dos muestras independientes, 559