Вы находитесь на странице: 1из 31

ESTADISTICA EN SPSS

AGENDA DE TRABAJO PRIMER DIA: TEMA Presentacin del curso Tema 1: Introduccin al SPSS 18 Receso 1 Tema 2: Estadstica descriptiva Taller de aplicacin 1 Receso 2 Tema 3: Tablas Taller de aplicacin 2 Receso 3 Tema 4: Comparar medias Indicaciones generales DURACION 30 90 15 120 45 60 90 30 15 90 15 TIEMPO 08h00 a 08h30 08h30 a 10h00 10h00 a 10h15 10h15 a 12h15 12h15 a 13h00 13h00 a 14h00 14h00 a 15h30 15h30 a 16h00 16h00 a 16h15 16h15 a 17h45 17h45 a 18h00

SEGUNDO DIA: TEMA Taller de repaso Tema 5: Anlisis de varianzas Receso 1 Tema 6: Regresin lineal Taller de aplicacin 4 Tema 7: Control de calidad Receso 2 Taller de aplicacin 5 Tema 8: Anlisis Cluster Taller de aplicacin 6 Receso 3 Taller de Evaluacin final Cierre del curso DURACION 30 90 15 60 45 60 60 30 60 30 15 90 15 TIEMPO 08h00 a 08h30 08h30 a 10h00 10h00 a 10h15 10h15 a 11h15 11h15 a 12h00 12h00 a 13h00 13h00 a 14h00 14h00 a 14h30 14h30 a 15h30 15h30 a 16h00 16h00 a 16h15 16h15 a 17h45 17h45 a 18h00

Contenido
ESTADISTICA EN SPSS ............................................................................................................................. 1 1. INTRODUCCION AL PROGRAMA SPSS 18 ........................................................................................ 5 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 2. Presentacin PASW 18 (SPSS) ................................................................................................. 5 Introduccin de datos manuales ............................................................................................ 5 Abrir y guardar archivos .......................................................................................................... 5 Importacin de datos .............................................................................................................. 5 Men Datos: Ordenar, fundir archivos, seleccionar casos ..................................................... 5 Men Transformar: Calcular, Recodificar ............................................................................... 6

ESTADISTICA DESCRIPTIVA: ............................................................................................................. 7 2.1. 2.2. 2.3. 2.4. Eleccin de la tcnica estadstica a utilizar: ............................................................................ 7 Distribucin de frecuencias..................................................................................................... 7 Estadstica descriptiva: medidas de tendencia central, dispersin, posicin y forma ........... 7 Representaciones grficas: ..................................................................................................... 7 Diagramas de barras ....................................................................................................... 7 Grficos de sectores ........................................................................................................ 7 Grficos de dispersin..................................................................................................... 7 Histogramas: ................................................................................................................... 8 Grficos probabilsticos ................................................................................................... 8 Generador de grficos..................................................................................................... 8

2.4.1. 2.4.2. 2.4.3. 2.4.4. 2.4.5. 2.4.6. 2.5.

Anlisis exploratorio: .............................................................................................................. 8 Clculo de estadsticos descriptivos................................................................................ 8 Mtodos grficos: ........................................................................................................... 8 Comparando dos grupos: ................................................................................................ 8 Estandarizando variables ................................................................................................ 9

2.5.1. 2.5.2. 2.5.3. 2.5.4. 2.6. 3.

Taller de aplicacin ................................................................................................................. 9

ANALISIS DE TABLAS...................................................................................................................... 10 3.1. 3.2. Tablas de contingencia.......................................................................................................... 10 Anlisis e inferencias segn tipo de variables....................................................................... 10 Ambas variables cuantitativas ...................................................................................... 10 Ambas variables nominales .......................................................................................... 10 Ambas variables ordinales ............................................................................................ 11 Una variable de intervalo y otra nominal ..................................................................... 11

3.2.1. 3.2.2. 3.2.3. 3.2.4. 3.3.

Grficos ................................................................................................................................. 11 2

3.4. 3.5. 3.6. 3.7. 4.

Capas ..................................................................................................................................... 11 Tablas Personalizadas ........................................................................................................... 12 Tablas De Respuestas Mltiples............................................................................................ 12 Taller De Aplicacin............................................................................................................... 13

COMPARAR MEDIAS ..................................................................................................................... 14 4.1. 4.2. 4.3. 4.4. Anlisis General De Medias................................................................................................... 14 Pruebas T Para Media De Una Muestra ................................................................................ 14 Pruebas De Medias Para Muestras Pareadas O Relacionadas.............................................. 14 Pruebas De Medias Para Muestras Independientes ............................................................. 14

5. 6.

ANOVA DE UN FACTOR Y PRUEBA KRUSKAL WALLIS .................................................................... 14 REGRESIN LINEAL........................................................................................................................ 15 6.1. 6.2. 6.3. Conceptos y supuestos importantes de la Regresin Lineal................................................. 15 Proceso y contrastes para realizar una regresin lineal ....................................................... 15 Aplicacin en SPSS ................................................................................................................ 17 Botn Estadsticos ......................................................................................................... 17 Botn Grficos............................................................................................................... 18 Botn Guardar............................................................................................................... 18

6.3.1. 6.3.2. 6.3.3. 6.4. 7.

Taller de aplicacin ............................................................................................................... 19

GRAFICOS DE CONTROL DE CALIDAD............................................................................................ 20 7.1. 7.2. 7.3. 7.4. 7.5. Conceptos y supuestos importantes de los grficos de control ........................................... 20 Cartas o grficos de control por variables ............................................................................ 20 Cartas o grficos de control por atributos ............................................................................ 21 Anlisis de los Grficos de control ........................................................................................ 22 Grficos de control en SPSS .................................................................................................. 24 Grfico X-barra .............................................................................................................. 24 Grfico para datos individuales..................................................................................... 25 Grfico para p y np cuando los casos son unidades ..................................................... 26 Grfico para p y np cuando los casos son subgrupos ................................................... 26 Para obtener grficos c y u donde los casos son unidades ........................................... 26 Para obtener grficos c y u donde los casos son subgrupos ......................................... 26 Ejemplos y ejercicios propuestos .................................................................................. 27

7.5.1. 7.5.2. 7.5.3. 7.5.4. 7.5.5. 7.5.6. 7.5.7. 8.

ANALISIS CLUSTER ......................................................................................................................... 28 8.1. 8.2. Conceptos y supuestos importantes del anlisis cluster ...................................................... 28 Proceso del anlisis Cluster ................................................................................................... 28 3

8.2.1. 8.2.2. 8.2.3. 8.3.

Eleccin de las variables: .............................................................................................. 28 Eleccin de una medida de asociacin: ........................................................................ 29 Eleccin de la tcnica cluster: ....................................................................................... 29

Aplicacin en SPSS ................................................................................................................ 30 Botn Mtodo ............................................................................................................... 30 Botn Estadsticos ......................................................................................................... 31 Botn Grficos............................................................................................................... 31

8.3.1. 8.3.2. 8.3.3.

1. INTRODUCCION AL PROGRAMA SPSS 18


1.1.Presentacin PASW 18 (SPSS)
Veamos una presentacin PPT donde se presenta de manera general al programa PASW 18 (antes SPSS)

1.2.Introduccin de datos manuales


Para practicar el ingreso de datos manuales, ingresemos la siguiente tabla de datos respecto a una encuesta sobre evaluacin del personal de una empresa ambiental:

En nuestro ejemplo tendremos que crear cuatro variables de nombre sexo, edad, estadocivil y notamedia dentro del Vista de Variables, en los que los tipos sern cadena, numrico, cadena, numrico respectivamente y donde introduciremos en las variables sexo y estadocivil etiquetas en los valores (1 para hombres y 0 para las mujeres, y 1 para soltero y 2 para casado). Se ingresan los datos en funcin de los valores. Para ver las etiquetas, dar click en el men Ver Etiquetas de valor.

1.3.Abrir y guardar archivos


Una vez que hemos ingresado los datos, podemos guardar el archivo como Ejemplo.sav. en el Men Archivos Guardar como. Tambin se pueden guardar en formatos .txt (texto plano), .xls (Excel), .dat(datos) Para abrir el archivo Ejemplo1.sav damos click en Archivo Abrir Datos

1.4.Importacin de datos
Previamente debemos revisar el archivo a importar para saber donde estn los nombres de las variables y luego podemos cargar el archivo de Excel, haciendo click en Archivo Abrir Datos

1.5.Men Datos: Ordenar, fundir archivos, seleccionar casos


Abramos el archivo Ejemplo 1.sav: En el men Datos, podemos: Ordenar (por sexo y edad) Seleccionar casos: (aquellos con edad mayor a 24 aos) para variables numricas

Segmentar archivo: para crear grupos (por tipo de variable categrica) hay que ordenar primero

1.6.Men Transformar: Calcular, Recodificar


En el archivo anterior, podemos: Calcular (otra variable) por ejemplo, calculemos la variable Nota2: 3*notamedia Recodificar (en la misma u otra variable): Por ejemplo, para crear una nueva variable (llamada nota) que tuviese los valores de notamedia pero que en lugar de tener los valores numricos, fuese suspenso para aquellos individuos con nota menor que 5, aprobado para los que estn entre 5 y 7, notable entre 7 y 9 y sobresaliente a los mayores de 9. En este caso, tendramos que realizar los siguientes pasos: Men Transformar Recodificar- En distintas variables Seleccionar la variable Notamedia y crear la variable Nota (dar click en Cambiar) Seleccionar Valores antiguos y Nuevos - Introducir los nuevos valores

2. ESTADISTICA DESCRIPTIVA:
2.1.Eleccin de la tcnica estadstica a utilizar:

2.2.Distribucin de frecuencias
Men Analizar Estadsticos Descriptivos Frecuencias (para Sexo y Edad)

2.3.Estadstica descriptiva: medidas de tendencia central, dispersin, posicin y forma


Men Analizar Estadsticos Descriptivos Frecuencias (para Edad) Botn Estadsticos

2.4.Representaciones grficas:
2.4.1. Diagramas de barras Men Grficos cuadro de dilogo antiguos Barras Simple Resmenes para grupos de casos Eje de categoras (edad) - % de casos 2.4.2. Grficos de sectores Men Grficos cuadro de dilogo antiguos Sectores Resmenes para grupos de casos definir sectores por (sexo) - % de casos Para editar, dar doble click en el grfico y luego en el men Elementos podemos mostrar los porcentajes. 2.4.3. Grficos de dispersin Men Grficos cuadro de dilogo antiguos Dispersin/Puntos Dispersin Simple Resmenes para grupos de casos Eje Y (edad) Eje X (Notamedia)

2.4.4. Histogramas: Men Grficos cuadro de dilogo antiguos Histograma - Edad 2.4.5. Grficos probabilsticos Sirven para comparar la distribucin emprica de los datos frente a una distribucin especfica. Men Analizar Estadsticos Descriptivos Grfico PP o QQ (Edad) 2.4.6. Generador de grficos Es un asistente general para generar grficos en SPSS

2.5.Anlisis exploratorio:
Utilizando el Men Analizar Estadsticos descriptivos - Explorar, podemos determinar: datos atpicos, errores en los datos, etc. Para eso, se utilizan varios mtodos: 2.5.1. Clculo de estadsticos descriptivos Men Analizar Estadsticos descriptivos Explorar Visualizacin Estadsticos (Variable Notamedia) Botn Estadsticos Seleccionamos todas las opciones: Descriptivos, estimadores robustos (otros mtodos), Valores atpicos, Intervalo de confianza, etc. Considerando que la variable Nota Media no debe superar 10 puntos (suponiendo que la nota mxima debe ser de 10 en el instrumento aplicado), tenemos un dato atpico (verifquese incluso los lmites del Intervalo de confianza al 95%) 2.5.2. Mtodos grficos: Para los mtodos grficos, utilizamos el diagrama de caja y bigotes y el diagrama tallo y hojas Men Analizar Estadsticos descriptivos Explorar Visualizacin Grficos (Variable Notamedia) Vemos que el valor de 12 pertenece a ambos grficos, y por tanto, es un dato aislado pero no se considera atpico de manera general. Si ingresamos a un nuevo registro en los datos, cuya notamedia es 18, observe y compare los resultados 2.5.3. Comparando dos grupos: Para verificar el anlisis por grupo de sexo, repetimos el proceso anterior, pero ahora seleccionamos ambas visualizaciones, e incluimos en la opcin FACTOR a la variable Sexo. Observe y compare la dispersin en ambos grficos de caja y bigotes. Podemos tambin comparar si cada grupo (hombres y mujeres) siguen una distribucin normal y tienen igual varianza (homocedasticos) Para eso, repetimos el proceso anterior, y en el Botn Grficos, seleccionamos Grficos con pruebas de normalidad, y dispersin por nivel con prueba de Levene (estimacin de potencia) 8

Para verificar normalidad y homocedasticidad, se utilizan los valores Sig (valores P) de cada tipo de prueba (una hiptesis se rechaza si alfa es mayor que Valor P) 2.5.4. Estandarizando variables A cada variable numrica se puede calcular su Z score, y guardndolo como nueva variable: Menu Analizar Estadsticos descriptivos Descriptivos seleccionamos Guardar valores tipificados. (variable notamedia) Es importante verificar que si un dato tiene un Zscore fuera del intervalo [-2, 2] se considera atpico

2.6. Taller de aplicacin


El fichero Encuesta, fue pasado a los estudiantes universitarios con la intencin de estudiar patrones de comportamiento en el Plan de Prevencin de Drogodependencias. El fichero contiene 6 variables: Sexo, Edad, Relacin con los amigos, Relacin con la Familia, Consumo de Tabaco y Alcohol. Se pide: 1. Buscar posibles datos atpicos en las variables Sexo y Edad. 2. Realizar un estudio descriptivo (numrico y grfico) para la variable Edad. 3. Realizar un estudio descriptivo (grfico) de las variables Consumo de Alcohol y Consumo de tabaco. 4. Repetir el apartado anterior pero particularizando por la variable Sexo. 5. Realizar un estudio descriptivo de la variable Consumo de drogas, para aquellos individuos que reconozcan tener relaciones familiares malas o muy malas.

3. ANALISIS DE TABLAS
3.1. Tablas de contingencia
Para obtener una tabla de frecuencias, seleccionaremos los siguientes mens: Analizar - Estadsticos Descriptivos - Tablas de Frecuencias En este caso cruzaremos la variable EstadoCivil (en filas) y Sexo (en columnas) del fichero de datos. A continuacin seleccionaremos el botn de Casilla. Esta opcin nos ofrece: 1. Frecuencias: a) Frecuencias observadas: con ellas obtenemos el valor real de cada par de valores. b) Frecuencia esperada: es el valor terico que tuviera que tener cada casilla para que fueran independientes las variables. 2. Porcentajes: a) Porcentaje por fila: es el valor de cada casilla dividido entre el nmero total de individuos (frecuencia sobre el total de la poblacin). b) Porcentaje por columna: es el valor de cada casilla entre el total de su columna. Coincide con las distribuciones condicionadas por columna. La ltima columna es la marginal de la variable. c) Porcentaje por fila: marginal a la variable fila. Valor de cada casilla entre el total de su fila. La ltima fila es la marginal. 3. Residuos: diferencias entre el valor observado y el esperado.

De manera descriptiva, nos sern tiles las frecuencias observadas y todos los porcentajes (total, fila y columna).

3.2. Anlisis e inferencias segn tipo de variables


3.2.1. Ambas variables cuantitativas Abrir el archivo Ejemplo 1. Hacer la tabla de contingencia entre Notamedia y Edad En el botn Estadsticos, seleccionamos Chi cuadrado y Correlaciones Analizamos los niveles de significancia y observamos que la Hiptesis nula de independencia no es rechazada, y por tanto no es necesario analizar los coeficientes de correlacin. 3.2.2. Ambas variables nominales Abrir el archivo Ejemplo 1.sav Hacer la tabla de contingencia entre Sexo y Estadocivil En el botn Estadsticos, seleccionamos Chi cuadrado, y las opciones de Contingencia, Phi y V de Cramer, Lambda y Coeficiente de incertidumbre En este caso al ser la tabla de frecuencias de 2x2 (hombre y mujer frente a soltero y casado) SPSS proporciona adems del test de la chi-cuadrado, el de Fisher, que en este caso es ms adecuado. Los valores de la Phi, la V de Cramer y el coeficiente de contingencia miden el valor de la asociacin, es decir, si hay una asociacin fuerte o dbil. Cuanto ms grande son estos valores (cercanos a 1) mayor es la asociacin.

10

Las Medidas direccionales indican como de buenas es cada una de las variables para pronosticar a la otra, mientras ms alto sea su valor. De tal manera que usaremos las medidas simtricas cuando no se pueda o no sepa que variable es ms importante como dependiente. 3.2.3. Ambas variables ordinales Abrir el archivo Encuesta.sav En este caso usaremos el fichero Encuesta, y las variables nivel de estudios del Padre y de la Madre. Estas variables son claramente ordinales, ya que entre ellas se puede establecer un orden referente al nivel de estudios. Al igual que en los casos anteriores, lo primero ser contrastar si existe asociacin entre las variables y posteriormente, si existe, dar un grado de asociacin Se procede igual que en el caso anterior, pero seleccionamos las opciones de variables Ordinales. Todas estas medidas de asociacin estn comprendidas entre -1 y 1, de tal manera que cuanto ms cercanas estn a los extremos, mayor ser la dependencia y si estn cercanos a cero menor.

3.2.4. Una variable de intervalo y otra nominal Abrir el archivo Encuesta.sav En este caso una variable ser categrica pero codificada numricamente y la otra cuantitativa (numrica), por ejemplo, la variable Edad y Relaciones Familiares (categrica codificada con valores numricos) del fichero Encuesta. Como en los casos anteriores realizaremos el contraste de independencia y el de asociacin, escogiendo esta vez la opcin ETA. La cual est entre 0 y 1. A mayor valor , mayor relacin entre variables.

3.3.Grficos
Si en la ventana del anlisis seleccionamos la opcin de Mostrar los grficos agrupados obtendremos grficos de resumen que nos ayudan a resumir los datos por grupos de casos. De tal manera que SPSS agrupa segn el valor especificado para las Filas mientras que la variable Columna, es la que define las barras dentro de cada grupo de las filas. Por ejemplo, si en el fichero Encuesta, seleccionamos como variable de filas las relaciones con los amigos y en la variable columna las relaciones familiares

3.4.Capas
Si seleccionamos una o ms variables de capas, se generara una tabla de contingencia por cada categora de cada variable de capas (variable de control). Por ejemplo, si empleamos una variable de fila, una variable de columna y una variable de capas con dos categoras, obtendr una tabla de doble clasificacin por cada categora de la variable de capas. Si solicitamos estadsticos y medidas de asociacin, se aplicarn slo a las tablas de doble clasificacin. Por ejemplo, con el fichero Encuesta, vamos a obtener la tabla de contingencia de las Relaciones Familiares frente a la Relacin con los Amigos, pero con una variable de capa, que ser el Sexo

11

3.5. Tablas Personalizadas


La opcin de tablas personalizadas nos permite: Crear nuestra propia tabla de contingencia, mucho ms libre y crear una estructura de capas ms clara, as como la obtencin de estadsticos descriptivos ms amplios sobre cada grupo. Obtener la tabla de frecuencias para respuestas mltiples Para acceder a ellas hemos de seleccionar: Men Analizar Tablas - Tablas Personalizadas... Con esta opcin podemos crear tablas a nuestra medida. Como ejemplo vamos a utilizar el fichero Encuesta2.sav y vamos a obtener la tabla de contingencia del Sexo (columnas) en funcin de la Raza (filas). Solo hemos de seleccionar en el listado de variables de la izquierda las variables con las que trabajar y arrastrarlas hasta el lugar que deseemos. Una vez seleccionadas las variables podremos establecer los estadsticos de resumen que deseemos, el orden de la tabla en categoras y totales. Estadsticos de contraste: Con la pestaa de estadsticos de contraste obtenemos la ventana: 1. Pruebas de independencia (Chi-cuadrado). Esta opcin genera la prueba chi-cuadrado sobre la independencia para las tablas en las que existe como mnimo una variable categrica en las filas y otra en las columnas. Tambin se puede especificar el nivel alfa de la prueba, que debe tener un valor mayor que 0 e inferior a 1. 2. Comparar las medias de columna (pruebas t). Esta opcin genera pruebas por parejas sobre la igualdad de las medias de columna, para tablas en las que existe como mnimo una variable categrica en las columnas y una variable de escala en las filas. Podemos seleccionar que los valores p de las pruebas sean corregidas mediante el mtodo de Bonferroni. Tambin se puede especificar el nivel alfa de la prueba, que debe tener un valor mayor que 0 e inferior a 1. Opciones: Con esta pestaa podemos: 1. Especificar lo que se visualiza en las casillas vacas y en las casillas para las que no se pueden calcular estadsticos. 2. Controlar cmo se van a tratar los valores perdidos en el clculo de los estadsticos de las variables de escala. 3. Establecer los anchos mnimo y/o mximo de las columnas de datos. 4. Controlar el tratamiento de las respuestas duplicadas en los conjuntos de categoras mltiples.

3.6.Tablas De Respuestas Mltiples


En el anlisis de cuestionarios es muy comn la circunstancia de utilizar conjuntos de respuestas mltiples, los cuales utilizan varias variables para registrar respuestas a preguntas en las que el encuestado puede ofrecer ms de una respuesta. Los conjuntos de respuestas mltiples se consideran variables categricas. Como ejemplo, utilizaremos el fichero Encuesta2, en el que a 1517 individuos les investigamos el Sexo, la Raza y los problemas ms importantes que han sufrido en los ltimos 12 meses, y en esta variable se pueden sealar hasta cuatro respuestas. Para definir conjuntos de respuestas mltiples, elegiremos los mens: 12

Analizar Tablas - Conjuntos de Respuestas Mltiples... A continuacin seleccionaremos las cuatro sub-variables de respuesta en variables de conjunto, indicaremos si las variables son dicotmicas (si o no) o si tienen categoras y la nombraremos (el nombre no puede coincidir con ninguna de las originales), por ejemplo con Dificul. Finalmente pulsaremos Aadir y Aceptar. Al realizarlo correctamente se obtiene una ventana de resultados donde confirma la realizacin. Para ello hemos de cumplir las siguientes reglas: 1. Todas las variables del conjunto deben estar codificadas de la misma manera. 2. Las etiquetas de valor se deben utilizar de forma consistente. Si una variable tiene definidas las etiquetas de valor, todas las dems variables debern tener el mismo valor asignado a las mismas etiquetas de valor. 3. En los conjuntos de dicotomas mltiples, cualquier etiqueta de variable definida para cada una de las variables del conjunto debe ser exclusiva. Dos o ms variables del conjunto no deben tener la misma etiqueta de variable. El paso siguiente ser el de tabular esos resultados. En este caso tabularemos la variable Dificul. Para ello, al igual que en el caso anterior, usaremos la opcin de Tablas Personalizadas. Obteniendo la misma ventana que en el caso anterior (ver figura 3.13); en este caso arrastraremos la variable elegida. Tambin en Definir Estadsticos de Resumen seleccionaremos por ejemplo, % del N de la Tabla (frecuencia) y en Categoras y Tablas que Ordene las categoras segn la etiqueta

3.7.Taller De Aplicacin
Con el fichero EncuestaUSA, responder a las siguientes cuestiones: a) Obtener las tablas de contingencia, realizar el contraste de independencia y en caso de existir dependencia dar una medida de esta para las siguientes variables: 1) Sexo y Raza 2) Raza y Regin 3) Nivel de Felicidad y Categora Ocupacional 4) Nivel de Felicidad y Raza segn el Sexo. b) Obtener las siguientes variables de respuestas mltiples: 1) ProbSalud, formado por Salud1, Salud2, ..., Salud9. 2) Trab, formada por Trabajo1, Trabajo2, ..., Trabajo9. Para ellas, obtener la tabla de frecuencias unidimensional y bidimensional junto con algunos estadsticos representativos.

13

4. COMPARAR MEDIAS
4.1. Anlisis General De Medias
Abrir Ejemplo1.sav Para calcular y comparar las medias de variables, de manera general o por casos, se puede utilizar la opcin: Men Analizar Comparar medias Medias Seleccionamos a edad como dependientes y a sexo como independiente. Podemos escoger las opciones de resultados que quisiramos generar. Los resultados sirven para verificar que hiptesis se pueden generar para los casos posteriores

4.2. Pruebas T Para Media De Una Muestra


En el ejemplo anterior, quisiramos probar si la nota media es 8.0 Para eso, seleccionamos: Men Analizar Comparar medias Prueba T para una muestra Seleccionamos la variables notamedia y en Valor de prueba ponemos 8. En opciones escogemos en nivel de confianza de la prueba

4.3.Pruebas De Medias Para Muestras Pareadas O Relacionadas


Veamos un video de aplicacin y posteriormente repliquemos el ejercicio

4.4.Pruebas De Medias Para Muestras Independientes


Veamos un video de aplicacin y posteriormente repliquemos el ejercicio

5. ANOVA DE UN FACTOR Y PRUEBA KRUSKAL WALLIS


La idea general de una ANOVA es hacer comparaciones entre las medias de varios grupos (y no de dos en dos, como las pruebas anteriores). Adems, permite verificar si existen grupos homogneos.

Respecto a las pruebas que se realizan, hay que considerar 2 tipos: Post hoc (cuando no conocemos los posibles efectos o comparaciones entre grupos) y Contrastes (cuando se tiene una evidencia a priori de los posibles resultados entre grupos. Vemos el video y luego repliquemos el ejercicio.

14

6. REGRESIN LINEAL
6.1. Conceptos y supuestos importantes de la Regresin Lineal

6.2. Proceso y contrastes para realizar una regresin lineal

15

16

6.3. Aplicacin en SPSS


Para este parte, trabajaremos con el archivo Regresion.sav En el SPSS seleccionaremos Men Analizar Regresin Lineal

Ahora revisaremos las opciones existentes: 6.3.1. Botn Estadsticos

17

6.3.2. Botn Grficos

En base a los resultados, grafiquemos: ZRESID vs. ZPRED (Sin patrones patrn aleatorio) Homocedasticidad y linealidad DEPEND vs. ZPRED (alineados a la diagonal sin mucha dispersin) Homocedasticidad Grficos Parciales (para verificar tendencia lineal entre variables) Linealidad Grficos de Probabilidad y Histograma (para probar normalidad de residuos)

6.3.3. Botn Guardar Sirve para guardar las variables generadas a partir de la regresin, en especial para buscar en ellas datos atpicos. Por lo general, se guardan:

18

6.4.Taller de aplicacin

19

7. GRAFICOS DE CONTROL DE CALIDAD


7.1. Conceptos y supuestos importantes de los grficos de control
Las cartas, o grficos, de control es un mtodo para controlar estadsticamente un proceso detectando cuando este est fuera de control. Las ms usadas son las Shewhart. Tienen una forma como la de la figura.

12.2 12.15 12.1 12.05 12 11.95 11.9

De un proceso a controlar se toman muestras en intervalos aproximadamente regulares. De cada muestra se mide una o varias variables (cartas de control por variables) o se determina el nmero o porcentaje de unidades defectuosas en la muestra (cartas de control por atributos). Las muestras correspondientes a un mismo intervalo constituyen un subgrupo. Los intervalos pueden ser definidos en trminos de tiempo (ej.: 5 muestras cada hora o turno) o de cantidad (ej.: 5 muestras cada 1000 uds fabricadas). Los valores medidos se comparan con unos lmites (lneas paralelas al eje OX). Los lmites ms comunes son los siguientes: Lmites naturales del proceso .- Aquellos lmites entre los que se mueve el proceso sin que podamos mejorarlo. Los lmites naturales habitualmente se utilizan como Lmites de Control (LC), normalmente se establecen dos lmites: El Lmite superior de control (LSC o UCL) y el el inferior (LIC o LCL), paralelos a una lnea central (CL) representativa del valor medio. Lmites de Tolerancia (LT) y Especificacin (LE).- Aquellos entre los que puede oscilar los valores individuales de la caracterstica que controlamos para que el producto sea aceptable La relacin entre los LT/LC nos da una idea sobre la capacidad que tiene nuestro proceso. Mientras mayor sea est relacin mejor ser la capacidad del proceso.

7.2.Cartas o grficos de control por variables


Una carta de control Shewhart consisten en un grfico formado por una lnea central (CL) y dos lneas paralelas una por encima, Lmite Superior (UCL) , y otra por debajo. lmite inferior (LCL). Para cada grupo se van representando los valores de <X>, R, o s, etc, si estn comprendidos en 20

el intervalo (UCL, LCL) se dice que el proceso est bajo control, en caso contrario el proceso puede estar descontrolado En el supuesto en el que la caracterstica a controlar sea una variable continua, como es nuestro caso, las medias de las muestras que se vayan tomando seguirn aproximadamente una distribucin N(,). los Lmites de control se consideran habitualmente aquellos que contienen el 99.97% de la produccin. Por tanto vendrn dados por: LC = 3. En general los lmites de control vienen dados por LC = z k donde los valores de k dependern del tipo de carta de control que se vaya a elaborar. Los programas estadsticos estos incorporan los algoritmos de clculo apropiados para calcularlos. Estos lmites puede ser conocidos por experiencias previas y de no ser as es necesario estimarlos (fase llamada "estudio inicial") a partir de las observaciones de varios subgrupos (normalmente se utilizan las observaciones de al menos 25 subgrupos). Los tipos mas frecuentes de cartas de control para una sola variable son: Medias y recorridos (X-barra, R) Medias y desviaciones tpicas (X-barra, S) Mediana y recorridos (X-med, R) Valores individuales (X-ind)

7.3.Cartas o grficos de control por atributos


La carta de control se construye a partir de la observacin de la presencia o ausencia de una determinada caracterstica (atributo o defecto) en cada una de las unidades, entonces se acepta o se rechaza contando cuantas unidades tienen o no el defecto, o comprobando el nmero de tales eventos que ocurren en la unidad, grupo o rea, y comparando con el criterio de aceptacin establecido. Se acepta o rechaza la pieza o el lote sin asociar un valor concreto. El atributo a controlar se suele elegir de forma que sea fcilmente observable y por tanto econmico de controlar. Ejemplos: a) La pieza se rechaza si visualmente se observan una o mas ralladuras de 1 cm. b) Un tornillo se acepta si su dimetro esta comprendido entre 1.1 y 1.2 mm y se rechaza en otro caso (no es necesario medir el dimetro, basta utilizar un calibre que permita comprobar si se cumple la caracterstica). c) Un lote se rechaza si se rechaza si posee mas de 20 piezas defectuosas. Los tipos de grficos por control por atributos pueden ser: N de piezas defectuosas por muestra (np) Fraccin de piezas defectuosas (p) Porcentaje de piezas defectuosas (100p) N de piezas defectuosas por muestra (np) 21

N de defectos por muestra (c) N de defectos por unidad (u) N de defectos por 100 unidades (u)

7.4. Anlisis de los Grficos de control


Una idea bsica de los Grficos de Control es identificar lo antes posible cualquier variacin de una caracterstica o parmetro importante. Dicha variacin en la medicin suele tener dos fuentes: - Variacin aleatoria (o corriente) - Variacin por causa asignable La variacin aleatoria se presenta porque, bsicamente, no hay elementos ni mediciones idnticas. Las mediciones de cierto parmetro en un equipo pueden variar por efectos climticos, ambientales, e incluso por el azar. Toda medicin lleva consigo una variacin inherente. Las diferencias naturales o errores aleatorios son de esperar pero no provocan problemas reales que impidan controlar el nivel de calidad de la medicin. Una variacin por causa asignable, por el contrario, es aquella que sobrepasa la diferencia natural en las mediciones. Obedece a una causa concreta que puede (y debe) ser corregida. Equipos mal calibrados o defectuosos, errores humanos, procedimientos inadecuados, mediciones mal realizadas y/u otros factores son aquellas causas o errores de causa asignable que producen variaciones mayores a las naturales. Si se detecta un error de causa asignable en los procesos de medicin, se establece que el proceso esta fuera de control y hay que tomar medidas correctivas. Entonces, de manera general se puede decir que al medir el valor numrico de un parmetro cualquiera, ste puede presentar variaciones aleatorias o de causa asignable en sus mediciones, y que es necesario determinar cuando se trata de un error u otro. Estadsticamente se conoce que para estimar el valor verdadero de una variable se debe calcular dos parmetros: una medida de tendencia central (promedio, mediana o moda) y una medida de dispersin (rango, varianza, desviacin estndar). Estos dos parmetros juegan un papel muy importante en los procesos de medicin, pues mientras que las medidas de tendencia central sirven para estimar el valor central (o representativo) de las mediciones, las medidas de dispersin dan una idea de la variacin entre una medicin y otra, y como stas se agrupan en torno al valor central.

+ 22

Como para estimar estos parmetros (, ) se utilizan las mediciones experimentales, los errores aleatorios y de causa asignable se pueden presentar en estas estimaciones. Supongamos que se toman muestras de HC en cada una de las lneas de un centro de revisin vehicular cada cierto tiempo, cada una de estas muestras de ellas consta de n mediciones. Si el proceso se encuentra bajo control, al realizar las estimaciones para el valor central y la dispersin obtendramos algo parecido al siguiente grfico para el mes en cuestin: HC (ppm)

L1

L2

L3

L4

Se puede observar claramente que cada una de las lneas presenta mediciones que en conjunto tienen la misma tendencia central (se agrupan en torno a un nico valor central) y que la dispersin es parecida en cada una de las lneas. El proceso de medicin est bajo control y no es necesario tomar acciones correctivas. Esto no significa que todas las medidas son exactamente iguales, sino que en conjunto las variaciones que presentan las mediciones (errores de medicin) son de tipo aleatorio. Pero pueden existir casos en los cuales las variaciones presentadas en las mediciones se deben a factores externos, que podran representarse en los siguientes grficos: a) HC (ppm) b) HC (ppm)

L1

L2

L3

L4

L1

L2

L3

L4

c) HC (ppm)

d) HC (ppm)

L1

L2

L3

L4

L1

L2

L3

L4

23

En el grfico (a) observamos que las mediciones para todas las lneas presentan la misma variacin, pero el valor central de las medidas difiere entre las lneas 1 y 2 respecto a las lneas 3 y 4. Esto se conoce como efecto de choque y es un error de causa asignable. Muchas veces, los valores centrales de las mediciones no cambian tan abruptamente, por lo general, los equipos de medicin se descalibran de una lnea a otra conforme pasa el tiempo. Luego, los valores centrales de las muestras van tomando una tendencia hacia abajo o hacia arriba del valor nominal, segn se aprecia en el grfico (b). Ntese que la dispersin en los dos casos anteriores permanece igual para todas las lneas. Como dijimos anteriormente, los errores de causa asignable se presentan no slo para el valor central, sino tambin para la dispersin. Hay circunstancias en las cuales los valores centrales de las mediciones son iguales pero la dispersin de las mediciones cambia de una muestra (lnea) a otra. Recurdese que para estimar , no interesan las medidas individuales, sino su tendencia central: Por ejemplo, las mediciones de HC para la lnea 1 pueden ser: 195, 200, 205 ppm; mientras que para las lnea 4 las mediciones pueden ser: 180, 200, 220. El promedio para ambas lneas es de 200 ppm, pero la dispersin de la lnea 1 es mucho menor a la lnea 4. Si calculamos el rango tenemos 10 y 40 ppm para las lneas 1 y 4 respectivamente. Entonces existen errores de causa asignable para la dispersin. Esto se puede apreciar claramente en el grfico (c). Pero en la prctica, cuando no se tiene ningn control sobre el proceso de medicin, los errores de causa asignable afectan tanto al valor central de las mediciones como a la dispersin de las mismas. Esto puede verse claramente en el grfico (d). Estadsticamente se recomienda, que cuando se tienen errores de causa asignable tanto en la dispersin como en la media, se identifiquen primero las causas que afectan a la dispersin, puesto que al corregir estos errores, los valores centrales se vern modificados a su vez y sern ms confiables que los anteriormente calculados.

7.5. Grficos de control en SPSS


Los comandos para estos grficos se encuentran en: Men Analizar Control de Calidad Grficos de control Los tipos de grficos de control que podemos elegir son: X-barra, R, s Individuos, Rango mvil p, np c, u 7.5.1. Grfico X-barra Para el caso de control por variables, hacemos el siguiente proceso:

24

Abrir el archivo Calidad.xls en SPSS e identifique la informacin Escoja el Grfico X-barra, R, s (analiza los graficos por submuestras) Seleccione la medida y los subgrupos Escoja el grfico (con R o con S) Revise los botones Opciones, Reglas de control, Estadsticos:

Introduzca un valor en Nmero de sigmas para indicar el nmero de desviaciones tpicas mostradas a ambos lados de la lnea central (por defecto 3). El grupo Lmites de especificacin para los grficos X-barra le permite especificar los lmites fijos que se mostrarn en el grfico junto a los lmites calculados. Puede resultar til si desea determinar si un proceso quedar dentro de unos lmites de tolerancia predefinidos. - Para mostrar un lmite superior fijo, seleccione Superior e introduzca el valor del lmite superior. - Para mostrar un lmite inferior fijo, seleccione Inferior e introduzca el valor del lmite inferior. Introduzca un valor en Tamao mnimo de muestra para los subgrupos para especificar el tamao mnimo de la muestra permitido en subgrupos. Si el nmero de una muestra es menor que el valor especificado, se elimina el subgrupo del grfico y de todos los clculos. Seleccione Mostrar los subgrupos definidos por los valores perdidos para mostrar cada valor perdido de la variable de subgrupo (incluido el valor perdido por el sistema) como grupo separado en el grfico. Si no se selecciona esta opcin, los casos con valores perdidos por el sistema o definidos por el usuario como perdidos en la variable de subgrupo quedan excluidos del grfico. 7.5.2. Grfico para datos individuales - Representa una nica variable de medida del proceso por caso individual. En los grficos de rango mvil, cada punto representa la diferencia entre el valor actual y el anterior. - Seleccione una variable numrica que contenga las medidas del proceso que se est analizando y muvala hacia el cuadro Medida del proceso. - Puede seleccionar una variable para etiquetar los subgrupos y moverla hacia Subgrupos etiquetados mediante: - Seleccione una de las opciones disponibles en Grficos para elegir el tipo de grficos que se van a generar. - Individuos y rango mvil genera un grfico de valores individuales y un grfico de rango mvil (Individuos genera slo un grfico de valores individuales) - Introduzca un valor en Amplitud para especificar el nmero de casos empleados en calcular los lmites de control en ambos tipos de grfico y la amplitud de las unidades temporales usada para calcular el rango mvil. - Seleccione Opciones para especificar el nmero de sigmas que aparecen en el grfico y definir los lmites de control. 25

Pulse con el botn derecho del ratn en cualquier elemento del cuadro de dilogo para ver su descripcin.

7.5.3. Grfico para p y np cuando los casos son unidades - Seleccione Definir. - Seleccione una variable que contenga la caracterstica que se va a representar y muvala hacia el cuadro Caracterstica. Esta variable puede ser numrica, una cadena o una cadena larga. - El grupo Valores a contar le permite definir el valor que se va a contabilizar y representar en un grfico. Si selecciona Disconforme, el valor especificado en Valores a contar representa las unidades disconformes. Si selecciona Conforme, el valor especificado en Valores a contar representa las unidades conformes. Introduzca el valor en Valor. - Seleccione una variable categrica que defina los subgrupos y muvala hacia Subgrupos definidos por. - Seleccione una de las opciones disponibles en Grficos para elegir el tipo de grficos que se van a generar. 7.5.4. Grfico para p y np cuando los casos son subgrupos - Cuando haya elegido que los casos son subgrupos - Seleccione Definir. - Seleccione una variable numrica y muvala hacia el cuadro Nmero de disconformes. - Puede seleccionar una variable para etiquetar los subgrupos y moverla hacia Subgrupos etiquetados mediante. - Debe ingresar el tamao de la muestra (fijo) 7.5.5. Para obtener grficos c y u donde los casos son unidades Cuando haya elegido que los casos son unidades. Seleccione Definir. Seleccione una variable que contenga la caracterstica que se va a representar y muvala hacia el cuadro Caracterstica. Seleccione una variable categrica que defina los subgrupos y muvala hacia Subgrupos definidos por. Seleccione una de las opciones disponibles en Grficos para elegir el tipo de grficos que se van a generar. Para obtener grficos c y u donde los casos son subgrupos Cuando haya elegido que los casos son subgrupos Seleccione Definir. Seleccione una variable numrica que contenga el nmero total de disconformidades por subgrupo, y muvala hacia el cuadro Nmero de disconformes. Puede seleccionar una variable para etiquetar los subgrupos y moverla hacia Subgrupos etiquetados mediante. Seleccione una de las opciones disponibles en Grficos para elegir el tipo de grficos que se van a generar.

7.5.6. -

26

Seleccione una de las opciones de Tamao de la muestra para definir el tamao de las muestras.

7.5.7. Ejemplos y ejercicios propuestos Ejemplo 1.- En una lnea de fabricacin de interruptores se han inspeccionado 25 subgrupos a razn de 4000 uds/subgrupo. El nmero de uds defectuosas por subgrupo se muestra en la lista "datos1". Construir una carta de control p o np (elige la mas apropiada). datos1 = {8, 14, 10, 4, 13, 9, 7, 11, 15, 13, 5, 14, 12, 8, 15, 11, 9, 18, 6, 12, 6, 12, 8, 15, 14} ; Ejemplo 2.- En un proceso de fabricacin de cintas de video el nmero de defectos por cada 500 metros de cinta son los que se muestran en datos2. Construir una carta de control c y otra u (elige la mas apropiada). datos2 ={7, 1, 2, 5, 0, 6, 2, 0, 4, 4, 6,3, 3, 3, 1, 6, 3, 1, 5, 6};

27

8. ANALISIS CLUSTER
8.1. Conceptos y supuestos importantes del anlisis cluster

8.2.Proceso del anlisis Cluster


8.2.1. Eleccin de las variables:

28

8.2.2. Eleccin de una medida de asociacin:

8.2.3. Eleccin de la tcnica cluster:

29

8.3. Aplicacin en SPSS

8.3.1. Botn Mtodo

30

8.3.2. Botn Estadsticos

8.3.3. Botn Grficos

NOTA: Por ser una tcnica exploratoria, se recomienda utilizar varios mtodos para comprobar los conglomerados que se forman.

31

Вам также может понравиться