Вы находитесь на странице: 1из 26

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO

MANUAL DE STATGRAPHICS

I. INTRODUCCIN Y MANEJO DE DATOS

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 1

INTRODUCCION El programa Statgraphics es un software que est diseado para facilitar el anlisis estadstico de datos. Mediante su aplicacin es posible realizar una anlisis descriptivo de una o varias variables, utilizando grficos que expliquen su distribucin o calculando sus medidas caractersticas. Entre sus muchas prestaciones, tambin figuran el clculo de intervalos de confianza, contrastes de hiptesis, anlisis de regresin, anlisis multivariantes, as como diversas tcnicas aplicadas en Control de Calidad. El programa trabaja en un entorno WINDOWS y su pantalla principal (a la que se accede ejecutando el programa SGWIN.EXE o directamente clickeando sobre el icono correspondiente, es la siguiente:

(Para salir del programa seleccionamos en la barra de men ARCHIVO...SALIR DE STATGRAPHICS o simplemente se cierra la ventana principal de la aplicacin) En la pantalla principal de Statgraphics, podemos distinguir los siguientes elementos: 1. Barra de men 2. Barra de herramientas 3. Barra de tareas Analicemos ahora cada uno de los elementos que podemos encontrar en la ventana principal.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 2

Barra de men

La barra de men siempre estar disponible al utilizar el programa, de forma que sea posible seleccionar el anlisis deseado. Al clickear con el ratn sobra cada una de las palabras que componen la barra, aparecer un men desplegable con otras opciones asociadas. As tendremos: ARCHIVO: permite realizar operaciones de carcter general: abrir, cerrar o grabar ficheros, imprimir y salir de Statgraphics. EDITAR: como en otras aplicaciones en entorno Windows, este men esta asociado a diversas opciones de edicin: cortar, copiar, pegar, deshacer... GRAFICAR, DESCRIBIR, COMPARAR RELACIONAR: al presionar con el ratn sobre ellos tendremos acceso a diversos mens de anlisis de Statgraphics que se irn analizando a lo largo de este manual. VER, VENTANA, AYUDA: tienen disponible varias opciones de formato y ayuda, de forma similar a otras aplicaciones que trabajan en el mismo entorno.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 3

Barra de herramientas

La barra de herramientas tiene como funcin asociar iconos (botones rpidos) con algunas de las opciones mas frecuentemente utilizadas de la barra de men. Si se seala con el ratn cualquier botn de la barra, aparecer una breve descripcin de la funcin asociada. Barra de tareas Incluye iconos asociados que contendrn los datos que se analizan, comentarios personales sobre el anlisis, resultados del anlisis efectuado y comentarios e interpretaciones del programa de los resultados obtenidos. El conjunto de estos elementos forma el Statfolio.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 4

Statadvisor: herramienta incorporada al programa, que interpreta de forma sencilla los resultados obtenidos. Statgalery: permite almacenar los resultados (grficos incluidos) del anlisis realizado. El realizar cualquier anlisis estadstico, el sistema genera una ventana de anlisis, que estar dividida en paneles conteniendo las diferentes partes del anlisis. Clickeando con el botn derecho del ratn sobre cada uno de estos paneles y seleccionando Copy to Galery podremos incluir el panel en el Statgalery al utilizar la opcion de Copiar una vez posicionados con el ratn sobre el panel de destino. (La configuracin de los paneles del Statgalery es seleccionable sin ms que desplazar con el ratn las barras horizontales y verticales) Comentarios al statfolio y Statreporter: opciones de Statgrafics que permiten introducir los comentarios de usuario para su posterior edicin. Ventana de datos: hoja de clculo que contiene los datos que se van analizar. Pueden introducirse directamente desde el teclado o recurarse desde un fichero ya grabado. (Archivo..Abrir..Abrir Archivo de datos) Al conjunto de los elementos anteriores se le denomina Statfolio, que puede almacenarse bajo un nombre nico (fichero .spg) activando la opcin Archivo...Guardar...Guardar cono STATFOLIO. Si abrimos un Statfolio previamente guardado y continuamos con el anlisis estadstico, cualquier modificacin que se realice sobre los datos se transmitir automticamente sobre todos los anlisis previamente realizados, por lo que la principal utilidad del Statfolio es repetir un anlisis sistemticamente sobre distintos conjuntos de datos.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 5

TRABAJAR CON DATOS EN STATGRAPHICS Los datos que van analizarse mediante Statgraphics pueden introducirse directamente desde el teclado en la ventana de datos. Los datos pueden agruparse formando una variable (cada una de las columnas de la hoja de clculo de constituye la ventana de datos). Para poder analizar una variable (es decir, los datos que contiene) es necesario definirla realizando las siguientes operaciones:

Seleccionamos la columna en la que queremos introducir los datos. Para ello clickeamos sobre la etiqueta de la columna (Inicialmente ser Col_1)

Pulsamos con el botn derecho del ratn sobre la columna seleccionada. Aparecer un men del que seleccionamos la opcin Modificar Columna:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 6

En esta pantalla escribiremos el nombre de la variable (mximo 32 caracteres, sin blancos ni signos especiales y utilizando siempre una letra como primer carcter), y el tipo de variable (numrico si vamos a analizar nmeros). Tras pulsar ACEPTAR ya estamos en condiciones de introducir los datos en las distintas celdas que componen la columna. A continuacin vemos como se han introducido un conjunto de datos agrupados en la variable EJEMPLO

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 7

Statgraphcis permite introducir columnas calculadas como una transformacin de otras columnas previamente definidas. Para ello realizaremos las siguientes operaciones: 1. Seleccionamos la columna donde queremos que aparezcan los datos calculados 2. Clickeamos con el botn derecho del ratn y elegimos la opcin Generar Datos del men que aparece 3. Componemos, en la ventana que aparece, la expresin para el clculo de los nuevos datos: (en este caso multiplicaremos por 2 la variable EJEMPLO)

Al pulsar Aceptar nos aparecer en la ventana de datos el clculo deseado: Curso de Formacin Estadistica. CHEMO Manual de Statgraphics 8

Los ficheros de datos generados pueden almacenarse para anlisis posteriores. Para ello, en el men ARCHIVO seleccionaremos GUARDAR COMO ARCHIVO DE DATOS... y elegiremos el nombre y la ubicacin del archivo deseada. (Podrn recuperarse posteriormente con la opcin ABRIR ARCHIVO DE DATOS del men ARCHIVO)

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 9

UNIVERSIDAD CARLOS III DE MADRID CURSO DE FORMACION ESTADISTICA CHEMO

MANUAL DE STATGRAPHICS

II.

ESTADSTICA

DESCRIPTIVA

GRFICOS

DE

DATOS

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 10

La Estadstica Descriptiva se ocupa de presentar, de forma resumida, la informacin ms importante de un conjunto de datos. Para ello se calculan sus medidas centrales (media, mediana...) y se da una medida de cmo estn los datos dispersos en torno a esos valores centrales (varianza, desviacin tpica, rango...). Asimismo, tras un anlisis descriptivo, se dispondr de una representacin de los datos en forma de grficos, de forma que sea posible detectar valores atpicos, tendencias o agrupaciones. Las diferentes opciones de anlisis descriptivo de las que dispone Statgraphics estn incluidas en la opcin DESCRIBIR de la barra de men. A continuacin se muestran las opciones ms importantes de un anlisis descriptivo de los datos. Resumen estadstico El resumen estadstico (SUMMARY STATISTICS) nos reproduce hasta 19 estadsticos (valores numricos caractersticos) de un conjunto de datos. Pare ello, en la pantalla de entrada de datos tendremos que introducir la variable que se quiere analizar, tal y como aparece a continuacin:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 11

Una vez seleccionada la variable a analizar, debe seleccionarse la opcin de RESUMEN ESTADISTICO en el men de TABLAS:

Por defecto, aparecern calculados los estadsticos de uso ms comn, como puede verse en la figura que sigue:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 12

Sin embargo pueden seleccionarse otros estadsticos que Statgraphics calcula sin ms que clickear con el botn derecho del ratn sobre el panel de RESUMEN ESTADISTICO y activar la opcin de OPCIONES DE VENTANA:

Activando la opcin de cualquiera de los estadsticos que estn incluidos en la ventana que aparece, el resultado de su clculo se mostrar inmediatamente por pantalla al clickear ACEPTAR.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 13

El RESUMEN ESTADISTICO puede obtenerse simultneamente para varias variables, sin ms que entrar en al anlisis mltiple de variables: DESCRIBIRANALISIS NUMERICO.. ANALISIS MULTIVARIADO. Tabla de frecuencias La tabla de frecuencias nos permite resumir la distribucin de los datos contenidos en una variable. Al igual que el RESUMEN ESTADISTICO, la opcin de la TABLA DE FRECUENCIAS se activa en el men de TABLAS del anlisis descriptivo de una variable. Como resultado del anlisis, Statgraphcis crea una serie de intervalos que constituyen una particin del rango de los datos estudiados; la tabla nos dar informacin del nmero de datos que tienen su valor dentro de cada intervalo.

El nmero de observaciones en cada intervalo ser la frecuencia absoluta, mientras que el porcentaje que esas observaciones representa frente al total se llama frecuencia relativa. (El programa presenta tambin las frecuencias acumuladas para cada una de los intervalos). El nmero de intervalos (tambin llamados clases) en los que se divide el rango de los datos puede modificarse clickeando con el botn derecho del ratn sobre la tabla y seleccionando la opcin OPCIONES DE VENTANA:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 14

La tabla de frecuencias no slo puede aplicarse a datos numricos, sino tambin a variables cualitativas. As en el fichero cardata.sf se recogen diferentes variables de automviles junto con el nombre de su fabricante:

Veamos como podemos aplicar la tabla de frecuencias a la variable que contiene el fabricante del vehculo. Para ello se sigue DESCRIBIR DATOS CATEGORICOS... TABULACION y se selecciona la opcin TABLA DE FRECUENCIAS del men de TABLAS. El resultado es el que continuacin se muestra:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 15

Donde obtenemos informacin sumaria de los vehculos que aporta cada fabricante a la muestra y de su frecuencia de aparicin. Histograma de frecuencias Los histogramas de frecuencias son representaciones grficas de las tablas de frecuencias estudiadas con anterioridad, donde a cada intervalo o clase en que se divide el rango de los datos, se le asigna una barra cuya altura es proporcional a la frecuencia de aparicin de sus elementos. El histograma se encuentra en las opciones grficas del men DESCRIBIR DATOS NUMERICOSANALISIS DE UNA VARIABLEE... NUMERIC DATA... ONE VARIABLE ANLISIS, tal y como puede verse en la figura que sigue:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 16

El resultado se muestra en la siguiente pantalla:

Histograma 60 50 frecuencia 40 30 20 10 0 150 160 170 180 altura 190 200 210

Donde podemos ver que el histograma presenta informacin sobre la variable analizada. En los datos analizados, la altura ms frecuente entre los individuos analizados est entre 172 y 182 cms.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 17

Percentiles Los percentiles de una variable proporcionan informacin sobre como estn distribuidos los datos estudiados. El percentil de orden k de una distribucin es una valor que es mayor que el k% de los valores que toma la variable. As el percentil 10 es aquel valor de los datos estudiados que es mayor que el 10% de las observaciones. Son importantes los percentiles 25 (cuartil inferior), 50 (mediana) y 75 (cuartil superior). Los percetiles pueden obtenerse en la opcin TABLAS del men DESCRIBIR DATOS NUMERICOS ANALISIS DE UNA VARIABLE.

El resultado es el siguiente:
Percentiles para altura Percentiles 1,0% 156,0 5,0% 161,0 10,0% 163,0 25,0% 169,0 50,0% 176,0 75,0% 180,0 90,0% 186,0 95,0% 190,0 99,0% 193,0 El StatAdvisor Esta ventana contiene los percentiles muestrales para altura. Los percentiles son valores debajo de los cuales se encuentra un porcentaje especfico de los datos. Puede verse grficamente los percentiles seleccionado Grfico de Cuantiles, de la lista de opciones Grficas.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 18

Diagrama de la caja El diagrama de la caja es una representacin grfica de una variable en la que a partir de sus percentiles se obtiene informacin sobre la distribucin de sus observaciones (concentracin o dispersin de los datos o existencia de valores atpicos). El diagrama de la caja se construye a partir de los percentiles 25%, 50% (mediana) y 75 %. Como medida de la dispersin se utiliza el rango intercuartlico (percentil 75 % - percentil 25%) de manera que cualquier dato que se aleje de los percentiles 25 75% una distancia superior a 1,5 veces el rango intercuartlico se considera atpico. Para obtener el diagrama de la caja de una variable se sigue la ruta DESCRIBIR DATOS NUMERICOS ANALISIS DE UNA VARIABLE...y se selecciona GRAFICO DE CAJA.

El resultado es el siguiente:

Grfico de Caja y Bigotes

150

160

170 altura

180

190

200

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 19

En el diagrama se debe observar: la forma de los rectngulos que forman la caja (cuanto ms estrechos sean, indicarn una mayor concentracin de datos); la posicin de la media, marcada con una cruz, respecto de la mediana, lnea central de la caja (la coincidencia de ambas indica simetra de la distribucin), y la existencia de valores ticos (quedan fuera de los segmentos de longitud 1,5 veces el rango intercuartlico colocados a derecha a izquierda). En ocasiones puede ser til observar simultneamente dos diagramas de la caja: por ejemplo para la variable altura en la que se separan los valores de las observaciones en funcin del diferente sexo de los individuos. Esta opcin est disponible en el men COMPARAR DOS MUESTRASMUESTRAS INDEPENDIENTES, seleccionando en la ventana que aparece de acuerdo con la disposicin de nuestros datos.

El resultado obtenido (tras seleccionar la opcin de GRAFICO DE CAJA en la opcin GRAFICAS) es el siguiente:

Grfico Caja y Bigotes

altura

peso

40

80

120

160

200

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 20

De forma que es posible analizar simultneamente una variable discriminada segn el criterio de seleccin. (Esta misma representacin simultanea de grficos tambin est disponible cuando se quiera observar el histograma de una variable). Diagrama de tarta o grfico de sectores El diagrama de tarta (Piechart) proporciona informacin sobre las categoras en que puede dividirse una variable (y la importancia relativa de las mismas) Para ensayara su aplicacin utilizaremos el fichero cardata.sf que contiene datos de diferentes automviles fabricados en el mundo. Siguiendo el men DESCRIBIRDATOS CATEGORICOSTABULACION

y activamos la opcin de DIAGRAMA DE SECTORES en el men del GRAFICAS veremos el diagrama de sectores que nos dar la distribucin de las diferentes categoras en que puede dividirse la variable make (que contiene marcas de coches) cuando la variable origin toma el valor 3 (lo que equivale a estudiar nicamente coches fabricados en Japn)

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 21

Diagrama de Sectores de make 3,03% 3,03% 6,06% 3,03% 21,21% 3,03% 3,03% 9,09% 3,03% 9,09% 15,15% 21,21%

make Acura Geo Honda Hyundai Isuzu Mazda Mitsubishi Nissan Subaru Suzuki Toyota Yugo

De modo que es posible analizar grficamente la importancia relativa de los fabricantes de coches radicados en Japn. Diagrama de barras Mediante esta grfico es posible obtener informacin sobre las diferentes categoras en que pude dividirse una variable. As por ejemplo en el fichero cardata.sf podemos analizar los coches fabricados en Amrica (origin = 1), en Europa (origin =2) o en Japn (origin=3) sin ms que hacer DESCRIBIR..DATOS CATEGORICOS TABULACION

Y seleccionar la opcin DIAGRAMA DE BARRAS del GRAFICAS

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 22

Diagrama de Barras de origin 50 40 frecuencia 30 20 10 0 1 2 3

La representacin de grfico de barras permite cruzar dos variables y analizar por ejemplo el nmero de cilindros del automvil (variable cylinder) segn su origen (variable origin). Para ello seleccionamos el men DESCRIBIR...DATOS CATEGORICOS...TABULACION CRUZADA.

Activando la opcin de DIAGRAMA DE BARRAS de GRAFICAS, se obtiene:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 23

Diagrama de Barras para cylinders segn origin 24 20 frecuencia 16 12 8 4 0 3 4 5 cylinders 6 8 origin 1 2 3

Lo que nos permite hacer un anlisis de las dos variables: por ejemplo puede verse que coches con 8 cilindros slo son fabricados en Amrica. Grficos de dispersin o Scatterplots Los grficos de dispersin proporcionan informacin acerca de la distribucin de una variable. Son especialmente tiles los grficos XY, pues permiten analizar la relacin entre dos variables Para visualizarlos se sigue DISPERSION...GRAFICO X-Y el men GRAFICAR...GRAFICOS DE

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 24

Como resultado obtenemos en diagrama que nos permite ver la distribucin conjunta de ambas variables, y por tanto su relacin lineal, en la que al aumentar la altura de una persona tambin lo har su peso. (Como puede verse, tambin est permitida la seleccin de valores de las variables mediante una variable de seleccin, en el caso estudiado sexo)

Grfico de altura vs peso 200 190 altura 180 170 160 150 41 61 81 peso 101 121

De la misma manera podemos calcular los grficos de dispersin XY para mas variables, para ello utilizamos el men DESCRIBIR DATOS NUMERICOSANALISIS MULTIVARIADO. Nos aparece un cuadro de dialogo donde introducimos las variables a analizar:

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 25

Una vez aceptadas las variables, seleccionamos la opcin MATRIZ DE DISPERSION del botn rpido GRAFICAS

El resultado es el siguiente:

COMISIONES CONSUMO DEPOSITOS FONDOS_INVERSION MG_ORDINARIO MOROSIDAD PROMOTOR PYMES VIVIENDA


Donde podemos ver todos los grficos XY que pueden formarse para todas las parejas que pueden formarse con las variables seleccionadas.

Curso de Formacin Estadistica.

CHEMO

Manual de Statgraphics 26

Вам также может понравиться