Вы находитесь на странице: 1из 33

Universidad Catlica del Maule

Facultad de Ciencias de la Ingeniera


Escuela de Ingeniera civil Informtica

Anlisis de Probabilidades
Con SPSS
Tutorial y ejemplos.

DATOS PERSONALES
Alumno:

Paulina Quezada Muoz.

Profesor:

Luis Cofr Rojas

Facultad:

Ciencias de la Ingeniera

Escuela:

Ingeniera Civil Informtica

Asignatura:

Inferencia Estadstica

Fecha:

Junio del 2014

1. CONTENIDOS
1. Contenidos.1
2. Introduccin.2
3. Ejecucin del SPSS.3
4. Creacin de Datos..4
5. Anlisis de Medidas Descriptivas.8
5.1. Media8
5.2. Mediana..9
5.3. Moda10
5.4. Grficos..11
6. Inferencia Estadstica.13
6.1. Estimadores puntuales13
6.1.1. Media...13
6.1.2. Varianza.13
6.1.3. Desviacin Estndar..13
6.2. Intervalos de Confianza...14
7. Prueba de Hiptesis16
7.1. Prueba para 1 muestra (Media).16
7.2. Comparacin de 2 muestras (Medias)17
7.3. Comparacin de 2 muestras (ANOVA)...18
8. Pruebas de Asociacin y Regresin....19
8.1. Correlaciones..19
8.2. Regresiones..21
9. Ejemplos de experimentos estadsticos.......22

2. INTRODUCCIN

En este tutorial se realizar una introduccin al programa SPSS con el objetivo de


facilitar su rpida utilizacin por un usuario sin conocimientos previos, bajo el
supuesto de que los datos para el anlisis proceden de una encuesta y que por
tanto debern codificarse para su posterior procesamiento.
Empezaremos diciendo que el SPSS es un programa adaptado al entorno de
Windows, por lo cual su forma de ejecutarse es a travs de ventanas, que
despliegan diferentes mens con distintas opciones.
Es uno de los programas estadsticos ms conocidos teniendo en cuenta su
capacidad para trabajar con grandes bases de datos y un sencillo interface para la
mayora de los anlisis. Tambin nos permite realizar anlisis y grficos
estadsticos sin tener que conocer la mecnica de los clculos ni la sintaxis de los
comandos del sistema.
Adems utiliza un anlisis predictivo que nos ayuda a anticipar los cambios de
manera que podamos planificar e implementar estrategias que mejoren nuestros
resultados.
Ms adelante veremos las distintas formas de tomar las muestras de anlisis y con
ellas se describir la introduccin de datos su captura desde otros programas
tales como la hoja de clculo de Excel, y en un posterior apartado se explicarn
algunas operaciones bsicas con el SPSS, tales como las medidas descriptivas (la
media, mediana, varianza, etc.), las medidas de inferencia estadstica (estimadores,
intervalos de confianza), la prueba de hiptesis (En donde compararemos las
distintas muestras), la prueba de asociacin y regresin.

3. EJECUCIN DEL SPSS


Una vez instalado el programa SPSS en su ordenador una opcin para ejecutar el
programa es seguir la ruta (la ruta vara un poco segn la versin del SPSS): Mi
PC/Disco Local(C:)/Archivos de Programa/IBM/SPSS/ Statistics/spss.exe
La otra opcin es que, en ocasiones existe un icono de acceso directo en el
escritorio, en este caso para ejecutar el SPSS, simplemente tendr que hacer doble
clic con el botn izquierdo del mouse sobre l.

Al ejecutar el programa desplegar la siguiente ventana con opciones:

En el cuadro de dilogo seleccionamos la opcin Introducir los datos, luego de


esto tenemos varias opciones; introducir los datos manualmente, exportarlos de
otro lugar como por ejemplo de una hoja de Excel o simplemente copiar y pegar
una base de datos. A continuacin se explicarn las opciones con detalle.

4. CREACIN DE DATOS

Lo primero que debemos hacer, luego de dar clic como se vea en la figura
anterior, veremos la siguiente pantalla:

Luego presionamos abajo donde dice vista de variables as:

Luego hacemos doble clic en la primera casilla y le otorgamos un nombre a la


variable que crearemos en este caso la llamaremos Temperatura luego
presionamos enter y automticamente se llenaran los campos de los lados de la
siguiente manera:

Ahora presionamos donde dice Medida y colocamos Escala

Ahora volvemos hacer clic abajo donde dice vista de datos

Ahora introducimos los datos en la columna de nuestra variable Temperatura


puede ser manualmente haciendo doble clic en las casillas y rellenndolas hacia
abajo segn el tamao de la muestra:

Tambin podemos exportar los datos desde otro lugar, como lo mencionamos
antes:

Aparecer una pantalla donde seleccionamos primero el tipo de archivo que


buscamos en este caso es de Excel, luego buscamos nuestro archivo y
seleccionamos en Abrir

Luego aparecer un cuadro de dilogo donde nos pregunta qu libro queremos


leer, en caso de que tuviera varios.

Luego se abrir otra ventana donde ir mostrando los resultados de las


operaciones realizadas con nuestro programa, en este caso se muestra que se
exportaron satisfactoriamente los datos desde Excel.

Otra manera ms sencilla es seleccionando los datos desde un documento, con el


botn derecho hacemos clic en copiar y luego en nuestro programa hacemos
clic con el botn derecho (debajo de la variable a llenar) y presionamos pegar y
listo.

5. ANLISIS DE MEDIDAS DESCRIPTIVAS


Ahora a travs del conjunto de datos que hemos creado, analizaremos las medidas
descriptivas de tendencias centrales y de dispersin. En nuestro ejemplo tomamos
una muestra llamada Temperatura de 60 datos.
Seleccionamos la columna completa de la variable Temperatura y nos vamos a la
barra de herramientas donde dice Analizar y con ella podemos obtener los
siguientes datos:

5.1

La Media:

Es un promedio estndar, en donde se suman el valor de todas las muestras y se


divide por el nmero total de stas.

Ahora para obtener la media seleccionamos en la lista de Analizar donde dice


Estadsticos Descriptivos y luego elegimos cualquiera de las dos opciones puede
ser en Frecuencias o en Descriptivos.

Y se nos abre un cuadro de dilogo en donde debemos seleccionar la variable


analizar y traspasarla al recuadro, luego presionamos en opciones donde se abrir
un nuevo cuadro y seleccionamos la casilla donde dice Media, luego presionamos
continuar y posteriormente aceptar.

A continuacin se abre una ventana con los resultados:

5.2

La Mediana:

Representa el valor de la variable de posicin central en un conjunto de datos


ordenados. Para obtener la mediana nos vamos a: Analizar -> Estadsticos
Descriptivos -> Frecuencias.

Resultado

5.3

La Moda:

La moda es el valor con una mayor frecuencia en una distribucin de datos. Para
obtener la moda seguimos los pasos anteriores: Analizar -> Estadsticos
Descriptivos -> Frecuencias. Como ya habamos seleccionado antes la variable
Temperatura solo presionamos en Estadsticos y cambiamos de seleccin a la
Moda, colocamos continuar y luego aceptar.

Resultado

10

5.4

GRFICOS:

Para obtener un grfico debemos buscar en las herramientas donde diga Grficos
y luego en generador de grficos, se abrir un cuadro con un mensaje que ponemos
aceptar y se abrir una ventana con todas las opciones de los diferentes tipos de
grficos que existen. Elegimos un dibujo para el grfico haciendo doble clic en l
y nos mostrar otro cuadro el cual cerraremos y aparecer el grfico pidiendo que
le ingrese las coordenadas y arrstramos una de las muestras hacia el eje y

11

Resultado

12

6. INFERENCIA ESTADSTICA
6.1

Estimadores Puntuales:

Corresponde a la Media (que ya vimos anteriormente), la Varianza y la


Desviacin Estndar.

6.1.1 La Media:
Se encuentra explicada en el punto 5.1

6.1.2 La Varianza:
La varianza puede pensarse como el promedio de las distancias hasta la media al
cuadrado. Para calcular la varianza seguimos los pasos anteriores: Analizar ->
Estadsticos Descriptivos -> Frecuencias. Como ya habamos seleccionado antes la
variable Temperatura solo presionamos en Estadsticos y cambiamos de seleccin
a la varianza, colocamos continuar y luego aceptar.

Resultado

6.1.3 Desviacin Estndar:


La desviacin estndar desviacin tpica mide cunto se separan los datos y su
frmula es la raz cuadrada de la varianza. Se siguen los mismos pasos anteriores:
Analizar -> Estadsticos Descriptivos -> Frecuencias, luego en el cuadro
seleccionamos Estadsticos y marcamos la desviacin tpica.

13

Resultado

6.2

Intervalos de Confianza:

Es un rango de valores (calculado en una muestra) en el cual se encuentra el


verdadero valor del parmetro, con una probabilidad determinada. Para nuestro
ejemplo obtendremos los intervalos de confianza del 90%, 95% y 99%. Debemos
seguir los siguientes pasos: Analizar -> Estadsticos descriptivos -> Explorar, luego
aparecer un cuadro donde debemos poner el porcentaje que deseamos

14

Para los dems intervalos de confianza se repiten los mismos pasos, pero se va
cambiando donde dice el porcentaje a 95% y luego a 99%, a continuacin se
muestran los resultados de los 3 intervalos con su respectivo diagrama de caja:

Para el 90% los resultados son:

Para el 95% los resultados son:

15

Para el 99% los resultados son:

16

7. PRUEBA DE HIPTESIS
7.1

Prueba para 1 muestra (Media):

Debemos seleccionar la muestra ir a: Analizar -> Comparar medias -> Medias,


luego saldr un cuadro de dilogo en donde debemos seleccionar la variable, en
este caso se llama Temperatura, luego presionamos en opciones y se abrir otro
cuadro con opciones y ponemos continuar y finalmente aceptar.

Resultado
17

7.2

Comparacin de 2 muestras (Medias):

Lo primero que debemos hacer es crear otra muestra siguiendo los pasos
explicados anteriormente, en este caso crearemos otra variable llamada Escala.
Teniendo listas nuestras variables las seleccionamos y vamos a: Analizar ->
Comparar medias -> Prueba T para muestras relacionadas, luego aparecer un
cuadro de dilogo donde debemos seleccionar una muestra y presionar la flecha de
al medio luego seleccionamos la otra muestra y presionamos nuevamente la flecha.
Ahora presionamos en opciones donde aparecer un pequeo cuadro preguntando que
intervalo de confianza desea obtener, ponemos continuar y finalmente aceptar, en este caso
repetiremos las operaciones para obtener los 3 intervalos del 90%,95% y 99%

Resultado

18

7.3

Comparacin de 2 muestras (ANOVA):

Seleccionamos las muestras vamos a: Analizar -> Comparar medias -> ANOVA de un
factor, seleccionamos una muestra (Temperatura) y con la primera flecha hacemos clic,
seleccionamos la otra muestra (Escala) y con la segunda flecha hacemos clic, luego vamos a
opciones donde se abrir otro cuadro, seleccionamos la casilla de Prueba de Homogeneidad de
las varianzas, luego ponemos continuar y finalmente aceptar.

Resultados

19

8. PRUEBAS DE ASOCIACIN Y REGRESIN


8.1

Correlaciones:

Debemos seleccionar las 2 muestras y luego dirigirnos a: Analizar -> Correlaciones


-> Bivariadas luego aparecer un cuadro de dilogo en donde debemos pasar las
dos muestras con la flecha, listo eso presionamos en opciones donde se abrir otra
ventana y seleccionaremos la casilla de y Medias y Desviaciones tpicas, ponemos
continuar y luego aceptar.

Resultados

20

8.2

Regresiones:

Seleccionamos las muestras y nos vamos a: Analizar -> Regresin -> Lineales y se
abrir un cuadro de dilogo donde seleccionaremos con la flecha una muestra para
Dependientes y la otra para Independientes, luego vamos a Estadsticos y
seleccionamos las casillas de Estimaciones y la de Ajustes del modelo, ponemos
continuar y despus aceptar.

Resultados

21

9.

Ejemplos de experimentos estadsticos.

Tabla 1. Calor empleado para cinco niveles de aislamiento.

Segn los datos de la tabla 1, Son los resultados de un diseo completamente


aleatorizado para el cual la respuesta son los kilowats hora, empleados por los
sistemas de calentamiento (en cientos de kilowats hora) para casas muy similares
en un mes dado, como funcin de cinco niveles de aislamiento trmico (En
pulgadas). Supongase un error tipo I con alfa igual a 0,01.

22

Como resultado el Software SPSS nos dar:

23

24

25

Tabla 2. Contenido en peso para un efecto de llenado.

Una planta de enlatado emplea un numero muy grande de maquinas para su


proceso de llenado. Se da por hecho que cada maquina vacia un un peso
especificado en cada lata. El gerente de la planta sospecha que existe un a gran
variacin en la cantidad del producto que se vacia entre las distintas maquinas.
Para verificar la sospecha, a elegido al azar cuatro maquinas y pesa el contenido de
cinco latas elegidas de forma aleatoria, llenadas por cada una de las 4 maquinas.

26

Como resultado el Software SPSS nos dar:

27

28

La secuencia para realizar un ANOVA es:

Analizar
Comparar medias
ANOVA de un factor

Se abre el siguiente cuadro de dilogo:

Se selecciona la variable que se considera Dependiente y la variable Factor y con el


botn Opciones se activan EstadsticosDescriptivos y Homogeneidad de varianzas.

Al aceptar en el visor de resultados aparecen los siguientes cuadros:

Descriptivos. Recoge la media, la desviacin tpica, el intervalo de confianza


del 95% (por defecto) para la media correspondientes a la variable
dependiente para cada uno de los grupos definidos por el factor.
Prueba de homogeneidad de varianzas. Contiene el valor del estadstico de
Levene del contraste de la hiptesis de homoscedasticidad con el nivel de
significacin crtico.
ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total,
sus correspondientes grados de libertad y el valor del estadstico de prueba
F junto con el nivel de significacin crtico.
29

Como complemento grfico de este anlisis, para obtener una primera


aproximacin acerca de si es razonable o no la hiptesis nula, se
selecciona Grficos > Barras de error y se activa la opcin Simple. Con el
botn Definir se abre el siguiente cuadro de dilogo:

Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de


categoras la
variable
factor.
El
intervalo
de
confianza
para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el
visor de resultados los puntos que respresentan a la media de cada grupo junto
con los lmites del correspondiente intervalo de confianza para la media
poblacional. Si los puntos que representan las medias estn desigualmente
distribuidos en el grfico se tiene un indicio de que a nivel poblacional no puede
sostenerse la hiptesis de igualdad de medias; es decir, por lo menos uno de los
niveles del factor influye significativamente sobre la variable dependiente.
EJEMPLOS
Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede
aceptarse que el tipo de transporte utilizado, Trans, influye sobre la variable tiempo.
Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir se
selecciona como Variable Tiempo y enEje de categoras la variable Trans; al aceptar
se obtiene la siguiente representacin grfica:

30

Como puede observarse, los puntos que representan a las medias de cada grupo
aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido
por el factor Tren. El intervalo de confianza para la media correspondiente al
grupo definido por el factor Metro est contenido dentro del intervalo
correspondiente al grupo definido por el factor Bus, as como, el intervalo
correspondiente al factor Coche est contenido dentro de los intervalos
correspondientes definidos por los factores Metro y Otros. El grfico, por tanto,
parece sugerir no una nica poblacin sino tres poblaciones con distintas medias.
Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar >
Comparar medias > ANOVA de un factor. En el cuadro de dilogo se selecciona
Tiempo como variable Dependiente y Trans como Factor. Para contrastar la
hiptesis de igualdad de varianzas se abre con el botn correspondiente el cuadro
de dilogo ANOVA de un factor: Opcionesy se activa Homogeneidad de varianzas. Si
se desea un anlisis descriptivo del comportamiento de la variable dependiente
dentro de cada grupo se activa tambin la opcin Descriptivos. Al aceptar se
obtienen los siguientes cuadros de resultados:

31

Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos,


as como, los lmites superior e inferior para la media de cada grupo al 95% de
confianza.

El estadstico de Levene toma un valor lo suficientemente pequeo para no


rechazar la hiptesis de homocesdaticidad a los niveles de significacin habituales.

En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450,


es significativamente distinto de 1 para cualquier nivel de significacin y, por lo
tanto, se rechaza la hiptesis nula de igualdad de medias y queda confirmada la
primera impresin proporcionada por el grfico de barras de error.

32

Вам также может понравиться