Вы находитесь на странице: 1из 72

CURSO: ESTADISTICA Y PROBABILIDADES

Tema: PRUEBA DE HIPOTESIS CON SPSS


Docente: EDIDSON FUENTES
2017-2B
II
I
HIPOTESIS

Una hiptesis (del latn hypothsis y este del griego ) es una suposicin de algo posible o imposible para sacar
de ello una o ms consecuencias.1 Es una idea que puede no ser verdadera, basada en informacin previa. Su valor
reside en la capacidad para establecer ms relaciones entre los hechos y explicar por qu se producen. Normalmente se
plantean primero las razones claras por las que uno cree que algo es posible. Y finalmente ponemos: en conclusin. Este
mtodo se usa en el mtodo cientfico, para luego comprobar las hiptesis a travs de los experimentos.(Fuente:
https://es.wikipedia.org/wiki/Hip%C3%B3tesis_(m%C3%A9todo_cient%C3%ADfico)
Orientaciones
Dar a conocer los conceptos bsicos de la estadstica como parte de la metodologa cientfica.
Entender el significado de probabilidad e identificar las caractersticas bsicas de los
experimentos aleatorios.
A travs de ellos el alumno podr al final del curso tomar decisiones apoyndose en la
estadstica inferencial. Los temas que se desarrollan son: Estadstica Descriptiva,
Probabilidades, Variables Aleatorias, Modelos Probabilsticos de Variables Aleatorias Continuas,
Propiedades del Modelo Probabilstico Normal y Distribuciones Muestrales, Estimacin de
Parmetros, Pruebas de Hiptesis.
PRUEBA DE HIPOTESIS

Tema 1 Introduccin
Tema 2 Variables
Tema 3 Ejercicios
Tema 4 Practica
INTRODUCCION
Resulta comn en el da a da, escuchar afirmaciones que dicen cosas como Las
mujeres ganan menos que los hombres, A mayor nivel de educacin, mayor nivel
de ingresos y asuntos por el estilo.

Si bien es cierto que la lgica o el sentido comn podan indicar que efectivamente
lo que sucede es as, cuando se desea comprobar de manera emprica estas
afirmaciones es necesario utilizar tcnicas estadsticas que apoyen o refuten las
teoras del investigador, de manera de tener certeza (desde el punto de vista
estadstico), sobre las afirmaciones realizadas.

Para poder realizar este tipo de anlisis, SPSS presenta algunas herramientas, sin
embargo, se considera prudente interiorizar al lector en el concepto de pruebas de
hiptesis, de manera superficial, con la finalidad de comprender su finalidad.
PRUEBA DE HIPOTESIS
VALOR DE P
Una vez establecidas las hiptesis, es necesario conocer el mtodo por el cual el
investigador escoger entre una hiptesis y la otra. Para ello, de manera general, se
utiliza un estadstico llamado valor p.

Este estadstico indica la probabilidad que existe de rechazar la hiptesis del


investigador, cuando esta es verdadera. Por convencin, se asume que si esta
probabilidad es ms de un 5% (0,05) debemos rechazar la hiptesis del investigador
(H1) en favor de la hiptesis nula (H0). Entonces:
EJEMPLO
La empresa Doble UAP est enfrentando una seria disputa entre su personal. Por una
parte los profesionales pelean porque de acuerdo a su percepcin, el salario recibido
por las mujeres es menor que el salario recibido por los hombres.

Adems todos reclaman que el salario promedio de la empresa es inferior al salario de


mercado, que promedia los S/. 520.000 para empresas similares.

Finalmente, todos concuerdan que en los ltimos aos el salario no ha aumentado, en


promedio, de manera considerable, por lo que piden que se reajuste a todos los
trabajadores su nivel de renta.

La empresa decide tomar cartas en el asunto y genera una base de datos


(BaseDatosC5.sav) en la que incluye informacin como: Sexo, Salario inicial, Salario
actual y aos de escolaridad para cada uno de sus 35 trabajadores.

Se le pide analizar la base de datos y determinar la veracidad de cada una de las


situaciones anteriormente descritas.
CODIFICACION DE VARIABLES
Base de datos (BaseDatosC5.sav) en la que incluye informacin como:
Sexo,
Salario inicial,
Salario actual
Aos de escolaridad para cada uno de sus 35 trabajadores.
PASO 1
PASO 1
Lo primero que se debe hacer es ir al men Analizar, posteriormente ir al apartado
Comparar medias y finalmente escoger Prueba T para muestras
independientes..
Esto abrir una ventana de dilogo donde se debern definir los parmetros para la
realizacin de la prueba de contraste de medias.H1.
PASO 2
Una vez en el cuadro de dilogo, se debe escoger la variable que se desea medir, en
este caso Salario actual y debe ser llevada hasta donde dice Contrastar variables,
mientras que la variable por la que se desee agrupar el estadstico (en este caso, el
sexo del trabajador) debe ir donde dice Variable de agrupacin.
Posteriormente se deben definir los grupos. Para ello hay que hacer clic en el botn
Definir grupos
PASO 3
Al hacer clic en el botn Definir Grupos, se abrir una pequea ventana como la que
se ve a la izquierda. En ella se debe ingresar los valores correspondientes a las
etiquetas de sexo. De acuerdo a la informacin de la base de datos: 1=Masculino y
2=Femenino.
A continuacin hay que escribir los nmeros en las casillas que se denominan Grupo
1 y Grupo 2, tal cual se observa en la figura.
Finalmente se debe hacer clic en el botn Continuar y para finalizar, en el botn
Aceptar.
PASO 3
Al hacer clic en el botn Definir Grupos, se abrir una pequea ventana como la que
se ve a la izquierda. En ella se debe ingresar los valores correspondientes a las
etiquetas de sexo. De acuerdo a la informacin de la base de datos: 1=Masculino y
2=Femenino.
A continuacin hay que escribir los nmeros en las casillas que se denominan Grupo
1 y Grupo 2, tal cual se observa en la figura.
Finalmente se debe hacer clic en el botn Continuar y para finalizar, en el botn
Aceptar.
INTERPRETACION
Los resultados indican que el salario promedio de los hombres es de S/.446.111,
mientras que el salario de las mujeres es de S/. 391.7647. Como primera aproximacin
se observa una diferencia de salario a favor de los hombres de S/.54.3464 en promedio.
Sin embargo esto necesita ser contrastado por pruebas ms especficas.
INTERPRETACION
SPSS utiliza el criterio del valor p para determinar la validez de los resultados de la
prueba de hiptesis. Sin embargo, en este software, el valor p, viene escrito como Sig
(bilateral). Por ende, para medir el valor p, solamente se debe ver donde dice Sig
(bilateral).

Utilizando el criterio del valor p, se puede afirmar que, estadsticamente, no hay


diferencias entre el salario de las mujeres en relacin al de los hombres (valor p = 0,0),
por lo que esa acusacin resulta falsa (Se debe aceptar H0).
PRUEBA DE MEDIAS PARA UNA MUESTRA
La segunda situacin que debe resolver el investigador es si efectivamente la
empresa ofrece un salario promedio inferior al del mercado, que ronda los
S/.520.000. Lo primero que se debe realizar es establecer la prueba de hiptesis
correspondiente:
H0: El salario promedio pagado por la empresa es igual al salario de mercado
(S/.520.000).
H1: El salario promedio pagado por la empresa es menor que el salario de mercado
(S/.520.000).

Para determinar cual hiptesis es la correcta, el procedimiento a seguir es el


siguiente:
PASO 1
Para determinar cual hiptesis es la correcta, el procedimiento a seguir es el
siguiente:

Para realizar este anlisis se debe ir al men Analizar posteriormente seleccionar


donde dice Comparar medias y finalmente escoger Prueba T para una
muestra.
PASO 2
Una vez abierta la ventana, se debe escoger la variable que se desea contrastar (en
este caso Salario actual y se debe llevar hacia el cuadro. Donde dice Valor de
prueba se debe ingresar el valor contra el que se quiere contrastar (en este caso el
salario de mercado de S/. 520.000.
INTERPRETACION
La primera parte de los resultados indican que el salario promedio pagado por la
empresa es de S/. 419.7143, lo que est indicando que en trminos brutos, el salario
Efectivamente es ms bajo que el de mercado
INTERPRETACION
Utilizando el criterio del valor p, y dado que el valor entregado por el software es de
0,000 se puede asumir que el investigador tiene razn al afirmar que la empresa
paga un salario ms bajo que el promedio de mercado.
Recordemos que cuando el valor p es menor que 0,05 se puede aceptar como
verdadera la hiptesis del investigador (H1).
PRUEBA DE MEDIAS PARA MUESTRAS RELACIONADAS:
La ltima situacin presentada por los trabajadores de la empresa indica que en
promedio sus sueldos no han subido significativamente conforme ha pasado el
tiempo.
Para resolver lo anterior, el investigador debe realizar una prueba que se denomina:
Prueba T para muestras relacionadas.

Las hiptesis detrs de esta prueba son las siguientes:

H0: El salario promedio actual de la empresa es igual al salario inicial.


H1: El salario promedio actual de la empresa es mayor al salario inicial.

Para determinar cual hiptesis es la correcta, el procedimiento a seguir es el


siguiente:
PASO 1
Primero hay que ir al men Analizar, posteriormente ir al submen Comparar
medias y ah escoger Prueba T para muestras relacionadas... tal como muestra
la figura de la izquierda.
PASO 2
En la ventana que se abre, se debe escoger las variables que se desea contrastar y
agregarlas al sector de Variables seleccionadas.
Para el desarrollo de este ejemplo, las variables son Salario inicial y Salario actual.
Una vez seleccionadas y ubicadas en la seccin variables Seleccionadas, se debe
hacer clic en el botn Aceptar.
INTERPRETACION
Los estadsticos descriptivos indican que inicialmente el salario inicial promedio de
los trabajadores era de S/. 406.7715, mientras que el salario promedio actual de los
trabajadores es de S/.419.7143.
INTERPRETACION
De acuerdo al anlisis del valor p, se puede determinar que en promedio, el salario
actual de la empresa si es estadsticamente mayor que el salario que se pagaba
inicialmente, debido a que como el valor p < 0,05, se debe aceptar la hiptesis del
investigador (H1), que dice que el salario actual es mayor que el salario inicial.
Bibliografa

Estadstica descriptiva e inferencial i, fascculo 1.


antecedentes histricos de la estadstica y sus funciones
autores: Hugo Garca Mancilla y Juan Matus Parra.
Matemtica 3 de secundaria, Felipe Eduardo Doroteo, Rubn
Hildebrando Glvez Paredes.
Matemtica 5 de secundaria, Alfonso Rojas Puemape.
http://www.conevyt.org.mx/bachillerato/material_bachillere
s/cb6/5sempdf/edin1/edin1_f1.pdf
http://maralboran.org/wikipedia/index.php/Tablas_de_datos
http://www.angelfire.com/sc/matasc/EyD/bioesta/medidas.
htm
EJERCICIOS PRACTICOS
PRACTICA N 01:
DEFINICIN DE VARIABLES DEL CUESTIONARIO AL PAQUETE ESTADSTICO
PRACTICA N 01:
DEFINICIN DE VARIABLES DEL CUESTIONARIO AL PAQUETE ESTADSTICO
PRACTICA N 02: INGRESO DE DATOS
1. Mediante trabajo en equipo (2 personas), ingresar al archivo que contiene la definicin de las
variables, deber dividir el trabajo para ingresar los datos de las 150 encuestas.
2. Guarde todos los datos ingresados en un solo archivo con el nombre, por ejemplo: ALVA (1-
150). Cada integrante cambiar el nombre del archivo con su propio apellido, quedar:
MIAPELLIDO-(1-150).
DE DATOS

DATOS RECOLECTADOS A
PARTIR DEL CUESTIONARIO
APLICADO PARA UN
TRABAJO DE
INVESTIGACIN
DE DATOS

DATOS RECOLECTADOS A
PARTIR DEL CUESTIONARIO
APLICADO PARA UN
TRABAJO DE
INVESTIGACIN
DE DATOS

DATOS RECOLECTADOS A
PARTIR DEL CUESTIONARIO
APLICADO PARA UN
TRABAJO DE
INVESTIGACIN
DE DATOS

DATOS RECOLECTADOS A
PARTIR DEL CUESTIONARIO
APLICADO PARA UN
TRABAJO DE
INVESTIGACIN
PRACTICA N 03

Se ha diseado un ensayo clnico aleatorizado, doble-ciego y controlado con placebo, para


estudiar el efecto de dos alternativas teraputicas en el control de la hipertensin arterial. Se han
reclutado 100 pacientes hipertensos y estos han sido distribuidos aleatoriamente en tres grupos de
tratamiento. A uno de los grupos (control) se le administr un placebo, a otro grupo se le
administr un inhibidor de la enzima conversora de la angiotensina (IECA) y al otro un tratamiento
combinado de un diurtico y un Antagonista del Calcio. Las variables respuesta final fueron las
presiones arteriales sistlica y diastlica.

Los datos con las claves de aleatorizacin han sido introducidos en una base de datos que reside
en la central de aleatorizacin, mientras que los datos clnicos han sido archivados en dos archivos
distintos, uno para cada uno de los dos centros participantes en el estudio. Las variables
almacenadas en estos archivos clnicos son las siguientes:

Tabla 1.1 Variables en los ficheros con los datos del estudio. (hipertens Datos)
PRACTICA N 03

DATOS
PRACTICA N 03

El archivo de claves de aleatorizacin contiene slo dos variables.


PRACTICA N 03

La Tabla con los datos relativos a los 10 de los pacientes enrolados en uno de los centros de
investigacin es la siguiente:
PRACTICA N 04
Configuracin de variables
Datos ingresados
Anlisis de Datos
Anlisis de Datos
Anlisis de Datos
EJEMPLO
REGRESIN Y CORRELACIN LINEAL SIMPLE CON SPSS
Ejemplo de Regresin Lineal Simple con SPSS
En un estudio sobre gastos mensuales (Y) e ingresos econmicos mensuales (X), una
muestra de 10 familias dio la siguiente informacin ( en dlares USA).

X: 280 250 350 400 450 500 500 350 550 600
Y: 250 200 320 370 400 400 450 300 490 550

a)Trazar e interpretar el diagrama de dispersin.


b)Calcular y analizar el coeficiente de correlacin lineal de Pearson
c)Estimar y comentar la ERP lineal simple de mnimos cuadrados
d)Cul ser el gasto y ahorro de una familia cuyo ingreso sea 300, 500 y 700 dlares?
Adems, cul sera el gasto y ahorro si una familia no tiene ingresos econmicos?
EJEMPLO
SOLUCION
a) Diagrama de dispersin Creamos las variables e introducimos los datos
en SPSS de la siguiente manera:
EJEMPLO
SOLUCION
Se sigue la secuencia Grficos Dispersin en el men principal
Se elige la opcin Simple
Se pulsa el botn Definir

Se eligen y se transfieren las variables INGRESOS (variables independientes)


a la casilla Eje X y GASTOS (variable dependiente) a la casilla Eje Y
EJEMPLO SOLUCION
Se pulsa Aceptar
Si se desea mostrar los valores perdidos, se pulsa el botn Opciones del
cuadro Diagrama de Dispersin simple, accediendo al cuadro Opciones en
donde se marca la opcin Mostrar los Grupos definidos por los valores
perdidos.

INTERPRETACIN
La nube de puntos y la lnea recta creciente
sobre ella revelan que existe una relacin
lineal creciente significativa entre gastos e
ingresos econmicos de las familias.
EJEMPLO SOLUCION
b) Coeficientes de correlacin lineal de Pearson

Sigue la secuencia Analizar Correlaciones - Bivariadas del men principal


Se elige y se transfieren las variables
INGRESOS y GASTOS a la casilla Variables
Se activa la opcin Bilateral de la seccin
Pruebas de significacin para evaluar la
significacin de dos colas (bilateral) del
coeficiente.
EJEMPLO SOLUCION
Se pulsa aceptar

Se activa la opcin Marcar las


correlaciones significativas para
mostrar la significacin del cociente.
EJEMPLO SOLUCION
INTERPRETACION

Anlisis
El coeficiente de correlacin lineal
de Pearson entre ingresos
econmicos y gastos es muy alto
(0,986) y altamente significativo
(p<0,001). Este resultado permite
afirmar que la correlacin entre
estas variables es positiva; por
tanto, la relacin entre gastos e
ingresos es lineal y creciente.
EJEMPLO SOLUCION
c) Estimacin de la ERP lineal simple
Se sigue la secuencia Analizar Regresin Lineal
EJEMPLO SOLUCION
c) Estimacin de la ERP lineal simple

Se eligen y se transfieren las


variables INGRESOS a la casilla
Independientes y GASTOS a la
casilla Dependientes
Se elige el mtodo de regresin
lineal Introducir
EJEMPLO SOLUCION
c) Estimacin de la ERP lineal simple

Se pulsa el botn Opciones


Se marca la opcin Incluir
constante en la ecuacin para
estimar la ordenada en el origen B0
adems de la pendiente B1.
EJEMPLO SOLUCION
c) Estimacin de la ERP lineal simple
Se pulsa el botn Continuar
Se pulsa el botn Estadstica
Se marcan las opciones Estimaciones y
Ajuste del modelo de la seccin
Coeficientes de regresin

Se pulsa los botones Continuar y Aceptar.


Cuando se desea estimar el modelo si el coeficiente B0 (constante o trmino independiente) se
desmarca la opcin Incluir constante en la ecuacin del cuadro Regresin lineal: Opciones.

Si se desea calcular algunas medidas de resumen, se pulsa el botn Estadsticas del cuadro
Regresin lineal, ingresando al cuadro Regresin lineal: Estadsticos, donde se marcan las
opciones matriz de covarianza y Descriptivos.

Si se desea excluir las parejas de valores perdidos o los valores perdidos de cada variable, se
pulsa el botn Opciones del cuadro Regresin lineal, ingresando al cuadro Regresin lineal:
Opciones. En este cuadro, se marca las opciones excluir casos perdidos segn parejas o
Excluir casos segn lista de la seccin Valores perdidos.
EJEMPLO SOLUCION
INTERPRETACION
En la primera tabla (resumen del modelo) se
aprecia el coeficiente de correlacin lineal de
Pearson , el coeficiente de determinacin (R
cuadrado), el coeficiente de determinacin
corregido a ajustado (R cuadrado corregido) y
el error tpico o estndar de la estimacin
(error tp. de la estimacin).

El coeficiente de correlacin de Pearson es


0,986, el coeficiente de determinacin es 0,972
y el coeficiente de determinacin corregido es
0,986. Estos ndices revelan que la correlacin
entre las variables es positiva y muy alta, casi
perfecta; y que el 97,2% de la variabilidad de
los gastos se explican por los ingresos (casi
total). El error estndar de la estimacin es 19,
346.
EJEMPLO SOLUCION
INTERPRETACION
En la segunda tabla (ANOVA) se aprecia
el anlisis de varianza (Anlisis Of
Variante). Con esta tcnica se evala la
significacin estadstica del modelo de
regresin, esto es, se evala la
significacin estadstica de los
parmetros B0 y B1 son muy significativos
en forma conjunta o simultanea. Como
Sig = 0, se deduce que el MRLS es
altamente significativo (p<0,001), es
decir, los parmetros B0 y B1 son muy
significativos en forma conjunta. El hecho
de decir que son significativos, significa
que los valores de los parmetros son
diferentes de 0. Si Sig > 0,05, entonces el
modelo no es significativo y, por tanto, no
existe una relacin lineal entre las
variables.
EJEMPLO SOLUCION
INTERPRETACION En la tercera tabla (Coeficientes) se observan las
estimaciones de los parmetros B0 y B1 y su
significacin estadstica individual. La estimacin de
B0 es -15,565 (Constantes o trmino independiente),
el cual no es significativo ( Sig = 0,539), p>0,05). La
estimacin de B1 es 0,919 (INGRESOS), el cual es
altamente significativo (Sig = 0,000, p<0,01). Con
estos resultados, la estimacin de la ecuacin del
MRLS sera.

Y = -15,565 + 0,919 X

Es decir,

Gastos = -15,565 + 0,919 Ingresos

Sin embargo, como el coeficiente B0, no es


significativo, se vuelve a correr el programa ajustado
un MRLS sin el trmino independiente (regresin
lineal a travs del origen). Lo resultados son los
siguientes.
EJEMPLO SOLUCION
INTERPRETACION

Con estos resultados, la estimacin de la ecuacin del MRLS es: Y = 0,884 X


Es decir. Gastos = 0,884 Ingresos

Como b1>0, entonces la tendencia lineal es creciente, es decir a mayores ingresos econmicos
correspondes mayores gastos; y a menores ingresos econmicos correspondes menores gastos. La recta
de regresin corta al eje Y (ingresos) en $ 0(B0 = 0) es decir, la recta pasa por el punto (0;0), por cada dlar
USA que cambia los ingresos econmicos, los gastos cambian en 88 cntimos de dlar ($ 0,88)

d) Pronsticos o predicciones

a) Si el ingreso de una familia es $ 300, entonces el gasto se obtiene sustituyendo 300 en Gastos = 0,884
Ingresos, dicho gasto sera $ 265,20. El ahorro es el gasto menos el ingreso , el cual sera $ 34,80.
b) Si el ingreso de una familia es $ 500, entonces el gasto sera $ 442 y el ahorro, $ 58.
c) Si el ingreso de una familia es $ 700, entonces el gasto sera $ 618,8 y el ahorro, 81,2
d) Si una familia no tiene ingresos, entonces el gasto sera $ 0 y el ahorro, $ 0.

Вам также может понравиться