Вы находитесь на странице: 1из 19

Estadstica II

Curso 2011/12
Guin de la Prctica 1
Introduccin a Statgraphics. Intervalos de confianza y contrastes de hiptesis para
una y dos poblaciones

1. Contenidos de la prctica
-

Introduccin a Statgraphics
Intervalos de confianza y contrastes de hiptesis para una y dos poblaciones

2. Introduccin a Statgraphics
Statgraphics es un paquete estadstico de Software comercial basado en ventanas y
orientado a la docencia, que incluye herramientas para tratar distintas tcnicas
estudiadas en Estadstica I y II.
En los guiones de las prcticas de la asignatura se presentan indicaciones de uso de
Statgraphics y ejemplos para su aplicacin a estos temas. Estos guiones se han
preparado para la versin de Statgraphics Centurion XVI para Windows, en espaol.
En ellos se mencionan nicamente aquellas opciones directamente relacionadas con
los contenidos de las asignaturas. Si deseas ms informacin sobre Statgraphics
puedes encontrarla en distintos recursos en la Web o en la propia ayuda de
Statgraphics.

2.1 Contenido de la introduccin


-

Cmo iniciar Statgraphics


Cmo leer datos de un fichero en Statgraphics
Obtencin de estadsticos descriptivos bsicos
Generacin de grficos
Cuantiles y probabilidades de distribuciones

2.2 Cmo iniciar Statgraphics


Como para otros programas de Windows, puedes ir al men de Inicio de Windows y
seleccionar
Inicio Todos los programas Statgraphics Centurion XVI.I Statgraphics
Alternativamente, si dispones de un icono en el Escritorio de Windows (usualmente
con el nombre Statgraphics), puedes pulsar dos veces en dicho icono.

2.3 Cmo leer datos de un fichero en Statgraphics


Al iniciar Statgraphics comienzas con un libro de datos vaco. Para empezar a
trabajar con datos que tengamos disponibles en un archivo de Statgraphics,
seleccionaremos en el menu Archivo la opcin Abrir y a continuacin Abrir
Datos...,
Archivo Abrir Abrir Datos OK
Aparece una ventana que nos pregunta por el formato en que estn nuestros datos.
Seleccionaremos la opcin Archivo de datos STATGRAPHICS y pulsaremos Aceptar
para cargar alguno de los conjuntos de datos ya disponibles.
Archivo de datos STATGRAPHICS Aceptar
Se abrir a continuacin una ventana del Explorador con el ttulo Abrir archivo de
datos y lo har por defecto en la carpeta Data de la instalacin de Statgraphics.
Dicha carpeta tiene la ruta \Archivos de programa\Statgraphics\STATGRAPHICS
Centurion XVI.I\Data
Para esta parte de la prctica vamos a seleccionar el fichero 93cars.sgd, que
contiene informacin sobre distintas caractersticas de automviles disponibles en el
mercado Norteamricano hace unos aos. Una vez seleccionado dicho archivo y tras
pulsar Aceptar obtendrs una ventana como la que se indica a continuacin, y
estars preparada para analizar estos datos.

Antes de continuar, examina brevemente los datos y como estn organizados.


Cuntas variables estn incluidas en el conjunto de datos? De cuntas
observaciones se dispone para cada variable? De qu tipo es cada variable?

2.4 Obtener estadsticos descriptivos bsicos


Para obtener un resumen de los datos seleccionamos en el men Describir,
Describir Datos Numricos Anlisis de una variable Aceptar
Se abre una nueva ventana de dilogo en la que se nos pide que seleccionemos la
variable con la que queremos trabajar. Seleccionamos la variable MPG
City (consumo en ciudad) y pulsamos el botn Datos. Aparece una ventana de
dilogo en la que se nos pide que indiquemos qu tablas y grficos deseamos generar.
En la ventana por defecto dejamos marcadas las opciones Resumen Estadstico,
Grfico de Dispersin y Grfico de Caja y Bigotes y pulsamos Aceptar para
obtener en tres cajas de una ventana los resultados del anlisis, como se indica a
continuacin.

En particular, en la caja correspondiente al resumen estadstico de los datos puedes


obtener los valores siguientes:
Recuento = 93
(nmero de observaciones)
Promedio = 22,3656
(promedio)
Desviacin Estndar = 5,61981
(desviacin tpica)
Coeficiente de Variacin = 25,127% (coeficiente de variacin,
tpica/promedio)
Mnimo = 15,0
(mnimo)
Mximo = 46,0
(mximo)
Rango = 31,0
(recorrido)
Sesgo Estandarizado = 6,71035
(coeficiente de asimetra)
Curtosis Estandarizada = 7,88248 (coeficiente de kurtosis)

desviacin

Repite el anlisis para un par de variables, seleccionando


Describir Datos Numricos Anlisis multivariado Aceptar
y a continuacin las variables MPG city y Horsepower (potencia), pulsando el
botn Datos. Selecciona la opcin Solamente Casos Completos en la siguiente
ventana. Obtn los valores de la covarianza de ambas variables y su coeficiente
de correlacin, as como su diagrama de dispersin.

2.5 Generacin de grficos


Hemos visto ya como obtener distintos tipos de grficos a travs de la opcin
Describir del men. Otra manera de generar representaciones grficas de los datos
se basa en emplear las opciones del men Graficar, a la izquierda del anterior. A
travs de dicho men se puede acceder a los grficos que ya hemos generado, y a

otros tipos de grficos. Por ejemplo, para obtener un histograma de la variable MPG
city seleccionamos
Graficar Grficos Exploratorios Histograma Aceptar
Seleccionamos la variable MPG city pulsando el botn Datos y en la ventana de
dilogo siguiente nos aseguramos de que est marcada la opcin Histograma.
Obtenemos el grfico que se indica a continuacin:

Si queremos modificar algunas de las caractersticas del grfico, por ejemplo el


nmero de cajas, se puede llevar a cabo esta tarea pulsando el botn derecho en la
ventana del histograma y seleccionando en el men que aparece la opcin
(BD) Opciones de Ventana Nmero de Clases 15 Aceptar
Genera un grfico de dispersin para las variables MPG City y
Horsepower.

2.6 Cuantiles y probabilidades de distribuciones


En muchos casos deseamos trabajar con distribuciones, sus cuantiles y los valores de
sus funciones de distribucin (probabilidades de sus colas, por ejemplo). Estos
procesos se corresponden por ejemplo con la consulta de tablas de distribuciones que
hemos llevado a cabo en clase.
Para obtener esta informacin en Statgraphics seleccionamos en el men Describir
Describir Ajuste de distribuciones Distribuciones de Probabilidad

En el men emergente marcamos la distribucin con la que queramos trabajar, por


ejemplo la t de Student, y Statgraphics abre una nueva ventana para seleccionar los
grados de libertad con los que queremos trabajar en dicha distribucin (por defecto
10 grados de libertad). Por el momento seleccionamos esta opcin pulsando
Aceptar y en la ventana siguiente seleccionamos nicamente Distribuciones
Acumuladas en la columna TABLAS, obteniendo una ventana con el ttulo
Distribuciones de Probabilidad y valores relativos a la distribucin.
Supongamos que quisiramos calcular la probabilidad a la derecha del valor 1,5 para
una distribucin t de Student con 24 grados de libertad. En la ventana anterior:

Seleccionamos con el botn derecho la opcin Opciones de Anlisis, y


escribimos 24 en la ventana de dilogo bajo G. L. (los grados de
libertad).
(BD) Opciones de Anlisis G. L. 24

Seleccionamos con el botn derecho la opcin Opciones de Ventana, e


introducimos el valor 1,5.
(BD) Opciones de ventana Variable Aleatoria: 1,5

Obtenemos como resultado la pantalla que se muestra a continuacin:

En ella se puede ver el valor de inters (la cola derecha), que es 0,0733278.

Podemos tambin obtener el valor del cuantil correspondiente a una determinada


probabilidad. Por ejemplo, vamos a obtener el cuantil correspondiente a una
probabilidad del 98% (el valor de la variable que deja a su derecha una probabilidad
del 2%) para una t de Student con 14 grados de libertad.
Para ello, empezamos por seleccionar el tercer botn en la parte superior de la
ventana, que muestra una ventana de dilogo denominada Tablas y grficos. En
ella marcamos la opcin Distribuciones Acumuladas Inversas y pulsamos Aceptar.
En la ventana resultante, tras pulsar el botn derecho y seleccionar Opciones de
Anlisis indicamos el nmero de grados de libertad deseados (14). Volvemos a
pulsar el botn derecho y seleccionamos Opciones de Ventana, indicando ahora la
probabilidad deseada (0,98).
(I) Tablas y grficos Distribuciones Acumuladas Inversas
(BD) Opciones de Anlisis G. L. 14
(BD) Opciones de Ventana FDA 0,98
Obtenemos la ventana:

El valor buscado es 2,26379.


Encuentra la probabilidad a la derecha del valor 32,37 bajo una distribucin
chi cuadrado (Chi-square) con 19 grados de libertad. Encuentra tambin los
cuantiles correspondientes al 2,5% y al 97,5% para dicha distribucin.

3. Intervalos de confianza y contrastes de hiptesis para una y dos poblaciones

3.1 Contenido de intervalos y contrastes


-

Intervalos de confianza para una poblacin


Contrastes de hiptesis para una poblacin
Contrastes de hiptesis para dos poblaciones

3.2 Intervalos de confianza para una poblacin


Vamos a trabajar en esta parte con uno de los ejercicios propuestos para resolver en
clase en el Tema 1 de la asignatura (el ejercicio nmero 13). Su enunciado era:
En una clnica se ofrecen tratamientos para la reduccin de peso en
pacientes. Se supone que la disminucin de peso que se observa tras
un tratamiento de dos meses sigue una distribucin normal.
De una muestra aleatoria simple de 16 pacientes se han obtenido los
valores de reduccin que se indican a continuacin:
12,5 14,3 9,8 15,3 10,5 11,8 9,5 8,4
9,3 8,9 10,6 12,0 14,1 8,8 12,1 9,4
Calcula un intervalo de confianza al 95% para la reduccin de peso
media en todos los pacientes que siguen el tratamiento.
Empezamos por introducir los datos del problema en Statgraphics. Para ello
podramos importar los datos desde un fichero de texto o una hoja de clculo que
hubisemos creado, con las opciones Archivo, Abrir, Abrir Datos y marcando
Archivo de Datos Externo. Alternativamente podemos introducir los datos
directamente seleccionando la opcin Archivo, Nuevo.
Archivo Nuevo
A continuacin introducimos los datos del problema (en una nica columna) en la
ventana de datos vaca que aparece (<sin titulo>), y obtenemos

Estos datos se pueden guardar para su uso posterior seleccionando en el men


Archivo, e indicando la carpeta y el nombre del archivo deseados.
Archivo Guardar Guardar Datos
El resumen de estos datos se puede obtener seleccionando en el men Describir,
Describir Datos Numricos Anlisis de una Variable
(Datos) Col_1
(Tablas) Resumen Estadstico Aceptar
donde, tras seleccionar Datos Numricos y Anlisis de una Variable, hemos
introducido en el cuadro de dilogo con el botn Datos la variable Col_1, y en la
ventana de dilogo hemos marcado la opcin Resumen Estadstico. El resultado es
el mostrado en la ventana siguiente:

Para calcular el intervalo de confianza podramos aplicar la frmula vista en clase,


esto es,
x tn-1,/2 s/n
para la que ya tenemos los valores de x, s y n, pero debemos calcular el cuantil
correspondiente de la distribucin t de Student, tn-1,/2, seleccionando en el men
Describir como se indica en la seccin Cuantiles y probabilidades de
distribuciones,
Describir Ajuste de Distribuciones Distribuciones de probabilidad
Students t
G. L. 15
TABLAS Distribuciones Acumuladas Inversas
(BD) Opciones de Ventana FDA 0,975
Obtenemos la pantalla siguiente (con el valor de tn-1,/2 = 2,13145):

y el intervalo ser el correspondiente a


11,0813

2,13145 x 2,1532/16 = [9.93394;12.22866]

Statgraphics tiene otra manera ms directa de realizar estos clculos. Para ello,
desde la ventana con los datos que hemos introducido seleccionamos en el men
Describir las opciones siguientes,
Describir Datos Numricos Anlisis de una Variable
(Datos) Col_1
(TABLAS) Intervalos de confianza
Una vez completado este proceso, podemos seleccionar el nivel de confianza
(cambiar el valor por defecto) pulsando el botn derecho del ratn en la ventana y
seleccionando Opciones de Ventana. En la ventana emergente introducimos el
valor deseado.
(BD) Opciones de Ventana Nivel de Confianza 95
Para el 95% (que tambin es el valor por defecto) obtenemos el resultado indicado en
la captura de pantalla siguiente (y en particular el intervalo [9,93 ; 12,23]):

Para el conjunto de datos 93cars.sgd, calcula un intervalo de confianza para


la media de la variable MPG City al 99%.

3.3 Contrastes de hiptesis para una poblacin


Veremos en esta seccin como llevar a cabo en Statgraphics los clculos asociados a
los contrastes de hiptesis que estudiamos en el Tema 2. Como ejemplo, supongamos
que queremos contrastar con los datos del problema anterior si la reduccin de peso
promedio obtenida no excede 10 Kg (H0 : 10). Supongamos tambin que queremos
hacerlo para un nivel de significacin del 5%.
De nuevo, podramos llevar a cabo los clculos manualmente. En particular, si
llevamos a cabo un contraste unilateral y quisiramos obtener el p-valor
correspondiente calcularamos el valor del estadstico como
(x 10)/(s/n ) = (11,0813 10)/(2,1532/16) = 2.008731
Podemos buscar la probabilidad para la cola derecha de este valor, correspondiente a
una distribucin t de Student, seleccionando el men Describir, como se indica en
la seccin Cuantiles y probabilidades de distribuciones, obteniendo
Describir Ajuste de Distribuciones Distribuciones de probabilidad
Students t
G. L. 15
TABLAS Distribuciones Acumuladas
(BD) Opciones de Ventana Variable Aleatoria 2,008731

El p-valor para el contraste unilateral ser por tanto 0,0314594, y con ese valor y el
nivel de significacin indicado rechazaramos la hiptesis nula.
De nuevo, existe una manera ms sencilla de llevar a cabo este contraste en
Statgraphics. Para ello seleccionamos en el men Describir,
Describir Datos Numricos Anlisis de una variable
(Datos) Col_1
(TABLAS) Prueba de Hiptesis
Al hacerlo obtenemos la ventana siguiente, correspondiente al anlisis por defecto
de Statgraphics, y en particular para un contraste bilateral y una hiptesis nula con
un valor del parmetro igual a cero.

Para cambiar estas opciones a una alternativa unilateral y a un valor del parmetro
igual a 10 para la hiptesis nula, debemos pulsar el botn derecho del ratn en la
ventana y seleccionar Opciones de Ventana En el cuadro de dilogo introducimos
Media/Mediana igual a 10, marcamos Mayor Que y dejamos Alfa en el 5%.
(BD) Opciones de Ventana Media/Mediana 10
Hiptesis Alternativa Mayor Que
Obtenemos ahora

Este resultado coincide con el anlisis que habamos realizado anteriormente.

Otra manera de llevar a cabo este contraste es seleccionar el men Describir,


Datos Numricos, Pruebas de Hiptesis. En el primer cuadro de dilogo
marcamos Media Normal, ya que estamos llevando a cabo un contraste sobre la
media de una poblacin normal, e introducimos en las casillas correspondientes los
valores
Hiptesis nula:
Media muestral:
Sigma muestral:
Tamao de muestra:

10
11,0813
2,1532
16

(valor de la media bajo la hiptesis nula)


(media de la muestra)
(cuasidesviacin tpica de la muestra)
(tamao de la muestra)

Describir Datos Numricos Pruebas de Hiptesis


Media Normal
(Hiptesis alterna) Mayor Que
En el siguiente cuadro de dilogo seleccionamos Mayor Que y dejamos el valor de
Alfa por defecto. Obtenemos

Para el conjunto de datos 93cars.sgd, contrasta si existe evidencia


suficiente para rechazar que la eficiencia de los automviles en carretera no
ha cambiado desde el ao anterior, cuando el valor promedio entre todos los
vehculos era de 28,3 mpg. Lleva a cabo el contraste para un nivel de
significacin del 1%.

3.4 Contrastes de hiptesis para dos poblaciones

Al igual que en caso anterior empezamos tomando como referencia uno de los
ejercicios de la coleccin correspondiente al Tema 3, en particular el ejercicio
nmero 10. Dicho ejercicio planteaba lo siguiente:
Estamos interesados en saber si los salarios medios en dos grandes ciudades
de un pas son homogneos o si, por el contrario, se puede evidenciar que hay
diferencias significativas en los salarios que perciben los trabajadores de estas
2 ciudades. Para ello se tomaron muestras aleatorias independientes de
trabajadores (de actividades similares y niveles similares) en las 2 ciudades y
se obtuvieron los siguientes datos:
Ciudad 1
Ciudad 2

5.9 6.1 6.3 6.1 6 6.2 5.7 6.3 6.6


6.4 6.3 6.5 6.1 5 5.5 4.7 5.1 2.8 1.8 1.5

Plantea un contraste bilateral para ver si hay diferencias significativas en los


salarios que perciben los trabajadores de estas 2 ciudades. A qu conclusin
llegas para un nivel de significacin de 0,1? Da una cota para el p-valor.
En primer lugar introducimos los datos en Statgraphics, en dos columnas
consecutivas. Para ello seleccionamos las opciones Archivo, Nuevo para obtener
una ventana de datos vaca (<sin ttulo>) e introducimos los valores indicados en
las dos primeras columnas de la ventana. Obtenemos la ventana que se indica a
continuacin.

Si queremos estudiar este contraste (como un contraste bilateral) siguiendo el


procedimiento que hemos descrito en clase, podemos calcular el valor del estadstico
correspondiente a partir de los valores de cada muestra. Para calcular los
estadsticos descriptivos bsicos simultneamente para ambas muestras podemos
seleccionar en el men Comparar,

Comparar Dos Muestras Muestras Independientes


(Muestra 1) Col_1 , (Muestra 2) Col_2
(TABLAS) Resumen Estadstico
En el men emergente tras seleccionar Muestras Independientes indicamos
Col_1 y Col_2 como muestras 1 y 2 (Muestra 1 y Muestra 2). En la ventana
de dilogo marcamos Resumen Estadstico bajo TABLAS. Obtenemos

Con estos valores podemos calcular el estadstico del contraste, y tenemos que
sp2 = (8x0,25982 + 10x1,8382)/18 = 1,907778
t = (6,13333 - 4,7)/(1,907778 (1/9+1/11)) = 2,308792

Con este dato podemos calcular el p-valor del contraste para la distribucin del
mismo, una t de Student con 18 grados de libertad. Seleccionamos en el men
Describir, como se indica en la seccin Cuantiles y probabilidades de
distribuciones,
Describir Ajuste de Distribuciones Distribuciones de probabilidad
Students t
G. L. 18
TABLAS Distribuciones Acumuladas
(BD) Opciones de Ventana Variable Aleatoria 2,308792

Obtenemos

Al tratarse de un contraste bilateral, su p-valor ser 2x0,0165173 = 0,0330346, y no


rechazamos la hiptesis nula para un nivel de significacin del 1%.
Si queremos realizar este mismo contraste de una manera ms directa, podemos
seleccionar en el men Comparar,
Comparar Dos Muestras Muestras Independientes
(Muestra 1) Col_1 , (Muestra 2) Col_2
(TABLAS) Comparacin de Medias
En la ventana emergente tras seleccionar Muestras Independientes, indicamos
Col_1 y Col_2 como muestras 1 y 2. En la ventana emergente marcamos la
opcin Comparacin de Medias. Obtenemos como resultado

Esto es, los mismos resultados que vimos anteriormente. Si quisiramos cambiar el
tipo de contraste a uno unilateral, o modificar el nivel de confianza para los
intervalos, podemos pulsar el botn derecho en la ventana, seleccionar Opciones de
Ventana y cambiar estos datos en la ventana de dilogo.
Alternativamente, puedes llevar a cabo este anlisis seleccionando
Comparar Dos Muestras Pruebas de Hiptesis
e introduciendo los datos para el contraste en la ventana emergente.
Si las muestras fuesen pareadas, bastara con seleccionar en el men Comparar,
Comparar Dos Muestras Muestras Pareadas
y seguir un procedimiento similar.
En la pgina Web de la asignatura tienes un conjunto de datos denominado
Datos_2, car_mpg.sf3. Estos datos corresponden a consumos de automviles
fabricados en Europa, Japn y los EEUU. Lee dichos datos en Statgraphics y
lleva a cabo contrastes de hiptesis para determinar si en funcin de estos
datos puedes concluir que los consumos medios son diferentes para
automviles fabricados en las distintas zonas.

Вам также может понравиться