Вы находитесь на странице: 1из 37

Uso de Statgraphics Centurin XVI.

1 en el
procesamiento y anlisis de datos para gestin de
procesos

RENE MALUENDA MOYA


Estadstico Matemtico
Especialista en Control y Gestin
de la Calidad
rmaluenda@uantof.cl

UNIVERSIDAD DE ANTOFAGASTA
CHILE


1.- Introduccin:
Este apunte est orientado a desarrollar la prctica y aplicacin de los conceptos tericos de la
estadstica, utilizando un software especializado. Se utilizar el Software Statgraphics Centurin. Versin
XVI.I
1.- Construccin de una base de datos y definicin de Variables:
1.- Cualitativas:
a).-Cualitativas Nominales: El estado Civil, color de la piel, sexo
b).- Cualitativas Jerrquicas u ordinales: Diagnstico de una lesin
Las variables cualitativas generalmente se codifican con valores numricos, para facilitar el ingreso de los
datos en la Base de Datos. Disminuir los errores de digitacin.2.Usodelsoftwareparaconstruirunabasesdedatos:
HagadobleClicenelconoqueidentificaalSoftware,locualpermiteunaccesodirecto:

ObtendrlasiguientepantallaFig1

Sobre la palabra "Col_1" coloque la " + " que aparece cuando se trabaja con el ratn y esa columna se
pondr de color cuando pique con el sector izquierdo del ratn. Seguidamente pique con el sector derecho
y aparecer una "ventana" con varias opciones. Seleccione " Modificar Columna.
Fig.2

Obtendr la siguiente pantalla, donde podr definir


a) Elnombredelavariable
b) Realizarunpequeocomentariodescriptivodesucontenidoosignificado,comoporejemplolasunidadesde
medicindelavariable

a) Definir si la variable es un Atributo o cualidad (Carcter) , una fecha, una variable numrica decimal
(numrico),unavariablenumricaentera,fijarlacantidaddedecimales,etc.
Fig.3

Numrica: Debe ser activada cuando la variable es variable continua


Carcter: Debe ser activada cuando la variable es un atributo o cualidad
Entera: Debe ser activada cuando la variable es variable discreta o cuando se trata de una
Variable Cualitativa (Nominal u Ordinal) donde el nmero entero que se ingresa representa
una jerarqua, ya sea ascendente o descendente.
Fecha: Si la variable a ingresar fuese una fecha, indicando da, mes, ao.
Mes: Si la variable fuese un mes dentro de un ao.
Decimal Fijo: Fija el nmero de decimales a utilizar .Pone 2 por defecto.
Supongamos que tenemos unas " fichas " con antecedentes de muchas personas que trabajan en
una empresa, con los siguientes datos. Debemos definir en base a lo dicho anteriormente, las columnas
de la base de datos:
Nombre: Carcter
Sexo

: Carcter (M = masculino; F = femenino)

Fecha de nacimiento: Fecha


Nivel de Escolaridad: Entera (1="bsica incomp." ; 2= "bsica compl." ; .............)
Oficio o Actividad: Carcter
Pertenencia de la vivienda: Carcter (Propia; Arriendo. ; Allegado ; Cedida ; Leasing ; .......)
Estatura: Numrica
Peso:

Numrica

Edad:

Entera

Una vez que se han ingresado todas las fichas o encuestas, cada cierto instante, es necesario
guardar la informacin ya sea en el "Disco Duro " de su computador o en un "pendrive" .Para ello debe
picar la palabra Archivo con el sector izquierdo del ratn y luego en la ventana que se despliega picar la
opcin " Guardar como...

Un ejemplo de Base da datos construida para automviles, se muestra en la siguiente pantalla


Fig.4

Una vez que se han ingresado todas las fichas o encuestas, cada cierto instante, es necesario
guardar la informacin ya sea en el "Disco Duro " de su computador o en un "pendrive" .Para ello debe
picar la palabra Archivo con el sector izquierdo del ratn y luego en la ventana que se despliega picar la
opcin " Guardar como... y expresar la ruta donde se guardara el archivo (Mis documentos, escritorio,
pendrive,etc.-).
Fig.5

3.- Recuperacin de variables de la Bases de Datos para su Procesamiento


Como se vio anteriormente, los datos estn almacenados en una estructura que se llama
"Archivo", el cual est constituido por variables.
Entonces debemos recuperar los datos desde el lugar en donde se encuentran

Ingrese en el ambiente de "Statgraphics"


Ubique el dispositivo de almacenamiento donde estn guardados sus datos.
Pique la palabra Archivo en la barra superior de herramientas de Statgraphics y tendr la
siguiente pantalla.
Fig.6

Fig.7

Fig.8

Usted deber de indicar la ruta que deber seguir para abrir el archivo de datos
A modo de ejemplo, abriremos el archivo 93cars tomando la ruta siguiente: Seleccione MI PC y luego
busque el disco C. Luego activar Archivos de Programa. Buscar el archivo Statgraphics. Seguidamente
seleccionar data. Buscar 93cars, y tendr desplegado todo el archivo.
Fig.9

4.- Procesamiento de variables cualitativas:


Para procesar este tipo de variables, utilizando Statgraphics, se debe usar la siguiente pantalla,
segn el objetivo que se persigue.
Fig. 10

Por ejemplo si lo que se desea es la Tabulacin de la variable Type (tipo), debe de seleccionar la
palabra Tabulacin, en la pantalla anterior y llenar la pantalla siguiente.
Fig. 11

Fig. 12

Fig. 13

El grfico de Pareto es un importante grfico de barras para destacar aspectos ms relevantes dentro de
un conjunto de valores nominales. El procedimiento para llegar a producirlo es
Fig. 14

Por ejemplo podramos ver que tipo de automviles son ms preferidos por los consumidores
Fig. 15

Podemos inicialmente aceptar la siguiente pantalla que ser desplegada al aceptar una pantalla como la
anterior.
Fig. 16

Los resultados son entregados en una pantalla que se despliega de forma automtica donde la persona
puede entrar a intervenir los grficos, las tablas, etc. Para dejarla a gusto del usuario.
Fig. 17

No debemos de olvidar que los anlisis, comentarios, conclusiones, etc. a los resultados que entrega
Statgraphics, son de responsabilidad del investigador o especialista encargado de describir y/o analizar la
situacin.

5.- Guardar las tablas y grficos entregados por Statgraphics al procesar los datos.
Statgraphics dispone de un ambiente especial donde se puede guardar todo lo que se realiza en
una sesin de trabajo para luego proceder a la redaccin del respectivo informe. Este ambiente se
denomina StatReport. Es necesario en los grficos realizar todas las modificaciones que el usuario crea
necesario para tener una mejor presentacin (Cambio de ttulos, fuentes de letra, escalas en los ejes,
colores y trama, etc.) antes de enviar los tabulados y grficos a dicho ambiente.
Debe de pulsar primero el sector derecho del mouse y tendr una pantalla donde aparece una barra
que dice Copiar Anlisis a StatReporter. Seguidamente con el sector izquierdo del mouse activar la
ventana. De forma automtica y sin que usted lo visualice, todo lo que est presente en el procedimiento
estadstico, queda guardado en ese ambiente.
Fig.18

Para recuperar o saber que tiene guardado en el ambiente StatReport, usted debe ubicar la barra
inferior de la pantalla del software y maximizar StatReporter
Fig. 19

Tambin se puede elaborar directamente el informe en este ambiente, para luego guardarlo con el
nombre y lugar que el usuario desee.
Fig. 20

Lo interesante de todo este proceso de guardar el informe, es que queda guardado como un archivo
Word, el que por supuesto puede ser abierto y trabajado con este programa, y ya no necesita de
Statgraphics.

6.- Procesamiento de variables cuantitativas.

6.1.- Cuantitativas Discretas:


Discretas: Son aquellas que nos entregan un conteo y se expresan con nmeros enteros. Ejemplo:
Nmero de hijos en una familia; Nmero de pacientes en una consulta mdica.
Pueden ser de poco rango: Ejemplo. Nmero de hijos tenidos vivos por las mujeres. Nmero de
episodios anuales de una enfermedad, por paciente. La cantidad de cilindros de los automviles.
Se procesan como si fuesen variables cualitativas, a efecto de obtener grficos y tablas
estadsticas.
Se pueden obtener medidas denominadas de resumen, tales como Promedio Aritmtico. Moda o Modo.
Pueden ser de amplio rango, como es el caso cuando en los censos se consulta por la edad en
aos cumplidos de las personas. Podemos obtener respuestas desde cero hasta ms de cien aos.
La cantidad de toneladas diarias producidas en ctodos de cobre en una empresa. La cantidad de
viajes hechos por camiones a distintos puntos de una faena, etc.
6.2.- Cuantitativas Continuas:
Cuando el dato se genera a partir de una medicin. Los valores numricos se expresan con decimales.
El procesamiento de las variables discretas de amplio rango y las variables continuas, generan:

Una tabla de distribucin de frecuencias que se caracteriza por que los niveles de medicin de la
variables son intervalos numricos.

Adems podemos obtener todas las medidas de Resumen vistas en el desarrollo terico del curso.

Todos los grficos estadsticos desarrollados.

El clculo de percentiles en la distribucin de los datos

6.2.1 Construir una tabla de Distribucin de Frecuencias


Por ejemplo en el archivo 93Cars podemos procesar la variable MPG City (rendimiento de los
automviles en la ciudad).
Fig. 21

Fig. 22

Fig. 23

Se desplegar entonces todo aquello que est activado y mostrar una pantalla general como la siguiente:
Fig. 24

Todo lo desplegado es factible de ser modificado o adecuado a las necesidades del usuario. Por
ejemplo podemos modificar la Tabla de Frecuencias para MPG City. Para ello se debe hacer un doble
click con el sector izquierdo del mouse en la ventana Tabla de Frecuencias para MPG City. Estando en
este ambiente, al pulsar el lado derecho del mouse se desplegar una ventana que permite ingresar los
requerimientos del usuario. Elegir Opciones de Ventana y activar la opcin con un clic usando el sector
derecho del mouse.

La tabla generada por el usuario tiene el siguiente aspecto.

Al guardar el informe en StatReport, es posible eliminar en este ambiente, la clase o intervalo inicial
y tambin la final. La tabla entonces queda de la siguiente forma:
Tabla de Frecuencias para MPG City
Lmite
Lmite
Clase Inferior
Superior Punto Medio
1
14,0
17,4
15,7
2
17,4
20,8
19,1
3
20,8
24,2
22,5
4
24,2
27,6
25,9
5
27,6
31,0
29,3
6
31,0
34,4
32,7
7
34,4
37,8
36,1
8
37,8
41,2
39,5
9
41,2
44,6
42,9
10
44,6
48,0
46,3
Media = 22,3656 Desviacin Estndar = 5,61981

Frecuencia
13
30
26
8
11
2
0
1
1
1

Frecuencia
Relativa
0,1398
0,3226
0,2796
0,0860
0,1183
0,0215
0,0000
0,0108
0,0108
0,0108

Frecuencia
Acumulada
13
43
69
77
88
90
90
91
92
93

Frecuencia
Rel. Acum.
0,1398
0,4624
0,7419
0,8280
0,9462
0,9677
0,9677
0,9785
0,9892
1,0000

A partir de esta tabla, el usuario deber de hacer todos los anlisis y redaccin del informe
destacando todos los aspectos que considere relevantes en el estudio.
6.2.2 Obtencin de Medidas de Resumen asociadas a una variable cuantitativa.

Estando en la pantalla principal del procedimiento que se realiza, como la Fig. 23, podemos
posicionarnos con el cursor en el sector Resumen Estadstico para MPG City y tener las medidas de
resumen analizadas tericamente. Para ello se debe hacer un doble click con el sector izquierdo del
mouse en la ventana Resumen Estadstico para MPG City. Estando en este ambiente, al pulsar el lado
derecho del mouse se desplegar una ventana que permite ingresar los requerimientos del usuario. Elegir
Opciones de Ventana y activar la opcin con un click usando el sector derecho del mouse.

Los conceptos de aquellas medidas de resumen que no se explicaron en la parte terica, pueden ser
estudiadas haciendo uso del botn Ayuda.

10

6.2.3 Obtencin de Medidas de Posicionamiento (Percentiles) de una variable cuantitativa.


Estando en una pantalla como la figura 23 anteriormente descrita, usted debe seleccionar la
ventana percentiles.

Obtendr inicialmente una tabla que propone el Software, la cual puede ser modificada si activa el
lado derecho del mouse y selecciona en ella opciones de ventana. Aparece una pizarra de dilogo para
ingresar los requerimientos del usuario, como la siguiente:

6.2.4 Obtencin de Grficos asociadas a una variable cuantitativa.

Estando en la pantalla principal del procedimiento que se realiza, como la Figuras 23 y 24, podemos
posicionarnos con el cursor en el sector Grficos y tener aquellos que se necesitan desplegar, para su
posterior anlisis.
6.2.4.1.- Grfico de caja y bigotes.
Permite detectar valores anmalos o atpicos.
Fig. 28

6.2.4.2.- Histograma:

11

Teniendo desplegado solamente el histograma en la pantalla de su PC., usted puede hacer todas
las modificaciones que desee, tales como: cantidad de barras (opciones de ventana), colores, tramas,
texto, etc. Pulse o active el sector derecho del mouse y se desplegarn un conjuntos de acciones posibles
de realizar, si se elige la opcin adecuada.
Fig. 30

Por ejemplo Fig. 31

Y obtendremos el histograma siguiente

6.2.4.3.- Polgono de Frecuencias.


Habiendo construido el histograma, debe activar el lado derecho del mouse y activar opciones de
ventana, para que aparezca el siguiente cuadro de dilogo que usted podr cambiarle a voluntad los
campos que aparecen en la figura 31, segn la figura siguiente.

12

Fig. 32

Obtendr la grfica configurada solicitada

6.2.4.4.- Grafica de distribucin de Frecuencias acumuladas


Estando dentro del grfico Histograma, y pulsando el lado derecho del ratn, debe de configurar la
opcin de ventana de la siguiente manera:

La grfica de distribucin de frecuencias acumuladas permite obtener valores aproximados de


valores de percentiles. Para ello debemos de haber accedido a la grfica usando e procedimiento descrito
en el prrafo anterior y activar el sector derecho del mouse para obtener una pantalla donde deber
seleccionar la opcin Localizar. Por ejemplo, el percentil 20 es igual 18,1263 millas por galn.
Fig. 34

13

6.2.4.5.- Cmo obtener los otros tipos de grficos cuando la variable es CONTINUA?
Estando en una pantalla como la figura 23 anteriormente descrita, usted debe seleccionar en
el sector de los grficos, aquellos que desea sean desplegados.

7.- PROCESAMIENTO DE DOS VARIBALES:


7.1.- Ambas variables son cualitativas y estn contenidas en columnas.
Se desea construir una tabla de distribucin de frecuencias conjuntas.
Fig. 35

Tendr acceso a la siguiente pantalla de dilogo:


Fig. 36

Adems de la tabla, este proceso entrega un grafico de barras agrupadas. La Tabla de Asociacin la
obtendr activando la ventana Tabla de Frecuencias.El grfico asociado se obtiene seleccionando
Diagrama de Barras
Fig. 37

14

7.1.2.- Cuando se dispone o se tiene una tabla de asociacin o de contingencia y se desea obtener
la Tabla de Asociacin y el grfico para presentar la situacin tabular.
En primer lugar debemos de construir una base de datos. Puede ser en Excel y desde aqu llevarla
a Statgraphics o directamente en Statgraphics.
Fig. 38

Fig.39

Luego deber llenar pantalla de dilogo, de la forma siguiente:


Fig. 40

Cuando pulse aceptar, aparece la siguiente ventana donde deber seleccionar lo que se indica
Fig. 41

Tendr entonces la tabla solicitada y el grfico de barras. Ambas salidas pueden ser mejoradas a
criterio del usuario, pulsando el sector derecho del mouse, cuando se est ya sea en la Tabla de
Frecuencias o en el Diagrama de Barras

15

Fig. 42

7.2.- Ambas variables son Cuantitativas (Anlisis de regresin simple)

En primer lugar se debe disponer de dos columnas de datos, Una para cada variable. El usuario
debe saber previamente a cual de ellas considerar variable independiente (X) y cual de ellas ser la
variable dependiente (Y). Una vez definido lo anterior, utilizar el procedimiento siguiente:
Fig.43

Fig.44

Se despliega una pantalla donde el Software trae incorporados 27 modelos que se pueden ajustar
con el procedimiento Regresin Simple. El modelo lineal es el que se propone inicialmente. Adems la
pantalla que se despliega trae algunas alternativas de ajuste.
Fig.45

16

Al aceptar el procedimiento anterior tal como lo especifica la Fig.45 anterior, ver desplegadas
informacin cuantitativa e informacin grafica del anlisis realizado.

7.3.- Qu modelo debemos elegir para ajustar a los datos?


Lo que debemos tener en cuenta para la eleccin del modelo que mejor interpreta a los datos, es
elegir del conjunto de ecuaciones dadas, aquel modelo que en trminos absolutos tenga el mayor
coeficiente de correlacin rxy, como tambin el mayor coeficiente de determinacin R2. Este criterio de
seleccin est justificado por el hecho de que al aumentar el coeficiente de correlacin (en trminos
absolutos), disminuye el error estndar de la estimacin del modelo.
Cuando puls el botn aceptar de la figura 45, se desplegar la siguiente pantalla, ebn la cual
deber activar la ventana Comparacin de Modelos Alternativos.
Fig. 46

Se desplegarn varios procedimientos estadsticos, como los muestra la siguiente figura, en la cual
con un doble clic en el sector que indica la flecha roja, secuencialmente tendr:
Fig. 47

Fig.48

En esta pantalla el software nos indica que el modelo a utilizar, dentro de lo que el dispone,
deber ser el modelo Inversa de X, debido a que presenta los mayores indices de asociacin entre las
variables: Coeficiente de Correlacin de 74,14% y Coeficiente de Determinacin R 2 de 54,97%.

17

Pulsando el sector derecho del mouse y seleccionado la barra Opciones de Anlisis, tendr
la ventana desplegada que le permite cambiarse de modelo.
Fig. 49

Haciendo una inspeccin en los grficos que muestran los datos originales y el modelo ajustado,
se puede observar claramente que el modelo Inversa de X reproduce de mejor forma la tendencia.

7.4.- Cmo predecir valores para la Variable Dependiente Y, cuando se asumen ciertos valores
para la variable Independiente X?
Estando en una pantalla como la figura 46, debe de activar Pronsticos. Para que ello ocurra, pulse el
icono siguiente, segn lo muestra la figura.
Fig. 50

No olvide los pronsticos los debe de hacer con el mejor modelo que ajusta a sus datos. En este caso el
modelo Inversa de X.
Fig.51

18

Usted deber ampliar esta ventana, y dar los valores para la variable X que usted desea saber que
valores para la variable Y sern posibles de obtener. Nos recuerda tambin cuales son los valores mnimo
y mximo de la variable X. Activando el sector derecho del mouse tendr disponible opciones de ventana
para ingresar otros o los valores de X que usted dispone y desea conocer la respuesta probable.
Fig. 52

Fig. 53

7.4.- Modelos Polinmicos


Puede ser que el modelo lineal, como tambin los modelos no lineales reducibles a lineal no
satisfagan al investigador. En este caso podemos ver la alternativa de probar un ajuste a los datos,
utilizando un modelo polinmico. Se comienza con uno de grado 2. Utilizando opciones de anlisis se
puede ir subiendo el grado del polinomio.
Fig. 54

Fig. 55

19

8.- Uso de Modelos de probabilidad de variables Discretas.


Para hacer clculos de probabilidad, grficos, etc. relacionados con estas funciones de distribucin,
utilizando Satagraphics , debe de realizar el siguiente procedimiento:
Fig. 56

Fig. 57

Todas las Distribuciones que aparecen encerradas en el recuadro, son distribuciones de


probabilidad de variable aleatoria discreta. El resto de las distribuciones son para variable aleatoria
continua.
Si la distribucin a utilizar fuese la Binomial, entonces en la pantalla que ofrece Statgraphics,
debe seleccionar esta opcin.

20

Va a desplegarse una ventana, donde deber ingresar la probabilidad de xito en cada evento o
ensayo y la cantidad de ensayos a realizar.
Por ejemplo: La probabilidad de que cada muestra de agua esta contaminada con una cierta
"sustancia rara" es de un 10%. Suponga que las muestras son independientes con respecto a la presencia
de dicha sustancia. Se toman 20 muestras en oportunidades diferentes.
Fig. 58

En la ventana que ser desplegada al configurar y aceptar la Fig. 58, ver desplegarse una
nueva ventana. Active las siguientes ventanas y luego acepte.
Fig. 59

1.- Resumen del Anlisis: Permite definir la funcin a utilizar y agregar otras. Para ello vaya
opciones de ventana.

a"

2.- Distribucin Acumulada: Permite calcular probabilidades para valores de variable aleatoria
especficos. Para ello vaya primero a opciones de anlisis " donde debe llenar los campos que solicitan
los parmetros de la distribucin. Seguidamente vaya a opciones de ventana, para entregar los valores de
la variable aleatoria para los cuales se desea realizar el clculo de probabilidades.
3.- Inversa de la Funcin de Distribucin Acumulada: Permite calcular valores de la variable
aleatoria, dada una probabilidad. Para ello vaya a " opciones de ventana.
a) Calcule la probabilidad de exactamente dos muestras estn contaminadas.
Fig.60

21

Fig. 61

La probabilidad que hayan exactamente dos muestras contaminadas es de 0,28518 o de manera


equivalente 28, 52%.
b).- Calcule la probabilidad de que hayan entre 2 y 5 muestras inclusive, contaminadas

Entonces la probabilidad de que hayan entre 2 y 5 muestras contaminadas, de un total de 10 es igual a


0.2852 + 0.1901 + 0.0898 + 0.0319 = 0.597
c).- Calcule la probabilidad de que hayan cuatro o ms muestras contaminadas. P ( X 3 ) = 0,13295

Tambin a veces en la prctica se nos presenta el problema de que en una muestra de tamao grande
con n conocida y probabilidad de xito conocida para cada evento o ensayo, cabe preguntarse Cul
es la cantidad mnima y mxima de unidades que con 90% de probabilidad tendrn una cierta
caracterstica?. Por ejemplo suponga n=150; Probabilidad del Evento = 0,1.
De la Figura 59, debe de tener activada la ventana Distribuciones Acumuladas Inversas
Fig. 63

22

Fig. 64

Fig. 65

Fig. 66.

La respuesta es que en una muestra de tamao 150, donde la probabilidad de ocurrencia de un


evento determinado es de un 10%, debemos esperar que con 90% central de confiabilidad haya entre 9
como unidades y a lo ms 21 unidades con la caracterstica.

9.- Uso de Modelos de probabilidad de variables Continuas.


Para hacer clculos de probabilidad, grficos, etc. relacionados con estas funciones de
distribucin, utilizando Satagraphics, debe de realizar el procedimiento indicado en la Fig. 56 y
enseguida buscar la funcin contnua que se desea utilizar.
Si lo que se desea es aplicar la Distribucin Normal, entonces en la ventana que ser desplegada al
aplicar el procedimiento indicado en la Fig. 56, active la distribucin normal.
Fig. 67

23

Se desplegar una pantalla que permite configurar hasta 5 distribuciones normales, entregando en
cada ventana el promedio y la desviacin estndar solicitada.
Fig. 68

Fig. 69

Resumen del Anlisis

El Resumen del Anlisis muestra la distribucin elegida y los valores de sus parmetros.

Distribucin Acumulada

Esta ventana muestra el valor de la funcin de distribucin acumulada y de la funcin masa o de densidad de
probabilidad en hasta 5 valores de X o de 5 distribuciones normales diferentes

Para calcular valores de probabilidad especficos, debe de estar en la pantalla que muestra la Distribucin
Acumulada y pulsando el sector derecho del mouse mostrar una ventana en la cual debe de seleccionar
opciones de ventana, que le permitir ingresar los valores de variable especficos.
Por ejemplo, Si se elige un ctodo al azar de una cosecha, cul es la probabilidad de que su peso est
entre 44 y 47 Kg?

24

P( 44 < X < 47) = P(X < 47) - P(X< 44) = 0,908789 - 0,252491 =
En la tabla Distribucin Acumulada se incluyen:
rea Cola Inferior: la probabilidad de que una variable aleatoria de la distribucin especificada sea menor
que el valor mostrado en la columna de ms a la izquierda.
Densidad de Probabilidad (slo distribuciones continuas): la altura de la funcin de densidad de
probabilidad f(X) en el valor mostrado en la columna de ms a la izquierda.

Masa de Probabilidad (slo distribuciones discretas): la probabilidad de que X sea igual al valor
mostrado en la columna de ms a la izquierda.

rea Cola Superior: la probabilidad de que una variable aleatoria de la distribucin especificada sea
mayor que el valor mostrado en la columna de ms a la izquierda.
La ventana Distribucin Acumuladas Inversas, que muestra la figura 69,(La FDA Inversa), calcula el
valor de una variable aleatoria X en o bajo el cual hay una probabilidad especfica.

Por ejemplo, sera importante saber cuales seran los pesos mnimos y mximos del peso de los ctodos
que entrega este proceso en el 90% de las veces

Lo cual indica entonces que el peso de los ctodos entregado por el proceso, en el 90% central de las
veces, el peso de ellos flucta entre 42,53 Kg. A 47,47 Kg.
En lo que respecta a grficos, se explicarn el contenido de las ventanas que trae la Figura 69.Funciones Masa/de Densidad
Esta ventana grafica la funcin de densidad de probabilidad f(X) para distribuciones continuas (p.d.f.
probability density function) o la funcin masa de probabilidad p(x) para distribuciones discretas (p.m.f.
probability mass function).

25

Para una distribucin continua tal como la distribucin normal, el rea bajo la funcin de densidad
sobre un intervalo de valores de X es igual a la probabilidad de que X caiga dentro de ese intervalo.
Estando dentro de esta pantalla, debe activar el sector derecho del mouse y seleccionando
opciones de ventana, puede definir lo que desea:
Fig. 70

Distribucin Acumulada
Esta ventana grafica F(X) la funcin de distribucin acumulada. Por ejemplo:

F(X) es igual a la probabilidad de que la variable aleatoria sea menor o igual a X.


Funcin de Supervivencia
Esta ventana grafica la funcin de supervivencia S(X), definida por S(X) = 1 F(X) , donde F(X) es la
funcin de distribucin acumulada. S(X) es igual a la probabilidad de que la variable aleatoria sea mayor
que X. El nombre de la funcin deriva de situaciones donde X representa el tiempo de vida de un individuo
o un producto. En ese caso, S(X) es la probabilidad de que un individuo sobreviva al menos X unidades de
tiempo.

26

Funcin Log de Supervivencia


Esta ventana grafica el logaritmo de la funcin de supervivencia S(X).

Funcin de Riesgo
La funcin de riesgo representa la distribucin condicional de una variable aleatoria dado que es al
menos X. Para distribuciones continuas, est definida por H(X) = f(x) / S(X) donde f(x) es la funcin de
densidad de probabilidad y S(X) es la funcin de supervivencia. Para distribuciones discretas, est
definida por H(X) = p(x+1) / S(X) donde p(x) es la funcin probabilidad de masa.
En anlisis de supervivencia o de sobrevivencia, la funcin de riesgo representa la tasa de fallo
condicional, i.e., la probabilidad de fallo en el siguiente incremento pequeo de tiempo dado que un
individuo ha sobrevivido hasta el tiempo X.
10.- Inferencia Estadstica Paramtrica.
10.1.- Promedio de la Poblacin
a).- Para utilizar Statgraphics en la prueba de hiptesis acerca del promedio en la poblacin, cuando
usted ha procesado los datos y dispone del promedio y de la desviacin estndar, se utiliza el
siguiente procedimiento:
Fig. 71

En la ventana que dice Prueba de Hiptesis, deber ingresar en cada ventana los requerimientos
necesarios. En la ventana siguiente, deber ingresar la opcin que se plantea para la hiptesis alternativa
Fig. 72

27

Resumiendo:
1.- En la pantalla anterior, en el campo de los parmetros, debe activar media normal
2.- En la ventana Hiptesis Nula , deber ingresar el valor de Hiptesis a probar 0
3.- En la ventana Media de la muestra deber ingresar el valor del promedio de la
Muestra.
4.- En la ventana Des. Tpica de la muestra , deber ingresar el valor de la desviacin estndar
de la muestra.
5.- En la ventana Tamao de la Muestra, deber ingresar el tamao de la muestra.
Obtendr con este procedimiento:

El intervalo de confianza para la rapidez promedio de combustin del producto en el caso de


que la hiptesis alternativa fuese Distinto de. O un limite inferior o el superior si la hiptesis
alternativa fuese mayor que; O un limite superior en caso de que la hiptesis alternativa fuese
menor que.
La decisin acerca de la prueba de hiptesis
La curva de potencia de la prueba o test.

Ejemplo a desarrollar:
Los sistemas de escape de emergencia para tripulaciones de aeronaves son impulsados por un
combustible slido. Una de las caractersticas importantes de este producto es la rapidez de combustin.
Las especificaciones requieren que la rapidez promedio de combustin sea de a lo menos 50 cm/ sg.
Se sabe que la desviacin estndar de esta rapidez es = 2 cm / sg. El experimentador decide especificar
una probabilidad para el error tipo I () = 0, 05. Selecciona una muestra aleatoria de tamao 16, y
obtiene en la muestra una rapidez promedio muestral de combustin de 51,3 A qu conclusiones debe
llegar.
b).- Para utilizar Statgraphics en la prueba de hiptesis acerca del promedio en la poblacin, cuando
usted tiene los datos originales colectados, se utiliza el siguiente procedimiento:

Los datos deben estar configurados en una columna. Una vez ingresada la columna de datos, en la
ventana desplegada, se selecciona en el sector Tablas, Intervalos de Confianza y Pruebas de Hiptesis
Fig. 74

Para ejemplificar se toma la columna MPG Highway del archivo 93Cars. Los resultados son
Intervalos de Confianza para MPG Highway :Intervalos de confianza del 95,0% para la media: 29,086 +/- 1,09806
[27,988, 30,1841] ; Intervalos de confianza del 95,0% para la desviacin estndar: [4,66015, 6,23125].

28

Tambin se despliega en un sector de la pantalla, una sub pantalla como la siguiente:

Despus de activar el sector derecho del mouse se despliega otra pantalla, donde se pueden configurar
dos pruebas de hiptesis. Una para la tendencia o promedio de la poblacin. Otra para la variabilidad o
dispersin de la variable.

10.2.- Prueba de hiptesis e intervalo de confianza para la diferencia entre promedios.


a).- Para utilizar Statgraphics en la prueba de hiptesis acerca de la diferencia entre los promedios
de dos poblaciones, cuando usted ha procesado los datos y dispone de los promedios y de las
desviaciones estndar de cada muestra, se utiliza el siguiente procedimiento.
Fig. 75

Deber llenar con los datos disponibles, lo solicitado en las distintas ventanas del cuadro de dialogo que
dice Pruebas de Hiptesis (Comparacin)
Ejemplo a Desarrollar:
Un diseador de productos est intensado en reducir el tiempo de sacado de una pintura tapa
poros. Se prueban dos formulaciones de pintura: la frmula 1 tiene el contenido estndar; la frmula 2 tiene
un nuevo ingrediente secante que debe reducir el tiempo de secado. Se pintan diez unidades con la
formulacin 1 y 12 unidades con la formulacin 2. Los datos obtenidos se dan en la siguiente tabla
resumen:

29

Formulacin

Promedio Muestral

Desv. Estndar

Tamao Muestral

121 minutos

8 minutos

10 unidades

112 minutos

6,5 minutos

12 unidades

A qu conclusiones puede llegar el diseador del producto sobre la eficacia del nuevo ingrediente,
utilizando = 0, 05?
b).- Si usted dispone de los datos originales colectados por su sistema de medicin, para dos
muestras independientes, entonces deber acceder a la siguiente pantalla, llenando los respectivos
campos solicitados por el Software Stagraphics.
Fig. 76

Ejercicio a desarrollar: Se realizan pruebas de dureza en dos tipos de bolas, X e Y, que se utilizan en
molinos de la gran minera. Se desea estudiar el desempeo de estas bolas en el proceso de molienda. Se
toman muestras independientes de cada uno de los tipos y se encuentran los siguientes resultados.
Bola X

75

46

57

43

58

39

61

56

44

65

60

50

Bola Y

52

41

43

47

32

49

52

44

57

60

45

50

55

a).- Redacte y pruebe la hiptesis de que ambos tipos de bolas no presentan diferencias estadsticamente
significativas en su resistencia promedio. Use alfa = 0,05. Que recomendacin dara usted, respecto
de cual tipo de bola usar? Justifique su respuesta.
b).- Determine con 95% de confianza entre que valores se encuentra la resistencia promedio de cada uno
de los tipos de bolas.
c).- Determine un intervalo de confianza del 90% para la desviacin estndar de la dureza del tipo de bola
Y
Nota: En este caso lo que primero que debe hacer es colocar los datos en dos columnas, generando cada
una de ellas una variable. Luego ingrese las variables en la pantalla que le presenta el software.

30

c).- Si usted dispone de los datos originales colectados por su sistema de medicin, para dos
muestras dependientes o pareadas, entonces deber colocar sus datos en dos columnas generando dos
variables y acceder a la siguiente pantalla, llenando los respectivos campos solicitados por el Software
Stagraphics.

Ejercicio a Desarrollar: Quince hombres adultos cuyas edades fluctan entre 35 y 50 aos, participan en
un estudio para evaluar el efecto de la dieta y el ejercicio sobre los niveles de colesterol en la sangre. El
colesterol total fue medido al inicio en cada persona y tres meses despus de participar en un programa de
acondicionamiento fsico y de haber cambiado una dieta baja en grasas.
Se asegura que el tratamiento deber bajar en a lo menos 10 puntos el nivel de colesterol total en la
sangre. Los datos son los siguientes:
Persona

10

11

12

13

14

15

265

240

258

295

251

245

287

314

260

279

283

240

238

225

247

Despus 229

231

227

240

238

241

234

256

247

289

246

218

219

226

233

Antes

a) Redacte las hiptesis para probar la efectividad del tratamiento. Use un nivel = 0,05 y obtenga
las conclusiones respectivas
b) Construya un intervalo de confianza para la diferencia promedio entre ambas situaciones

31

10.3.- Prueba de hiptesis e intervalo de confianza acerca una proporcin " p.

En la pantalla anterior ,en el campo de los parmetros, debe seleccionar Proporcin


Binomial.

En la ventana Hiptesis Nula deber ingresar el valor de Hiptesis a probar p 0

En la ventana proporcin muestraldeber ingresar el valor de la proporcin en la muestra.


En la ventana Tamao de la Muestra , deber ingresar el tamao de la muestra
Luego pulse Aceptar

Ver aparecer una pantalla que dice Opciones Prueba de Hiptesis, desde donde podr definir la
hiptesis alternativa H 1 y el error tipo I (): Luego aplique Aceptar

Obtendr:

El intervalo de confianza para la verdadera proporcin poblacional.


La decisin acerca de la prueba de hiptesis
La curva de potencia de la prueba o test

Ejemplo a desarrollar:
Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores de
automviles. El cliente requiere que la fabricacin de controladores defectuosos este por debajo del 4%. Y
que el fabricante demuestre esta caracterstica del proceso de fabricacin con este nivel de calidad. El
fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de
ellos son defectuosos. Puede el fabricante demostrar al cliente que su proceso est dentro de los
requerimientos?. Use = 0,05.

32

10.4.- Pruebe de hiptesis e intervalo de confianza para la diferencia entre las proporciones
Para utilizar Statgraphics en la prueba de hiptesis acerca de la diferencia entre las proporciones
de dos poblaciones, cuando usted ha procesado los datos y dispone de las proporciones de cada
muestra, se utiliza el siguiente procedimiento:

En la ventana que dice Prueba de Hiptesis (Comparacin), deber ingresar en cada ventana los
requerimientos necesarios. En la ventana siguiente, deber ingresar la opcin que se plantea para la
hiptesis alternativa

10.5.- Prueba de hiptesis e intervalos de confianza para la varianza de una sola poblacin.
a).- Cuando se ha calculado previamente la desviacin estndar de la muestra.

Resumiendo:
1.- En la pantalla anterior, en la ventana Prueba de Hiptesis, debe activar Sigma Normal
2.- En la ventana Hiptesis Nula , deber ingresar el valor de Hiptesis a probar 0
3.- En la ventana Sigma Muestral deber ingresar el valor de la desviacin estndar de la
muestra S
4.- En la ventana Tamao de la Muestra, deber ingresar el tamao de la muestra.
Obtendr con este procedimiento:

El intervalo de confianza para la desviacin estndar de la poblacin en el caso de que la


hiptesis alternativa fuese Distinto de. O un limite inferior o el superior si la hiptesis alternativa
fuese mayor que; O un limite superior en caso de que la hiptesis alternativa fuese menor
que.
La decisin acerca de la prueba de hiptesis
La curva de potencia de la prueba o test.

33

Observacin
Debemos tener en consideracin que en la mayora de las veces la preocupacin fundamental est
centrada en conocer el comportamiento de la desviacin estndar, como medida de variabilidad. Por eso es
que Statgraphics dedica esta ventana a tal medida de variabilidad.

b).- Cuando se dispone de los datos colectados o mediciones de las muestras


En este caso se procede segn como lo indican las figuras 73 y 74 del presente apunte
Ejemplo a desarrollar:
La desviacin estndar de cierto proceso de produccin es de 2 pulgadas. Se sospecha que la
varianza se ha hecho demasiado grande (ha aumentado). Se toma una muestra de 9 partes producidas
en dicho proceso y sus medidas son:
50 , 57 , 52 , 54 , 58 , 59 , 58 , 56 , 55
La prueba de hiptesis, de forma simblica, tiene la siguiente estructura:
H0: 2 =4v/sH1: 2 >4a un nivel de significancia = 0,05
Cree una variable y disponga los datos en una columna y luego proceda segn las figuras 73 y 74.
Activando el lado derecho del mouse se desplegarn las ventanas siguientes

10.6.- Prueba de Independencia o de Asociacin entre dos variables cualitativas


a).- Cuando se cuenta con dos columnas de datos que pertenecen a variables cualitativas o atributos, al
realizar el procedimiento Tabulacin Cruzada, tenemos una pantalla que contempla esta opcin de
anlisis.

34

b).- Cuando se cuenta con una tabla de asociacin.


Este procedimiento ya est descrito en las Figuras 38, 39, 40 y 41, del presente apunte. Tambin va a
desplegarse una pantalla como lo muestra la Figura 86. Aqu deber de seleccionar la opcin pruebas de
Independencia.

10.7.- Prueba de la Bondad de Ajuste.


Por ejemplo, podra un Ingeniero estar interesado en saber que modelo de distribucin estadstico
interpretara adecuadamente el comportamiento de la variable. Debe entonces de seguir el siguiente
procedimiento.

Qu modelo estadstico puede ajustar bien a la variable Horsepower del archivo 93cars?
Fig. 88

Fig. 89

35

En la pantalla anterior usted deber ir probando el modelo y decidir cual es el ms adecuado.


Por ejemplo, si ajustamos a los datos el modelo Logstica y el modelo Normal, tendremos:

Y hay dos tabulados muy importantes, que son los siguientes.

Las dos distribuciones pueden ajustar a los datos puesto que el Valor-P, para ambas, supera 0,05.
Entre la distribucin Logistica y la Normal el Valor-P mayor est dado para la curva Logistica y por lo tanto
sera este modelo el ms adecuado entre las dos distribuciones ajustadas a los datos. Esto tambin lo
corrobora el grafico.

36

Вам также может понравиться