Вы находитесь на странице: 1из 29

DISEÑOS

EX PERIMENTALES
“EX PERIM EN TOS COMPARAT IVOS
SIMPLES”
INTRODUCCIÓN
PA O L A
Un ingeniero, esta interesado en
La fuerza de la tensión de comprar la fuerza de una
adhesión del mortero, del formulación modificada, en la
cemento portland, es una que se han agregado emulsiones
característica importante del de latex de polímeros durante
producto. el mezclado con la fuerza del
mortero, sin modificar.

El experimentsdor a reunido 10
observaciones de la fuerza de la
formulación modificada y otras
OBSERVAR EN
10 observaciones de la
formulación sin modificar. LA SIGUIENTE
TABLA.
La prueba de hipótesis, permite que la comparación de las dos formulaciones
se haga en términos objetivos, con el conocimiento de los riesgos asociados si
se llega a una conclusión equivocada. Antes de presentar los procedimientos
de la prueba de hipótesis en experimentos comparativos simples, se hara una
breve revisión de algunos conceptos elementales de la estadística.
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
A cada una de las Es común llamar este La presencia del
observciones del ruido, el error error o ruido, implica
experimento experimental, o que la varieble de
portland, citados simplemente el error. respuesta, la fuerza
anteriomente se le Se trata de un error de la tensión de
llamaría una corrida. estadístico, lo cual adhesión, es una
Observe que las significa que se variable aleatoria.
corridas individuales, origina por la Una variable
difieren, por lo que variación que no etsa aleatoria, puede ser
existen fluctuaciones, bajo control y que discreta o continua.
o ruido en los generalmente es
resultados. inevitable.
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
Si el conjunto de todos los valores
posibles de la variable aleatoria es finito
o contablemente infinito, entonces la
variable aleatoria es discreta, mientras
que si el conjunto de todos los valores
posible, de la variable aleatoria es un
intervalo, entonces la variable aleatoria
es continua.
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
• DESCRIPCION GRAFICA DE LA VARIABILIDAD:

El diagrama de puntos es un
Es frecuente usar métodos graficos
recurso muy útil para representar
simples como ayuda para analizar
un cuerpo reducido de datos
los datos de un experimento.
(digamos hasta unas 20 obs.)

EJEMPLO: En la fuerza de tensión


de adhesión del cemento portland,
El diagrama de puntos le permite al el diagrama de puntos revela que
experimentador ver de inmediato la probablemente las dos
localización o tendencia central de formulaciones, difieran el las fuerzas
las observaciones y su dispercion. promedio, pero que ambas
producen aproximadamente la
variación en la fuerza.
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
Cuando los datos son muy
Se presenta un histograma
numerosos, es difícil
de 200 observaciones de la
distinguir las observaciones
recuperación de metal o
graficas, en un diagrama de
rendimiento en un proceso
puntos, y en tal caso seria
de fundación.
preferible un histograma.

El histograma muestra la Tenemos que recordar


tendencia central, la que un histograma se
dispersión y la forma construye dividiendo el
general de la distribución eje horizontal en
de los datos. intervalos
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
• DIAGRAMAS DE CAJAS:

Es una manera muy útil de representar gráficamente los datos,


en un diagrama de caja, se muestra el mínimo, el máximo. Los
cuartiles superior e inferior y la mediana.
En una caja rectangular, alineada horizontal o verticalmente la
caja se extiende, del cuartil inferior al cuartil superior, y se
traza una línea por la mediana, que atraviesa la caja se trazan
dos líneas que se extienden de los extremos de la caja hasta
los valores mínimo y máximo.
1. CONCEPTOS ESTADÍSTICOS BÁSICO:
• DIAGRAMAS DE CAJAS:

Diagramas de caja del experimento de la fuerza de


la tensión de adhesión del cemento portland.
2. MUESTREO Y DISTRIBUCIONES
DE MUESTREO
M U E S T R A S A L E AT O R I A S , M E D I A
M U E S T R A L Y VA R I A N Z A M U E S T R A L :

El objetivo de la inferencia estadistica, es sacar


conclusiones hacerca de una poblacion utilizando una
muestra de la misma.

La mayoría de los métodos que se estudiaran aquí,


incluye en el supuesto de que se usan muestras
aleatorias. Es decir si la población contiene N
elementos y va a seleccionar una muestra de n de
ellos, y si cada una de las N!(N-n) !n! muestras
posibles, tiene una probabilidad igual de ser escogida,
entonces el procedimiento empleado se le llamara
muesreo aleatorio.

En la practica, en ocaciones es difícil obtener muestras aleatorias,


para lo cual pueden ser útiles las tablas de números aleatorios.
2. MUESTREO Y DISTRIBUCIONES DE
MUESTREO
• MUESTRAS ALEATORIAS, MEDIA MUESTRAL Y VARIANZA MUESTRAL:

yi fi yi*fi yi^2*fi
1 9 9 9
2 4 8 16
3 3 9 27
4 6 24 96
5 8 40 200
TOTAL 30 90 348

σ 𝑦𝑖 ∗ 𝑓𝑖
𝑦ത =
σ 𝑓𝑖

(σ 𝑦𝑖 ∗ 𝑓𝑖)
σ 𝑓𝑖 ∗ 𝑦𝑖 2 ∗
σ 𝑓𝑖
𝑆2 =
(σ 𝑓𝑖 − 1)

𝑆 2 = 2.690
3. INFERENCIAS ACERCA DE LAS DIFERENCIAS
EN LAS MEDIAS, DISEÑOS ALEATORIOS

En esta sección se examina cómo pueden analizarse los datos de este experimento comparativo simple
utilizando procedimientos de prueba de hipótesis e intervalos de confianza para comparar las medias de dos
tratamientos.
A lo largo de esta sección se supone que se usa un diseño experimental completamente aleatorizado.
En este diseño, los datos se consideran como si fueran una muestra aleatoria de una distribución normal
3.1. PRUEBA DE HIPÓTESIS
. Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en parámetro poblacional. Después de
recolectar una muestra aleatoria, se compara la estadística muestral, así como la media, con el parámetro
hipotético, se compara con una supuesta media poblacional. Después se acepta o se rechaza el valor hipotético,
según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la
hipótesis es cierta.
Recuerde que el interés se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero
sin modificar y una del mortero modificado. En general, estas dos formulaciones pueden considerarse como
dos niveles del factor "formulaciones". Sea que y11, y12, ••• , y1ni represente las n1 observaciones del
primer nivel del factor y que Y11, Y22, ••• , y2ni represente las n2 observaciones del segundo nivel del factor.
Se supone que las muestras se sacan al azar de dos poblaciones normales independientes.
3.1.1. HIPÓTESIS ESTADÍSTICO
. Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población aplicada.
Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.
Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones
Una hipótesis estadística es un enunciado o afirmación ya sea acerca de los parámetros de una distribución de
probabilidad o de los parámetros de un modelo. La hipótesis refleja alguna conjetura acerca de la situación del
problema. Por ejemplo, en el experimento del cemento portland, puede pensarse que las fuerzas de la tensión de
adhesión promedio de las dos formulaciones del mortero son iguales. Esto puede enunciarse formalmente como:
Ho:µ1 = µ2
H1:µ1≠ µ2
donde µ1 es la fuerza de la tensión de adhesión promedio del mortero modificado y µ2 es la fuerza de tensión de
enlace promedio del mortero sin modificar. Al enunciado H0:µ1 = µ2 se le llama la hipótesis nula y a H1:µ1≠ µ2 se
le llama la hipótesis alternativa. Ala hipótesis alternativa que se especifica aquí se le llama hipótesis alternativa de
dos colas porque sería verdadera si µ1 < µ2 o si µ1 > µ2.
Para probar una hipótesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular un estadístico de
prueba apropiado para después rechazar o no estar en posición de rechazar la hipótesis nula Ho. Parte de este
procedimiento consiste en especificar el conjunto de valores del estadístico de prueba que llevan al rechazo de Ho. A
este conjunto de valores se le llama la región critica o región de rechazo de la prueba.
.
Pueden cometerse dos tipos de errores cuando se prueban hipótesis. Si la hipótesis nula se rechaza cuando es
verdadera, ha ocurrido un error tipo I. Si la hipótesis nula no se rechaza cuando es falsa, se ha cometido un error tipo
II. Las probabilidades de estos dos errores se expresan con símbolos especiales:
α = P( error tipo I) = P( rechazar Ho / Ho es verdadera)
β = P( error tipo II) = P( dejar de rechazar Ho / Ho es falsa)
En ocasiones es más conveniente trabajar con la potencia de la prueba, donde
Potencia = 1- β = P( rechazar Ho / Ho es falsa)
El procedimiento general en la prueba de hipótesis es especificar un valor de la probabilidad α del error tipo I,
llamada con frecuencia el nivel de significación de la prueba, y después diseñar el procedimiento de prueba de tal
modo que la probabilidad β del error tipo II tenga un valor convenientemente pequeño.
3.2 ELECCIÓN DEL TAMAÑO DE LA MUESTRA
La elección de un tamaño de la muestra apropiado es uno de los aspectos más importantes de cualquier problema de
diseño experimental. La elección del tamaño de la muestra y la probabilidad β del error tipo II guardan una estrecha
relación. Suponga que se están probando las hipótesis
Ho:µ1 = µ2
H1:µ1≠ µ2
y que las medias no son iguales, por lo que 𝛿 = µ1 - µ2. Puesto que Ho:µ1 = µ2 no es verdadera, la preocupación
principal es cometer la equivocación de no rechazar Ho. La probabilidad del error tipo II depende de la verdadera
diferencia en las medias 𝛿. A una gráfica de β contra 𝛿 para un tamaño particular de la muestra se le llama la curva
de operación característica, o curva OC, de la prueba. El error β también es una función del tamaño de la muestra.
En general, para un valor dado de 𝛿, el error β se reduce cuando el tamaño de la muestra se incrementa. Es decir, es
más fácil detectar una diferencia especificada en las medias para tamaños grandes de la muestra que para los
tamaños pequeños.
3.3 INTERVALOS DE CONFIANZA
En estadística, se llama intervalo de confianza a un par o varios pares de números entre los cuales se estima que
estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En
estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades
de fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá
más probabilidad de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumenta su probabilidad de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue
el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución normal. También pueden construirse
intervalos de confianza con la desigualdad de Chebyshev.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que
sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α,
donde P es la función de distribución de probabilidad de θ.
Muchas veces es preferible proporcionar un intervalo dentro del cual cabría esperar que estaría incluido el valor del
parámetro o los parámetros en cuestión. A las declaraciones de estos intervalos se les llama intervalos de confianza.
En muchos experimentos de ingeniería e industriales, el experimentador sabe de antemano que las medias µ1 y µ2
difieren; por consiguiente, la prueba de la hipótesis µ1 = µ2 es de escaso interés. Por lo general el experimentador
estaría más interesado en un intervalo de confianza para la diferencia en las medias µ1 - µ2.
Para definir un intervalo de confianza, suponga que θ es un parámetro desconocido. Para obtener una estimación del
intervalo de θ, es necesario encontrar dos estadísticos L y U tales que la declaración de la probabilidad
P(L≤ θ ≤U)= 1-α sea verdadera. Al intervalo L≤ θ ≤U
se le llama intervalo de confianza de 100(1- α) por ciento para el parámetro θ. La interpretación de este intervalo es
que si, en muestreos aleatorios repetidos, se construye gran número de estos intervalos, 100(1 - α) por ciento de ellos
contendrán el verdadero valor de θ. A los estadísticos L y U se les llama los límites de confianza inferior y superior,
respectivamente, y a 1- α se le llama el coeficiente de confianza. Si α = 0.05, a la ecuación P(L≤ θ ≤U) se le llama
intervalo de confianza de 95% para θ
3.4 CASO EN QUE 𝜎 2
1 ≠ 𝜎 2
1
Si se está probando:
Ho:µ1 = µ2
H1:µ1≠ µ2
y no hay bases para suponer que las varianzas σ21 y 𝜎 21 son iguales, entonces es necesario hacer ligeras
modificaciones en la prueba t de dos muestras. En este caso el estadístico de prueba es
yത1 − yത 2
𝑡𝑜 =
s 21 s 2 2
n − n
1 2
Este estadístico no se distribuye exactamente como t. No obstante, t es una buena aproximación de la distribución de
to si se usa
s2 s2
( n 1 + n 2 )2
υ= s2
1 2
s2
( n 1 )2 ( n 2 )2
1 + 2
𝑛1 −1 𝑛2 −1

para los grados de libertad. Una indicación clara de la desigualdad de las varianzas en una gráfica de probabilidad
normal sería una situación que requeriría esta versión de la prueba t.
3.5 CASO EN QUE SE CONOCEN
Si las varianzas de ambas poblaciones se conocen, entonces las hipótesis
𝜎 2
1 𝑦 𝜎 2
2
Ho:µ1 = µ2
H1:µ1≠ µ2
pueden probarse utilizando el estadístico
ഥ1 −ഥ
y y2
Zo =
σ2 1 σ2 2

n1 n2

Si ambas poblaciones son normales, o si los tamaños de las muestras son lo suficientemente grandes para aplicar el teorema del
límite central, la distribución de Zo es N(O, 1) si la hipótesis nula es verdadera. Por lo tanto, la región crítica se encontraría
utilizando la distribución normal en lugar de la distribución t.
Específicamente, Ho se rechazaría si | Zo | > ZαΤ2, donde ZαΤ2 es el punto porcentual αΤ2 superior de la distribución normal
estándar.
A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas conocidas no se requiere el
supuesto de que el muestreo se haga de poblaciones normales. Puede aplicarse el teorema del límite central para justificar una
distribución normal aproximada para la diferencia en las medias muestrales yത1 − yത 2
El intervalo de confianza de 100(1-α) por ciento para µ1-µ2 cuando las varianzas se conocen es

σ2 1 σ2 2 σ2 1 σ2 2
yത1 − yത 2 − Z αΤ2 − ≤ µ1-µ2 ≤ yത1 − yത 2 − Z αΤ2 −
n1 n2 n1 n2

Como ya se señaló, el intervalo de confianza es con frecuencia un complemento útil del procedimiento de
prueba de hipótesis.
4. INDIFERENCIAS ACERCA DE LAS DIFERENCIAS EN L AS MEDIAS,
DISEÑOS DE COMPARACIONES PAREADAS

a. EL PROBLEMA DE LAS b. V E N TA J A S D E L D I S E Ñ O D E
C O M PA R AC I O N E S PA R E A DA S : C O M PA R AC I O N E S PA R E A DA S :

• Existe una gran variabilidad en la • Se espera ganar un mejor conocimiento de la


comparación. situación (experimento), al eliminar una fuente
adicional de variabilidad (diferencias entre
• Existe una mayor tendencia a inflar el
ejemplares).
error experimental
• Se puede obtener una indicación de la calidad de la
• Se hace mas difícil determinar la
información producida por el diseño pareado
diferencia entre dos ejemplares a
comparando la desviación estándar S𝑑 de las
estudiar.
diferencias con la desviación estándar combinada S𝑝 .
• El intervalo de confianza basado en el análisis
pareado tiene una anchura sensiblemente menor
que el intervalo de confianza independiente. Esto
ilustra la propiedad de reducción del ruido de la
formación de bloques.
EJEMPLO: 1 2

FACTORES: Fuerza conocida


Precisión igual
Ejemplar de
• Podrían seleccionarse al azar varios ejemplares de prueba del
metal, (por ejemplo 20).
prueba

• La mitad de estos ejemplares de prueba podrían probarse con la


punta 1 y la otra mitad con la punta 2.

• La asignación exacta de los ejemplares a las puntas se


determinara de manera aleatoria. (diseño completamente
aleatorizado).

• La dureza promedio de las dos muestras podría compararse


utilizando la prueba t.
SUPONIENDO QUE:
Los
ejemplares se
cortaron de
barras
diferentes

Variabilidad
de las
mediciones
de la dureza
Estas barras
fueron No son
fabricadas a exactamente
temperaturas homogéneas
diferentes

Diseño experimental alternativo Disminución de


errores
DISEÑO EXPERIMENTAL ALTERNATIVO

EJEMPLAR DE
PRUEBA

LADO A LADO B

CONSISTE EN :
Se divide cada ejemplar de prueba en dos secciones, para
después asignar de manera aleatoria una punta a una mitad
de cada ejemplar de prueba y la otra punta a la otra mitad

El orden en que se prueban las puntas en un ejemplar de


prueba particular se seleccionaría al azar.
U N M O D E L O E S TA D Í S T I C O Q U E D E S C R I B E Donde:
L O S D AT O S D E E S T E E X P E R I M E N T O P U E D E
EXPRESARSE COMO: 𝑦𝑖𝑗 es la observación dela
dureza para la punta i en el
𝑖 = 1,2 ejemplar de prueba j, 𝜇 𝑖 es la
• 𝑦𝑖𝑗 = 𝜇 𝑖 + 𝛽 𝑗 + 𝜀 𝑖𝑗 ቊ
𝑗 = 1,2, … , 10 verdadera dureza promedio
Observamos que si se calcula la diferencia pareada j-ésima. de la punta i - ésima, 𝛽 𝑗 es un
efecto sobre la dureza debido
d 𝑗 = 𝑦𝑖𝑗
al ejemplar de prueba j - ésima,
y 𝜀 𝑖𝑗 es el error experimental
aleatorio con media cero y
varianza 𝝈𝟐𝟐 es la varianza de
las mediciones de la dureza
hechas con la punta 2.
A diferencia de las pruebas para
5. INDIFERENCIAS ACERCA DE LAS las medias, los procedimientos
VARIANZAS DE para las pruebas de varianzas son
DISTRIBUCIONES NORMALES bastante mas sensibles al
supuesto de normalidad.
Suponga que quiere probarse la
VARIABILIDAD
hipótesis de que la varianza de
VARIABILIDAD
una población normal es igual a
una constante, por ejemplo, 𝜎02 .
VARIABILIADAD
Expresando en términos
formales, quiere probarse.

𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 ≠ 𝜎02
RESPUESTA
• El estadístico de prueba para la ecuación anterior es:

𝑺𝑺 (𝒏 − 𝟏)𝑺𝟐
𝒙𝟐𝟎 = 𝟐 =
𝝈𝟎 𝝈𝟐𝟎
𝑛
• Es la suma de cuadrados
𝑆𝑆 = ෍ (𝑦𝑖 − 𝑦)2 corregida de las observaciones
𝑖=1
muéstrales

2 • La distribución de referencia
𝑥0 apropiada, es la distribución ji-
cuadrada con 𝑛 − 1 grados de
libertad
𝑥02 > 𝑥𝛼2,𝑛−1
2
• La hipótesis nula se rechaza
ó
𝑥02 < 𝑥𝛼2,𝑛−1
2

Вам также может понравиться