Вы находитесь на странице: 1из 179

Métodos Estadísticos

Para la Investigación
Experimental
Elías A. Torres Armas Lic. Ms. C.

i
Métodos Estadísticos para la
Investigación Experimental
Elías Alberto Torres Armas, Lic. Ms. C.
Es propiedad del Autor, prohibida la producción total o parcial de esta obra, por
cualquier medio o método, sin autorización del autor.
Dirección postal: Grau 721
Chachapoyas, Amazonas, Perú
e-mail: allpachaki@hotmail.com

Derechos Reservados según Ley N° 13714 y Decreto Ley 822

Depósito legal en la Biblioteca Nacional del Perú Nº 2013-06200


Versión Impresa

Diagramación
Elías A. Torres Armas

Tiraje: 1000 unidades


Impreso en el Perú

Impreso:
Compugraf S.R.L.
RUC. 20479787779
SEVILLANO GAYOSO JOSE LUIS
e-mail: sevillano16@hotmail.com
Jr. Ayacucho N° 1041
Amazonas / Chachapoyas / Chachapoyas
Perú – 2013.
Métodos Estadísticos para la Investigación

Contenido

Páginas
Carátula interior i
Depósito Legal de la Biblioteca Nacional ii
Presentación iii
Tablas Estadísticas iv
Índice vi
Tabla de números aleatorios
1
Tabla Binomial simple
2 -11
Tabla Binomial acumulada
12-21
Tabla Poisson simple
22-26
Tabla Poisson acumulada
27-30
Tabla Normal estandarizada
31-37
Tabla F 10%
38-39
Tabla F 5%
40-41
Tabla F 2.5%
42-43
Tabla F 1%
44-45
Tabla F 0.1%
46-47
Tabla F
48-65
Tabla t-Student
66
Tabla Chi cuadrado
67-68
Tabla Chi cuadrado cola derecha
69-70
Tabla Duncan
71-72
Tabla Tukey
73-74
Tabla Newman Keuls
75-76
Tabla Dunnett
77-80
Prefacio

El texto esta, organizado en experiencias de aprendizaje, orientadas a la adquisición de conceptos,


principios y procedimientos de los Diseños Estadísticos principalmente utilizados en la
investigación experimental, para evaluar la influencia unifactorial y multifactorial, sin y con
restricciones en la aleatorización, sin y con presencia de covariables, sobre una o un vector de
variables respuesta. El texto permite al lector lograr las habilidades y destrezas para realizar una
investigación experimental en las diferentes áreas de conocimientos, teniendo en cuenta la
optimización del proceso para el cual se realiza el diseño experimental, de tal modo que el
investigador podrá:
- Determinar el modelo correspondiente a un experimento dado.
- Analizar un experimento de acuerdo a los diseños y método estudiados.
- Preparar una metodología para construir un diseño concordante con un problema de
investigación experimental.

En verdad, el propósito de este texto es el de ayudar al lector a entender los conceptos, ideas y
funciones de los métodos estadísticos aplicados a problemas de la ingeniería y de la ciencia en
general. Este texto deberá ser también útil para aquellos estudiosos quienes deseen hacer
aplicaciones de métodos estadísticos a problemas de la ingeniería en términos generales, así como
también a la investigación experimental.
Este texto estará diseñado para estudiantes de ingeniería y de la ciencia en general. Es decir, para
aquellos investigadores quienes deseen encontrar, prácticamente, todos los conceptos de la
probabilidad y de la estadística, que les pueda ayudar en el desarrollo de su profesión de
ingeniería, en la investigación o en cualquier otra área de la ciencia en general.
El texto tiene un enfoque de carácter científico, tecnológico centrado en métodos estadísticos
como herramientas útiles para la investigación experimental con repercusión en el desarrollo
económico, cultural y social de la región y del país.
CAPITOLO I

1. Introducción

En la vida diaria cada persona hace alguna observación de acontecimientos ordinarios, como
predicción del tiempo, precios de un producto, costo de vida etc. y compara sus observaciones
actuales con su valor promedio y concluye si su observación actual es habitual (no diferencia
significativa) o no habitual (diferencia significativa); utiliza la estadística con la que valúa
mentalmente su investigación; sin embargo la investigación formal es de importancia
infinitamente mayor y debe conducirse con mayor cuidado; pues, la investigación científica es un
estudio escudriñante o examen, análisis o experimentación crítica y exhaustiva cuya finalidad es el
descubrimiento de nuevos hechos y su correcta interpretación; revisión de conclusiones
aceptadas, teorías o leyes, a la luz de hechos descubiertos recientemente o la aplicación práctica
de tales conclusiones nuevas o revisadas; por consiguientes, la investigación científica es la
búsqueda continuada del conocimiento y entendimiento, compuesta de dos elementos: observación,
por la cual se obtiene el conocimiento de ciertos hechos a través de percepciones sensitivas; el
razonamiento, mediante el cual se determina el significado de esos hechos, su interrelación y su
relación con el acervo existente de conocimientos, en el grado que el presente estado del
conocimiento y la habilidad del investigador lo permiten. Además, la investigación implica que el
investigador esté interesado en generalidades, más que en resultados particulares, que esté
interesado en la reproducción de resultados y en su aplicación a situaciones más complicadas y
generales (Ostle, 1986, pp. 17, 18)

2. Aspectos generales de la Investigación, Estadística y experimentos.

La investigación se puede definir como un estudio sistemático de un sujeto con el fin de


descubrir nuevos hechos o principios y el procedimiento para la investigación es el método
científico.

El método científico. Existen más definiciones de método científico que investigadores. Pero
para fines de este texto se usará la siguiente: El método científico es una estrategia para lograr el
ideal de la ciencia que es lograr una interrelación sistemática de hechos, mediante
experimentación, observación, argumentación lógica de los postulados aceptados y una
combinación de los mismos en proporciones variables (Ostle, 1986, pp. 18).

La aplicación de la lógica y la objetividad al entendimiento de los fenómenos es la base de la


fundamentación del método científico (MC). Para el MC es esencial el estudio de lo que ya se
conoce, del cual se puede formular hipótesis que se ponen a prueba partiendo por lo general de
situaciones experimentales. La estadística juega un papel importante en la fundamentación de
MC, tiene tres funciones que son: La descripción, el análisis, y la predicción.

El investigador generalmente aborda estudios descriptivos, por ejemplo: En poblaciones.-


estudios ecológicos, ambientales, agropecuarios, industriales. En individuos.- A propósito de un
caso, series de casos; o estudios analíticos observacionales.- por ejemplo, estudios de casos y
controles, estudios de cohorte (prospectivos o retrospectivos, o estudios analíticos de
intervención, por ejemplo, ensayo de laboratorio, clínico; ensayo de campo, ensayo comunitario.
Por otro lado, en la Investigación Científica, es común: La formulación de hipótesis cuya
aprobación o rechazo, deben estar sustentados por un conjunto de observaciones, las cuales
deben seleccionarse a través de un patrón definido. Este patrón es el diseño experimental. Una
vez definido el tipo de estudio a realizar, la hipótesis; el investigador debe concebir la manera
Métodos Estadísticos para la Investigación experimental

práctica y concreta de responder a las preguntas de investigación, es decir seleccionar o


desarrollar un diseño de investigación que puede ser no experimental o experimental.

Investigación no experimental. Aquellos que se realizan sin manipular deliberadamente las


variables independientes. Se basa en eventos o sucesos, hechos que ya ocurrieron o se dieron en
la realidad sin intervención directa del investigador. Se le conoce como investigación expost-facto
(los hechos ya ocurrieron y ya existe datos para las variables en estudio) y observa variables y
relaciones entre ellas en su contexto natural. Se divide en:

Estudios transeccionales o transversales. Realizan observaciones en un momento único en el


tiempo. Se divide en: Descriptivos.- Miden las variables de manera individual y reportan esas
mediciones, por ejemplo en poblaciones: estudios ecológicos, en estudios de individuos.- estudios
de caso y series de casos. Correlacionales.- Describen relaciones entre las variables.
Correlacionales/causales.- Establecen procesos de causalidad entre las variables. Exploratorio.

Estudios longitudinales o evolutivos. Realizan observaciones en dos o más momentos o puntos


en el tiempo. Se dividen en: Estudios de tendencia.- Si estudian una población a través del
tiempo. Estudio de análisis evolutivo de grupo.- Si analiza una subpoblación o grupo específico.
Estudios de panel.- Si se estudian a los sujetos. Analíticos como estudios de casos y controles,
estudios de cohorte.

Investigación experimental: aquella en los que se manipulan deliberadamente las variables en el


experimento.

Experimento. Es una prueba o serie de pruebas en las que se hacen cambios deliberados en las
variables de entrada de un proceso o sistema para observar o identificar las razones de los
cambios que pudieran observarse en la respuesta de salida (Montgomery, 2004, pp.1). ¿Qué tipo
de estudio es la investigación experimental? En Sampieri y otros (1998) encontramos 4 tipos de
estudios: Exploratorios, descriptivos, correlacionales, explicativos. Los estudios explicativos
analizan relaciones entre una o más variables independientes, una o más variables dependientes y
los efectos causales de las primeras sobre las segundas. Las investigaciones experimentales se
pueden considerar del tipo explicativo.

Tipos de experimento.

Experimentos exploratorios.- Aquellos en el cual el investigador está interesado en encontrar los


factores que tienen influencia sobre las ejecuciones de cierto proceso.

Experimentos confirmatorios. Aquellos en el cual se trata de comparar el “mejor” procedimiento


encontrado en el experimento exploratorio con un procedimiento establecido o un producto y
“establecer” que el procedimiento o producto nuevo es mejor que el antiguo. En el experimento
confirmatorio, se puede querer encontrar el mejor para establecer procesos de control.

Clases de experimento. Según el tipo de información que éste produzca, se tiene:

Experimento cualitativo. Es aquel para el cual, las mediciones de las variables respuesta se hacen
en escala nominal u ordinal. Se usa las estadística no paramétrica.

Experimento cuantitativo. Es aquel en que las mediciones se hacen en una escala de razón e
intervalo. Se usa la estadística paramétrica.
Experimentos mixtos. Si algunas variables son cuantitativas y otras cualitativas.

7
Elías Alberto Torres Armas, Lic. Ms. C.

Diseño experimental. Se entiende por diseño experimental, al proceso de planear un


experimento, tal que se tomen datos apropiados con la mayor realidad posible, los cuales deben
ser analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas; con
una alta fidelidad y a un costo mínimo.

Características del diseño experimental

 Simplicidad. Selección de tratamientos y disposición experimental lo más simple posible.


 Grado de precisión. Capacidad para medir diferencias entre tratamientos con los grados de
precisión que el investigador desea. El número de repeticiones y el diseño deben ser
adecuados.
 Ausencia de error sistemático. Procurar una estimación insesgado del efecto de
tratamientos.
 Rango de validez de las conclusiones. El diseño deberá ser tan amplio posible, como los
experimentos replicados y experimentos con estructuras factoriales.
 Cálculo del grado de incertidumbre. El experimento debe ser concebido de modo que sea
posible calcular la probabilidad de obtener los resultados observados debido únicamente al
azar.

El diseño experimental: Es un plan usado en la distribución de los tratamientos a las unidades


experimentales, teniendo en cuenta ciertas restricciones, como la aleatorización, con fines de
disminuir el error experimental.

Clases de diseño experimental: Se clasifica según el objetivo del diseño, “estudiar uno o más
factores (variables independientes).

 Experimentos simples: (de un solo factor)

o Parcelas apareadas
o Parcelas no apareadas o grupos sorteados o grupos sorteados (2 tratamientos)
o Diseño completamente al azar (DCA)
o Diseño en bloque completamente al azar (DBCA)
o Diseño cuadrado latino (DCL)
o Diseño cuadrado grecolatino
o Diseño cuadrado modificado
o Etc.

 Experimento factorial: (de 2 ó más factores)

o Bifactoriales, trifactoriales, etc en DCA, en bloques, cuadrado latino, etc.


o Confusión
o Parcelas divididas
o Clasificación anidada

3. Diseños de investigación científica no experimental. (Sin manipulación de variables).

Longitudinales o evolutivos. (Analiza cambios a través del tiempo): Diseño de análisis


evolutivo de grupo(s), Diseño de Panel, Diseño de tendencia

8
Métodos Estadísticos para la Investigación experimental

Transversales o transeccionales. (Recolección de datos en un único momento): Correlacional –


causal, Descriptivo, Exploratorio

4. Diseños de investigación científica. Experimental (Con manipulación de variables con


estímulos o tratamientos)

Cuasi-experimentos, Implican grupos intactos. No cumple con el principio básico del diseño:
No Aleatorización

Pre-experimentos (Tienen grado de control mínimo). Poco o nulo control local. No cumple
con dos principios básicos del diseño: No aleatorización. Medición en dos grupos no
equivalentes, Medición única en un solo grupo

Experimentos puros (verdaderos). Cumple con los tres principios básicos del diseño:
Repetición, Aleatorización, Control Local. Manipulación intencional de las variables
independientes. Medición del efecto en la variable(s) dependientes(s). Control y validez. Dos o
más grupos

5. Pasos de una investigación experimental.

Según Hinkelman K. & Kempthorne O. (1994) los pasos lógicos de la experimentación científica
se muestran en el siguiente esquema:

PROBLEMA
FORMULACIÓN DE PREGUNTAS E HIPÓTESIS

FORMULACIÓN DEL MODELO


MATERIAL SUBJETIVO

MODELO ESTADISTICO LINEAL DESARROLLO DEL DISEÑO ESTADÍSTICO

DESARROLLO DEL DISEÑO ESTADÍSTICO

DESARROLLO DEL DISEÑO ESTADÍSTICO

ANÁLISIS ESTADISTICO

INTERPRETACIÓN DE RESULTADOS

FORMULACIÓN DE NUEVAS HIPÓTESIS

Figura 1.1.Diagrama de la investigación experimental

En la figura 1.1 se puede observar dos etapas básicas:


La primera: La estadística.- Conformada por el desarrollo del diseño estadístico, formulación del
modelo estadístico y el análisis estadístico. La segunda: La no estadística.
 Formulación del problema.- Es afinar y estructurar formalmente la idea de investigación,
desarrollando tres elementos:
o Objetivos de investigación. ¿Qué se pretende?
o Preguntas de investigación ¿Qué respuestas encontrar?
o Justificación de la investigación. ¿Por qué hacer la investigación?

9
Elías Alberto Torres Armas, Lic. Ms. C.

 Criterios para evaluar el valor potencial de la investigación, son: Conveniencia, relevancia


social, implicancias prácticas, valor teórico, utilidad metodológica, viabilidad, y consecuencias
de la investigación.

En resumen, se debe tener en cuenta:

A. Problema o experimento
a. Exposición del problema
b. Elección de la variable respuesta
c. Selección de factor(es).
d. Elección de niveles: Cuantitativos o cualitativos; fijos o aleatorios.
e. Combinación de niveles (tratamientos)
B. Diseño
a. Tamaño de la muestra: cantidad, variación, diferencia o precisión, riesgo.
b. Aleatorización. Método de aleatorización
c. Modelo matemático
C. Análisis
a. Recolección y procesamiento de datos
b. Cálculos de pruebas estadísticas
c. Interpretación de resultados
d. Conclusiones

En general se usa: Planteamiento del problema, Marco teórico, Metodología, Análisis de datos,
Conclusiones, Recomendaciones.

6. Definiciones, conceptos básicos en el planeamiento de un diseño experimental.

Factor. Es una variable explicativa independiente de tipo cualitativo y cuantitativo. También


puede ser definido como: el elemento, material o cualquier procedimiento sometido a estudio o
ensayos de comparación sobre el cual el investigador tiene conocimiento y es de su interés
estudiarlo. Ejemplo:

o Tipo de sustrato
o Tamaños de poda
o Sistema de riego
o Tipos de poda
o Densidad de siembra
o Tipos de herbicidas
o Temperatura
o Tiempo
o Alimentación
o Presentación de un producto
o Sistemas de enseñanza
o Formas de elaborar un producto
o Terapia de una enfermedad.

Nivel de factor o tratamiento. Es una de las categorías de la variable explicativa (factor). El


término tratamiento en Estadística es utilizado ampliamente para designar a cada uno de los
niveles de un factor (experimentos simples) o también para designar a cada una de las
combinaciones de los niveles de dos o más factores (experimentos factoriales). En la tabla 1 se
muestras ejemplos de factor y sus niveles o tratamientos:

10
Métodos Estadísticos para la Investigación experimental

Tabla 1.1. Ejemplos de factor y sus niveles


Factor Nivel de factor o tratamiento
Tipo de sustrato Humus, compost, estiércol y musgo
Tamaño de poda 5 cm, 10 cm, 15 cm, 20 cm, 25 cm
Sistemas de riego Por gravedad, por goteo, por aspersión
Temperatura 15°C, 30°C, 45°C, 60°C, 75°C, 90°C, 105°C

Tratamiento Testigo. Es un tratamiento especial del experimento (tratamiento local, original)


sirve como base de comparación de los nuevos tratamientos. Ejemplo:

Tabla 1.2. Ejemplo de factor y tratamientos con testigo


Niveles (tratamientos)
Factor t0:testigo t1 t2 t3
Dosis de fertilizante 0 60 120 180

Característica o variable respuesta. Es la característica a través de la cual se evalúa el efecto de


cada uno de los niveles del factor en estudio, para lo cual se debe disponer del material
experimental adecuado. Ejemplos: Rendimiento en kilos de papa, sabor de la mermelada de
tomate (escala hedónica de 5 puntos), altura de planta, rendimiento, número de semillas, ancho
de hoja, diámetro de tallo, etc.

Unidad experimental (u.e.). Llamado también “Parcela experimental” en donde se aplican los
tratamientos, en el cual se observan, se miden y se evalúan las variables respuesta (características)
que se investiga. El conjunto de unidades experimentales viene a ser el material experimental,
ejemplo: Una maceta, una planta, un animal, una persona, un árbol, una parcela, un conjunto de
semillas, etc.

AREA DE BORDES

ÁREA PARA MUESTREO

PARCELA UTIL

Figura 1.2. Componentes de una parcela experimental agrícola

Dato estadístico. Es el registro numérico, en un momento dado, de cada una de las unidades
experimentales ante la aplicación de los (tratamientos) niveles del factor en estudio. Ejemplo:
Factor: Dosis de nitrógeno. Niveles de factor (tratamentos): N1, N2, N3, … , Nk. Variable
respuesta: Rendimiento en Kg de una variedad de papa. Unidad experimental: Una parcela de 20
m2. Dato estadístico: 18 kg/parcela

7. Objetivos del diseño experimental

o Proporcionar la información pertinente y suficiente y confiable al problema que se investiga,


con mayor precisión a menor costo.
o Obtener un estimado imparcial de los efectos de los tratamientos.
o Obtener un estimado imparcial del error experimental.

11
Elías Alberto Torres Armas, Lic. Ms. C.

8. Reglas para planear un experimento

o El fenómeno de que se trate, de ser posible, debe aislarse para estudiarse mejor
o El experimento debe repetirse en las mismas circunstancias para probar y medir el error
experimental
o Las condiciones del experimento deben alterarse para investigar de qué grado modifican al
fenómeno.
o El experimento debe durar el tiempo suficiente para que se produzca el fenómeno deseado.

9. Características deseables de un diseño experimental.

o Que proporcione información suficiente y confiable pertinente al problema


o Que sea lo más barato posible
o Que sea lo más simple posible y sencillo de conducir
o Que el tiempo en realizarlo sea mínimo

En resumen: Un buen diseño de un experimento busca un equilibrio entre costo, eficiencia, y


objetivo. El éxito del diseño estadístico de un experimento está en la planeación utilizando
principios de la teoría estadística y de una serie de reglas y supuestos necesarios para poder
realizar el análisis de la información.

10. Error experimental

o El error experimental es la variación existente (involuntaria y/o extraña) entre los resultados
de las observaciones, realizados por dos o más unidades experimentales que recibieron el
mismo tratamiento y que por efectos aleatorios (factores no controlables) reportan ciertas
diferencias.
o Es el fracaso de llegar a resultados idénticos con dos o más unidades experimentales tratados
por igual.

Las causas del error experimental son:

a. La variabilidad propia del material experimental al cual se aplican los tratamientos. Ejemplo:
En una población de plantas de papaya, existen diferencias genéticas entre los individuos de
dicha población: Diferencias en tipo de fruto, tamaño de planta, color de fruto, etc.
b. Falta de uniformidad en la conducción física del experimento. Es decir, la deficiencia en poder
uniformizar la técnica experimental. Ejemplo: Heterogeneidad del suelo, error en la medición,
pérdida de la biomasa en la cosecha, etc.
c. Efecto combinado de factores extraños (estos efectos no pudieron ser controladas por el
investigador durante la conducción de experimento).
d. Error de medición y/u observación

El control del error experimental se realiza:

a. Utilizando un diseño experimental apropiado


b. Con observaciones concomitantes (o adicionales)
c. Con la elección de tamaño y forma de las unidades experimentales.
d. Utilizando en lo posible, material homogéneo, o estratificado en grupos homogéneos si el
material es heterogéneo.
e. Utilizando información disponible sobre otros factores no incluidos en el estudio.
f. Conduciendo cuidadosamente el experimento

12
Métodos Estadísticos para la Investigación experimental

11. Principios básicos de un diseño experimental

La experimentación moderna no obstante multiforme obedece a algunos principios básicos que


son indispensables para la validez de las conclusiones a que se arriban (Lizarzaburu, 1984). Estos
principios son: Repeticiones, aleatorización y control local.

a. Repeticiones-. Cuando un tratamiento aparece dos o más veces en un experimento, se dice


que esta repetido. La repetición es la aplicación de los tratamientos en tantas unidades
experimentales como sea posible y tiene como funciones:
- Permite estimar el error experimental
- Mejora la precisión de un experimento mediante la reducción del error estándar de la
media de tratamiento.
S2 S S2 S
Sx    Sx  
n n r r
r=Números de repeticiones
 2 =Varianza del error experimental verdadero. Existe mayor precisión si “r” se
incrementa.
Además S 2 es estimador insesgado de  2
- A mayor número de repeticiones más preciso será el estimado del efecto de los factores
en estudio. El número óptimo de repeticiones depende de: El grado de precisión
requerido del estimado del efecto de los factores en estudio (diferencia entre
tratamientos), la magnitud del error experimental permisible, grado de precisión de la
prueba de significancia, disponibilidad de presupuesto (Lizarzaburu, 1984).
- Al incrementar el número de repeticiones se disminuya el error experimental, aumenta la
precisión y la exactitud.
- Ejerce un control sobre el error experimental

Número óptimo de repeticiones

El método para determinar el número óptimo de repeticiones está de acuerdo a los


diferentes métodos de pruebas de significación de las diferencias entre los tratamientos y
todos basados en el grado de precisión requerido y la magnitud del error experimental. Para
aplicar cualquiera de estos métodos se requiere la siguiente información (Lizarzaburu, 1984):
d: Diferencia mínima entre los promedios o efectos de los tratamientos que se comparan,
que nos indica a la vez el grado de precisión requerido.
2
S : Estimado del error experimental (obtenido de la información de experimentos
anteriores sobre el material experimental, puede ser σ 2).
γ1: Grado de libertad con que se estimó σ2.
γ2: Grado de libertad del estimado del error experimental en el nuevo experimento,
supeditado al tipo de diseño experimental.
α: Nivel de significación (Probabilidad de cometer error tipo I)
P: Probabilidad de conseguir un resultado significativo (Probabilidad de rechazar Ho).

Cochran y Cox proponen la siguiente fórmula (Lizarzaburu, 1984):


2
S
r  2  t1  t2 
2

d 
Donde:
r: Número de repeticiones
t1: Valor crítico de t-student para grados de libertad γ2 y nivel de significación α1= α

13
Elías Alberto Torres Armas, Lic. Ms. C.

t2: Valor crítico de t-student para grados de libertad γ2 y nivel de significación α2=2(1-P).

Harris – Horvist – Hood proponen la siguiente fórmula (Lizarzaburu, 1984):

2
 kS 
r  2   2  1
 d 
Donde:
k: Valor crítico que se puede encontrar en la tabla III-1 del libro de Federer, W. (1955).
“Experimental designs”, New York, The Macmillan Co.

Tukey indica la siguiente fórmula (Lizarzaburu, 1984):

S 2q 2
r F( 2 , 1 )(1 P )
d2
Donde:
q: Valor crítico del rango estudentizado para el nivel α1= α, grados de libertad γ2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación α 2=1-P y grados de
libertad γ2 y γ1.

Las tres fórmulas indicadas requieren de un proceso iterativo debido a que los valores de t, k
y F dependen del valor de los grados de libertad γ2 que a su vez dependen del número de
repeticiones r del nuevo experimento. Pues, tenemos que dar un valor supuesto para obtener
el primer estimado, con el cual nuevamente obtenemos otro, y así sucesivamente hasta hallar
el menor valor conveniente de r (Lizarzaburu, 1984).

Ejemplo: Se realizó un experimento con variedades de algodón que arrojó un error


experimental igual a 10 con 50 grados de libertad, para 5.5 quintales por hectárea. Si se desea
experimentar un nuevo experimento en diseño en bloque completo al azar con 5 variedades
de algodón en el mismo campo; estime el número de repeticiones con α=0.05, P=0.90 (Los
grados de libertad en un DBCA es (t-1)(b-1), donde t es el número de tratamientos y b es el
número de bloques).

d=5.5 S2=CME=10S= 10 α=0.05 P=0.90 γ1=50 γ2=(t-1)(b-1)=(5-1)(b-1),


b=r (Número de bloques es igual al número de repeticiones), entonces: γ2=(t-1)(r-1)=(5-1)(r-
1).

Según Cochran y Cox:


2
S
r  2  t1  t 2 
2

d 
2
 10 
r  2 
 t 2 ,0.05  t 2 , 0.20 2

 5.5 
1    0.05
 2  2(1  P)  2(1  0.90)  1(0.10)  0.20
Damos un valor de r supuesto para obtener el primer estimado:
Sea r=6  γ2=(t-1)(r-1)=(5-1)(r-1)
γ2=(t-1)(r-1)=(5-1)(6-1)=20

14
Métodos Estadísticos para la Investigación experimental

Ahora:
2
 10 
r  2 
 t 2 ,0.05  t 2 , 0.20 
2

 5.5 
2
 10 
r  2  t20,0.05  t20,0.20 2
 5 .5 
t20, 0.05  2.089 tabla t  student dos colas
t20, 0.20  1.325 tabla t  student dos colas
2
 10 
r  2  2.089  1.3252  7.69250975
 5 .5 
r 8

Sea r=7  γ2=(t-1)(r-1)=(5-1)(r-1)


γ2=(t-1)(r-1)=(5-1)(7-1)=24
Ahora:

2
 10 
r  2 
 t 2 , 0.05  t 2 , 0.20 
2

 5. 5 
2
 10 
r  2  t 24, 0.05  t 24, 0.20 2
 5. 5 
t 24, 0.05  2.064 tabla t  student dos colas
t 24, 0.20  1.318 tabla t  student dos colas
2
 10 
r  2  2.064  1.3182  7.5622638
 5. 5 
r 8
Tabla 1.3. Número óptimo de repeticiones
Tratamientos r inicial supuesto glerror t0.05 t0.20 ro
5 2 4 2.776 1.533 12.28
5 3 8 2.306 1.397 9.07
5 4 12 2.179 1.356 8.26
5 5 16 2.12 1.337 7.90
5 6 20 2.086 1.325 7.69
5 7 24 2.064 1.318 7.56

Según Tukey

S 2q 2
r F( 2 , 1 )(1 P )
d2

q: Valor crítico del rango estudentizado para el nivel α1= α, grados de libertad γ2 y para p
tratamientos.
F: Valor crítico de la distribución F para el nivel de significación α 2=1-P y grados de
libertad γ2 y γ1.
Sea r=6  γ2=(t-1)(r-1)=(5-1)(r-1)
γ2=(t-1)(r-1)=(5-1)(6-1)=20
q=4.23 α1= α=0.05 γ2=20 γ1=50

15
Elías Alberto Torres Armas, Lic. Ms. C.

d=5.5 S= 10 P=0.90
F( 2 , 1 )(1 P )  F( 20,50)0.10  1.57
S 2q 2
r F( 2 , 1 )(1 P )
d2
10(4.23) 2
r 1.57  9.28656298  9
5.52

b. Aleatorización.-

- La aleatorización consiste en asignar al azar los tratamientos a las unidades


experimentales, dando igual probabilidad (posibilidad) a cada unidad experimental de
poder recibir cualquiera de los tratamientos bajo estudio, sea favorables o desfavorable.
- Las observaciones y las unidades experimentales deben ser independientes.
- Al aleatorizar los tratamientos o las unidades experimentales en forma adecuada se ayuda
a “cancelar” los efectos de los factores extraños que pudieron estar presentes alterando
los resultados.
- Cochran y Cox indican que la aleatorización es como un “Seguro” ya que es como
precaución contra “anomalías” que pueden o no ocurrir.
- La repetición permite tener un estimado del error experimental
- La aleatorización nos asegura que la obtención del estimador del error experimental sea
válido e insesgado.
- La aleatorización garantiza la independencia del Error experimental

En resumen: La aleatorización garantiza la validez de loa estimación del error experimental.


Garantiza la independencia de los errores o que las observaciones sean variables aleatorias
independientes. Permite eliminar sesgo, de tal manera que no desfavorezca a discrimine a los
tratamientos y permite cancelar los efectos de factores extraños que pudieran estar presentes.

c. Control local

- Es el agrupamiento, bloqueo y balanceo de las unidades experimentales que se emplean


en el diseño estadístico con la finalidad de disminuir el error experimental.
- Agrupamiento. Consiste en colocar un conjunto de unidades experimentales homogéneas
en grupos, de modo que en los diferentes grupos queden sujetos a distintos tratamientos.
- Bloqueo. Es la distribución de las unidades experimentales en bloques, de modo que las
unidades dentro de un bloque sean relativamente homogéneas
- Balanceo. Consiste en aplicar cada tratamiento al mismo número de unidades
experimentales con el propósito de tener la misma precisión en la estimación de las
medias de todos los tratamientos.
- Es una técnica que se usa para incrementar la precisión del experimento mediante el uso
del diseño adecuado.
- Este principio se refiere a las medidas que se toman para reducir el error experimental
mediante el bloqueo de unidades experimentales más homogéneos. De tal manera
controlar las influencias ambientales que afectan al material experimental.
12. Modelo estadístico de un diseño experimental.

Es una representación matemática de las relaciones existentes entre los diversos factores o
componentes considerados en un diseño experimental. Cada fenómeno natural tiene un modelo.
Los modelos más perfeccionados dependen de afirmaciones matemáticas y que estos nos

16
Métodos Estadísticos para la Investigación experimental

permiten explicar un fenómeno. Por ejemplo: Modelo lineal aditivo para un diseño completo al
azar (DCA), es:
Yij     i   ij

Aditivo: Porque los efectos o componentes que están incluidos en el modelo son aditivos (se
suman), para dar lugar al hecho observado a su valor.
Lineal: Porque sus componentes del modelo están elevados a la potencia uno.

Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los modelos
son de tres tipos:

Modelo I (Efectos fijos). Se presenta cuando los niveles son fijados por el experimentador.
Ejemplo. Se desea estudiar el efecto de dietas con diferente nivel energético en la ganancia de
peso en terneros de ganado vacuno, este factor es fijo. Las conclusiones del experimento son
solamente válidas para los niveles evaluados.

Modelo II (Efectos aleatorios). Se presenta cuando los niveles son escogidos aleatoriamente
desde una población. Las conclusiones del experimento serán válidas para la población de niveles
del factor. Ejemplo. Si además en el ejemplo anterior, de estudiar el efecto de las dietas, se desea
evaluar el efecto de la condición genética del padrillo en la ganancia de peso de los terneros, este
último es factor aleatorio.

Modelo III (Efectos mixtos). Se presenta cuando se tiene una combinación de los dos modelos
anteriores, es decir; cuando se tiene algunos factores con efectos fijos y algunos con efectos
aleatorios.

13. Análisis de varianza.

Es una técnica estadística que permite descomponer la variabilidad total de los resultados de un
experimento en sus distintas fuentes (tratamientos, interacciones entre factores, covariables, error
experimental), con la finalidad de compararlas e identificar su importancia relativa en la
explicación de la variabilidad total. Se entiende como análisis de varianza a las descomposición
de la variabilidad total que se en los datos en cada una de sus fuentes controladas y no
controladas. El análisis de varianza (ANVA) es una técnica que se puede utilizar para decidir si las
medidas de dos o mas poblaciones (tratamientos) son iguales o no.

Propósitos del análisis de varianza (ANVA)

- Estimar las diferencias entres los tratamientos que son de interés, de manera que el valor
estimado este lo más cercano posible al valor real.
- Obtener información acerca de la exactitud de los estimadores, lo cual se logra al determinar el
correspondiente error estándar.
- Proveer información necesaria y suficiente para efectuar pruebas de de comparación entre
promedios de tratamientos tal la prueba t-student, etc.
- Estimar los componentes de varianza.

Preguntas y temas de repaso y análisis

Dé en forma concreta el concepto de los siguientes términos y/preguntas:

1. Estadística – investigación – método científico – problema – hipótesis – objetivos

17
Elías Alberto Torres Armas, Lic. Ms. C.

2. Investigación experimental
3. Según Sampieri y otros (1998). La investigación experimental es de 4 tipos ¿Cuáles son?
4. ¿Cuáles son los tipos de experimento?.
5. ¿Cuáles son las características del diseño experimental?.
6. Mencione las clases de diseño experimental según el objetivo del diseño, “estudiar uno o más
factores (variables independientes).
7. Eligiendo una situación práctica de interés en el campo de su especialidad, describa un
problema cuya solución deba ser determinada experimentalmente e indique: Factor(es),
nivel(es) de factor, variable respuesta, unidad experimental.
8. Mencione dos reglas para planear un experimento
9. En qué consiste el error experimental
10. Cuáles son las recomendaciones para realizar control del error experimental
11. ¿Qué se entiende por modelo estadístico?.
12. Dependiendo de la forma en que son elegidos los niveles de los factores en estudio, los
modelos son de tres tipos ¿cuáles son? Indique solamente cuáles son
13. Mencione al menos dos propósitos del análisis de varianza (ANVA)
14. Mediante un ejemplo describa y conceptualice los términos siguientes: Factor, niveles del
factor, tratamiento, testigo (si lo hubiera), unidad experimental, variable respuesta, diseño
experimental y conceptualice cada uno de los principios básicos del diseño experimental.

Resuelva los siguientes casos.

Ejercicio 1. En cada uno de los siguientes enunciados referentes a estudios experimentales


indicar: la unidad experimental, la variable de respuesta, las fuentes de variabilidad, los factores y
sus niveles (tratamientos).

1. Un investigador desea estudiar los efectos de los medicamentos A y B sobre el recuento de


linfocitos en ratones (expresados en miles por ml de sangre) comparando A, B y el placebo P.
Al diseñar el experimento se piensa que los ratones de una misma camada darán respuestas
más homogéneas que ratones de camadas diferentes. Por tal motivo se utilizan en el
experimento 7 camadas de 3 ratones cada una.
2. Se pretende estudiar si el azufre produce una disminución del número de cierto tipo de
parásitos de la papa. Para ello se divide el campo en 24 parcelas de igual tamaño. Interesa
comparar 3 cantidades distintas de azufre en 2 estaciones del año (primavera y otoño). En
cada estación del año y con cada cantidad de azufre se repite el experimento en 4 parcelas que
son asignadas al azar entre las 24 parcelas preparadas para el experimento. En cada parcela se
mide el número de parásitos de la papa.
3. Un investigador realizó un estudio sobre las técnicas de dosificación del ácido ribonucleico.
En una determinada etapa el proceso comprende una extracción por una solución de ácido
tricloroacético, donde se efectúa una medición del total de ácido ribonucleico extraído. El
investigador estaba interesado en saber si el reemplazo del ácido tricloroacético por ácido
perclórico asegura una extracción más completa y decidió ensayar el ácido perclórico a dos
concentraciones diferentes, 5% y 10%, con respecto al procedimiento que se realizaba
anteriormente. A tal fin se trataron 15 partes alícuotas de un mismo homogenato de páncreas
(5 con cada tratamiento).
Ejercicio 2. La única manera satisfactoria de conocer la duración de una cubierta de automóvil
es hacerla rodar en un auto de prueba bajo condiciones normales del camino. Se desea comparar
4 tratamientos, cada uno corresponde a gomas preparadas con diferentes procesos. Evalúe los
siguientes planes:

18
Métodos Estadísticos para la Investigación experimental

1. Utilizar 4 autos y en cada auto colocar las 4 cubiertas con el mismo tratamiento. Es decir, un
tratamiento por auto.
2. Utilizar 4 autos y en cada uno de ellos asignar a la cubierta delantera derecha el tratamiento 1,
a la delantera izquierda el tratamiento 2, a la trasera derecha el tratamiento 3 y a la trasera
izquierda el tratamiento 4.
3. Utilizar 4 autos y en cada uno asignar aleatoriamente un tratamiento a una cubierta.
4. Utilizar 4 autos y en cada uno asignar un tratamiento a una cubierta de modo que todos los
tratamientos estén una vez en cada posición (usando los 4 autos) y los 4 tratamientos estén
presentes en cada auto.

Ejercicio 3. Los tres principios básicos del diseño de experimentos son: replicación,
aleatorización y control de los efectos de variables externas. Considere cada uno de los siguientes
escenarios. ¿Se adhiere cada uno de ellos a todos los principios? En caso de respuesta afirmativa,
describa de qué manera. En caso de respuesta negativa indique cómo cambiaría el diseño para
incorporar el o los principios faltantes.

1. Un químico desea comparar un nuevo método de ensayo más simple con un método estándar.
Prepara una cierta solución y la divide en 40 tubos de ensayo. Aleatoriamente selecciona 20
tubos y le pide a su ayudante técnico que los analice usando el método estándar. Ella por su
parte analiza los restantes 20 usando el método nuevo. Al final los dos grupos de resultados de
estos ensayos serán comparados.
2. Un grupo de estudiantes universitarios cree que un cierto té de hierbas posee un remarcable
poder para levantar el ánimo. Para probar lo que creían realizaron visitas semanales a un hogar
de ancianos, visitando a los residentes y sirviéndoles de este té. El personal del hogar reportó
que luego de varios meses muchos de los residentes estaban más alegres y saludables.

Ejercicio 4. El tamaño final del fruto es un factor determinante de la calidad de los duraznos.
Algunas de las nuevas variedades de duraznero se caracterizan por su abundante fructificación lo
que origina una gran cantidad de frutos de pequeño tamaño con escasa calidad comercial. Una
práctica que puede mejorar el tamaño del fruto es el raleo (eliminación de frutos) químico o
manual. Con el objetivo de evaluar el impacto del raleo sobre el tamaño final de los frutos (peso
medio de fruto en gramos), se realizó el siguiente ensayo: Material experimental: plantas
homogéneas en desarrollo y estado sanitario. Repeticiones: 5 por tratamiento, cada repetición era
una planta y se muestrearon 100 frutos por planta. Tratamientos: un testigo sin ralear
(Tratamiento 1); raleo manual (Tratamiento 2); y raleo químico (Tratamiento 3). Los datos del
experimento se resumen en el siguiente tabla:
Tabla 1.4. Los calibres promedio por planta (mm) en cosecha
Repeticiones
Tratamiento 1 2 3 4 5
1 52.3 53.8 57.3 60.2 61.3
2 70.2 71.8 68.7 67.5 66.2
3 57.8 67.2 63.5 58.4 68.8
Indique: (a) Objetivo del estudio, b) Factor en estudio, (c) Unidad experimental , (d) Variable de
respuesta, e) Escriba el modelo estadístico adecuado para este estudio y explique sus componentes.

19
CAPITOLO II

Experimentos simples con dos tratamientos

1. Comparación de medias de dos poblaciones normales independientes de varianzas


conocidas.

Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ 1, σ21) y Sean Y1 ,Y2,
Y3, …Yn una muestra aleatoria, seleccionada de una población N(µ 2, σ22). Supongamos que las
poblaciones son independientes y con medias maestrales: X y Y .

Tabla 2.1. Comparación de medias de dos poblaciones normales independientes de


varianzas conocidas.
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho: 1   2 Ho: 1   2 Ho: 1   2
Ha: 1  2 Ha: 1  2 Ha: 1   2
Nivel de Significancia α = 0.01 o 0.05. Asocia a Zα de la distribución normal estándar
Estadística de prueba
X1  X 2
zc    (0,1)
 12  22

n1 n2
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
zc > Zα zc < - Zα | zc |> Zα/2

2. Comparación de medias de dos poblaciones normales independientes de varianzas


desconocidas

Sean X1 ,X2, X3, …Xn una muestra aleatoria, seleccionada de una población N(µ1, σ21) y Sean Y1 ,Y2,
Y3, ………Yn una muestra aleatoria, seleccionada de una población N(µ2, σ22 ) donde µ1, µ2 , σ21 y
σ22 , son desconocidas. Supongamos que las poblaciones son independientes.

Tabla 2.2. Comparación de medias de dos poblaciones normales independientes de varianzas


desconocidas pero iguales (σ21 = σ22 = σ2), muestras pequeñas (n1; n 2 < 30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis Ho: 1   2 Ho: 1   2 Ho: 1   2
Ha: 1  2 Ha: 1  2 Ha: 1   2
Nivel de Significancia α = 0.01 o 0.05. Asocia a tα de la distribución t-student
Estadística de prueba X1  X 2
tc   t( n1  n2  2) g .l .
(n1  1) S1  (n2  1) S22 1 1
2
(  )
n1  n2  2 n1 n2
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
t c > t (n1 + n 2 - 2) t c  - t (n1 + n 2 - 2) | t c | > t  (n1 + n 2 - 2)
2
Métodos Estadísticos para la Investigación experimental

Tabla 2.3. Comparación de medias de dos poblaciones normales independientes de varianzas


desconocidas pero distintas (σ21 ≠ σ22), muestras pequeñas (n1; n 2 < 30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho: 1   2 Ho: 1   2 Ho: 1   2
Ha: 1  2 Ha: 1  2 Ha: 1   2
Nivel de Significancia α = 0.01 o 0.05. Asocia a tα de la distribución t-student
Estadística de prueba  S12 S 22 
2

  
X1  X 2  n1 n2 
tc   t( v ) g .l . v 2 2
2
S12 S22  S12   S 22 
    
n1 n2  n1    n2 
n1  1 n2  1
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
t c > t α(v) t c < - t α(v) |t c | > t α/2(v)

Tabla 2.4. Comparación de medias de dos poblaciones normales independientes de varianzas


desconocidas, muestras grandes (n2; n 2 ≥ 30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho: 1   2 Ho: 1   2 Ho: 1   2
Ha: 1  2 Ha: 1  2 Ha: 1   2

Nivel de Significancia α = 0.01 o 0.05. Asocia a Zα de la distribución normal estándar


Estadística de prueba X1  X 2
zc    (0,1)
S12 S22

n1 n2
Decisión Rechazamos Ho Si Rechazamos Ho Si Rechazamos Ho Si
zc > Zα zc < - Zα |zc |> Zα/2

3. Comparación de medias de dos poblaciones normales dependientes.

Sean X1 , …Xn una m.a. seleccionada de una población N(µ1 , σ²1) y Y1,…,Yn una muestra
aleatoria tomada de una población N(µ2 , σ²2), de modo que las observaciones están pareadas,
esto es, la muestra está formada por los pares (X1 , Y1) , (X2 , Y2), ………………,(Xn , Yn).

Ahora, definiendo la variable auxiliar D= X-Y. Tenemos la muestra aleatoria de diferencias D 1,


D2, …., Dn. La variable auxiliar D tiene distribución N(µD , σ²D), donde:

µD = E(D) = E( X-Y) = E(X) – E(Y) = µ1 - µ2


σ²D = Var(D) = Var( X-Y) = σ²1 + σ²2 -2 ρσ1 σ2
ρ = Cov( X,Y) = coeficiente de correlación ≠ 0

La media y la varianza de la muestra de n diferencias D1, D2, ……, Dn es :

 Di  D ²
n n

 Di  D2
D i 1
, S 
2 i 1
Asi, D  N (  D , )
n 1
D
n n

21
Elías Alberto Torres Armas, Lic. Ms. C.

Tabla 2.5. Comparación de medias de dos poblaciones normales dependientes, muestra pequeña
(n<30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho:  D  0 Ho:  D  0 Ho:  D  0
Ha:  D  0 Ha:  D  0 Ha:  D  0
Nivel de Significancia α = 0.01 o 0.05. Asocia a tα de la distribución t-student
Estadística de prueba D
tc 
SD / n
Decisión Re chazar H 0 Re chazar H 0 Re chazar H 0
Si t c  t n1, Si tc  tn1, Si t c  t 
n 1,
2

Tabla 2.6. Comparación de medias de dos poblaciones normales dependientes, muestra grande
(n ≥ 30)
Pasos Unilateral derecha Unilateral izquierda Bilateral
Hipótesis: Ho:  D  0 Ho:  D  0 Ho:  D  0
Ha:  D  0 Ha:  D  0 Ha:  D  0

Nivel de Significancia α = 0.01 o 0.05. Asocia a Zα de la distribución normal estándar


Estadística de prueba D
zc 
SD / n
Decisión Re chazar H 0 Re chazar H 0 Re chazar H0
Si zc  z Si zc   z Si zc  z
2

APLICACIONES

Ejemplo 1: Comparamos dos muestras aleatorias de 10 hombres y de 10 mujeres de edades


comprendidas entre los 18 a 22 años en un ítem que mide su autoestima (escala de 0 a 10 puntos).

a) ¿Podemos afirmar que ambas muestras difieren significativamente en autoestima?


b) ¿Podemos afirmar que la autoestima de los hombres es significativamente mayor que la de las
mujeres?

HOMBRES 7 6 8 7 5 6 4 9 9 8
MUJERES 6 5 6 5 4 4 4 6 4 8

a) Se trata de comparar las medias de hombres y de mujeres (6.9 y 5.2, respectivamente) con una
prueba t para muestras independientes (contraste bilateral o de dos colas): el SPSS nos da
t(18)0.05=2.53, p=0.021, luego la respuesta es sí.

b) Igual que en a) sólo cambia aquí que el hecho de que el contraste es ahora unilateral (una cola).
En este caso sólo hay que dividir la p que nos da el programa por 2. Luego quedaría así:
t(18)0.05=2.53, p=0.0105, siendo la respuesta también que sí.
Ejemplo 2. (Quevedo H, 2006. pp.303). En un estudio de la aplicación del pH (potencial
hidrógeno que tiene una escala de 0 a 14, donde 7 es neutral y abajo de 7 es ácido y arriba de 7 es

22
Métodos Estadísticos para la Investigación experimental

alcalino) para medir la alcalinidad y la acidez de soluciones, un científico, dedicado al estudio de la


contaminación ambiental, asegura que dos muestras de soluciones (A y B) provienen del mismo
lugar de un río, donde supuestamente hubo un descarga industrial de ácido clorhídrico (HCl). Si
esto fuera cierto, entonces el pH de las dos muestras de soluciones serían iguales. Asumiendo que
las observaciones provienen de poblacionales normales, probar la hipótesis nula de igualdad de
los promedios de pH. Asumir α = 0.05. ¿Desaprueban los datos la afirmación del científico? La
tabla de abajo muestra la información requerida para este problema.
Mediciones Mediciones
de pH de de pH de
solución A solución A
6.24 6.27
6.31 6.25
6,28 6.33
6.30 6.27
6.25 6.24
6.26 6.31
6.24 6.28
6.29 6.29
6.22 6.34
6.28 6.27

Ejemplo 3. (Di Rienzo, 2008. Pp183). Los siguientes resultados se obtuvieron al analizar los
registros de las precipitaciones ocurridas en dos zonas: A y B. Para conocer la precipitación
promedio de cada zona se construyeron los correspondientes intervalos de confianza al 95%.

Zona n Media DE LI(95%) LS(95%)


A 39 547.29 154.07 497.35 597.24
B 45 614.35 113.96 598.61 630.09

Teniendo en cuenta la información anterior responder las siguientes cuestiones, justificando la


respuesta. a) ¿Cuál sería la decisión en cada zona, al realizar un contraste de hipótesis bilateral
para μ=500?. b) ¿Esperaría encontrar diferencias estadísticamente significativas entre las medias
de las precipitaciones observadas en cada zona?

Ejemplo 4. Para un análisis de pesticidas clorinados hidrocarbonados en aguas residuales (usando


cromatografía de gas), se dio una muestra conteniendo este pesticida a dos laboratorios. Los
tamaños de las muestras fueron de 40 y 50 casos, respectivamente. Si las muestras tienen
promedios de ̅ = 74 con desviación estándar de σ1 = 8, y de promedio de ̅ = 78 con una
desviación estándar de σ2 = 7, decir si hay una diferencia significante entre los resultados de los
dos laboratorios. Asumir niveles de significancia de α =0.05 y α =0.01. (Rpta: z = -2.49, p
=0.0064) (Quevedo H, 2006. pp.303).

Ejemplo 5. Medimos la capacidad lectoescritura de 10 niños disléxicos a través de un cuestionario


(escala de 0 a 100 puntos) antes y después de recibir una terapia. Sus resultados fueron:
Antes 72 80 75 77 80 74 81 76 73 70
Después 73 84 75 84 95 88 86 80 79 74
¿Ha aumentado la capacidad lectoescritura de los niños tras el tratamiento?
Ejemplo 6. En una prueba para diseñar un equipo de control para partículas emitidas por una
fuente industrial, se hicieron dos pruebas para saber cuál de los dos sistemas de control eran más
eficientes. La primera prueba consistió en instalar un filtro de vidrio (baghouse). La otra prueba
consistió en agregar al sistema de control del baghouse, un ciclón. La tabla de abajo muestra los

23
Elías Alberto Torres Armas, Lic. Ms. C.

resultados de los dos equipos de control. Asúmase que el muestreo de selección fue
completamente al azar, sin emparejamiento y asumir que las poblaciones son normales.

Concentración de partículas con el Concentración de partículas con el


sistema de control agregado un sistema de control, agregado el ciclón
filtro de vidrio (Microgramos/m3) (Microgramos/m3)
421 207
462 17
400 412
378 74
413 116
Probar la hipótesis, al 95% de nivel de confianza de qué, con el equipo adicional, no hubo
diferencia en las reducciones de contaminantes.

Antes de comenzar, tenemos que hacer una decisión sobre cual prueba de t es la más apropiada.
Pudiéramos usar la versión de t para observación pares donde hay un aparejamiento deliberado.
Tal vez pudiéramos usar la función de t que asume que las varianzas de las poblaciones son
iguales y con muestras del mismo tamaño. La tercera opción, sería usar la versión de t para
varianzas desiguales. Sin embargo, si asumimos que se usó el método de selección completamente
aleatorio, sin emparejamiento, y si analizamos a simple vista los datos de la tabla de arriba,
podemos ver que hay mucha variación en las observaciones (se debe hacer una prueba de
hipótesis con el objeto de ver si las varianzas son iguales), lo que nos inclinaría a usar la tercera
opción.

I. Prueba de igualdad de varianzas


Hipótesis
Ho: Las varianzas son iguales
Ha: Las varianzas son diferentes
Nivel de significación: 10% para tener dos colas del 5% cada una)
Estadística de prueba:

Fc=(varianza mayor/varianza menor) F(glvar.mayor;glvr.menor)(a/2)

Tabla 2.7. Prueba F para varianzas de dos muestras


Concentración
de partículas Concentración
con el sistema de partículas
de control, al con el sistema
cual se le de control
agregó el ciclón agregado
Media 165.2 414.8
Varianza 23839.7 960.7
Observaciones 5 5
Grados de libertad 4 4
F 24.8149266
P(F<=f) una cola 0.00438547
Valor crítico para F (una cola) 6.38823291
Fc=24.81 F(4;4)0.05=6.39 Fc es mayor que el Ftabla, por tanto se
Rechaza Ho. Conclusión: Las varianzas son diferentes

24
Métodos Estadísticos para la Investigación experimental

II. Prueba de la diferencia de medias


Ho: 1   2
Ha: 1   2
Nivel de significación: 5%
Estadística de prueba: teniendo en cuenta que las varianzas poblacionales son desconocidas
pero distintas (σ21 ≠ σ22), muestras pequeñas (n1; n 2 < 30)
2
 S12 S 22 
  
X1  X 2  n1 n2 
T  t ( v ) g .l . v 2 2
2
S12 S 22  S12   S 22 
    
n1 n2  n1    n2 
n1  1 n2  1
Tabla 2.8. Prueba t para dos muestras suponiendo varianzas desiguales
Concentración
de partículas
con el sistema Concentración de
de control partículas con el sistema
agregado el de control, el cual se le
filtro de vidrio agregó el ciclón
Media 414.8 165.2
Varianza 960.7 23839.7
Observaciones 5 5
Diferencia hipotética de las medias 0
Grados de libertad 4
Estadístico t 3.54405326
P(T<=t) una cola 0.01196303
Valor crítico de t (una cola) 2.13184679
P(T<=t) dos colas 0.02392606
Valor crítico de t (dos colas) 2.77644511

tc=3.544 t(4)0.05dos colas=2.77Rechazamos Ho Si |tc| > t α/2(v) tc>t(4)0.05dos colas por tanto se
rechaza Ho.
Conclusión: con el equipo adicional, hubo diferencia en las reducciones de contaminantes.

25
CAPÍTULO III

Experimentos simples con más de dos tratamientos

Diseño completamente al azar (DCA)


Introducción

Es el diseño estadístico más elemental y sencillo utilizado en la investigación, utilizado


generalmente en laboratorio, y no es empleado en experimentos de campo debido a que exige
una estricta homogeneidad en las unidades experimentales y el control del medio ambiente.

Características, ventajas, desventajas, usos

- Es el diseño más simple y aplicable solo cuando las unidades experimentales son
homogéneas.
- Los tiramientos son asignados completamente al azar ( sin restricción en el azar) en las
unidades experimentales o viceversa.
- Los tratamientos pueden tener igual o diferente número de unidades experimentales.
- El número de tratamientos está en función del número de unidades experimentales que se
disponen, es conveniente tener menor número de tratamientos y más unidades
experimentales.

Ventajas

- Fácil de planear y flexible en cuanto al número de tratamientos y repeticiones


- Se puede tener diferente número de repeticiones por tratamiento
- Si se pierde uno o más tratamientos del experimento, el análisis estadístico se realiza con los
tratamientos restantes.
- Permite tener el máximo número de grados de libertad para estimar el error experimental.
- En caso que hubiera perdida de una unidad experimental se puede considerar un diseño con
diferente número de repeticiones por tratamiento y no afecta al análisis de varianza

Desventajas

- Es apropiado para pequeño número de tratamientos y para un material experimental


homogéneo.
- No es recomendable utilizar cuando el material experimental no es homogéneo, debido a
que incrementa el error experimental.
- La dificultad de encontrar uniformidad en las unidades experimentales
- Es más apropiado para pequeño número de tratamientos
- Cuando se tiene diferente número de repeticiones por tratamientos es necesario calcular el
error estándar para cada par de promedios de tratamientos a comparar.

Usos

- Puede ser aplicado en todos los campos de la investigación


- Muy utilizado en experimentos de invernadero, laboratorio, establos, etc.
- No se utilizan en el campo.

1. Diseño completamente al azar con una observación por unidad experimental para
cada tratamiento
Métodos Estadísticos para la Investigación experimental

1.1. Diseño con número diferente de observaciones por tratamiento

Modelo aditivo lineal

Yij     i   ij

Para i = 1,2,3,..... t tratamientos; j = 1,2,3,..... ri observaciones o repeticiones

Yij: Observación de la variable respuesta con i-ésimo tratamiento, j-ésima repetición


µ : Efecto de la media poblacional
τi : Efecto del i-ésimo tratamiento
εij : Efectos aleatorio (error experimental) que pertenece a la Yij observación de la
variable respuesta con i-ésimo tratamiento, j-ésima repetición

Supuestos básicos modelo estadístico:

El modelo estadístico debe cumplir con los siguientes supuestos:

1. Aditividad: Los efectos del modelo son aditivos


2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con
media µi y varianza σ2
4. Independencia: Los resultados obtenidos en el experimento son independientes
entre si
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación
de los diferentes tratamientos tienen varianzas iguales (σ2)

Análisis de varianza

Hipótesis:

H 0 : i  0 H 0 : i  0
ó
H a : i  0 H a : i  0 ( No todos son iguales )

Nivel de significación:   0.05 ó 0.01 etc.

Estadística de prueba: Fc del análisis de varianza

Tabla 3.1 Cuadro de análisis de varianza para el diseño completo al azar con diferente
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t CME
 (ni  1)
i 1
Total SC total t

n
i 1
i 1

27
Elías Alberto Torres Armas, Lic. Ms. C.

Tabla 3.2. Representación simbólica de los datos del diseño


completo al azar (DCA).
Observaciones Tratamientos
T1 T2 T3 .. Tt
1 Y11 Y21 Y31 .. Yt1
2 Y12 Y22 Y32 .. Yt2
3 Y13 Y23 Y33 .. Yt3
4 Y14 Y24 Y34 .. Yt4
. . . . . .
. . . . . .
R ..
Y1r1 Y1r2 Y1r3 Y1ri
TOTAL Y1. Y2. Y3. . Yt. Y..
Repeticiones r1 r2 r3 … ri t

r
i 1
i

Para i = 1,2,3, ....., t tratamientos y j = 1,2,3, ...., r repeticiones

Calculo de las sumas de cuadrados

t r
Y..2
 Suma de cuadrados para el total SCtotal   Y  2
ij t
i 1 j 1
r
i 1
i

Y 2
i.
Y..2
 Suma de cuadrados para tratamientos SCtratamiento  i 1
 t

r
ri
i
i 1

 Suma de cuadrados para el error: SCerror  SCtotal  SCtratamiento

Decisión. Rechace Ho si Fc>Ft

Conclusión. El análisis de varianza concluirá en la existencia o no de por lo menos


un promedio de tratamiento diferente que los demás respecto al reporte de las
observaciones de la variable respuesta en estudio. En investigador deseará saber cuál es
ese tratamiento, pues entonces tendrá que realizar una prueba de comparaciones
múltiples de promedios de tratamientos; que más adelante será una exposición
detallada de algunas de algunas pruebas, las más usuales.

Ejemplo:

Un Ingeniero en agroindustrial evalúa el tiempo de vida útil de mermelada de piña


haciendo variar el porcentaje de conservante. Realizó diferente número de ensayos
para cada uno de los porcentajes de conservante en estudio. Después de un tiempo o
periodo de referencia se concluyó con la evaluación y los datos se reportaron en la
siguiente tabla:

28
Métodos Estadísticos para la Investigación experimental

Tabla 3.3. Vida útil de la mermelada de


piña a distintos porcentajes de
conservante

% Conservante
Repetición 0.01 0.02 0.03 0.04
1 20 17 32 28
2 22 19 30 25
3 26 20 28 23
4 25 - - 26
5 21 - - -
6 23 - - -
Total 137 56 90 102 385
ri 6 3 3 4 16

Modelo aditivo lineal

Yij     i   ij

Para i = 1,2,3,..... t tratamientos; j = 1,2,3,..... ri observaciones o repeticiones

Yij : Vida útil de la mermelada de piña con el i-ésimo porcentaje de conservante, j-


ésima repetición
µ : Efecto de la media poblacional
τi : Efecto del i-ésimo porcentaje de conservante
εij : Efectos aleatorio (error experimental) que pertenece a la (Yij) vida útil de la
mermelada de piña con el i-ésimo porcentaje de conservante, j-ésima repetición

Análisis de varianza

Hipótesis: H0: t1=t2=t3=t4


Ha: t1t2t3 t4 (Al menos uno de los tratamientos es diferente)

H 0 : i  0
H a : i  0 ( No todos son iguales )

Nivel de significación:   0.05 ó 0.01

Estadística de prueba: Fc del análisis de varianza

Cálculos:
( 385 ) 2
SC total = 202 + 222 + ... 262 -  262.93
16
137 2 562 902 1022 ( 385 ) 2
SC trat = + + + -  210.44
6 3 3 4 16
SC error = SC total - SC trat = 52.49

29
Elías Alberto Torres Armas, Lic. Ms. C.

Tabla 3.4. Análisis de varianza de la vida útil de la mermelada de piña con


diferentes porcentajes de conservante
Fuente de Suma de Grados de Cuadrados Fc Significación
Variación Cuadrados Libertad Medios
Tratamiento 210.44 3 70.15 16.05 * (**)
Error 52.49 12 4.37
Total 262.93 15

Observe que Fc>Ft tanto para 5% (F0.05=3.49) como para 1% (F0.01=5.95), lo que
significa que al menos uno de los tratamientos es (*) significativo y/o (**) altamente
significativo

Figura 3.1. Salida del stagraphics plus v.5.1

Rechace Ho si p-valor es menor que el nivel de significación (0,0002<0,05 y


0,0002<0,01 entonces rechazamos Ho)

Decisión. Rechazar H0 porque Fc>Ft tanto para 5% (F0.05=3.49) como para 1%


(F0.01=5.95) ó (p=0,0002<0,05 y p= 0,0002<0,01)

Conclusión. No hay evidencias suficientes para aceptar la igualdad entre los


tratamientos. Existe evidencia estadística suficiente para afirmar, que al menos uno de
los porcentajes de conservante es significativamente (*) (altamente significativo (**))
en la vida útil de la piña de mermelada. Para saber cuál es el porcentaje significativo se
debe aplicar una prueba de comparación múltiple de promedios de tratamientos que se
verá con detalle más adelante.

1.2. Diseño con número igual de observaciones por tratamiento

Modelo aditivo lineal

Yij     i   ij

Para i = 1,2,3,..... t tratamientos y j = 1,2,3,..... r observaciones o repeticiones

Yij: Observación de la variable respuesta con i-ésimo tratamiento, j-ésima repetición


µ : Efecto de la media poblacional
τi : Efecto del i-ésimo tratamiento
εij : Efectos aleatorio (error experimental) que pertenece a la Yij observación de la
variable respuesta con i-ésimo tratamiento, j-ésima repetición.

Supuestos básicos modelo estadístico:

1. Aditividad: Los efectos del modelo son aditivos

30
Métodos Estadísticos para la Investigación experimental

2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con
media µi y varianza σ2
4. Independencia: Los resultados obtenidos en el experimento son independientes
entre si
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la
aplicación de los diferentes tratamientos tienen varianzas iguales (σ 2)

Análisis de varianza

Hipótesis:
H 0 : i  0 H 0 : i  0
ó
H a : i  0 H a : i  0 ( No todos son iguales )

Nivel de significación:   0.05 ó 0.01 etc.

Estadística de prueba: Fc del análisis de varianza

Tabla 3.5. Cuadro de análisis de varianza para el diseño completo al azar con igual
número de repeticiones por tratamiento
Fuente de Suma de Grados de Cuadrados Fc
Variación Cuadrados Libertad Medios
Tratamiento SC tratamiento t-1 CM tratamiento CM tratamiento/CME
Error SC error t(r-1) CME
Total SC total rt-1

Tabla 3.2. Representación simbólica de los datos del diseño


completo al azar (DCA).
Observaciones Tratamientos
T1 T2 T3 .. Tt
1 Y11 Y21 Y31 .. Yt1
2 Y12 Y22 Y32 .. Yt2
3 Y13 Y23 Y33 .. Yt3
4 Y14 Y24 Y34 .. Yt4
. . . . . .
. . . . . .
R Y1r Y2r Y3r … Ytr
TOTAL Y1. Y2. Y3. . Yt. Y..
Repeticiones R r R … r rt
Para i = 1,2,3, ....., t tratamientos y j = 1,2,3, ...., r repeticiones

Calculo de las sumas de cuadrados


t r
Y..2
 Suma de cuadrados para el total SCtotal   Y  2
ij
i 1 j 1 tr
t

Y 2
i.
Y..2
 Suma de cuadrados para tratamientos SCtratamiento  i 1

r tr
 Suma de cuadrados para el error SCerror  SCtotal  SCtratamiento

31
Elías Alberto Torres Armas, Lic. Ms. C.

Decisión. Rechace Ho si Fc>Ft

Conclusión. El análisis de varianza concluirá en la existencia o no de por lo menos


un promedio de tratamiento diferente que los demás respecto al reporte de las
observaciones de la variable respuesta en estudio. En investigador deseará saber cuál es
ese tratamiento, pues entonces tendrá que realizar una prueba de comparaciones
múltiples de promedios de tratamientos; que más adelante será una exposición
detallada de algunas de algunas pruebas, las más usuales.

Ejemplo:

Se llevó a cabo un experimento para evaluar el efecto de 4 dietas alimenticias de


concentrado con diferentes dosis de maíz amarillo duro, en el incremento en peso de
ganado porcino, utilizándose para ello 20 camadas de cerdos de la misma raza, de la
misma parición y del mismo día de nacidos, obteniéndose los siguientes resultados:

B2 A1 C20 C15 D7 C9 B16 A11 B12 D3

D10 B19 A6 C14 D18 B4 A17 D5 A8 C13


A. 20%m.a.d. B. 30%m.a.d. C. 40%m.a.d. D. 50%m.a.d.

Los datos se registraron en la siguiente tabla:

Tabla 3.3. Incremento en peso de ganado porcino a diferentes


dosis alimenticias de amarillo duro
Dietas
Observaciones A B C D
1 1 2 20 10
2 6 19 15 7
3 17 4 14 18
4 11 16 9 5
5 8 12 13 3


Incremen to en peso de ganado porcino

20

15

10

1 2 3 4

Gráfico
Die ta alim enticia 3.1. Incremento
de concentr adodea peso
diferdeentes
ganado porcino
dos isa de maíz am ar illo duro
diferentes dietas alimenticias de maíz amarillo duro

32
Métodos Estadísticos para la Investigación experimental

Del gráfico interactivo: diagrama de cajas y bigotes, por simple inspección se puede
mencionar que no hay diferencia entre los niveles del factor, es decir entre los distintos
porcentajes de concentrado de maíz amarillo duro, aun cuando en las dietas B y C se
observen ganancias más altas. La dieta C se encuentra concentrado respecto a la media,
pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.

Obsérvese que en el diseño está presente cada uno de los siguientes elementos:

Variable respuesta: Incremento en peso de ganado porcino


Factor: Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro
Niveles del factor A:20%m.a.d. B:30%m.a.d. C:40%m.a.d. D:50%m.a.d.
Número de repeticiones por tratamiento: 5
Unidad experimental: Camada de cerdos, 20u.e.

Modelo Lineal Aditivo:

Yij     i   ij
Para i = 1, 2, 3,..., 4 tratamientos t=4, j = 1,2,3,..... 5 observaciones o repeticiones
r=5

Yij : Incremento en peso de ganado porcino en la i-ésisma dieta alimenticia y j-ésima


repetición.
µ : Efecto de la media general
τi : Efecto de la i-ésima dieta alimenticia
εij : Error experimental (efecto verdadero) que pertenece a la i-ésisma dieta alimenticia
y j-ésima repetición.

Supuestos básicos modelo estadístico:

El modelo estadístico debe cumplir con los siguientes supuestos:

Aditividad: Los efectos del modelo son aditivos


Linealidad: Las relaciones entre los efectos del modelo son lineales
Normalidad: Los errores del modelo deben tener una distribución normal con media µi
y varianza σ2 .
Independencia: Los resultados obtenidos en el experimento son independientes entre
sí.
Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de
los diferentes tratamientos tienen varianzas iguales (σ2)

Análisis de Varianza

Hipótesis: H0: t1 = t2 = t3 = t4
Ha: t1 t2  t3  t4 (Al menos una de las dietas es diferente)
ó
H 0 : i  0
H a : i  0 ( No todos son iguales )

Nivel de significación:   0.05 ó 0.01

33
Elías Alberto Torres Armas, Lic. Ms. C.

Estadística de prueba: Fc del análisis de varianza


Cálculos

Tabla 3.4. Incremento en peso de ganado porcino a diferentes


dosis alimenticias de amarillo duro
Dietas
Observaciones A B C D
1 1 2 20 10
2 6 19 15 7
3 17 4 14 18
4 11 16 9 5
5 8 12 13 3
Total 43 53 71 43 210
Repeticiones 5 5 5 5 20

Suma de cuadrados para el total

t r
Y..2 210..2
SCtotal  Y   1  6  17  ...  3 
2
ij
2 2 2 2
 665
i 1 j 1 tr 4(5)

Suma de cuadrados para tratamientos


t

Y 2
i.
Y..2 432  532  712  432 2102
SCtratamiento  i 1
    560.40
r tr 5 4(5)

Suma de cuadrados para el error

SCerror  SCtotal  SCtratamiento  665  560.40

Tabla 3.5. Análisis de varianza del incremento en peso de ganado porcino a


diferentes dosis alimenticias de amarillo duro
Fuente de Suma de Grados de Cuadrados Fc Significación
Variación Cuadrados Libertad Medios
Tratamiento 104.60 3 34.867 0.995 o (oo)
Error 560.40 16 35.025
Total 665.00 19

Observe que Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) lo que
significa que no existe al menos uno de los tratamientos es significativo y/o altamente
significativo, por tanto, se acepta H0, es decir no hay diferencia entre los incrementos
promedio de peso del ganado porcino por efecto de las distintas dietas alimenticias de
maíz amarillo duro

34
Métodos Estadísticos para la Investigación experimental

Figura 3.2. Salida del stagraphics plus v.5.1

Rechace Ho si p-valor es menor que el nivel de significación

Decisión

Aceptamos Ho porque Fc<Ft tanto para 5% (F0.05 =3.24) como para 1%, (F0.01 =5.29) ó
(p-valor=0,4202>0,05 y p-valor= 0,4202>0,01).

Conclusión

No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas
alimentícias sea diferente de las demás.

Estadísticos descriptivos

Tabla 3.5. Incremento en peso de ganado porcino a diferentes


dietas alimenticia de concentrado a diferentes dosis de maíz
amarillo duro
Dieta Media Desviación estándar r
A:20%m.a.d. 8.60 5.941 5
B:30%m.a.d. 10.60 7.403 5
C:40%m.a.d. 14.20 3.962 5
D:50%m.a.d. 8.60 5.857 5
Total 10.50 5.916 20

Aun cuando la prueba F del análisis de varianza sea o no significativa, las Pruebas post
hoc (posterior al análisis de varianza), Duncan o Tukey se podrán aplicar para las
comparaciones múltiples de promedios de los tratamientos. Estas pruebas se evaluaran
más adelante.

2. Diseño completamente al azar con más de una observación por unidad experimental

2.1. Diseño completo al azar con sub-muestra con igual número de repeticiones e
igual número de unidades en la muestra

Cuando se tiene en cada unidad experimental varias observaciones. Un DCA con sub-
muestreo e igual número de subunidades por unidad experimental (u.e), puede ser usado
cuando se demandan unidades experimentales muy grandes debido a ello es posible dividirlas
en subunidades y ser estudiadas a partir de muestras pequeñas. También puede ser usado
cuando se presentan experimentos donde es muy tedioso tomar toda la unidad experimental,
siendo por esto, necesario sacar subunidades de cada unidad. Se debe tener claro que en éste
tipo de diseños existen dos tipos de análisis: Uno referente a las unidades y el otro referente

35
Elías Alberto Torres Armas, Lic. Ms. C.

a las subunidades, generando dos fuentes de variabilidad que contribuyen a formar la


varianza para las comparaciones entre los promedios de los tratamientos, estas son: La
variabilidad entre los tratamientos de la misma unidad experimental. El cuadrado medio de
esta variabilidad se denomina error de muestreo. La variabilidad entre las unidades
experimentales de un mismo tratamiento. El cuadrado medio de esta variabilidad se
denomina error experimental.

El modelo lineal aditivo.

Yijk     i   ij  ijk
i  1,2,3,..., t j  1,2,3,..., r k  1,2,3,..., s
Yijk : Observación de la variable respuesta asociado a la k-ésimo sub-unidad experimental, j-
esimo unidad experimental del i-ésimo tratamiento
 i : Efecto del i-ésimo tratamiento
 ij : Efecto de error experimental. Asociado a las unidades experimentales, j-ésimo unidad
experimental del i-ésimo tratamiento
ijk : Efecto del k-ésimo sub-unidad experimental j-esimo unidad experimental del i-ésimo
tratamiento.

Hipótesis

Ho: t1 = t2 = t3 =... = tt
Ha: t1  t2  t3  ... tt para i = 1, 2,3,................, t tratamientos

Nivel de significación: 

Análisis de varianza (ANVA)

Tabla 3.6. Análisis de varianza para un diseño completamente al azar


con sub-muestreo e igual número de repeticiones e igual número de
unidades en la muestra
Suma de Grados de Cuadrados
Fuente de variación cuadrados libertad medios Fc
Tratamiento Tyy t-1 T T/E
Error experimental Eyy t(r-1) E E/S
Error de sub-muestreo Syy tr(s-1) S
Total Wyy trs-1 W

Decisión.

Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar.

Conclusión.

El análisis de varianza reporta existencia o no de diferencias entre los tratamientos después


de separar el error del sub-muestreo.
Cálculo de la suma de cuadrados

36
Métodos Estadísticos para la Investigación experimental

Y 2
i ..
Y...2
Suma de cuadrados de tratamientos Tyy  i

rs rst
Y 2
ij . Y 2
i ..
Suma de cuadrados del error experimental E yy  i j
 i
s rs
 Y 2
ij .
Suma de cuadrados de sub-muestreo S yy   Y  2
ijk
i j

i j k s
Y...2
Suma de cuadrados del total Wyy  Yijk2 
i j k rst
Ejemplo:

El cuadro siguiente muestra el análisis químico de tres variedades de pastos, donde se evaluó
el contenido de Mg en ppm, se tomó lecturas en duplicado para cada unidad experimental.
Realizar el análisis de varianza y ver si existe diferencia estadística entre las concentraciones
de Mg de los pastos en estudio.

Tabla 3.7. Contenido de Mg en


ppm en el tres variedades de
pasto
Repetición A B C
1 3.3 5.0 8.0
2 3.5 3.9 8.1
1 Sub total 6.8 8.9 16.1
1 3.5 4.4 7.9
2 3.6 4.6 8.0
2 Sub total 7.1 9.0 15.9
1 4.1 3.8 7.0
2 3.7 5.1 7.4
3 Sub total 7.8 8.9 14.4
1 3.9 4.7 7.8
2 3.8 4.2 7.0
4 Sub total 7.7 8.9 14.8
Total 29.40 35.70 61.20 126.30
Hipótesis
Ho: t1 = t2 = t3 =... = tt
Ha: t1  t2  t3  ... tt para i = 1, 2,3,................, t tratamientos

Nivel de significación:  =0.05

Suma de cuadrados de tratamientos


i Yi..2 Y...2 29.402  35.702  61.202 126.302
Tyy      70.88
rs rst 4(2) 4(2)(3)

Suma de cuadrados del error experimental


Y 2
ij . Y 2
i ..
6.82  8.92  16.12    14.82 29.402  35.702  61.202
E yy  i j
 i
   1.38
s rs 2 4(2)

37
Elías Alberto Torres Armas, Lic. Ms. C.

Suma de cuadrados de sub-muestreo


 Y 2
ij .
6.82  8.9 2  16.12    14.82
S yy   Yijk2   3.32  5.0 2  8.0 2    7.0 2   2.12
i j

i j k s 2
Suma de cuadrados del total
Y2 126.302
Wyy  Yijk2  ...  3.32  5.02  8.02    7.02   74.38
i j k rst 4(2)(3)

Análisis de varianza (ANVA)

Tabla 3.8. Análisis de varianza para un diseño completamente al azar con


sub-muestreo e igual número de repeticiones e igual número de unidades en
la muestra
Suma de Grados de Cuadrados
Fuente de variación cuadrados libertad medios Fc
Tratamiento Tyy=70.88 t-1=2 T=35.44 T/E=231.35
Error experimental Eyy=1.38 t(r-1)=9 E=0.15 E/S=0.869
Error de sub-muestreo Syy=2.12 tr(s-1)=12 S=0.18
Total Wyy=23 trs-1=23

Decisión.

Para la hipótesis de tratamientos: Rechazar H o: si Fc > F(gl tratamient o , glerrorexperimental ) de lo contrario


aceptar. Fc=231.35>F(2,9)0.05=4.26 rechazamos Ho (F(2,9)0.01=8.02)

Conclusión.

Se concluye de que existe diferencia altamente significativa entre el contenido de Mg en los


pastos evaluados después de separar el efecto de la sub-muestra.

2.2. Diseño completo al azar con sub-muestra con diferente número de repeticiones
e igual número de unidades en la muestra

Modelo lineal aditivo

Yijk     i   ij  ijk
Donde : i  1,2,3,..., t j  1,2,3,..., ni k  1,2,3,..., nij

Yijk : Una observación cualquiera


 : Efecto de la media
 i : Efecto del i  ésimo tratamient o
 ij : Error exp erimental
ijk : Error de muestreo

La adición de sub-muestreo al programa experimental tendrá un efecto en el análisis


eventual, cuya distribución podría mostrarse como los esquemas que se muestran en las
siguientes tablas:

38
Métodos Estadísticos para la Investigación experimental

Tabla 3.9. Esquema para el registro de datos de un experimento con Diseño completo al
azar con sub-muestra con diferente número de repeticiones e igual número de unidades
en la muestra
TRATAMIENTO
Observación T1 Ti Tt
Y111 Yi11 Y1t1
Y112 Yi12 Y1t2
1 Y11. Yi1. Y1t.
Y121 Yi21 Y1t1
Y122 Yi22 Y1t2
2 Y12. Yi2. Y1t.
Y131 Yi31 Y1t1
Y132 Yi32 Y1t2
3 Y13. Yi3. Y1t.
. . .
. . Y ijk .
. . . .
.
Y1j. Yij. .
. . .
. . .
. . .
R . . .
TOTAL Y1.. Yi.. . Y…
Número de repeticiones n1.. ni.. . n
Número de unidades de sub-muestra n12. nij. .

ni..: Número de repeticiones del tratamiento i


nij.: Número de unidades de la muestra del tratamiento i, repetición j

Otra forma de presentar la matriz de datos:

Tabla 3.10. Esquema para el registro de datos de un experimento con Diseño completo al azar
con sub-muestra con diferente número de repeticiones e igual número de unidades en la
muestra
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
(i) (j) muestra (k) i ..

1 1 …
2 …
3 …
4 …
2 1 …
2 …
3 …
3 1 …
2 …
. . …
. . …
. . …
Y…= Y 
...

Supuestos del modelo:

Adicionalmente a la linealidad, independencia, aditividad, normalidad, e igualdad de varianzas;


se deberá cumplir también los siguientes supuestos:

39
Elías Alberto Torres Armas, Lic. Ms. C.

 : Es una constante
 ij :
Están normalmente distribuidas con media cero y desviación estándar 
 ijk : 
Están normalmente distribuidas con media cero y desviación estándar 

Hipótesis

H o : i  0 (i  1,..., t ) T1 = T2 = T3 =... = Tt
H a : i  0 T1  T2  T3  ... Tt para i=1, 2, 3, ..., t tratamientos

Nivel de significación. 

Análisis de varianza (ANVA)

Tabla 3.11. Análisis de varianza para un experimento con Diseño completo


al azar con sub-muestra con diferente número de repeticiones e igual número
de unidades en la muestra
Suma de Cuadrados
Fuente de variación cuadrados Grados de libertad medios Fc
Tratamiento Tyy t-1 T T/E
t

Error Eyy
 (n
i 1
i  1)
E E/S
t ni

  (n ij  1)
Error de sub-muestreo Syy i 1 j 1 S
Total Wyy n-1 W

Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar

Conclusión.

El análisis de varianza reporta existencia o no de diferencias entre los tratamientos después


de separar el error del sub-muestreo.

Cálculo de la suma de cuadrados


Y 2
i ..
Y...2
Suma de cuadrados de tratamientos Tyy  i

ni.. n
Y 2
ij . Y 2
i ..
Suma de cuadrados del error experimental E yy  
i j i

nij . ni..
 Y 2
ij .
Suma de cuadrados de sub-muestreo S yy   Yijk2 
i j

i j k nij .

40
Métodos Estadísticos para la Investigación experimental

Y...2
Suma de cuadrados del total Wyy    Yijk2 
i j k n
t
n   ni..
i 1

Ejemplo:

En el cuadro siguiente, se muestra el análisis químico de 3 variedades de pastos, donde se


evaluó el contenido de Mg en ppm, se tomó lecturas en duplicado para cada unidad
experimental. Hallar el ANVA y ver si existe diferencia estadística entre las concentraciones
de Mg de los pastos de en estudio.

Tabla 3.12. Contenido de Mg en ppm en tres variedades de pasto


Pastos (i)
Parcelas (j) Sub muestra (k) T1 T2 T3
1 3,3 5,0 8,0
1 2 3,5 3,9 8,1
Subtotal 6,8 8,9 16,1
1 3,5 4,4 7,9
2 3,6 4,6 8,0
2 Subtotal 7,1 9,0 15,9
1 4,1 3,8
2 3,7 5,1
3 Subtotal 7,8 8,9
1 3,9
4 2 3,8
Subtotal 7,7
TOTAL 29,40 26,80 32,00 88,20
Número de repeticiones ni.. 8 6 4 18
Número de unidades de sub-muestra 2 2 2

Modelo lineal aditivo

Yijk     i   ij   ijk
Donde :
i  3 tratamient os j  4, 3, 2 (ni ) repeticion es por tratamient o
k  2 unidades de la muestra

Yijk : Contenido de Mg en ppm en la i-ésima variedad de pasto j-ésima repetición y k-ésima


unidad del sub-muestreo.
 : Efecto de la media
 i : Efecto del i-ésima variedad de pasto
 ijk : Error experimental del contenido de Mg en ppm en la i-ésima variedad de pasto j-ésima
repetición y k-ésima unidad del sub-muestreo.
ijk : Error de sub-muestreo
Hipótesis
41
Elías Alberto Torres Armas, Lic. Ms. C.

Ho:  i  0 (i  1,..., t ) T1 = T 2 = T3
Ha:  i  0 T1  T2  T3 para i=1, 2, 3 tratamientos t=3
Nivel de significación:   0,05
t

 (n
i 1
i  1) =(4-1)+(3-1)+(2-1)=6 n1=4, n2=3, n3=2
t ni

 (n
i 1 j 1
ij  1) = (2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+(2-1)+ (2-1)=9

nij=2 para todo i, j


t
n   ni.. =8+6+4=18 n1..=8 n2..=6 n3..=4
i 1

Suma de cuadrados de tratamientos


Y 2
i ..
Y...2 (29,40) 2 (26,80) 2 (32,00) 2 (88,20) 2
Tyy  i
      483,76  432,18  51,58
ni.. n 8 6 4 18
Suma de cuadrados del error experimento
 Y 2
ij . Y 2
i ..
(6,8) 2  (7,1) 2  (7,8) 2  (7,7) 2  (8,9) 2  (9,0) 2  (8,9) 2  (16,1) 2  (15,9) 2
E yy  i j
 i
  483,76
ni j . ni.. 2
 484,41  483,76  0,35

Suma de cuadrados del error de sub-muestreo


 Y 2
ij .

S yy   Yijk2  i j
 (3,3) 2  (3,5) 2  (3,5) 2  (3,6) 2  (4,1) 2  ...  (8,0) 2  484,41
i j k ni j .
 485,70  484,41  1,59

Suma de cuadrados del total


Y2
Wyy   Yijk2  ...  (3,3)2  (3,5)2  (3,5)2  (3,6)2  (4,1)2  ...  (8,0)2  432,18  53,52
i j k n
Análisis de varianza (ANVA)

Tabla 3.12. Contenido de Mg en ppm en tres variedades de pasto


Suma de Grados de Cuadrados
Fuente de variación cuadrados libertad medios Fc
Tratamiento 51,58 2 25,79 429,38
Error experimental 0,35 6 0,06 E/S
Error de sub muestreo 1,59 9 0,18
Total 53,52 17

Decisión.

Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=429,38> F(2;6)0,05 = 5,14
Conclusión.

42
Métodos Estadísticos para la Investigación experimental

Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
tratamiento después de separar el efecto de la sub-muestra.
2.3. Diseño completo al azar con sub-muestra con diferente número de repeticiones y
diferente número de unidades en la muestra

Modelo lineal aditivo

Yijk     i   ij  ijk Donde : i  1,2,3,..., t j  1,2,3,..., ni k  1,2,3,..., nij


Yijk : Una observación cualquiera
 : Efecto de la media
 i : Efecto del i  ésimo tratamient o
 ij : Error exp erimental
ijk : Error de muestreo
Supuestos.
Adicionalmente a la linealidad, independencia, aditividad, normalidad, e igualdad de varianzas;
se deberá cumplir también los siguientes supuestos:
 : Es una constante
 ij : Están normalmente distribuidas con media cero y desviación estándar 
 ijk : Están normalmente distribuidas con media cero y desviación estándar  

Hipótesis
H o : i  0 (i  1,..., t ) T1 = T2 = T3 =... = Tt
H a : i  0 T1  T2  T3  ... Tt para i=1, 2, 3, ..., t tratamientos
Nivel de significación. 

Análisis de varianza (ANVA)

Tabla 3.13. Análisis de varianza para un experimento con Diseño completo


al azar con sub-muestra con diferente número de repeticiones y diferente
número de unidades en la muestra
Suma de Cuadrados
Fuente de variación cuadrados Grados de libertad medios Fc
Tratamiento Tyy t-1 T T/E
t

Error Eyy
 (n
i 1
i  1)
E E/S
t ni

  (n ij  1)
Error de sub-muestreo Syy i 1 j 1 S
Total Wyy n-1 W

Decisión.
F(gl tratamient o , glerror )
Para la hipótesis de tratamientos: Rechazar Ho: si Fc > de lo contrario
aceptar

Conclusión.

43
Elías Alberto Torres Armas, Lic. Ms. C.

El análisis de varianza reporta existencia o no de diferencias entre los tratamientos después


de separar el error del sub-muestreo.

Cálculo de la suma de cuadrados


Y 2
i ..
Y...2
Suma de cuadrados de tratamientos Tyy  i

ni.. n
Y 2
ij . Y 2
i ..
Suma de cuadrados del error experimental E yy  
i j i

nij . ni..
 Y 2
ij .
Suma de cuadrados de sub-muestreo S yy   Yijk2 
i j

i j k nij .
Y...2
Suma de cuadrados del total Wyy    Yijk2 
i j k n
t
n   ni..
i 1

Ejemplo:

Un experimento compara la capacidad de dos microorganismos para efectuar la conversión


fermentativa del azúcar a ácido láctico. Una cantidad de substrato es preparada y dividida en
dos porciones desiguales, cada porción es dividida en un número de subporciones de 100ml.
(unidades experimentales) y cada una de éstas unidades es inoculada con uno u otro de los
dos microorganismos. La fermentación se deja proceder por 24 horas y después cada unidad
experimental es examinada respecto a la cantidad de azúcar residual, expresada en mg por
5cc., para determinar la cantidad de cambio producida por cada microorganismo, el azúcar
previamente presentado será convertido y aparece como ácido láctico. Posteriormente, se
registran varios números de mediciones hechas en cada muestra (Ostle, 1986 pp. 326). Los
resultados están en la siguiente tabla:

Tabla 3.14. Cantidad de azúcar no convertida en el substrato que sigue a una fermentación de 24
horas debida a dos diferentes microorganismos
Tratamiento Repeticiones Observaciones de la Yij. nij. Yi.. ni.. Y
i ..
(i) (j) muestra (k)
1 1 5,6 5,7 11,3 2
2 5,0 5,0 5,1 15,1 3
3 5,4 5,4 5,4 5,5 5,4 27,1 5
4 5,3 5,5 10,8 2 64,3 4
2 1 7,6 7,6 7,8 23,0 3
2 7,4 7,0 7,2 21,6 3
3 7,5 7,6 7,5 7,4 30,0 4 74,6 3
Y…=138,9 Y  ...

Modelo lineal aditivo

Yijk     i   ij  ijk

44
Métodos Estadísticos para la Investigación experimental

Yijk : Cantidad de azúcar no convertida con el i-ésima microorganismo, j-ésima repetición


(unidad experimental) y k-ésima unidad del sub-muestreo.
 : Efecto de la media
 i : Efecto del i-ésima microorganismo
 ijk : Error experimental de la cantidad de azúcar no convertida con el i-ésima
microorganismo, j-ésima repetición (unidad experimental) y k-ésima unidad del sub-
muestreo.
ijk : Error de sub-muestreo

Hipótesis

Ho:  i  0 (i  1,..., t ) T1 = T 2
Ha:  i  0 T1  T2 para i=1, 2 tratamientos t=2

Nivel de significación:   0,05

t
t=2r=7 m=22  (n
i 1
i  1) =(4-1)+(3-1)=5 n1=4, n2=3

t ni

  (n
i 1 j 1
ij  1) = (2-1)+(3-1)+(5-1)+(2-1)+(3-1)+(3-1)+(4-1)=15
t
nij=2 para todo i,j n   ni.. =4+3=18 n1..=4 n2..=3
i 1

Suma de cuadrados de tratamientos

Y 2
i ..
Y...2 (64,3) 2 (74,6) 2 (138,9) 2
Tyy  i
ni
     901,0568  876,9641  24,0927
n 12 10 22
n
j 1
i ..

Suma de cuadrados del error experimental

 Y 2
ij . Y 2
i ..
(11,3) 2 (15,1) 2 (27,1) 2 (10,8) 2 (23,0) 2 (21,6) 2 (30,0) 2
E yy  i j
 i
ni
        901,0568
ni j . 2 3 5 2 3 3 4
n
j 1
i ..

 901,9036  901,0568  0,8568

Suma de cuadrados de error de sub-muestreo


Y...2
S yy   Yijk2  Tyy  Eyy   24,0927  0,8468  876,9641  0,1664
i j k n

Suma de cuadrados del total

Y...2
Wyy   Yijk2   (5,6) 2  (5,7) 2  (5,0) 2  (5,0) 2  (5,1) 2  ...  (7,4) 2  876,9641
i j k n
 902,07  876,9641  25,0059

45
Elías Alberto Torres Armas, Lic. Ms. C.

Análisis de varianza (ANVA)

Tabla 3.15. Análisis de varianza de la cantidad de azúcar no convertida en el


substrato que sigue a una fermentación de 24 horas debida a dos diferentes
microorganismos
Suma de Grados de Cuadrados
Fuente de variación cuadrados libertad medios Fc
Tratamiento 24,0927 1 24,0927 142,22
Error experimental 0,8468 5 0,1694
Error de sub-muestreo 0,1664 15 0,0111
Total 25,0059 21

Decisión.

Para la hipótesis de tratamientos: Rechazar Ho: si Fc > F(gl tratamient o , glerror ) de lo contrario
aceptar. Rechazar H0 porque Fc=142,22>F(1;5)0,05 =6.61

Conclusión.

Por lo menos existe una diferencia significativa entre dos promedios atribuibles al efecto del
microorganismo.

2.4. Ejercicios y aplicaciones

2.4.1. Los datos que se presentan a continuación corresponden al tiempo de coagulación


(en segundos) de sangre extraída a 24 animales, asignados aleatoriamente a 4 dietas
diferentes, resultado de un experimento llevado en un diseño completamente al azar.

Repeticiones Dieta Total


A B C D
62 63 68 55
60 67 66 63
63 71 72 60
59 64 67 61

Describir el modelo lineal aditivo del diseño en términos del enunciado.. Indique los
principios básicos del modelo. Realice el Análisis de Variancia y de sus conclusiones
a un nivel de significación del 5%

2.4.2. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A. Los resultados del incremento de peso (en Kg.)
al final del experimento se presentan a continuación:
Observaciones. RACIONES (i)
(j) R1 R2 R3
1 4.228 4.529 4.994
2 4.330 4.956 4.373
3 3.791 4.160 5.642
4 4.008 4.650 5.124
5 3.910 3.891 4.562

46
Métodos Estadísticos para la Investigación experimental

Presente el Modelo Aditivo Lineal y explique sus componentes de acuerdo al


enunciado del problema. Realice el Análisis de Variancia a un nivel de significación
del 5%

2.4.3. Continuación aparece un fragmento de la libreta de apuntes de datos primarios de


un investigador. Él planeó un experimento para lograr un peso final de trucha
ahumada evaluado a 4horas de tiempo ahumado, 14 horas de tiempo salado y 1 hora
de desalado.
TRATAMIENTOS DESCRIPCION
T1 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 60°C + 5% SAL
T2 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 60°C + 5% SAL
T3 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 70°C + 5% SAL
T4 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 70°C + 5% SAL
T5 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 60°C + 7.5% SAL
T6 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 60°C + 7.5% SAL
T7 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 70°C + 7.5% SAL
T8 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 70°C + 7.5% SAL
T9 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 60°C + 10% SAL
T10 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 60°C + 10% SAL
T11 50 GR. DE AJO + 5 GR. DE AJIPANCA + 3 GR. DE PIMIENTA + 5 ml VINAGRE A 70°C + 10% SAL
T12 20 GR. DE COMINO + 5 GR. DE AJINOMOTO + 5GR. DE SAZONADOR + 10 ml VINAGRE A 70°C + 10% SAL

Repetición T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12


1 126 115 128 121 61.5 59.9 65.4 126 121 127 130 124
2 116 113 119 118 53.4 52.6 59.9 117 112 111 126 118
3 112 98 107 110 58.4 62.1 60.4 106 91 92 101 102
4 90 84 93 94 60.2 63.4 62.7 88 76 79 89 95

Describa el modelo del diseño utilizado en términos del experimento. Indique el


factor y sus niveles. Qué y cuántas unidades experimentales utilizó?. ¿Cuál es la
variable dependiente?. ¿Cuál es la secuencia del análisis de los datos que usted recomendaría al
investigador?

2.4.4. Se uso 5 tratamientos diferentes para la elaboración de vino en la Agroindustria


FOOD R&R estos tratamientos son de acuerdo a las temperaturas dadas en la
pasteurización y de todas las muestras se obtuvo los siguientes datos de la
variación de las densidades. resultado de un experimento llevado en un diseño
completamente al azar. Al 1% de significación cuál es la conclusión del ANVA

A B C D E
60 ºC 65 º C 70 º C 75 ºC 78 ºC
TOTAL 9,243 9,177 9,190 9,076 7,880
PROMEDIO 1,027 1,020 1,021 1,008 0,876
REPETICION 9 9 9 9 9

ANVA

F.V GL SC CM FC
Tratamientos 4 0,150 0,037 0,00371
Error 40 403,580 10,090
Total 44 403,730

2.4.5. En un experimento de riegos en el cultivo de algodón se tuvieron los siguientes


tratamientos que están expresados en metros cúbicos de agua absorbidos por
hectárea: T1=5400, T2=4800, T3=4200, T4=4000 El experimento se condujo en
parcelas de 300 m2 de área útil y los resultados están expresados en kilogramos.

47
Elías Alberto Torres Armas, Lic. Ms. C.

Indique el nombre del diseño utilizado y presente el modelo lineal aditivo y su


interpretación de sus componentes en términos del problema. Efectúe el análisis de
varianza. Los datos se dan a continuación:

Metros cúbicos de agua


Repeticiones T1 T2 T3 T4
1 68 53 73 85
2 86 62 90 75
3 68 46 71 60
4 68 48 70 50
5 69 50 75 40

2.4.6. Los datos que se presentan a continuación corresponden al tiempo de coagulación


(en segundos) de sangre extraída a 20 animales, asignados aleatoriamente a cuatro
dietas diferentes

DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
Total 244 330 340 366 1280
Promedio 61 66 68 61 64
Repeticiones 4 5 5 6 20

Indique el nombre del diseño utilizado y presente el modelo lineal aditivo y su


interpretación de sus componentes en términos del problema. Efectúe el análisis de
varianza

2.4.7. Los datos que se presentan a continuación corresponden al tiempo de coagulación


(en segundos) de sangre extraída a 16 animales, asignados aleatoriamente a cuatro
dietas diferentes

DIETA
Observaciones
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
Total 244 265 272 239 1020
Promedio 61 66.25 68 59.75 63.75
Desviación estándar 1.8257 3.5940 2.1602 2.6300
Repeticiones 4 4 4 4 16

48
Métodos Estadísticos para la Investigación experimental

Indique el nombre del diseño utilizado y presente el modelo lineal aditivo y su


interpretación de sus componentes en términos del problema. Efectúe el análisis de
varianza

2.4.8. Se realizó un experimento en cerdos, donde se probaron tres tratamientos con


diferentes niveles de energía en la etapa de acabado, evaluándose los pesos finales.
El experimento terminó con diferente número de repeticiones y diferente número
de muestras dentro de cada repetición. Los datos se dan a continuación:

Tabla 3.16. Peso final de los cerdos a tres tratamientos con diferentes niveles de energía
Tratamiento (i) Repetición (j) Muestras (k) Yij. nij. Yi.. ni..
A 1 70 90 160 2 600 8
2 60 90 90 240 3
3 50 60 90 200 3
B 4 100 120 220 2 430 5
5 80 70 60 210 3
C 6 50 40 50 140 3 240 5
7 50 50 100 2

Probar con el análisis de varianza, si existe diferencia estadística entre los


tratamientos.

2.4.9. En un experimento, un Agrónomo desea evaluar 4 tipos de fertilizantes para ello


disponía de 18 parcelas homogéneas. Cada fertilizante se le asigna aleatoriamente a
las parcelas. Debido al poco tiempo que se disponía, se tomaron dos partes al azar
de cada parcela experimental y se evaluó el rendimiento de Cebada Trebi, de cada
una de las 32 partes. Los datos se registraron en la siguiente tabla:

Tabla 3.17. Rendimiento de la Cebada Trebi a cuatro fertilizantes diferentes


Fertilizante
Parcelas 1 2 3 4
1 57 67 95 102
46 72 90 88
2 26 44 92 96
38 68 89 89
3 39 57 91 102
39 61 82 93
4 23 74 105 103
36 47 85 90

49
CAPITULO IV

Pruebas estadísticas para comparar medias de tratamientos


“comparaciones múltiples”

El rechazo de la hipótesis nula (H0) en la tabla del análisis de varianza (ANVA) del diseño, nos
indica que existe diferencia significativa (o altamente significativa) entre los tratamientos en
estudio, sin embargo no nos informa en qué tratamiento se da la mayor diferencia y en última
instancia cuál es el tratamiento óptimo en función de la naturaleza del problema (máx. ó min.).
En muchos experimentos entonces, en el planteamiento existirá específicamente el interés en
determinar los mejores tratamientos o en el tratamiento óptimo. Para solucionar el problema se
utiliza los métodos de comparaciones múltiples, entre los cuales tenemos: Prueba t-Student,
Prueba de la diferencia límite significativa, Prueba Duncan, Prueba Tukey, Prueba SHEFFE,
Prueba Dunnet, Entre otras como las de contrastes ortogonales, Bonferroni, Neuman Keuls, etc.
Estas pruebas se realizan posterior al análisis de varianza (ANVA).

1. Prueba t-student

Se usa para comparar dos medias poblacionales, para su análisis se debe tener en cuenta las
siguientes restricciones:
a. Las comparaciones a estudiar deberán ser seleccionadas antes de cualquier análisis de datos.
b. La prueba F del ANVA debe ser SIGNIFICATIVA
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj H0: µi=µj H0: µi=µj
H0: µi≠µj H0: µi>µj H0: µi<µj
2. Nivel se significación: α
3. Estadística de prueba
( xi  x j )  (  i   j )
tc   t ( g lerro r )
s xi  x j
Donde :
1 1
s xi  x j  CME (  ) si ri  r j
ri rj
2CME
s xi  x j  si ri  r j
r
DLS  ( s xi  x j )(t ( g lerro r ) )
4. Región crítica
5. Decisión: Rechazar H0 si tc cae en región de rechazo ó
Rechazar Ho si:
xi  x j  DLS, Dos colas
xi  x j  DLS, Una cola derecha
xi  x j  DLS, Una cola izquierda
6. Conclusión.
Métodos Estadísticos para la Investigación experimental

2. Diferencia límite significativa (DLS)

Llamada también DIFERENCIA MÍNIMA SIGNIFICATICA (DMS) se usa en forma estricta


cuando: Hay comparaciones planeadas antes de realizar el experimento. Fc se presenta
significativa en el ANVA
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj H0: µi=µj H0: µi=µj
H0: µi≠µj H0: µi>µj H0: µi<µj
2. Nivel se significación: α
3. Estadística de prueba
MDS  DLS  ( s xi  x j )t ( g lerro r )
Donde :
1 1
s xi  x j  CME (  ) si ri  r j
ri rj
2CME
s xi  x j  si ri  r j
r
4. Decisión:
Para dos colas
Si | xi  x j |≥DLS, entonces rechazar H0
Si | x i  x j |<DLS, entonces aceptar H0
Para una cola derecha
Si xi  x j ≥DLS, entonces rechazar H0
Si x i  x j <DLS, entonces aceptar H0
Para una cola izquierda
Si xi  x j ≤DLS, entonces rechazar H0
Si x i  x j >DLS, entonces aceptar H0
5. Conclusión.

EJERCICIO: Se desea antes de realizar el experimento, planear la comparación entre las dietas
alimenticias 3 y 5 para aumento de peso en pollos a los 28 días de edad; se piensa que la dieta 5
genera mayores pesos que la dieta 3: Los datos son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4

CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132

51
Elías Alberto Torres Armas, Lic. Ms. C.

3. Prueba Duncan

Se llama también t-Student modificada, se realiza posterior al ANVA; se usa para efectuar
comparaciones múltiples entre dos medias de tratamientos del experimento. Con t tratamientos
se realiza t(t-1)/2 comparaciones posibles de promedios de tratamientos. La prueba de igualdad
de tratamientos (F en el ANVA) puede ser o no significativa. Cuando el número de repeticiones
es igual en los tratamientos, los cálculos son más precisos que cuando se tiene diferente número
de repeticiones por tratamiento. Tiene el inconveniente cuando se tiene un alto número de
tratamientos el nivel de significación α remodifica en función a ellos.
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación: α
3. Estadística de prueba
 Ordenar los promedios de tratamientos de menor a mayor o viceversa
 Del ANVA tomamos CME y us grados de libertad aun cuando la H0 haya sido
aceptada, y calculamos:
CME 1 1
s xi  x j  (  ) si ri  r j
2 ri rj
CME
s xi  x j  si ri  r j
r
 De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para α dado para 5% y 1% con grados de libertad del error y para
2,3,4,…,t tratamientos (t-1) rangos
 Calculamos ahora: ALS D  AES D (s xi  x j )
4. Decisión:
xi  x j
Si | |≤ALSD, entonces aceptar H0
x x
Si | i j |≥ALSD, entonces rechazar H0
5. Comparaciones y significación
Comparaciones x x p ALSD Decisión Sig
H0 d=| i j |

6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.

EJERCICIO: De un experimento en DCA se obtuvo los siguientes resultados:

Tratamientos A B C D
Promedios 71.5 85 76 62
r=6 t=4 CME=103.075 g.lERROR=6.4-4=20
Realizar la prueba Duncan para todas las comparaciones posibles.

52
Métodos Estadísticos para la Investigación experimental

1. Hipótesis
H0: µi=µj
H0: µi≠µj
2. Nivel se significación: α=1%, ó 5%
3. Estadística de prueba
 Ordenar los promedios de tratamientos de menor a mayor o viceversa
Tratamientos B C A D
Promedios 85 76 71.5 62
 Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
aceptada.
CME=103.075 g.lERROR=6.4-4=20
 Calculamos:
CME 1 1
s xi  x j  (  ) si ri  r j
2 ri r j
CME 103.075
s xi  x j  si ri  r j  s xi  x j   4.14
r 6
 De la tabla Duncan obtenemos los AESD (amplitud estudentizado significativa de
Duncan), rangos para α dado para 5% y 1% con grados de libertad del error y para
2,3,4,…,t tratamientos (t-1) rangos
t 2 3 4
AESD 2.95 3.10 3.18
 Calculamos ahora: ALS D  AES D (s xi  x j )  AES D (4.14)
t 2 3 4
AESD 2.95 3.10 3.18
ALSD 12.227 12.849 13.180
x x xi  x j
4. Decisión: Si | i j |≤ALSD, entonces aceptar H0. Si | |≥ALSD, entonces
rechazar H0
5. Comparaciones y significación
Comparaciones x x P ALSD Decisión Sig
H0 d=| i j |
ns
µB=µC 85 – 76 =9 2 12.227 Acepta
µB=µA 85 - 71.5 =13.5 3 12.849 Rechaza *
µB=µD 85 – 62 =23 4 13.180 Rechaza *
µC=µA 76 - 71.5 =4.5 2 12.227 Acepta o
µC=µD 76 – 62 =14 3 12.849 Rechaza *
µA=µD 71.5 – 62 =9.5 2 12.227 Acepta O
6. Representación de los resultados: (grupos homogéneos)
 Por segmentos de recta
Tratamientos B C A D

 Literal. Tratamientos grupos homogéneos.


B a
C ab
A bc
D c

53
Elías Alberto Torres Armas, Lic. Ms. C.

 Cuadro de doble entrada


B C A D
B 9 13.5 * 23 *
C 4.5 14 *
A 9
D
 Tratamientos grupos homogéneos.
B X
C XX
A XX
D X
7. Conclusión. Se distinguen tres grupos de tratamientos con resultados similares. Un primer
grupo B con C con valores mayores, un segundo grupo C con A con valores intermedios
y un tercer grupo A con D con valores menores. Se recomienda el tratamiento B por
ocasionar mayor rendimiento en la variable respuesta, también podría recomendarse en
tratamiento C.

4. Prueba de Tukey

Es menos rigurosa que al prueba Duncan por tal motivo el nivel de significación debe ser más
amplio y las comparaciones que realmente son significativas, ésta prueba las podría declarar no
significativas. El nivel de significación α se mantiene constante. F calculado en el ANVA puede
ser significativa o no. Es más precisa cuando los tratamientos tienen igual número de
repeticiones. No es necesario ordenar los promedios de tratamientos, sin embargo ello es muy
usual en la práctica. Utiliza un solo valor tabular para calcular la ALST (amplitud limite
significativa de Tukey)
PROCEDIMIENTO:
 Información básica: Promedios de los tratamientos y el cuadro ANVA del diseño.
PROCEDIMIENTO:
1. Hipótesis
H0: µi=µj i  j
H0: µi≠µj
2. Nivel se significación: α
3. Estadística de prueba
 Ordenar los promedios de tratamientos de menor a mayor o viceversa
 Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada. Calculamos:
CME 1 1
s xi  x j  (  ) si ri  r j
2 ri rj
CME
s xi  x j  si ri  r j
r
 De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de
significación α dado para 5% y 1%, con grados de libertad del error y para un solo
valor de p (p: número de tratamientos propuestos en el experimento)
 Calculamos ahora: ALST  AES T (s xi  x j ) . Cuando se tiene diferente número de
repeticiones por tratamiento se genera varios valores ALS T.

54
Métodos Estadísticos para la Investigación experimental

x x x x
4. Decisión: Si | i j |≤ALST, entonces aceptar H0. Si | i j |≥ALST, entonces rechazar
H0
5. Comparaciones y significación
Comparaciones xi  x j ALST Decisión Sig
H0 d=| |

6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.

EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Tukey para comparaciones múltiples; se tiene los datos
son los siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4

CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28 dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132
SOLUCIÓN:
1. Hipótesis
H0: µi=µj i  j
H0: µi≠µj
2. Nivel se significación: α=5%
3. Estadística de prueba
 Ordenar los promedios de tratamientos de menor a mayor o viceversa
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T5 T3 T4
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
 Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada. Calculamos:
CME 1 1
s xi  x j  (  ) si ri  r j
2 ri r j
CME 0.000213
s xi  x j  si ri  r j  s xi  x j   0.0073
r 4
 De la tabla Tukey obtenemos los AEST (amplitud estudentizado significativa de
Tukey) y tambén se obtiene de la tabla de Student_Neuman-Keul, para un nivel de

55
Elías Alberto Torres Armas, Lic. Ms. C.

significación α dado para 5% y 1%, con grados de libertad del error y para un solo
valor de p (p: número de tratamientos propuestos en el experimento)
α =5%, grados de libertad del error = 15 p=5 tratamientos
AEST=4.37
 Calculamos ahora: ALST  AES T (s xi  x j )  (0.0073)(4.37)  0.0319
Cuando se tiene diferente número de repeticiones por tratamiento se genera varios
valores ALST.
x x x x
4. Decisión: Si | i j |≤ALST, entonces aceptar H0. Si | i j |≥ALST, entonces rechazar
H0
5. Comparaciones y significación
Comparaciones x x ALST Decisión Sig
H0 d=| i j |
µ1=µ2 0.017 < 0.0319 Acepta o
µ1=µ5 0.024 < 0.0319 Acepta o
µ1=µ3 0.032 > 0.0319 Rechaza *
µ1=µ4 0.067 > 0.0319 Rechaza *
µ2=µ5 0.007 < 0.0319 Acepta o
µ2=µ3 0.015 < 0.0319 Acepta o
µ2=µ4 0.05 > 0.0319 Rechaza *
µ5=µ3 0.008 < 0.0319 Acepta o
µ5=µ4 0.043 > 0.0319 Rechaza *
µ3=µ4 0.035 > 0.0319 Rechaza *
6. Representación de los resultados: (grupos homogéneos)
 Por segmentos de recta
Tratamientos T1 T2 T5 T3 T4

 Literal
Tratamientos grupos homogéneos.
T1 a
T2 ab
T5 abc
T3 bc
T4
 Cuadro de doble entrada
T1 T2 T5 T3 T4
T1 0.017 0.024 0.032* 0.067 *
T2 0.007 0.015 0.050 *
T5 0.008 0.043 *
T3 0.035 *
T4
 Tratamientos grupos homogéneos.
T1 X
T2 XX
T5 XXX
T3 XX
T4

56
Métodos Estadísticos para la Investigación experimental

7. Conclusión: En base a los resultados experimentales podemos decir que existen tres grupos
con resultados de diferencia de tratamientos similares (homogéneos). El grupo de los de
menor valor (el primero) de éste quien posee el menor rendimiento (más bajo) es el
tratamiento T1. El segundo grupo de mayor valor, de estos, el que posee rendimientos
medios superiores es el tratamiento T4. Por tanto se recomienda el tratamiento T4, puesto
que da un mayor incremento en el peso a los 28 días de edad en la alimentación de los pollos
para carne.

5. Prueba de Dunnett

Se usa cuando existe tratamiento testigo y se desea comparar éste testigo con los demás
tratamientos. La prueba F del ANVA debe ser significativa. Las comparaciones son planeadas
antes de realizar el experimento.

PROCEDIMIENTO:
1. Hipótesis
H0: µk=µj k  j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación: α
3. Estadística de prueba
 Del ANVA tomamos CME y sus grados de libertad aun cuando la H0 haya sido
aceptada.
 Calculamos:
1 1
s xk  x j  CME (  ) si rk  rj
rk rj
2CME
s xk  x j  si rk  rj
r
 De la tabla Dunnett obtenemos los t(DN), para un nivel de significación α dado para
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
tratamientos propuestos en el experimento sin incluir el tstigo o control)
 Calculamos ahora: ALS( DN )  (T( DN ) )(sxk  x j )
4. Decisión: Si | x k  x j |≤ALS(DN), entonces aceptar H0, Si | x k  x j |≥ALS(DN), entonces rechazar
H0
5. Comparaciones y significación
Comparaciones d=| x k  x j | ALS(DN) Decisión Sig
H0

6. Representación de los resultados: Por segmentos de recta, literal, cuadro de doble entrada,
por grupos homogéneos.
7. Conclusión.

57
Elías Alberto Torres Armas, Lic. Ms. C.

EJERCICIO: Se desea saber que tratamiento permite una mayor ganancia en el peso en pollos a
los 28 días de edad, mediante la prueba Dunnett para comparaciones múltiples usando el
tratamiento 1 como testigo; se tiene los datos siguientes:
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T3 T4 T5
Promedio 1.241 1.258 1.273 1.308 1.265
Repetición 4 4 4 4 4

CUADRO N° 2: ANVA para el aumento de peso del pollo a los 28


dias de edad
F.de V GL SC CM Fc Ftab Sig
Tratamientos 4 0.01 0.0025 11.74 4.77 **
Error 15 0.0032 0.000213
Total 19 0.0132

SOLUCIÓN:
1. Hipótesis
H0: µk=µj k  j
H0: µk≠µj k: es la ubicación del tratamiento testigo
2. Nivel se significación: α=5%
3. Estadística de prueba
 Ordenar los promedios de tratamientos de menor a mayor o viceversa
CUADRO N° 1: Promedio de 5 dietas alimenticias
Tratamientos T1 T2 T5 T3 T4
Promedio 1.241 1.258 1.265 1.273 1.308
Repetición 4 4 4 4 4
 Del ANVA tomamos CME y sus grados de libertad aún cuando la H 0 haya sido
aceptada.
 Calculamos:
1 1 1 1
s xk  x j  CME (  ) si rk  r j  s xk  x j  0.000213(  )  0.0103
rk r j 4 4
2CME
s xk  x j  si rk  r j
r
 De la tabla Dunnett obtenemos los t (DN), para un nivel de significación α dado para
5% y 1%, con grados de libertad del error y para un valor de p=t-1 (p: número de
tratamientos propuestos en el experimento sin incluir el testigo o control)
p=t-1=4 grados de libertad del error = 15 α =5% t(DN)=2.73
 Calculamos ahora: ALS ( DN )  (T( DN ) )(s xk  x j )  2.73(0.0103)  0.028119
4. Decisión:
Si | x  x |≤ALS(DN), entonces aceptar H0. Si | x  x |≥ALS(DN), entonces rechazar H0
k j k j

5. Comparaciones y significación
Comparaciones d=| x  x |
k j
ALST Decisión Sig
H0
µ1=µ2 1.258 – 1.241=0.017 < 0.0319 Acepta o
µ1=µ5 1.265 – 1.241=0.024 < 0.0319 Acepta o
µ1=µ3 1.273 – 1.241=0.032 > 0.0319 Rechaza *
µ1=µ4 1.308 – 1.241=0.067 > 0.0319 Rechaza *

58
Métodos Estadísticos para la Investigación experimental

6. Representación de los resultados: (grupos homogéneos)


 Por segmentos de recta
Tratamientos T1 T2 T5 T3 T4

 Literal

Tratamientos grupos homogéneos.


T1 a
T2 a
T5 a
T3
T4

 Cuadro de doble entrada


T1 T2 T5 T3 T4
T1 0.017 0.024 0.032* 0.067 *
T2
T5
T3
T4

 Tratamientos grupos homogéneos.


T1 X
T2 X
T5 X
T3
T4
7. Conclusión: Los tratamientos que actúan mejor en relación al testigo (T1) son los
tratamientos 3 y 4, mientras que los tratamientos 2 y 5 actúan en forma similar al testigo

6. Caso ilustrativo de análisis estadístico de un experimento en diseño completo al azar

Se llevó acabo un experimento para evaluar el efecto de 4 dietas alimenticias de concentrado con
diferentes dosis de maíz amarillo duro, en el incremento en peso de ganado porcino, utilizándose
para ello 20 camadas de cerdos de la misma raza, de la misma parición y del mismo día de
nacidos, obteniéndose los siguientes resultados:
B2 A1 C20 C15 D7 C9 B16 A11 B12 D3
D10 B19 A6 C14 D18 B4 A17 D5 A8 C13
A. 20%m.a.d. B. 30%m.a.d. C. 40%m.a.d. D. 50%m.a.d.
Realice el análisis estadístico pertinente y anuncie sus conclusiones para el investigador

Incremento en peso de ganado porcino


Dietas
Observaciones A B C D
1 1 2 20 10
2 6 19 15 7
3 17 4 14 18
4 11 16 9 5
5 8 12 13 3

59
Elías Alberto Torres Armas, Lic. Ms. C.

Gráfico interactivo: diagrama de cajas y bigotes


Incremento en peso de ganado porcino


20

15

10

1 2 3 4

Die ta alim enticia de concentr ado a difer entes dos is de maíz am ar illo duro

Por simple inspección se puede mencionar que no hay diferencia entre los niveles del factor, es
decir entre los distintos porcentajes de concentrado de maíz amarillo duro, aun cuando en las
dietas B y C se observen ganancias más altas. La dieta C se encuentra concentrado respecto a la
media, pero tiene valores anómalos, mediciones que afectan a la misma, así como la dieta D.

Experimento en Diseño Completamente aleatorizado


Variable respuesta: Incremento en peso de ganado porcino
Factor: Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro

Niveles del factor Etiqueta del valor N


Dieta alimenticia de 1 A:20%m.a.d. 5
concentrado a diferentes dosis 2 B:30%m.a.d. 5
de maíz amarillo duro
3 C:40%m.a.d. 5
4 D:50%m.a.d. 5

Unidad experimental: Camada de cerdos, 20u.e.

Modelo Lineal Aditivo:

Yij     i   ij
Para i = 1,2,3,..... 4 tratamientos t=4
j = 1,2,3,..... 5 observaciones o repeticiones r=5
Donde:
Yij : Es incremento en peso de ganado porcino en el i-ésisma dieta alimenticia y j-
ésima repetición.
µ : Efecto de la media general
τi : Efecto de la i-ésima dieta alimenticia
εij : Error experimental (efecto verdadero) que pertenece a la i-ésisma dieta
alimenticia y j-ésima repetición.

Supuestos básicos modelo estadístico: El modelo estadístico debe cumplir con los siguientes
supuestos:
1. Aditividad: Los efectos del modelo son aditivos
2. Linealidad: Las relaciones entre los efectos del modelo son lineales
3. Normalidad: Los errores del modelo deben tener una distribución normal con media Cero y
varianza σ2 .
4. Independencia: Los resultados obtenidos en el experimento son independientes entre si.
5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de los
diferentes tratamientos tienen varianzas iguales (σ2)

60
Métodos Estadísticos para la Investigación experimental

Estadísticos descriptivos
Variable dependiente: Incremento en peso de ganado porcino
Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro Media Desv. típ. N
A:20%m.a.d. 8.60 5.941 5
B:30%m.a.d. 10.60 7.403 5
C:40%m.a.d. 14.20 3.962 5
D:50%m.a.d. 8.60 5.857 5
Total 10.50 5.916 20

Análisis de Varianza
MODELO I.- EFECTOS FIJOS

CUADRO ANVA. Variable dependiente: Incremento en peso de ganado porcino


Suma de
cuadrados tipo Media
Fuente III gl cuadrática F Significación
DIETA 104.600 3 34.867 .995 .420
Error 560.400 16 35.025
Total corregida 665.000 19

No existe evidencia suficiente para afirmar de que por lo menos uma de lãs dietas alimentícias sea
diferente de las demás.

Pruebas post hoc. Usando Duncan o Tukey, que son dos pruebas en las que la prueba F puede
ser o no significativa.

Dieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro


Comparaciones múltiples

Variable dependiente: Incremento en peso de ganado porcino

(I) Dieta alimenticia (J) Dieta alimenticia Interv alo de conf ianza al
de concentrado a de concentrado a Dif erencia 95%.
diferentes dosis de diferentes dosis de entre Límite
maíz amarillo duro maíz amarillo duro medias (I-J) Error típ. Significación Límite inf erior superior
DHS de Tukey A:20%m.a.d. B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
D:50%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. A:20%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. -3.60 3.743 .772 -14.31 7.11
D:50%m.a.d. 2.00 3.743 .949 -8.71 12.71
C:40%m.a.d. A:20%m.a.d. 5.60 3.743 .462 -5.11 16.31
B:30%m.a.d. 3.60 3.743 .772 -7.11 14.31
D:50%m.a.d. 5.60 3.743 .462 -5.11 16.31
D:50%m.a.d. A:20%m.a.d. .00 3.743 1.000 -10.71 10.71
B:30%m.a.d. -2.00 3.743 .949 -12.71 8.71
C:40%m.a.d. -5.60 3.743 .462 -16.31 5.11
Basado en las medias observ adas.

Todas la t(t-1)/2=6 comparaciones posibles presentan diferencias no significativas. Los 4


tratamientos constituyen un solo grupo homogéneo. Frente a estos resultados, se podrá
recomendar usar la dieta alimenticia más económica y de mejor calidad y que produce mayores
ganancias en el peso del ganado porcino.

61
Elías Alberto Torres Armas, Lic. Ms. C.

Subconjuntos homogéneos
Incremento en peso de ganado porcino

Diet a aliment icia Subconjunto


de concentrado a N 1
DHS de Tukeya,b dif erent es dosis de
A: 20%m.a.d. 5 8.60
maíz amarillo duro
D:50%m.a.d. 5 8.60
B: 30%m.a.d. 5 10.60
C:40%m.a.d. 5 14.20
Signif icación .462
Duncana,b A: 20%m.a.d. 5 8.60
D:50%m.a.d. 5 8.60
B: 30%m.a.d. 5 10.60
C:40%m.a.d. 5 14.20
Signif icación .187
Se muest ran las medias para los grupos en subconjunt os
homogéneos.
Basado en la suma de cuadrados tipo III
El término error es la Media cuadrática (Error) = 35.025.
a. Usa el tamaño muestral de la media armónica = 5. 000
b. Alf a = .05.

Observese además que los niveles del factor son de naturaleza cuantitativa, es de interés,
conocer la naturaleza de la curva de respuesta al factor en estudio, esto implica realizar un análisis
de regresión, que puede ser lineal, cuadrática, y cúbica. Si los niveles del factor son t=4,
obtenemos t-1=3 componentes: la lineal, cuadrática, cúbica.

ANOVA: Incremento en peso de ganado porcino


Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos (Combinados) 104.600 3 34.867 .995 .420
Término lineal Contraste 3.240 1 3.240 .093 .765
Desviación 101.360 2 50.680 1.447 .264
Término cuadrático Contraste 72.200 1 72.200 2.061 .170
Desviación 29.160 1 29.160 .833 .375
Término cúbico Contraste 29.160 1 29.160 .833 .375
Intra-grupos 560.400 16 35.025
Total 665.000 19

No hay evidencia suficiente para rechazar la hipótesis de que el modelo sea lineal, cuadrático o
cúbico.

Resumen del modelo y estimaciones de los parámetros

62
Métodos Estadísticos para la Investigación experimental

Variable dependiente: Incremento en peso de ganado porcino


Ecuación Resumen del modelo Estimaciones de los parámetros
R cuadrado F gl1 gl2 Sig. Constante b1 b2 b3
Lineal .005 .088 1 18 .770 9.600 .360
Cuadrático .113 1.088 2 17 .359 .100 9.860 -1.900
Cúbico .157 .995 3 16 .420 19.000 -20.200 11.600 -1.800
La variable independiente esDieta alimenticia de concentrado a diferentes dosis de maíz amarillo duro.

Verificación de los supuestos:

Homogeneidad de varianzas

Una salida de statgraphics plus for v.5.1 muestra los siguientes contrastes

Contraste de Varianza
Contraste C de Cochran: 0.391149 P-valor = 0.681973
Contraste de Bartlett: 1.09633 P-valor = 0.721391
Contraste de Hartley: 3.49045
Test de Levene: 0.639354 P-valor = 0.600638

El estadístico mostrado en esta tabla, comprueba la hipótesis nula de que la desviación típica de
INCREPESO dentro de cada uno de los 4 niveles de Dieta, es la misma. De particular interés
están los tres p-valores. Dado que el menor de los p-valores es superior o igual a 0.05, no hay
diferencia estadísticamente significativa entre las desviaciones típicas para un nivel de confianza
del 95.0%.

Normalidad de los errores


Gráfico Q-Q Normal de Residuo para INCREPESO

10

5
Valor Normal esperado

-5

-10

-10 -5 0 5 10

Valor observado

Según el grafico Q-Q plot Normal, los puntos de las observaciones estan alineados respecto a la
recta, lo que significa que existe normalidad de los errores.
Gráfico Q-Q Normal sin tendencia de Residuo para INCREPESO

1
Desviación de Normal

-1

-10 -5 0 5 10

Valor observado

63
Elías Alberto Torres Armas, Lic. Ms. C.

Además, Tanto Kolmogorov-Smirnov como Shapiro-Wilk ambos muestran p-valor superior a


0.05, lo que significa que existe normalidad en el residuo para INCREPESO.

Pruebas de normalidad
Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Residuo para
INCREPESO .098 20 .200(*) .959 20 .516

* Este es un límite inferior de la significación verdadera.


a Corrección de la significación de Lilliefors

CONCLUSION FINAL

Se ha realizado los calculos y analisis de los resultados, se encontró que no hay evasión de
supuestos del diseño DCA, pero en el ANVA encontramos que la razón F es menor que 1 (.995).
La salida del Statgraphics Plus nos presenta la siguiente conclusión: grupos. El F-ratio, que en
este caso es igual a 0.995479, es el cociente de la estimación entre grupos y la estimación dentro
de los grupos. Puesto que el p-valor del test F es superior o igual a 0.05, no hay diferencia
estadísticamente significativa entre las INCREPESO medias de un nivel de Dieta a otro para un
95.0%. Siembargo, estaríamos en el caso presentado por Ostlle: La razon F resulta ser un
número menor que 1. (Ostle, 1986, pp335, 336) “…es posible (y completamente probable) que el
valor calculado de F resultara menor que la unidad. ¿Cuál debería ser nuestra conclusión ante tal
situación?. Podemos, por supuesto, simplemente decir que F no era significante y de esta manera
la hipótesis no puede ser rechazada. Sin embargo, no es prudente una excusa tan simple del
problema, ya que podría causar que ignorásemos una advertencia tan valiosa. Supongamos, como
puede suceder, que F, con v1 y v2 grados de libertad, en tan pequeña que F’=1/F, con v2 y v1
grados de libertad, es significante. ¿Cuál sería nuestra conclusión en este caso? Parece que debería
rechazarse algo; ¿pero qué? En esta situación, parece razonable rechazar el modelo
estadístico postulado (el modelo utilizado no es el más idóneo). Si el modelo estadístico es
rechazado debido a un valor significante F’, entonces, ¿cuáles son los pasos que deberán tomarse?
Algunos de ellos son:
1. El procedimiento experimental deberá ser revisado para ver si se satisfacen las diferentes
suposiciones. Por ejemplo, si no se empleó la aleatorización debida, la validez de la
suposición de independencia es dudosa.
2. Si se dispone de suficientes observaciones, la suposición de normalidad podría revisarse
mediante la representación gráfica de los datos, bien sea en una hoja grafica regular o en
una hoja de papel normal.
3. La suposición de varianzas homogéneas deberá ser revisada, pero esto requerirá un gran
número de observaciones dentro de subclases.
4. El fenómeno básico deberá reestudiarse para ver si el modelo lineal supuesto es una
buena aproximación a la verdad de los hechos. Si, como resultado, el modelo supuesto es
rechazado deberá buscarse un nuevo modelo que describa mejor los datos observados y
el fenómeno bajo investigación.

7. Ejercicios de DCA y pruebas de comparación múltiple de promedios

1. Se quiere estudiar la influencia de cuatro tipos de riego en la producción de maíz. Para ello, se
seleccionan parcelas del mismo tamaño y con la misma calidad de terreno, y se prueban los
cuatro tipos de riego, en 6, 8, 9 y 7 parcelas respectivamente. Los datos de producción que se
obtienen son los siguientes:

64
Métodos Estadísticos para la Investigación experimental

Observaciones Tipo de riego


A B C D
1 47 51 37 42
2 42 58 39 43
3 46 62 41 42

Con la información del enunciado anterior, determinar:

a. Realice el ANVA
b. Analizar las diferencias entre pares de medias de tratamientos, usando el método de Duncan
con α=0.01.
c. Describir el modelo lineal aditivo del diseño en términos del enunciado
d. Indique los principios básicos del modelo

2. Se cargan consecutivamente 5 hornadas de carne dentro de una maquinaría giratoria


empacadora de carne. La máquina tiene 4 cilindros alimentadores. Se toman al azar tres latas
llenadas por cada uno de los cilindros, al efectuar cada hornada. A continuación se dan los
pesos codificados en las latas llenas.
CILINDRO HORNO
1 2 3 4 5
1 1 4 6 3 1
1 3 3 1 3
2 5 7 3 3

2 1 2 5 2 1
3 1 1 0 0
1 0 5 1 1

3 1 2 2 1 3
1 0 4 3 3
1 1 3 3 3

4 2 2 3 0 0
3 0 3 0 1
0 1 4 2 1

TOTAL
a. Escriba el modelo lineal aditivo. Plantear las hipótesis del modelo
b. Realice el análisis de varianza correspondiente e intérprete sus resultados.
DESCRIBA LOS TÉRMINOS SIGUIENTES:
c. Factor
d. Niveles del factor
e. Tratamiento
f. Testigo (si lo hubiera)
g. Unidad experimental
h. Variable respuesta
i. Diseño experimental
j. Y conceptualice cada uno de los principios básicos del diseño experimental
k. Modelo estadístico
l. Y conceptualice cada uno de los supuestos básicos del modelo experimental

65
Elías Alberto Torres Armas, Lic. Ms. C.

3. Plantear un caso experimental relacionado con su especialidad (Industria Agroindustrial) e


indique: Objetivos, variable respuesta, Factor(es), Tratamientos, Unidad experimental.

4. Los datos que se presentan a continuación corresponden al tiempo de coagulación (en


segundos) de sangre extraída a 24 animales, asignados aleatoriamente a 4 dietas diferentes,
resultado de un experimento llevado en un diseño completamente al azar.
Repeticiones Dieta Total
A B C D
62 63 68 55
60 67 66 63
63 71 72 60
59 64 67 61
65 69 63
65
Total
a. Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del
problema.
b. Enuncie los supuestos básicos del modelo lineal aditivo
c. Realice el análisis de varianza
d. Calcule el coeficiente de variación.
e. Qué se puede concluir respecto de las dietas. ¿Cuál es la que se recomendaría según usted?

DESCRIBA LOS TÉRMINOS SIGUIENTES


f. Factor
g. Niveles del factor
h. Tratamiento
i. Testigo (si lo hubiera)
j. Unidad experimental
k. Variable respuesta
l. Diseño experimental
m. Y conceptualice cada uno de los principios básicos del diseño experimental
n. Modelo estadístico
o. Y conceptualice cada uno de los supuestos básicos del modelo experimental
Esquema del análisis de varianza

5. Los datos que se presentan a continuación corresponden al análisis del tiempo de coagulación
(en segundos) de sangre extraída a 20 animales, asignados aleatoriamente a 4 dietas
diferentes, resultado de un experimento llevado en un diseño completamente al azar.
Source DF SS MS F P
Diets (trats) 3 200.52 66.84 8.10 0.002
Error 16 132.03 8.25
Total 19 332.55
Level N Mean
1 5 61.000
2 5 66.000
3 5 68.400
4 5 61.167
a) Al 1% de significación cuál es la conclusión del ANVA
b) Utilizando t-student al 5% probar que el tratamiento 3 es mayor que el 2.
c) Realice la prueba Tukey de comparación múltiple de promedios de los tratamientos

66
Métodos Estadísticos para la Investigación experimental

6. Se usó 5 tratamientos diferentes para la elaboración de vino en la Angronindustria FOOD


R&R estos tratamientos son de acuerdo a las temperaturas dadas en la pasteurización y de
todas las muestras se obtuvo los siguientes datos de la variación de las densidades. resultado
de un experimento llevado en un diseño completamente al azar.
A B C D E
60 ºC 65 º C 70 º C 75 ºC 78 ºC
TOTAL 9,243 9,177 9,190 9,076 7,880
PROMEDIO 1,027 1,020 1,021 1,008 0,876
REPETICION 9 9 9 9 9

ANVA
F.V GL SC CM FC FT
Tratamientos 4 0,150 0,037 0,00371 2,021
Error 40 403,580 10,090
Total 44 403,730
a. Al 1% de significación cuál es la conclusión del ANVA
b. Utilizando t-student al 5% probar que el tratamiento A es mayor que el C.
c. Realice la prueba Duncan de comparación múltiple de promedios de los tratamientos

7. Lea cuidadosamente lo siguiente: Un investigador se ha planteado el siguiente título de


investigación “Evaluación de los niveles de concentración de aceite y humedad de 8
variedades de palta de mayor producción en el valle del Utcubamba” y se plantea la siguiente
interrogante “¿existirá una variedad de palta en el valle del Utcubamba que presente mayores
contenidos de aceite y humedad que la variedad fuerte?”. La respuesta permitirá proponer la
propagación de este cultivar, si lo existe (el investigador piensa que si lo existe), como palta
aceitera en la región Amazonas. La materia prima (experimental) será recolectada en el valle
mencionado, del distrito de Chachapoyas y de árboles que presentan buenas características
fisiológicas y un excelente volumen de producción. Se recolectarán 12 frutos seleccionados de
cada una de las 8 variedades y de la variedad Fuerte; las unidades experimentales serán
evaluadas y las mediciones de la(s) variable(s) respuesta(s) serán registrados en un esquema
especialmente construido para el diseño experimental correspondiente. Diga usted:
a) ¿Cuál o cuáles es (son) la(s) variable(s) respuesta(s) o (dependiente(s))?
b) ¿Cuál es la variable independiente o factor y sus respectivos niveles?
c) ¿Cuál es la materia experimental, cuántas y cuáles son las unidades experimentales usara el
investigador?
d) ¿Cuántos tratamientos ha considerado el investigador?
e) Proponga el diseño experimental más conveniente a usar en esta investigación, y mencione
los principios básicos que este diseño debe cumplir.
f) Bosqueje un esquema (matriz) del diseño propuesto en el que registrará las mediciones del
experimento
g) Describa el modelo lineal aditivo definiendo cada una de sus componentes en términos del
problema de investigación y mencione los supuestos (principios) básicos que debe cumplir el
citado modelo.
h) ¿El modelo será a efectos fijos o a efectos aleatorios? ¿por qué?
i) Escriba la hipótesis correspondiente para el análisis de varianza del diseño experimental
propuesto
j) Suponga que ya ejecutó el experimento, registró los datos correspondientes a la variable
respuesta, realizo el ANVA, y encuentra que es necesario hacer una prueba de comparaciones
múltiples de promedios. ¿Cuál de las pruebas, de las tantas que existen, será la más
conveniente usar? y ¿Por qué?.

67
Elías Alberto Torres Armas, Lic. Ms. C.

8. Con el objeto de investigar el efecto de la harina del fríjol “canario” en el sabor de las galletas,
se formularon las siguientes recetas A: Galletas, con 0% de harina de fríjol canario
(TESTIGO), B: Galletas, con 5% de harina de fríjol canario, C: Galletas, con 10% de harina
de fríjol canario, Galletas, con 15% de harina de fríjol canario. Intervinieron 18 panelistas
semi-entrenados, que recibieron una muestra testigo y tres muestras debidamente
codificadas; los panelistas evaluaron las muestras en relación al testigo, según la escala de
comparación múltiple de 9 puntos, donde extremadamente mejor que el testigo (9 puntos),
mucho mejor que el testigo (8 puntos), moderadamente mejor que el testigo (7 puntos),
ligeramente mejor que el testigo (6 puntos), igual que el testigo (5 puntos), ligeramente peor
que el testigo (4 puntos), moderadamente peor que el estigo (3 puntos), mucho peor que el
testigo (2 puntos), extremadamente peor que el testigo (1 puntos). Se indica que los
resultados obtenidos de la evaluación organoléptica, fueron previamente sorteados la
ubicación de las posiciones de las muestras que fueron servidos, los cuales fueron
procesados estadísticamente con el propósito de saber, si la harina de fríjol canario altera el
sabor de las galletas a un nivel del 5% de significación. Con la información del enunciado
anterior, determinar:

a. Factor y sus niveles


b. Unidades experimentales
c. VARIABLE RESPUESTA
d. Clase de variable respuesta
e. Describa en términos del enunciado el cumplimiento de los tres principios básicos del
diseño experimental.
f. Se observa la existencia de otra fuente de variación a parte del factor considerado ¿Cuál
es? y ¿por qué?

9. Sea un experimento con tres tratamientos T 1, T2, y T3, cuyos resultados experimentales se
indican a continuación:
T1 4 6 5 4 9 8 5
T2 10 9 7 10 8
T3 33 5 8 4 5 6 3
Determinar la variabilidad de cada tratamiento
¿Cuáles son los supuestos básicos del modelo lineal aditivo para el DCA que se deben
cumplir para el análisis de varianza? Realizar el ANVA y una prueba de comparaciones
múltiple de tratamientos apropiada

10. Se desea investigar si 4 máquinas alimentadoras (A, B, C, D) en cierta planta están llenando
envases a diferentes niveles de lo normalmente establecido. Las condiciones en las cuales se
lleva a cabo es estudio hacen que se utilice el Diseño completamente al Azar (DCA) para el
análisis de resultados. Por cada repetición se tomaron muestras aleatorias de 10 envases cada
una de la producción de cada máquina y al examinarse se obtuvieron los siguientes datos
estadísticos que expresan el número de envases por muestra, con llenado no conveniente o
fuera de lo normal.
Tratamientos Repeticiones Total
A 4 3 4 5
B 3 4 3 5 4
C 2 2 2
D 6 5 4 5 4 6
Identifique: La variable de respuesta, enuncie el modelo lineal aditivo, y efectúe el ANVA al
α=0.05

68
Métodos Estadísticos para la Investigación experimental

11. En un experimento de riegos en el cultivo de algodón se tuvieron los siguientes tratamientos


que están expresados en metros cúbicos de agua absorbidos por hectárea: T1=5400,
T2=4800, T3=4200- El experimento se condujo en parcelas de 300 m 2 de área útil y los
resultados están expresados en kilogramos.
Metros cúbicos de agua
Repeticiones T1 T2 T3
1 68 53 73
2 86 62 90
3 68 46 71

1. La variable respuesta
2. Factor(es) y niveles de factor(es)
3. Nombre del diseño utilizado
4. Presente el modelo lineal aditivo y su interpretación de sus componentes en términos del
enunciado.
5. Proponga la Hipótesis de interés y cuadro simbólico ANVA
6. Efectúe el análisis de varianza
7. Mediante la prueba DLS compare T1 y T3
8. Realice la prueba de Tukey.
9. ¿Se justifica el uso de DCA? Explique brevemente.
10. ¿Es conveniente realizar la prueba Dunnett? ¿Por qué?

12. Se realizó un experimento para comparar el contenido de colesterol de 3 alimentos dietéticos.


Cada uno de los 3 laboratorios que fabrican alimentos dietéticos produce alimentos de estos
3 tipos en paquetes de similar peso. Al evaluar el contenido de colesterol (en miligramos por
paquete) se obtuvo los siguientes resultados:
Alimento Laboratori
dietético o
1 2 3
A 13 12 15
B 17 14 18
C 15 13 18
Total
Promedio
Repeticiones
a) La variable respuesta
b) Factor(es) y niveles de factor(es)
c) Presente el modelo lineal aditivo y su interpretación de sus componentes en términos del
enunciado.
d) Efectúe el análisis de varianza
e) Mediante la prueba t-student compare el contenido medio de colesterol de los alimentos
AyB
f) Realice la prueba de Duncan. Resuma sus resultados mediante el diagrama de líneas.
g) ¿Se justifica el uso de un DCA? Explique brevemente.
h) ¿Es conveniente realizar la prueba Dunnett? ¿Por qué?

13. Con la finalidad de estudiar el efecto de 5 raciones para cerdos, se llevó a cabo un
experimento conducido en D.C.A.. Los resultados del incremento de peso (en Kg.) al final
del experimento se presentan a continuación:

69
Elías Alberto Torres Armas, Lic. Ms. C.

Observ. RACIONES (i)


Total
(j) R1 R2 R3 R4 R5
1 4.228 4.529 4.994 5.626 4.891
2 4.330 4.956 4.373 5.373 5.142
3 3.791 4.160 5.642 4.932 5.002
4 4.008 4.650 5.124 4.843 3.992
5 3.910 3.891 4.562 5.217 4.810
ni . 5 5 5 5 5
Yi. 20.267 22.186 24.695 25.991 23.837 116.976
Y i. 4.0534 4.4372 4.939 5.1982 4.7674 4.67904
S i2 0.0496 0.175 0.2485 0.1027 0.2034
5 5

 Y
i 1 j 1
2
ij  554.42461

a) Pruebe el supuesto de homogeneidad de variancias. Use =0.01


b) Presente el Modelo Aditivo Lineal y explique sus componentes de acuerdo al enunciado
del problema.
c) Realice el Análisis de Variancia y de sus conclusiones a un nivel de significación del 5%
d) Calcule los efectos de los tratamientos
e) Si el experimentador, antes de realizar el experimento pensó que la ración 3 era más
eficiente que la ración 1 en por lo menos 3 Kg. Realice la prueba más conveniente,
utilice un =0.05
f) Comparar la ración 1 con la ración 2 mediante la prueba D.L.S.. Use =0.05
g) Utilice la Prueba de Duncan para comparar la ración 2 con la ración 3. Use =0.05
h) Utilice la prueba de Tukey para comparar la ración 4 con la ración 5. Use =0.05
i) Asumiendo que la ración 4 es utilizada como testigo. Realice la prueba correspondiente,
utilice un nivel de significación del 5%
j) Mediante contrastes ortogonales pruebe la hipótesis de que la ración 2 es igual al
promedio de las otras 4 raciones.

IMPORTANTE: TRABAJE CON REDONDEO A CUATRO DECIMALES.

14. Un ingeniero está investigando el efecto que tienen cuatro métodos de ensamblaje (A, B, C y
D) sobre el tiempo de ensamblaje de un componente para computadoras. Se selecciona a
cuatro operadores para realizar este estudio con similares habilidades. Los resultados en
minutos se muestran a continuación:
METODO
REP. A B C D
1 5 6 9 7
2 4 7 8 6
3 6 6 10 5
4 4 5 11 8
Si. 0.9574 0.8165 1.2910 1.2910
Yi . 19 24 38 26
a. Presente el modelo aditivo lineal y describa cada uno de sus componentes en términos del
experimento.
b. ¿Se cumple el supuesto de homogeneidad de variancias?. Usar  = 0.01.
c. Presente el cuadro ANVA y pruebe la hipótesis respectiva. Usar  = 0.05.
d. Descomponga Y34 en sus efectos estimados e intérprete los resultados.

70
Métodos Estadísticos para la Investigación experimental

e. Si antes del experimento se planeó probar si el método A es mejor que el método D.


Realice la prueba correspondiente. Usar  = 0.05.
f. Utilice la Prueba de Duncan la probar el método A y C. Use  = 0.01
g. Use la prueba de Tukey para comparar los métodos B y D. Use un nivel de significación
del 5%

15. La variancia ponderada (Sp2) es una estimación de:

a) Suma de Cuadrados del Error b) Efecto de Tratamientos


c) Cuadrado Medio del Error d) Efecto del Error Experimental
e) Efecto de la Media

16. Los principios básicos del Diseño Experimental son:

a) Aleatorización, Reproducción Aditividad b) Aleatorización, Repetición, Control Local


c) Normalidad, Aditividad, Independencia d) Aditividad, Control Local, Repetición
e) Homogeneidad, Linealidad, Aditividad

17. Una forma de disminuir el error experimental es:

a) Aumentar el número de tratamientos


b) Aumentar el número de repeticiones
c) Disminuir el número repeticiones
d) Trabajar con el Modelo I
e) Trabajar con el Modelo II

18. El Métodos de Mínimos Cuadrados consiste en:

a) Minimizar la Suma de Cuadrados de Tratamientos


b) Estimar los efectos de los Tratamientos
c) Construir el Cuadro ANVA
d) Minimizar la Suma de Cuadrados del Total
e) Minimizar la Suma de Cuadrados del Error Experimental

71
CAPÍTULO V

DISEÑO BLOQUE COMPLETO RANDOMIZADO (DBCR)

1. INTRODUCCIÓN

Generalmente este diseño es utilizado en experimento de campo y aun se pueden utilizar


en invernaderos. Donde existen uno o más fuentes de variación.
Este diseño es conocido también como diseño de doble vía de clasificación, en este diseño
las unidades experimentales se agrupan en bloques o grupos siendo estas homogéneas
dentro de cada bloque y heterogéneas entre bloques.

2. CARACTERISTICAS
- Las unidades experimentales se distribuyen en grupos o en bloques bajo el criterio de
homogeneidad dentro de grupos y heterogeneidad entre grupos.
- En cada bloque el número de unidades experimentales es igual al numero de
tratamientos (bloques completos).
- Los tratamientos son asignados aleatoriamente en las unidades experimentales dentro
de cada bloque.
- Los números de bloques, puede ser igual o diferente al numero de tratamientos.
3. VENTAJAS
- En general es más preciso que el diseño completamente al azar
- Es simple y fácil de planificar.
- Las unidades experimentales perdidas no causan mucha dificultad.
- Es flexible con relación al número de tratamientos y repeticiones.
4. DESVENTAJAS
- No es apropiado para un número elevado de tratamientos, debido a que aumenta el
tamaño del bloque y como consecuencia aumenta la variabilidad dentro de cada
bloque y por ende el error experimental.
- Si en la fuente de variabilidad para los bloques no existe diferencias estadísticas, no
hay ganancia en precisión con respecto al diseño completo randomizado, y por el
contrario puede haber perdida por la disminución de los grados de libertad del error.
5. USOS
- Son utilizados en experimentos de campo, laboratorio, etc.
- Se utilizan en cultivos anuales y perennes.

6. MODELO ADITIVO LINEAL

Yij    t i   j  ij
Para i = 1,2,3,..... t tratamientos j= 1,2,3,..... r bloques

Donde:

Yij = Es la variable respuesta


u = Efecto de la media poblacional
ti = Efecto del i-ésimo tratamiento
j = Efecto del j-ésimo bloque
Eij = Efectos aleatorio que pertenece a la Yij observación EE.
Métodos Estadísticos para la Investigación experimental

7. ESQUEMA DEL DISEÑO: Representación simbólica del DBCR.


TRATAMIENTOS
bloque T1 T2 T3 .. .. Tt Total
bloques
1 Y11 Y21 Y31 .. .. Yt1 Y.1
2 Y12 Y22 Y32 .. .. Yt2 Y.2
. . . . . . . .
r Y1r Y2r Y3r .. .. Ytr Y.r
Total
Tratam Y1. Y2. Y3. . . Yt. Y..

Para
i = 1,2,3,..... t tratamientos
J = 1,2,3,..... r bloques
CALCULO DE LAS SUMAS DE CUADRADOS
 OBTENCIÓN DEL FACTOR DE CORRECCIÓN
(Total ) 2 Y2
C  ..
( Número de respuestas( N de panelistas )).( N de tratamient os) B.T
B: Número de bloques
T: Número de tratamientos
 SUMA DE CUADRADOS PARA EL TOTAL
t r
S .C.total   Yij2  C
i 1 j 1
 SUMA DE CUADRADOS PARA TRATAMIENTOS
t

Y 2
i.
SCtratamiento  i 1
C
B
 SUMA DE CUADRADOS PARA BLOQUES
r

Y
j 1
2
.j

SC Panel  SCbloques  C
T
 SUMA DE CUADRADOS PARA EL ERROR
SCerror  SCTotal  SCtratamiento  SCbloque
8. ESQUEMA DEL ANÁLISIS DE VARIANCIA
FV GL SC CM FC
Tratamiento (B-1) SC tratam. CM tratam. CM tratm.
CM error
Bloques (T-1) SC bloques CM bloq. CM bloq.
CM error
Error Experim (B-1) (T-1) SCerror CMerror
TOTAL BT-1 SCtotal
3. PRUEBAS DE HIPOTESIS
a. Plantear la hipótesis para tratamientos
Ho : T1 = T2 = T3 = ...... = Tt
Ha : T1  T2  T3  ...... Tt para i = 1,2,3, ................ , t tratamientos

b. Plantear la hipótesis para bloques


Ho : 1 = 2 = 3 = .... = r
Ha : 1  2  3  ....  r Para j = 1,2,3, .........., r Bloques

EJERCICIO. UN DBCA.

73
Elías Alberto Torres Armas, Lic. Ms. C.

En un trabajo de investigación de cocona, zanahoria y cebolla, es utilizado en la elaboración


encurtidos.
T1 : 80% de cocona + 20% cebolla
T2 : 80% de cocona + 20% zanahoria
T3 : 70% de cocona + 15% cebolla + 15% zanahoria
T4 : 60% de cocona + 30% cebolla + 10% zanahoria
T5 : 50% de cocona + 35% cebolla + 15% zanahoria
T6 : 40% de cocona + 40% cebolla + 20% zanahoria
T7 : 30% de cocona + 45% cebolla + 25% zanahoria
T8 : 20% de cocona + 50% cebolla + 30% zanahoria
En la elaboración participaron 18 panelistas semi-entrenados degustando los encurtidos, según
la escala hedónica de 7 puntos, donde:
Escala: Gusté extremadamente 7
Gusté medianamente 6
Gusté moderadamente 5
No guste ni disguste 4
Disguste ligeramente 3
Disguste moderadamente 2
Disguste extremadamente 1
El experimento organoléptico ha seguido el delineamiento de DBCA cuyo resultados de la
evaluación se indica en el siguiente cuadro:
Valores de la evaluación organoléptica de los encurtidos, según escala hedónica
Panelistas TRATAMIENTOS
TOTAL
o bloques 1 2 3 4 5 6 7 8
1 4 6 7 3 7 5 6 5 43
2 6 7 7 5 7 7 6 5 50
3 6 5 7 5 6 7 6 6 48
4 6 6 7 5 7 7 6 6 50
5 4 5 6 3 6 5 7 4 40
6 5 5 6 4 6 5 6 6 43
7 5 6 7 4 7 6 6 6 47
8 5 5 7 4 6 4 7 6 44
9 6 5 6 5 6 7 5 6 46
10 6 6 6 5 7 7 5 6 48
11 6 7 6 5 7 7 6 3 47
12 6 7 7 5 7 7 6 5 50
13 6 7 7 5 7 7 6 4 49
14 4 6 7 3 7 5 5 4 41
15 6 5 6 5 6 7 6 6 47
16 6 7 7 5 7 7 6 6 51
17 5 6 7 4 7 6 5 6 46
18 5 6 7 4 7 6 5 4 44
TOTAL 97 107 120 79 120 112 105 94 834
Cálculos para el ANVA.
8342
SCTOTAL = 4  ...  4   4986  4830.25  155.75
2 2

144

74
Métodos Estadísticos para la Investigación experimental

97 2  ...  942 8342


SCTRAT =   4905.77778  4830.25  75.52778
18 144
432  ...  442 8342
SCBLOQUES =   4852.5  4830.25  22.25
8 144
SCERROR = SCTOTAL- SCTRAT - SCBLOQUES = 155.75 – 75.52778 – 22.25 = 57.97222
Hipótesis: Ho : t1 = t2 = t3 = t4 = t5 = t6 = t7 = t8
Ha : t1  t2  t3  t4  t5  t6  t7  t8

ANVA

F.V. S.C. G.L. C.M. F.C.


Tratamiento 75.52778 7 10.78968 22.148 **
Bloques 22.25 17 1.3088
Error 57.9722 119 0.48716
TOTAL 155.75 143
Ft =F(7,17)0.05 = 2.01
Ft =F(7,17)0.01 = 2.64

Conclusión. Como Fc = 22.148, es altamente significativa a 5% y 1%, por la que rechazamos


Ho y se acepta Ha.
PRUEBAS DE COMPARACION MÚLTIPLE
Tratamiento T1 T2 T3 T4 T5 T6 T7 T8
Promedio 5.389 5.944 6.667 4.389 6.667 6.222 5.833 5.222
Hipótesis:
Ho : ui = uj
Ha : ui  uj
Nivel de significancia :  = 0.05
Prueba estadística : PRUEBA TUKEY . ALS (T) = S y (AES (T))
i y j

Determinación de S y
i y j

CM error 0.48716
Sy =  0.1645127
i y j
r 18
AES (T) Tabla : 4.36067
 ALS (T) = 0.1645127 x 4.36067 = 0.717386
Ordenamiento de los promedios de tratamientos:
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5

75
Elías Alberto Torres Armas, Lic. Ms. C.

Promedio 4.389 5.222 5.389 5.833 5.944 6.222 6.667 6.667


Claves I II III IV V VI VII VIII

Regla de decisión:
Si Y i  Y j  ALS (T ) se acepta Ho
Y i  Y j  ALS (T ) se rechaza HO
Número de comparaciones posibles: 8(8-1)/2=28
Comparación y significación
Comparación d ALS (T) Acepta/rechaza Signif = 0.05
I – II 0.8333 > 0.717386 u4  u8 *
I – III 1.0000 > 0.717386 u4  u1 *
I – IV 1.4444 > 0.717386 u4  u7 *
I–V 1.5555 > 0.717386 u4  u2 *
I – VI 1.8333 > 0.717386 u4  u6 *
I – VII 2.2778 > 0.717386 u4  u3 *
I – VIII 2.2778 > 0.717386 u4  u5 *
II – III 0.1667 < 0.717386 u8 = u7 n.s
II – IV 0.6111 < 0.717386 u8  u2 n.s
II –V 0.7222 > 0.717386 u8  u6 *
II – VI 1.0000 > 0.717386 u8  u3 *
II – VII 1.4445 > 0.717386 u8  u5 *
II – VIII 1.4445 > 0.717386 u1 = u7 *
III – IV 0.4444 < 0.717386 u1 = u2 n.s
III –V 0.5555 < 0.717386 u1  u6 n.s
III – VI 0.8333 > 0.717386 u1  u3 *
III – VII 1.2775 > 0.717386 u1  u5 *
III –VIII 1.2778 > 0.717386 u7 = u2 *
IV – V 0.1111 < 0.717386 u7 = u6 n.s
IV – VI 0.3889 < 0.717386 u7  u3 n.s
IV – VII 0.8334 > 0.717386 u7  u5 *
IV – VIII 0.8334 > 0.717386 u2 = u6 *
V –VI 0.2778 < 0.717386 u2 = u6 n.s
V-VII 0.7223 > 0.717386 u2  u3 *
V-VIII 0.7223 > 0.717386 u2  u5 *
V –VII 0.4445 < 0.717386 u6 = u3 n.s
VI-VIII 0.4445 < 0.717386 u6 = u5 n.s
VI –VIII 0 < 0.717386 u3 = u5 n.s

Presentación de la prueba Tukey:

a) Por segmento de recta.

Tratamiento T4 T8 T1 T7 T2 T6 T3 T5

76
Métodos Estadísticos para la Investigación experimental

b) Literalmente.
Tratamiento T4 T8 T1 T7 T2 T6 T3 T5
A A A
B B B
C C C
D D
E E E
F F
c) Utilizando un cuadro de doble entrada:
T4 T8 T1 T7 T2 T6 T3 T5
T4 - 0.8333 * 1.000 * 1.444 * 1.556 * 1.833 * 2.278 * 2.278 *
T8 - 0.167 0.611 0.722 * 1.000 * 1.4445 * 1.4445 *
T1 - 0.444 0.556 0.833 * 1.278 * 1.2778 *
T7 - 0.111 0.389 0.833 * 0.833 *
T2 - 0.278 0.722 * 0.722 *
T6 - 0.445 0.445
T3 - 0
T5 -

Conclusiones.
Podemos afirmar a un nivel de 5% de probabilidad, que el encurtido T 3 y T5, son mejores que
los otros tratamientos, alcanzando el calificativo por los panelistas de gusten moderadamente.

EJERCICIO N° 2: DISEÑO EN BLOQUE COMPLETO AL AZAR

1) Se quiere saber el grado de aceptación entre los panelistas del producto en evaluación
(yogurt ) los cuales dan la siguiente puntuación.
Bloque T1 T2 T3 TOTAL
1 8 8 9 25
2 10 9 8 27
3 7 10 6 23
4 8 9 8 25
5 9 8 9 26
6 9 7 7 23
7 8 8 6 22
8 7 7 8 22
9 8 10 9 27
10 9 9 9 27
TOTAL 83 85 79 247

Hipótesis:
Ho : T1= T2 = T3 = T4
Ha : T1  T2  T3  T4

Nivel de significación Factor de corrección

77
Elías Alberto Torres Armas, Lic. Ms. C.

α= 5% C = ( 247 )2 = 2033.63
30
Cálculos:
SC Bloque =  total -C

= ( 252 + 272 + .....+ 272 )– C


3
= 12.70

Sc tratam = ( 832 + 85 2+ 792 ) - C


10
= 1.87

Sc total = (102 + 72 +...+ 92 ) - C

= 43.37

Grados
Fuente de Suma de de Promedio de
variacion cuadrados libertad los cuadrados F Significancia
Bloque 12.70 9 1.41 0.88 ns
Tratamiento 1.87 2 0.935 0.58 0 ns
Error 28.80 18 1.6

Total 43.37 29

Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en la
tabla por lo tanto esta en el rango de significan cía.
Conclusión: No existe diferencia significativa entre los bloques ni tratamientos. Realice la
prueba Duncan de comparaciones múltiples

EJERCICIO N° 3: DISEÑO DE BLOQUE COMPLETO AL AZAR BALANCEADO


En una heladería se hizo una degustación de diferentes sabores de helados y para evaluación
organolépticamente se utilizó una escala hedónica de 7 puntos y los resultados se dan la
siguiente tabla:
Posicion
Panelista 1 2 3 TOTAL
1 A 5 B 4 C 6 15
2 B 7 C 6 A 5 18
3 C 4 A 5 B 6 15
4 B 4 A 4 C 7 15
5 A 4 C 6 B 7 17
6 B 5 A 5 C 5 15
7 A 6 B 4 C 5 15
8 C 7 A 4 B 4 15

78
Métodos Estadísticos para la Investigación experimental

9 B 4 A 6 C 4 14
10 C 5 A 7 B 4 16
TOTAL 51 51 53 155
Hipótesis: Ho : T1= T2 = T3 = T4
Ha : T1  T2  T3  T4
Nivel de significación Factor de corrección
α= 5% C = ( 155 )2 = 800.83
30
Ordenando datos :
Sabor del helado
Panelista A B C TOTAL
1 5 4 6 15
2 5 7 6 18
3 5 6 4 15
4 4 4 7 15
5 4 7 6 17
6 5 5 5 15
7 6 4 5 15
8 4 4 7 15
9 6 4 4 14
10 7 4 5 16
TOTAL 51 49 55 155
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los
variaciones cuadrados libertad cuadrados F Significancia
Panelista 4.17 9 0.463 0.25 o
Posición 0.27 2 0.135 0.072 o
Tratamiento 1.87 2 0.935 0.501 o
Error 29.86 16 1.866
Total 36.17 29

Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.

Conclusión: No existe diferencia significativa entre los bloques ni tratamientos. Complete el


cálculo de la suma de cuadrados y realice la prueba de comparación múltiple Duncan y
Tukey.

EJERCICIO N° 5: DISEÑO EN BLOQUE AL AZAR CON PERDIDA DE UNIDADES


EXPERIMENTALES POR TRATAMIENTOS

Se elaboro mermelada de mango y se le añadió diferentes unidades de


conservantes se evaluó su evolución pero una de la muestras se malogro
perdiendo una muestra, los datos fueron:
BLOQUES
Tratamientos A B C D TOTAL
1 2 3 4 5 14
2 4 3 2 2 11

79
Elías Alberto Torres Armas, Lic. Ms. C.

3 X 5 3 4 12
4 4 3 4 5 16
TOTAL 10 14 13 16 53
Hipótesis: Ho : T1= T2 = T3 = T4
Ha : T1  T2  T3  T4
Nivel de significación ŷ = T ( Y n) + B ( Y.n ) - Y
α= 5% ( T-1 ) ( B – 1)
= 4 ( 12 ) + 4 (10 ) – 53 = 3.89
3x 3
Factor de corrección:
C = ( 56.89 )2 = 202.28
16
BLOQUES
Tratamientos A B C D TOTAL
1 2 3 4 5 14
2 4 3 2 2 11
3 3.89 5 3 4 15.89
4 4 3 4 5 16
TOTAL 13.89 14 13 16 56.89

ANÁLISIS DE VARIANZA
Origen de las Grados de Promedio de los
variaciones Suma de cuadrados libertad cuadrados F Significancia
Bloque 1.20 3 0.4 0.303 O
Tratamiento 4.093 3 1.364 1.03 O
Error 10.5591 8 1.32
Total 15.8521 14

Decisión: Aceptamos Ho ya que el valor del f calculado es menor que el valor encontrado en
la tabla por lo tanto esta en el rango de significan cía.

Conclusión: No existe diferencia significativa entre los bloques ni tratamientos.. Complete el


cálculo de la suma de cuadrados y realice la prueba de comparación múltiple Duncan y
Tukey.

EJERCICIO. DISEÑO BLOQUES COMPLETO AL AZAR

Doce personas excedidas en pesos, participan en un estudio para comparar, tres regimenes
para reducir el peso, para lo cual utilizamos un producto con bajas calorías. Los sujetos se
distribuyeron en cuatro grupos de acuerdo a su peso inicial y cada uno de los tres sujetos de
cada grupo fue asignado aleatoriamente a uno de los tres regimenes reductores. Al final del
experimento se registraron las perdidas de peso en kilogramos.

Peso Inicial REGIMENES (i) Promedio


(Kg) A B C Y. j Y. j
76 a menos de 88 13 12 11 36 12
88 a menos de 100 14 11 12 37 12.33
100 a menos de 112 13 12 12 37 12.33
112 o mas 19 16 15 50 16.67

80
Métodos Estadísticos para la Investigación experimental

Yi 59 51 50
Promedio Yi 14.75 2.75 12.5 Y.. = 160
A. HIPOTESIS

H0 : T1 =T2 = T3 = T4 = T5
Ha : T1 = T2 = T3 = T4 = T5

B. CALCULO DEL ANALISIS DE VARIANZA

Obtención de la suma de cuadrados (S.C.)


1602
SC TOTAL  132  ...  152   60.667
3 4
542  ...  502 1602
SC TRATAMIENT O    12.167
4 3 4
362  ...  502 1602
SC BLOQUES    44.667
3 3 4
SC ERROR  SC TOTAL  SC TRATAMIENT O  SC ERROR  922.67  690.67  44.667  3.833

ANVA

FV GL SC CM Fc Ft Significancia
Bloques (peso 3 44.667 14.889 23.3065 9.73 **
inicial)
Tratamiento 2 12.167 6.0835 9.5228 10.92 Ns
(regimenes)
Error 6 3.833 0.6388
Total 11 60.667

C. CONCLUSION
En conclusión no hay evidencia estadística suficiente como para rechazar la hipótesis.
No existen diferencias significativas entre los efectos de los regimenes aplicados para
reducir de peso.

D. PRUEBA DE COMPARACIONES.

PRUEBA DE TUKEY

1. Con un nivel de significancia del 0.01.


2. El valores del ALS(T):

CME =0.6388
r = 4 AES(t)= 6.33
CME
ALST   AEST  
r

81
Elías Alberto Torres Armas, Lic. Ms. C.

ALS(T) = 2.5296
3. Comparación de los promedios y significación
Diferencias ALS(D) Conclusiones
14.75 – 12.75 = 2  2.5296 Se acepta la Hp
14.75 – 12.50 = 2.25  2.5296 Se acepta la Hp
12.75 – 12.50 = 0.25  2.5296 Se acepta la Hp

4. CONCLUSIÓN
En conclusión no existen diferencias significativas entre ninguno de los efectos de los
regímenes aplicados para reducir el peso.

EJERCICIO. DISEÑO DE BLOQUES COMPLETO BALANCEADO


o
Con el objetivo de investigar el efecto de la cantidad de grados Brix ( Bx ) en la fruta
confitada de mango (sabor) se formuló los siguientes tratamientos:
TA: Fruta confitada de mango con 400 Brix (testigo),
TB: Fruta confitada de mango con 450 Brix ,
TC: Fruta confitada de mango con 500 Brix ,
TD: Fruta confitada de mango con 550 Brix

Para esto intervienen 18 panelistas entrenado que recibieron una muestra testigo de (40 0Brix )
y 3 muestras debidamente codificadas en relación al testigo, los panelistas evaluaron las
muestras según la escala de comparación múltiple de 9 puntos, donde: Escala:

Extremadamente mejor que el testigo: 9, Ligeramente peor que el testigo: 4,


Mucho mejor que el testigo: 8, Moderadamente peor que el testigo: 3,
Moderadamente mejor que el testigo: 7, Mucho peor que el testigo: 2,
Ligeramente mejor que el testigo: 6, Extremadamente peor que el testigo: 1.
Igual que el testigo: 5,

Cuadro 1: Valores obtenidos de la evaluación organoléptica


Panelistas Posiciones
1 2 3 4 Total
1 C=5 B=6 D=5 A=6 22
2 D=2 C=4 B=3 A=6 15
3 C=4 B=5 A=5 D=3 17
4 C=3 D=2 A=5 B=4 14
5 A=5 D=2 B=3 C=2 12
6 B=3 C=6 D=4 A=5 18
7 C=6 A=5 D=5 B=5 21
8 D=4 A=5 B=4 C=4 17
9 A=5 D=2 B=4 C=3 14
10 B=3 C=6 D=2 A=6 17
11 C=3 B=5 D=4 A=8 20
12 D=4 A=6 C=3 B=4 17
13 D=4 A=5 C=3 B=5 17
14 B=4 D=3 C=4 A=5 16
15 A=4 D=4 C=5 B=5 18
16 C=3 A=5 B=4 D=4 16
17 C=3 D=7 B=7 A=6 23
18 B=4 C=8 D=4 A=5 22

82
Métodos Estadísticos para la Investigación experimental

Total 69 86 74 86 315
Se desea saber qué cantidad de grados Brix da un mejor sabor a la fruta confitada de mango a
un nivel de 5% de probabilidad. Para calcular el análisis de varianza, confeccionar el siguiente
cuadro auxiliar ordenados en función a los tratamientos.

Cuadro 2: Valores de la evaluación organoléptica.


TRATAMIENTOS
Panelistas A B C D Total
1 6 6 5 5 22
2 6 3 4 2 15
3 5 5 4 3 17
4 5 4 3 2 14
5 5 3 2 2 12
6 5 3 6 4 18
7 5 5 6 5 21
8 5 4 4 4 17
9 5 4 3 2 14
10 6 3 6 2 17
11 8 5 3 4 21
12 6 4 3 4 17
13 5 5 3 4 17
14 5 4 4 3 16
15 4 5 5 4 18
16 5 4 3 4 16
17 6 7 3 7 23
18 5 4 8 4 21
Total 97 78 75 65 315
X 5.38 4.33 3.88 3.61

A. CALCULOS DE LA SUMA DE CUADRADOS

3152
SC TOTAL  62  ...  42   1511  1378.125  132.875
18  4
97 2  ...  652 3152
SC TRATAMIENT O    1407.94  1378.125  29.815
18 18  4
692  ...  862 3152
SC POSICION    12.375
18 18  4
222  ...  222 3152
SC PANELISTA    1426  1378.125  47.875
4 18  4

B. HIPOTESIS
H0 = TA = TB = TC = TD
Ha = TA ≠ TB ≠ TC ≠ TD

CUADRO N° 3. ANVA
FV GL SC CM Fc Significancia
Tratamiento 3 29.815 9.9383 11.142 * *
Panelistas 17 47.875 2.816
Posición 5 12.375 4.125
Error 48 42.81 0.892

83
Elías Alberto Torres Armas, Lic. Ms. C.

Total 71 132.875
*: Existe diferencia significativa con una seguridad del 95% de probabilidad.
* *: Existe diferencia altamente significativa con una seguridad del 99% de
probabilidad.

D. CONCLUSION

Se observa que los tratamientos resultan altamente significativos que conlleva a una
comparación de promedios, como el testigo ha sido comprobado en tres minutos entonces la
prueba apropiada es la Dunnet. Complete el cálculo de la suma de cuadrados y realice la
prueba de comparación múltiple Dunnett.

84
Métodos Estadísticos para la Investigación experimental

CAPÍTULO VI

DISEÑO CUADRADO LATINO: DCL

4. INTRODUCCIÓN

Es el diseño estadístico cuya aplicación cada día es mas frecuente, ya que los
investigadores, conociendo la sencillez en el planteamiento y análisis, hacen
conclusiones muy adecuadas.

5. CARACTERÍSTICAS

- El diseño cuadrado latino tiene las unidades experimentales sujetas (influenciadas) a


una doble división en bloques: (bloque-fila a causa de una fuente de variación y
bloque-columna a causa de otra fuente de variación)
- La distribución de los tratamientos a las unidades experimentales se hace en forma
aleatoria, de modo que cada uno de ello esta una vez y sólo una vez en cada bloque-
fila y en cada bloque-columna.
- Si t es el número de tratamientos, r es el número de bloques-filas y c es el número de
bloques-columnas, entonces, en el diseño cuadrado latino se cumple que: t=r=c. Es
decir, el número de tratamientos es igual al número de filas e igual al número de
columnas.
- Es muy eficaz cuando el número de tratamientos a comparar está entre 4 y 10
(Lizarzaburu,1984), con mayor frecuencia se usan los de 5x5 a 8x8, el de 3x3 y 4x4
se usa cuando se puede repetir el experimento en varios cuadrados latinos.
- El principio de éste diseño es controlar la variabilidad en dos direcciones, siempre y
cuando la variación en ambos sentidos sea pronunciada.
- El número total de unidades experimentales, con una observación por unidad
experimental es r*c ó r2.
- Solamente cuando ambas fuentes de variación (filas y columnas) varían
apreciablemente, el DCL superará al DBCA, respecto a detectar los efectos de
tratamientos

6. VENTAJAS.-

- Controla la fuente de variación en dos direcciones (bloques-fila y bloques-


columna), es decir extrae del error experimental la variación debido a tratamientos,
filas y columnas. En otras palabras, ayuda a controlar mejor la variabilidad del
material experimental al estratificarlo (bloquearlo) de dos modos.
- El análisis es simple.

7. DESVENTAJAS.-

- Se pierde grados de libertad en el error experimental, sacrificando la precisión del


diseño experimental. Con un numero de tratamientos menor que 5 resulta que el
error experimental tendría un número de grados de libertad desproporcionadamente
pequeño

85
Elías Alberto Torres Armas, Lic. Ms. C.

- Número limitado de tratamientos, porque t=r=c. Rara vez se utiliza com más de 10
tratamientos.
- El diseño es rígido en el número de repeticiones y en agrupar los tratamientos en
filas y en columnas en tal forma que ningún tratamiento se repita en fila ni en
columna.

8. USOS

- Se puede emplear siempre que haya homogeneidad dentro de bloques(filas o


columnas), pero alta heterogeneidad entre bloques-fila y entre bloques-columna.

9. RESTRICCIONES

Tiene dos restricciones


- Un tratamiento cualquiera debe estar solamente una vez en la fila-bloque
- Un tratamiento cualquiera debe estar solamente una vez en la columna-bloque.

10. PROCEDIMIENTO DE ALEATORIZACIÓN

- Cuadrado Latino Estándar.- Es aquel en que su primera fila y primea columna


presenta los tratamientos en estricto orden alfabético, asi:
DCL 3x3
A B C
B C A
C A B

DCL 4x4
A B C D
B C D A
C D A B
D A B C

DCL 5x5
A B C D E
B C D E A
C D E A B
D E A B C
E A B C D

- El método del DCL consiste en:

a) Dividir el lote o lugar de la experiencia en un número de unidades


experimentales igual al cuadrado del número de tratamientos.
b) El numero de repeticiones debe ser igual al número de tratamientos
c) Formar filas y columnas de unidades experimentales iguales al número de
repeticiones y tratamientos.
d) Distribuir los tratamientos en tal forma que ningún tratamiento se repita en la fila
ni en la columna.
Para empezar, se arreglan los tratamientos haciendo permutaciones horizontales
a verticales:

86
Métodos Estadísticos para la Investigación experimental

Ejemplo: Supongamos que se tiene 5 tratamientos A, B, C, D, E:

LAS PERMUTACIONES HORIZONTALES, son:


A B C D E
E A B C D
D E A B C
C D E A B
B C D E A
LAS PERMUTACIONES VERTICALES, son:
A E D C B
B A E D C
C B A E D
D C B A E
E D C B A
- Para un número dado de tratamientos existen muchos cuadrados latinos estándar y
por cada uno de ellos a su vez existen otros más. Como no se puede representar
todos los cuadrados latinos para luego seleccionar uno de ellos, tómese uno de
aquellos que resulte de permutar las r filas y c columnas.
- El objeto de la ALEATORIZACIÓN es seleccionar uno de los posibles cuadrados
latinos para el número dado de tratamientos de modo que cada cuadrado latino tiene
igual probabilidad de ser seleccionado. Tiene la finalidad de hacer una distribución
de los tratamientos, más dispersa y evitar que los tratamientos AB, CD, DE, etc.
estén sistemáticamente juntos Ejemplo:
Para t=3, se realizan permutaciones de filas y permutaciones independientes de
columnas de un cuadrado estándar.
Para t=4, Se elige uno de los cuadrados latino base
Se aleatoriza hileras ( o columnas)
Se aleatoriza columnas
Adoptando el procedimiento indicado, podríamos obtener, si salió
elegido el primer cuadrado, si se decidió aleatorizar primero columnas
y después hileras:
1º Cuadrado Latino base
Columnas
1 2 3 4
A B C D
B C D A
C D A B
D A B C
2º Permutación de columnas (sortear las columnas)
Columnas
3 2 4 1
C B D A 1
Filas

D C A B 2
A D B C 3
B A C D 4
3º Permutación de filas (sortear las filas)
B A C D 4
Filas

C B D A 1
A D B C 3
D C A B 2

87
Elías Alberto Torres Armas, Lic. Ms. C.

Se podrá disponer de este último para llevar a cabo el experimento. Con cuadrados
latinos de mayor número de tratamientos se procede en forma similar.
11. ANALISIS

La técnica apropiada es el análisis de varianza correspondiente a un modelo de tres


factores sin interacción, con el único interés de prueba respecto a los tratamientos. Al
igual que los diseños DCA y DBCA, se tiene los siguientes casos: Modelo parámetrico
(tipo I), modelo de componente de varianza (tipo II) y modelo mixto (tipo III); los
modelos mas usados en el DCL son los paramétricos y los mixtos.

MODELO ADITIVO LINEAL

Y(i)jk    t (i)   j   k   (i)jk i, j, k  1,2,..., t


Para i = 1,2,3,...,4 t=4 tratamientos
j= 1,2,3,...,4 r=4 filas
k= 1,2,3,...,4 r=4 columnas

Para i=j=k = 1,2,3,.....t tratamientos=filas=columnas

Donde:

Y(i)jk : Es la respuesta o resultado una unidad experimental clasificada en el j-ésimo


bloque-fila, k-ésimo bloque-columna y que ha recibido el tratamiento i.
µ : Efecto de la media general a la cual esperan alcanzar todas las
observaciones.
τi : Efecto del i-ésimo tratamiento con  i  0

βj : Efecto de la j-ésima fila con  j 0

γk : Efecto de la i-ésima columna con  k 0

ε(i)jk : Error experiemental que pertenece a la Y (i)jk observación tal


que  (0,  2 )
La variable respuesta debe ser normal talque: V (Y(i ) jk )  V ( (i ) jk )   2
Las restricciones con respecto a filas, columnas y tratamientos si estna bajo el criterio del
Modelo I son:  i    j    k  0 . En caso de tratarse de Modelo II: τi , βj, γk, se
considera como variables aleatorias distribuidas normal e independiente con media cero y
varianza   ,  2 ,  2 respectivamente.
2

t es el número de tratamientos que es igual al número de filas y de columnas; La simbología


(i) implica que no es una clasificación ordinaria de tres vias.

SUPUESTOS DEL MODELO ADITIVO LINEAL

88
Métodos Estadísticos para la Investigación experimental

El modelo estadístico debe cumplir con los siguientes supuestos:


6. Aditividad: Los efectos del modelo son aditivos
7. Linealidad: Las relaciones entre los efectos del modelo son lineales
8. Normalidad: Los errores del modelo deben tener una distribución normal con media
2
Cero y varianza σ .
9. Independencia: Los resultados obtenidos en el experimento son independientes entre si.
10. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de los diferentes
2
tratamientos tienen varianzas iguales (σ )
11. Noe existe interacción entre los bloques por filas, los bloques por columnas y los tratamientos.

ANALISIS DE VARIANZA

LAS HIPOTESIS SON:


Hipótesis Modelo I
Respecto a En términos de los H0 : i  0 i
tratamientos efectos de los H a :  i  0 para almenos a lg ún i
tratamientos
En términos de las H 0 : i  0 i
medias de los H a :  i  0 para almenos a lg ún i
tratamientos
Respecto a filas H0 :  j  0
Ha :  j  0
Respecto a columnas H0 :i  0
H a :i  0

CUADRO ANVA Y PRUEBA F


F
FUENTE DE GRADOS SUMA DE CUADRADOS
VARIACION DE CUADRADOS MEDIOS
LIBERTAD
Filas t-1 SCfilas CMfilas CMfilas/
CM E
Columnas t-1 SCcolumnas CMcolumnas CMcolum/
CM E
Tratamiento t-1 SCtratamiento CM tratam. CM tratam.
CM E
Error Experim. (t-1)(t-2) SC error exp. CM E
TOTAL n2-1 SC total

Representación simbólica de los datos del DCL.

FILAS (j) COLUMNAS (k) Total


1 2 3 .. c
1 Y11 Y21 Y31 .. Yt1 Y1.
2 Y12 Y22 Y32 .. Yt2 Y2.
3 Y13 Y23 Y33 .. Yt3 Y3.
4 Y14 Y24 Y34 .. Yt4 Y4.
. . . . . .
. . . . . . Yj.
R
TOTAL Y1. Y2. Y3. Y.k Y..
Total de Tratamientos Y(1). Y(2). Y(3). Y(i).

89
Elías Alberto Torres Armas, Lic. Ms. C.

i = 1,2,3, ....., t Para tratamientos


j = 1,2,3, ....,r filas
k= 1,2,3,….,c columnas
t=r=c
CALCULO DE LAS SUMAS DE CUADRADOS
 SUMA DE CUADRADOS PARA EL TOTAL
t r
Y..2
SCtotal   Yij2 
i 1 j 1 t
 SUMA DE CUADRADOS PARA TRATAMIENTOS
t

Y 2
(i )
Y..2
SCtratamiento  i 1
 2
t t
 SUMA DE CUADRADOS PARA FILAS
t

Y 2
j.
Y..2
SC filas  i 1

t t2
 SUMA DE CUADRADOS PARA COLUMNAS
t

Y 2
.k
Y..2
SC columnas  i 1
 2
t t
 SUMA DE CUADRADOS PARA EL ERROR
S.C.error  SCtotal  SCtratamiento  SC filas  SCcolumnas
También
t t t

t r Y 2
(i ) Y 2
j. Y 2
.k
Y..2
S .C.total   Y  2
ij
i 1
 i 1
 i 1
2
i 1 j 1 t t t t

El valor del Fcalculado en el cuadro ANVA se denomina: CMtratamientos/CMerror y para tomar la


decisión comparado con Ftabular.

Ejemplo. En un experimento se probó 4 nuevas raciones para evaluar la producción de la


leche durante el primer mes de lactación en vacas de 1º, 2º, 3º y 4º parto, se emplearon 16
vacas de 4 razas distintas: 4 Holstein, 4 B.S., 4 Normando y 4 Simmental. Los tratamientos
están dados por las letras A, B, C y D; a continuación se presentan los resultados del
experimento:
FILAS (j) COLUMNAS (k) LACTACIONES Total
RAZAS Yj.
1 2 3 4
NORMANDO 630ª 680B 750C 810D Y1.
B.S. 890D 750A 790B 840C Y2.
SIMMENTAL 750C 800D 600A 620B Y3.
HOLSTEIN 940B 990C 1050D 800A Y4.
TOTAL Y.k Y1.=3210 Y2.=3220 Y3.=3190 Y4.=3070 Y..
Total de Tratamientos Y(1).=2780 Y(2).=3030 Y(3).=3330 Y(4).=3550 12690
A B C D
Hágase un análisis de varianza para probar la significación de los tratamientos

SOLUCION:

90
Métodos Estadísticos para la Investigación experimental

H0 : i  0 i
H a :  i  0 para almenos a lg ún i

H 0 : i  0 i
H a :  i  0 para almenos a lg ún i

CALCULO DE LAS SUMAS DE CUADRADOS

 SUMA DE CUADRADOS PARA EL TOTAL

t r
Y..2 1260 2
SCtotal   Yij2   600 2  ...  800 2   10315300  10064756,25
i 1 j 1 t 16
SCtotal  250543.75
 SUMA DE CUADRADOS PARA TRATAMIENTOS
t

Y 2
Y..2 27802  30302  33302  35502 12602
(i )
SCtratamiento  i 1
  
t t2 4 16
SCtratamiento  10150175  10064756.25  85418.75

 SUMA DE CUADRADOS PARA FILAS (RAZAS)


t

Y 2
Y..2 2870 2  3270 2  2770 2  3780 2 1260 2
j.
SC filas  i 1
  
t t2 4 16
SC filas  10222775  10064756.25  158018.75

 SUMA DE CUADRADOS PARA COLUMNAS (LACTACIONES)


t

Y 2
Y..2 3210 2  3220 2  3190 2  3070 2 1260 2
.k
SC columnas   2
i 1

t t 4 16
SC columnas  10068375  10064756.25  3618.75

 SUMA DE CUADRADOS PARA EL ERROR

S.C.error  SCtotal  SCtratamiento  SC filas  SCcolumnas

SCerror=250543.75-3618.75-158018.75-85418.75=3487.5

CUADRO DE ANÁLISIS DE VARIANZA

F de V SC gl CM Fc
Lactaciones 3618.75 3 1206.25 2.07526882
Razas 158018.75 3 52672.9167 90.6200717
Tratamientos 85418.75 3 28472.9167 48.9856631
Error 3487.5 6 581.25
Total 250543.75 15 16702.9167

91
Elías Alberto Torres Armas, Lic. Ms. C.

Decisión:

Conclusión

Salida del SPSS v.15


Pruebas de los efectos inter-sujetos

Variable dependiente: Producción de leche

Suma de cuadrados tipo Media


Fuente III gl cuadrática F Significación
Modelo corregido 247056.250(a) 9 27450.694 47.227 .000
Intersección 10064756.2
10064756.250 1 17315.710 .000
50
Razas 158018.750 3 52672.917 90.620 .000
Lactaciones 3618.750 3 1206.250 2.075 .205
Tratamientos 85418.750 3 28472.917 48.986 .000
Error 3487.500 6 581.250
Total 10315300.000 16
Total corregida 250543.750 15
a R cuadrado = .986 (R cuadrado corregida = .965)

92
Métodos Estadísticos para la Investigación experimental

CAPÍTULO VII

REGRESION Y CORRELACION SIMPLE

1. Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés.
Variable dependiente: la variable que se pronostica o estima. Variable independiente: la
variable que proporciona la base para la estimación. Es la variable predictora.
2. Modelo de regresión lineal simple. Propósito: determinar la ecuación de regresión; se usa
para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X).
El modelo es: Yi   0  1 X i   i
3. Estimación de los parámetros del modelo de regresión. Procedimiento: seleccionar una
muestra de la población y enumerar los datos por pares para cada observación; dibujar un
diagrama de dispersión para visualizar la relación; determinar los estimadores de los
parámetros  0 , y 1 del modelo de regresión. La ecuación de regresión estimada es:
Yˆ  b0  b1 x , Donde:
Yˆ Es el valor promedio pronosticado de Y para cualquier valor de X.
b0: Es el estimador de  0 , es la intercepción en Y, o el valor estimado de Y cuando X = 0
b1: Es el estimador de 1 , es la pendiente de la recta, o cambio promedio en Yˆ por cada
cambio de una unidad en X
Para el cálculo de a y b, se usa el método de mínimos cuadrados ordinarios:

 x y
 xy  n SP. XY Suma de productos XY  y b x
b1    , b0 
( x) 2 1
SC. X suma de cuadrados de X n n
x 2

n

Suposiciones fundamentales de regresión lineal. Para cada valor de X, existe un grupo de


valores de Y que tienen una distribución normal. Las medias de estas distribuciones normales
de valores de Y deben estar sobre la recta de regresión. Las desviaciones estándar de estas
distribuciones normales son iguales. Los valores de Y son estadísticamente independientes.
Es decir, que en la selección de una muestra, los valores elegidos de Y para un valor particular
de X no dependen de los valores de Y para otro valor de X.
4. Pruebas de significación del modelo
Análisis de varianza. Prueba global de significación del modelo (Prueba F)
Hipótesis y nivel de significación:
H 0 :  i  0 ( No existe regresión lineal entre X e Y )
H 1 :  i  0 ( Existe regresión lineal entre X e Y )
 : Nivel de significac ión
CÁLCULO DE LA SUMAS DE CUADRADOS

93
Elías Alberto Torres Armas, Lic. Ms. C.

( y ) 2
SCT   y2  n

SCR   1 ( xy 
 x y ) ó SCR   ( x  2 2
( x) 2
1
n n
SCE  SCT  SCR

CUADRO DE ANÁLISIS DE VARIANZA


Fuente de variación Suma de Grados de Cuadrados Fc
cuadrados libertad medios
Debido a la SCR 1 CMR=SCR/1 CMR/CME
regresión
Debido al error SCE n-2 CME=SCE/(n-2)
Total SCT n-1
Decisión y conclusión: Re chazarH 0 SiFc  F(1,n2)
Error estándar de la estimación. El error estándar de la estimación mide la dispersión de los
valores observados alrededor de la recta de regresión. Fórmulas usadas para calcular el error
estándar:

S y. x 
 (Y  Yˆ ) 2


y 2
 b0  y  b1  xy
ó S y. x 
SCE
 CME
n2 n2 n2

PRECISION DE LOS ERRORES ESTANDAR DE LOS ESTIMADORES DE j

CME CME
Var (b1 )   s b1 
SCX SCX
( x 2 )CME ( x 2 )CME
Var (b0 )   s b1 
nSCX nSCX

INTERVALO DE CONFIANZA PARA LOS ESTIMADORES DE  j


b0  t n  2; s b0   0  b0  t n  2; s b0
b1  t n  2; s b1   1  b1  t n  2; s b1
Prueba individual de significación de los estimadores de  j del modelo (Prueba t-
student)
Hipótesis H 0 : 0  0
H1 :  0  0
PARA  0
Nivel de significac ión : 
b0
Estadistic a de prueba : t c   t n  2;
s b0
Decisón : Re chazar H 0 si t c  t n  2; prueba bilateral
si t c  t n  2; prueba unilateral izquierda
si t c  t n  2; prueba unilateral derecha

94
Métodos Estadísticos para la Investigación experimental

Hipótesis H 0 : 1  0
H 1 : 1  0
PARA  1 Nivel de significac ión : 
b1
Estadistic a de prueba : t c   t n  2;
s b1
Decisón : Re chazar H 0 si t c  t n  2; prueba bilateral
si t c  t n  2; prueba unilateral izquierda
si t c  t n  2; prueba unilateral derecha
Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la
relación (correlación) entre dos variables. Coeficiente de correlación, r: El coeficiente de
correlación (r) es una medida de la intensidad de la relación entre dos variables. Requiere datos
con escala de intervalo o de razón (variables). Puede tomar valores entre -1.00 y 1.00. Valores de
-1.00 o 1.00 indican correlación fuerte y perfecta. Valores cercanos a 0.0 indican correlación
débil. Valores negativos indican una relación inversa y valores positivos indican una relación
directa. Fórmula para r
 x y
 xy  n SCR SCE
r ó r  1
( x) 2 ( y ) 2 SCT SCT
( x 2
)( y 
2
)
n n
Correlación negativa perfecta

Correlación positiva perfecta

Correlación cero Correlación positiva


fuerte

Coeficiente de determinación. El coeficiente de determinación, r2 es la proporción de la


variación total en la variable dependiente Y que está explicada por o se debe a la variación en
la variable independiente X.
El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores
de 0 a 1.
Prueba individual de significación del coeficiente de correlación (Prueba t-student)

95
Elías Alberto Torres Armas, Lic. Ms. C.

Hipótesis H0 :   0
H1 :   0
Nivel de significac ión : 
r n2
Estadistic a de prueba : t c   t n  2;
1 r2
Decisón : Re chazar H 0 si t c  t n  2; prueba bilateral
si t c  t n  2; prueba unilateral izquierda
si t c  t n  2; prueba unilateral derecha
5. Predicción. El intervalo de confianza (de predicción) de 100(1-α)% para la media de Y dado
un valor de X está definido por:

1 ( X  X )2 1 ( X  X )2
yˆ  t  CME (   Y  ˆ
y  t  CME ( 
n  2;1 n SCX n  2;1 n SCX
2 2
El intervalo de predicción (de predicción) de 100(1-α)% para un valor individual de Y dado
un valor de X se define por:

1 ( X  X )2 1 ( X  X )2
yˆ  t  CME (1    Y  yˆ  t  CME (1  
n  2;1 n SCX n  2;1 n SCX
2 2

Ejemplo. Se efectuó un experimento para evaluar el efecto el zinc en el peso de las cacatúas.
En el experimento, a 7 grupos de cacatúas adultas se les dio diferentes dosis de zinc y sus
pérdidas de peso tras la primera semana fueron registradas. Los datos de los pesos medios
por grupo al final de la semana están expresados como porcentajes sobre los pesos iniciales.

X(Ingesta Y(Peso
X2 Y2 XY
de zinc) medio %)
1 0 100 0 10000 0
2 2 92 4 8464 184
3 4 95 16 9025 380
4 8 90 64 8100 720
5 12 98 144 9604 1176
6 16 85 256 7225 1360
7 30 67 900 4489 2010
SUMA 72 627 1384 56907 5830
 X Y 72  627
 XY  n
5830 
7
1   , 1  -0.96225577
 X 2 72
2

X  n 2 1384 
7

0 
 Y     X   627   0.96225577 72  ,  0  99.4689165
n
1  n  7  7 
 
Ecuación: Y   0  1 X  Y  99.4689165 - 0.96225577 X
 X Y 72  627
CORRELACIÓN:  XY  n
5830 
7
  

 X2   X 
2
 Y 2   Y  
 2
 
1384 
72 2

 56907 
627 2 
 n 
 n 

 7  7 
  

96
Métodos Estadísticos para la Investigación experimental

  0.89382905
Coeficiente de determinación:  2  - 0.893829052   2  0.79893037
Nota : El 80% de “Y” depende de “X”

ANÁLISIS DE VARIANZA:
Hipótesis

H0: No existe regresión lineal entre x e y


Ha: Si existe regresión lineal entre x e y

 Y  2
627 2
SCTOTAL  Y  2
 56907   745.714286
n 7

  X 2 
  -0.962255771384  72
2

SC REGRESIÓN  1  X 
2
   595.7737884
 n   7 
 
SC ERROR  SCTOTAL  SC REGRESION  745.714286 - 595.7737884  149.9404973

Cuadro ANVA:
F.V. S.C. G.L. C.M. F.C. Sig.
Regresión 595.7737884 1 595.7737884 19.8670072 **
Error 149.9404973 5 29.98809947
TOTAL 745.7142857 6
Decisión: Ft = F (1,5)0.05 = 3.84. Fc > Ft entonces se rechaza H0.
Conclusión: Existe suficiente evidencia estadística de que existe regresión lineal entre x e
y.

97
Elías Alberto Torres Armas, Lic. Ms. C.

CAPÍTULO VIII

REGRESIÓN LINEAL MÚLTIPLE:

1.1. INTRODUCCIÓN:

En los trabajos de Investigación es necesario emplear técnicas estadísticas que permitan


interpretar los resultados y de estas forma poder llegar a conclusiones valederas que permitan al
investigador aceptar o rechazar Hipótesis planteadas inicialmente e inclusive formular nuevas
hipótesis, una de esas técnicas de gran utilidad es el análisis de regresión que permite
estudiar la asociación entre dos o más variables.

REGRESIÓN: Consiste en determinar una relación funcional entre las variables con el fin de
que se pueda predecir el valor de una variable (dependiente) en base a otra(s) variables
(independientes).

CORRELACIÓN: Consiste en determinar la variación conjunta de las variables, su grado de


relación y su sentido (positivo o negativo).

Los modelos para un análisis de regresión múltiple son similares a los de regresión lineal simple,
excepto que contienen más términos y pueden servir para proponer relaciones más complejas que
una línea recta en lugar de usar un modelo de línea recta E(y) =β0 + β1 X , para modelar el
componente determinístico podríamos emplear el modelo cuadrático E(y) =β0 + β1X + β2X2
También conocido como modelo de segundo orden se representa gráficamente como una
parábola en contraste con los modelos de línea recta o modelos de primer orden.

Si por añadidura pensamos incluir en el modelo otra variable una gráfica de E(y) como función
de X1, X2 describe una superficie de respuesta en el plano (X 1,X2) y el modelo de primer orden
es: E(y) =β0 + β1 X1 + β1X2 (describe una superficie plana) sin embargo en la mayor parte de
las aplicaciones de la vida real esperaríamos una curvatura en la superficie de respuesta y
utilizaríamos un modelo de tercer orden: E(y)  0  1 X1  2 X 2  3 X1 X 2  4 X12  5 X 23
para modelar la relación.

98
Métodos Estadísticos para la Investigación experimental

Estos modelos e denominan modelos lineales generales porque E(y) es función lineal de los
PARÁMETROS desconocidos
β0, β1, β2...

 1 X
El modelo E ( y )   0  no es un modelo lineal porque E(y) no es función lineal de los
parámetros β0 + β1

Podemos incluir variables cuantitativas y cualitativas en el modelo, éstas variables son


denominadas ficticias, dicotomas o de índice. Ejemplo:
Si E(y): Tiempo medio para ejecutar un trabajo
X : Día de la semana en que se ejecuta en trabajo
X1= 1 Si la observación se hace en domingo
0 Si no es así.
X2= 1 Si la observación se hace en lunes
0 Si no es así.
X3= 1 Si la observación se hace en martes
0 Si no es así.
X4= 1 Si la observación se hace en miércoles
0 Si no es así.
X5= 1 Si la observación se hace en jueves
0 Si no es así.
X6= 1 Si la observación se hace en viernes
0 Si no es así.

Podemos escribir el modelo:

E(y)   0  1 X 1   2 X 2   3 X 3   4 X 4   5 X 5   6 X 6
Las variables ficticias introducen al parámetro β apropiado ( de que puede ser positivo o
negativo) dependiendo del día de la semana. Así: En domingo X1= 1, X2 = X3, ...., = X6 = 0 y el
valor medio de Y es:

E(y) =β0 + β1(1)


E(y) =β0 + β1
En lunes E(y) =β0 + β2
En martes E(y) =β0 + β3
En miércoles E(y) =β0 + β4
En jueves E(y) =β0 + β5
En viernes E(y) =β0 + β6
En sábado se asigna 0 a todas las variables ficticias y el valor medio de Y es: E(y) =β0

Se recomienda seleccionar el modelo de regresión apropiado para una situación en particular.


Ningún método estadístico puede compensar una mala selección del modelo. Propondremos un
análisis más profundo al respecto en una próxima sesión. En el presente su pondremos que se ha
seleccionado un modelo razonable para la situación y nos concentraremos en el procedimiento de
ajuste del modelo a un conjunto de datos y en los métodos asociados de inferencia estadística.

Después de haber seleccionado una porción determinística de un modelo de regresión, esto es


para E(y) agregamos un componente ε a fin de compensar el error aleatorio, de modo que se
tiene:

99
Elías Alberto Torres Armas, Lic. Ms. C.

Y = E(y) + ε

Componente
aleatorio
Componente
Determinístico
El componente aleatorio ε debe obedecer los supuestos del modelo de regresión lineal:

 Tenga distribución normal con media 0 y varianza σ2. Esto implica que la media de Y
equivale al componente deterministico

E(y)   0  1 X 1  ...   k X k
 Para todos los valores de las variables independientes X1, X2, X3,..., Xk la varianza de ε es
constante.

 La distribución de probabilidad de ε es normal.


 Los errores aleatorios asociados a cualquier par de Y son independientes (en sentido
probabilístico).

1.2. DESCRIPCIÓN DE LOS DATOS Y DEL MODELO:

Los datos consisten de n observaciones sobre una variable independiente o respuesta Y y de


K variables independientes:
X1, X2, X3, ..., Xk. Si n  k y Xij es la ij-ésima observación o nivel de la variable Xj , donde
i=1,2,3,...,n; j=1,2,3,..,k.

Las observaciones usualmente son presentadas de la siguiente manera:


Observaciones Y X1 X2 X3 ... Xk
1 Y1 X11 X12 X13 ... X1K
2 Y2 X21 X22 X23 ... X2K
3 Y3 X31 X32 X33 ... X3K
. . . . . ... .
. . . . . ... .
. . . . . ... .
n Yn Xn1 Xn2 Xn3 … Xnk

Las relaciones entre la variable Y con las variables X1, X2, X3, ..., Xk, donde cada observación (Xi1
Xi2 Xi3 ... Xik , Y) satisface el modelo lineal general de regresión siguiente:

Yi   0  1 X i1   2 X i 2   3 X i3  ...   k X ik   i

Cada modelo describe un hiperplano en el espacio k-dimensional formado por {Xi }


Donde:
Yi: Variable dependiente ( respuesta)

100
Métodos Estadísticos para la Investigación experimental

X1, X2, X3, ..., Xk: variables independientes. Podrían en realidad representar los
cuadrados cubos productos cruzados u otras funciones
(sen, log. Etc.) de las variables de predicción. Lo esencial es
que se pueden medir sin error cuando se observe un valor
de Y y que no intervengan parámetros desconocidos.
βj: Parámetros de la regresión . constantes desconocidas.
Expresan el incremento en la variable respuesta Y que se
corresponde a una unidad de incremento en Xj cuando
otras variables Xi i  j  se mantienen constantes.
εi: Vector aleatorio de errores supuestos.

Los coeficientes βj : 0,k son estimados por el método de mínimos cuadrados, así:
El modelo:
Yi   0  1 X i1   2 X i 2   3 X i3  ...   k X ik   i
Despejando εi y elevando al cuadrado ambos miembros:
(εi)2= (Yi  (  0  1 X i1   2 X i 2   3 X i 3  ...   k X ik ))
2

Aplicando el operador de sumatoria en ambos miembros de la igualdad:


n n
 i 
2
 (Yi  (  0  1 X i1   2 X i 2   3 X i 3  ...   k X ik ))2
i 1 i 1

Derivando parcialmente con respecto a β j e igualando a cero buscamos minimizar la suma de los
cuadrados del error aleatorio:
n n
 i 
2
 (Yi  Yˆi ) 2  SSE
i 1 i 1
Obteniéndose un sistema de ecuaciones lineales simultaneas llamadas ecuaciones normales de
mínimos cuadrados del modelo:
SSE
0
 0
SSE
0
1
SSE
0
 2
.
.
.
SSE
0
 k
Examinemos la primera ecuación:

101
Elías Alberto Torres Armas, Lic. Ms. C.

Si tomamos la primera derivada parcial de SSE con respecto a β 0 obtenemos:

SSE n
 2 (Yi  (  0  1 X i1   2 X i 2   3 X i 3  ...   k X ik ))(1)
 0 i 1

Introduciendo el operador SUMATORIA e Igualando a cero, queda:

Yi  (n 0  1X i1   2 X i 2   3X i3  ...   k X ik )  0


Osea: (despejando e intercambiado miembros):

n 0  1X i1   2 X i 2   3X i3  ...   k X ik  Yi


Esta es una ecuación lineal en los β parámetros. Las ecuaciones de mínimos cuadrados restantes
todas lineales en los β parámetros son:
 0 X i1  1X i21   2 X i1 X i 2  ...   k X i1 X ik  X i1Yi
 0 X i 2  1X i 2 X i1   2 X i22  ...   k X i 2 X ik  X i 2Yi
.
.
.
 0 X ik  1X ik X i1   2 X ik X i 2  ...   k X ik2  X ik Yi
Luego el sistema es:

n 0  1X i1   2 X i 2   3X i3  ...   k X ik  Yi


 0 X i1  1X i21   2 X i1 X i 2  ...   k X i1 X ik  X i1Yi
 0 X i 2  1X i 2 X i1   2 X i22  ...   k X i 2 X ik  X i 2Yi
.
.
.
 0 X ik  1X ik X i1   2 X ik X i 2  ...   k X ik2  X ik Yi
El sistema tiene p = k +1 ecuaciones e incógnitas

Como puede verse, escribir k+1 ecuaciones lineales de mínimos cuadrados ya cuesta trabajo,
resolverlos simultáneamente a mano es todavía más difícil. Una forma fácil de expresar las
ecuaciones y resolverlos es mediante el álgebra de Matrices y obtener fórmulas para las
estimaciones de los coeficientes de regresión lineal de mínimos cuadrados, SSE, estadísticas de prueba, intervalos de
confianza y de predicción.

102
Métodos Estadísticos para la Investigación experimental

1.2.1. ECUACIONES DE MINIMOS CUADRADOS Y SU RESOLUCION:


ENFOQUE MATRICIAL.

Es preciso acomodar los datos en matrices siguiendo un patrón específico:

Supondremos que el modelo es:

Y = βo + β1X1 + β2X2 + β3 X3 +…+βk Xk + ε


Donde:
X1 X2 X3 … Xk: Variables de predicción
ε : error aleatorio
p = k +1: número de parámetros del modelo
k: Número de variables de predicción

Supongamos que se tiene una muestra de tamaño n ( n  k ) que se denota así:

Valor Variables explicatorias Error


de aleatorio

Datos Y X1 X2 X3... Xk ε
1 Y1 X11 X12 X13...X1K ε1
2 Y2 X21 X22 X23...X2K ε2
3 Y3 X31 X32 X33...X3K ε3
. . . . . ....
. . . . . ....
. . . . . ....
n Yn Xn1 Xn2 Xn3… Xnk εk
En notación matricial:
En forma desarrollada puede verse así:

Y1  1 X11 X12 X13 ... X1p 


  1 
Y     0  
1  1 
X 21 X 22 X 23 ... X 2p 
 2   2
Y3  1     3 
 2 
X31 X32 X33 ... X3p
    
.   . . . . . .  ..   . 
.   
. . . . . .  .  . 
     
.  . . . . . .  .  . 
Y     
 n  nx1 1 X n1 X n2 X n3  X np    k  px1  n  nx1
 nxp
Ynx1 = Xnxp . βpx1 + εnx1

Matriz de error: εnx1


Matriz de parámetros coeficientes de regresión: βpx1

103
Elías Alberto Torres Armas, Lic. Ms. C.

k: número de variables X´s, p= k +1 n° de parámetros


Matriz de datos x´s: Xnxp
Matriz de los datos Y´s : Ynx1

OBSERVACIONES:
 La primera columna de X es una columna de unos, es decir estamos insertando un valor
de X, específicamente X0 como coeficiente de βo donde X0 es una variable que siempre
toma valores iguales a 1.
 Hay una columna en la matriz X para cada parámetro β
 Un punto de datos en particular se identifica mediante filas específicas de las matrices Y y
X. Ejemplo: el Valor de Y para el punto de datos 3, osea y 3 está en la tercera fila de la
matriz Y y sus valores correspondientes de X1 X2 X3 … Xk aparecen en la tercera fila de
la matriz X.
 Con ésta notación el modelo lineal general se pude expresar en la forma de matriz como:
Y = Xβ + ε
 La matriz β contiene a los parámetros βo, β1, β2, β3,…,βp de modo que resolver el sistema
nos dará como resultado, las estimaciones de mínimos cuadrados de cada uno de ellos,
denotados por:
ˆ  ( ˆ 0 ˆ1 ˆ 2 ˆ 3  ˆ ) ' y el modelo de estimación es
y  Xˆ   , donde y  Yˆ

Ahora bien:

ESTIMACIÓN DE LOS PARÁMETROS

Utilizamos las matrices de datos Y y X, sus transpuestas y la matriz ˆ  ( ˆ 0 ˆ1 ˆ 2 ˆ 3  ˆ ) '


, podemos escribir las ecuaciones de mínimos cuadrados, así:

* El modelo: y  Xˆ  
 Despejando ε
  y  Xˆ

 Elevando al cuadrado en ambos miembros , en notación matricial es multiplicar por la


izquierda en cada miembro por su transpuesta correspondiente:

 '  ( y  Xˆ )'( y  Xˆ )

 '  ( y  Xˆ )( y'( Xˆ )')


 '  y' y  y' ( Xˆ )  ( Xˆ )' y  ( Xˆ )' Xˆ

y ' ( Xˆ )  ( Xˆ )' y

 '  y' y  y' ( Xˆ )  y' ( Xˆ )  ( Xˆ )' Xˆ

104
Métodos Estadísticos para la Investigación experimental

Se obtiene:

 '  y' y  2 y' ( Xˆ )  ˆ ' X ' Xˆ

 Derivando con respecto a ̂ para minimizar  ' que es la suma de cuadrados del
error:

 ' 
 2 X ' y  2 X ' Xˆ
ˆ
 Igualando a cero:

 2 X ' y  2 X ' Xˆ  0


Obtenemos:

X ' Xˆ  X ' y

 Para despejar ̂ multiplicamos en ambos miembros de la igualdad por (X’X)-1 que es la


inversa de la matriz X’X:

(X’X)-1 X’X ̂ = (X’X)-1X’y

Por tanto:

= (X’X)-1X’y

 PARA EL CÁLCULO, A PARTIR DE:

Y1  1 X11 X12 X13 ... X1p 


  1 
Y     0  
1  1 
X 21 X 22 X 23 ... X 2p 
 2   2
Y3  1     3 
 2 
X31 X32 X33 ... X3p
    
.   . . . . . .  ..   . 
.   
. . . . . .  .  . 
     
.  . . . . . .  .  . 
Y     
 n  nx1 1 X n1 X n2 X n3  X np    k  px1  n  nx1
 nxp

105
Elías Alberto Torres Armas, Lic. Ms. C.

SE ESCRIBE:

1 1 1  1  1 X11 X12 X13 ... X1k 


  
X11 X 21 X 31  X n1  1 X 21 X 22 X 23 ... X 2k 
X12 X 22 X32  X n2  1 X31 X32 X33 ... X3k 
   
X ' X  X13 X 23 X33  X n3  . . . . . .
  . . . . . .
   
.  . . . . . .
  1 X n1 X n2 X n3  X nk  nxp
X1k X 2k X3k  X nk  pxn 

El producto resulta:

n  Xi1 Xi2 Xi3 ...  Xik 


 
Xi1 Xi12 Xi1 Xi2  Xi1 Xi3 ... Xi1 Xik 
X Xi1Xi2 Xi22 Xi2 Xi3 ... Xi2 Xik 
 i2 
 X Xi1Xi3 Xi2Xi3 Xi32 Xi3Xik 
X ' X   i3 
 
      
 
 
X Xi1Xik X i 2 X ik Xi3Xik Xin Xik  pxp
 ik

X’X: Es una matriz no singular, es matriz cuadrada. El cálculo de su inversa se realiza


mediante:

(X’X)-1 = (1/|X’X|)adjunta(X’X)

1 1 1  1  Y1  Yi1 
    X Y 
X11 X 21 X 31  X n1  Y2  i1 1 

X12 X 22 X32  X n2  Y3  X i 2Y2 
     
X ' Y  X13 X 23 X33  X n3  .   X i 3Y3 
  .   
     
 .  .   
  Y   
X1k X 2k X3k  X nk  pxn  n  nx1 X ikYn  px1

Luego el vector de parámetros es:

106
Métodos Estadísticos para la Investigación experimental

 0 
 
 1 

ˆ  ( X ' X ) X ' Y    2 
1
 
 
  K 

Y el modelo de regresión estimado es:


k
Yˆi  ˆ 0   ˆ j X ij ; i  1, n  j  1, k
j 1

Yˆ  Xˆ

1.3. CARACTERÍSTICAS DE LOS ESTIMADORES ̂ DE MINIMOS


CUADRADOS
a. ESPERANZA MATEMÁTICA DE ̂
E( ̂ )=
Demostración:
E( ̂ )= E ( X ' X ) 1 X ' Y )  E ( X ' X ) 1 X ' ( X   )
E( ̂ )= E (( X ' X ) 1 X ' X  ( X ' X ) 1 X '  )
E( ̂ )= E (  )  ( X ' X ) 1 X ' E ( )
E( ̂ ) = 
b. VARIANZA Y COVARIANZA DE ̂

Var-cov( ̂ )=  2 ( X ' X ) 1

Demostración:

Var-cov( ̂ )=E( ̂ -E( ̂ ))( ̂ -E( ̂ ))’


Var-cov( ̂ )=E( ̂ -  )( ̂ -  )’

Observe que:
ˆ  ( X ' X ) 1 X ' Y donde Y  X  
ˆ  ( X ' X ) 1 X ' ( X   )
ˆ  ( X ' X ) 1 X ' X  ( X ' X ) 1 X ' 
ˆ    ( X ' X ) 1 X ' 
ˆ    ( X ' X ) 1 X ' 

107
Elías Alberto Torres Armas, Lic. Ms. C.

Var-cov( ̂ )=E[( ( X ' X ) 1 X '  )( ( X ' X ) 1 X '  )’]


Var-cov( ̂ )=E[ ( X ' X ) 1 X '  ' X ( X ' X ) 1 ]
Var-cov( ̂ )= ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1
Observe: E ( ' )   2 I n (Demostración para el lector)
Var-cov( ̂ )= ( X ' X ) 1 X '  2 I n X ( X ' X ) 1
Var-cov( ̂ )= ( X ' X ) 1 X ' X 2 I n ( X ' X ) 1
Var-cov( ̂ )=  2 ( X ' X ) 1

c. Los errores estándar y la covarianza de los estimadores ̂ j se determinan mediante los


elementos de la matriz (X’X)-1 cuya notación es:
c00 c01 c02 c03  c0k 
c c11 c12 c13  c1k 
 10
1
( X ' X )  c20 c21 c22 c23  c2k   cij
 
      
ck 0 ck1 ck 2 ck 3  ckk  pxp
Los elementos de la diagonal proporcionan los valores que se necesitan para calcular los errores
estándar de los estimadores. De modo que:
Var-cov( ̂ j )= 
2
c jj
Luego: Los errores estándar de los estimadores de ̂ j son:

SE ( ˆ j )   c jj , Donde  es la desviació del error aleatorio

Los elementos que están fuera de la diagonal proporcionan valores necesarios para calcular las
covarianzas de los parámetros, digamos
̂ j , ̂ i Donde i j
cov( ˆ i ˆ j )=  cij   2 c ji
2

Estas covarianzas son necesarias para determinar la varianza de la ecuación de predicción, o


cualquier otra función lineal de parámetros. Desempeñan un papel el el establecimiento de un
intervalo dre confianza para E(y) y un intervalo de predicción para Y

ESTIMADOR DE  2 . VARIANZA DE  EN EL MODELO DE REGRESIÓN


MÚLTIPLE
Las varianzas de los estimadores de los parámetros y de Yˆ dependen del valor de  (varianza
2
del error aleatorio  ) que aparece en el modelo y casi nunca se se le conoce por adelantado,
debemos usar los datos de la muestra para estimar su valor

108
Métodos Estadísticos para la Investigación experimental

Y ' Y  ˆ ' X ' Y SSE


2  
n p n p

COMPONENTES DE LA SUMA DE CUADRADOS DEL TOTAL DE Y

SCT = SCR + SCE

 Suma de cuadrados del total de Y.


SCT  Y ' Y  nY 2
 Suma de cuadrados de la regresión
SCR  ˆX ' Y  nY 2
 Suma de cuadrados del error (residual)
SCE  Y 'Y  ˆX 'Y
 Varianza explicada SCR/n Varianza no explicada SCE/n-p
1.4. PRUEBA DE HIPÓTESIS EN LA REGRESIÓN LINEAL MÚLTIPLE

a. Prueba para la significación de la regresión

Hipótesis
H0: β1= β2= β3=…=βK=0
H1: Por lo menos uno de los parámetros es distinto de cero
ANÁLISIS DE VARIANZA
Fuente de Suma de G. L. Cuadrados FC
Variación cuadrados medios
REGRESIÓN SCR K CMR CMR/CME
ERROR SCE n-p CME
TOTAL SCT n-1

Donde: n es tamaño de la muestral o número de datos


k número de variables independiente
p número de parámetros

Rechazar H0 Si Fc es mayor que F(k, n-p) 

El rechazo de H0 implica que al menos una de las variables de regresión tienen una contribución
significativa en el modelo.

b. PRUEBAS SOBRE LOS COEFICIENTES INDIVIDUALES DE REGRESIÓN


Estas pruebas son útiles para determinar el valor potencial de cada una de las variables de
regresión del modelo, así el modelo puede ser mas eficaz con la inclusión de variables adicionales
o quizá con la eliminación de una o más regresoras presentes en el modelo
Hipótesis
H0 : ̂ j =0
H1 : ̂ j ≠0
ESTADÍSTICA DE PRUEBA

109
Elías Alberto Torres Armas, Lic. Ms. C.

ˆ j
TO 
ˆ 2 c jj
DECISIÓN:
Rechazar H0 si |To|> tn-p para un  % de significación
CONCLUSIÓN
Si no se rechaza la hipótesis H0 indica que el regresor Xj puede eliminarse del modelo

1.5. MEDIDAS DE ADECUACION DEL MODELO

a. Coeficiente de determinación múltiple

Es una medida de la magnitud de la reducción en la variabilidad de Y, obtenida mediante el


empleo de variables de regresión X1 X2 X3 … Xk.

SSR SSE
R2  1 , 0  R2 1
SCT SCT
R2 grande no necesariamente implica que el modelo de regresión sea bueno, pues la adición de
una variable al modelo siempre aumenta R2 sin importar si la variable es o no estadísticamente
significativa.
 R 2  R Es el coeficiente de correlación múltiple entre Y y el conjunto de variables de
regresión X1 X2 X3 … Xk
R es una mediad de asociación lineal que existe entre Y y X1 X2 X3 … Xk. Cuando k=1
tenemos el coeficiente de correlación simple entre Y y X

PROBLEMAS PROPUESTOS DE REGRESION LINEAL MULTIPLE

1. dados los siguientes datos: X1 X2 Y


1 4 6.4
3 3 4.3
4 2 2.2
Donde: X1: Precio en soles
X2: Ingreso en cientos de soles,
Y: Demanda de cuadernos en miles de unidades
a) Calcular la ecuación de la demanda e interpretar sus pendientes.
b) Si los errores estándar de 1 y 2 son respectivamente 0.006 y 0.005 en una muestra de
tamaño n=10. Probar si es significativo el aporte del ingreso al modelo. Como debería ser
el modelo? ( Usar 5% de significancia)

2. En un estudio de 125 trabajadores expuestos a compuestos químicos contaminados con


dioxina (Y) en un trabajador (medido en partes por millon) con variables independientes:

X1: Logaritmo de los años de exposición a la dioxina.


X2: Número de años de la primera exposición.
X3: Edad(en años).
X4: Índice de masa corporal.
Los resultados computarizados según Eviews se muestran en el siguiente cuadro:
Variable coeficiente error estándar t-estadístico

110
Métodos Estadísticos para la Investigación experimental

C 1.721 0.770 2.24


X1 0.566 0.054 10.48
X2 -0.085 0.018 -4.72
X3 0.044 0.010 4.40
X4 0.075 0.021 3.57........
a) Probar la significación del modelo
b) Probar la significación de los parámetros de regresión e indicar el efecto sobre el nivel de
dioxina en un trabajador.
c) Describir el modelo de regresión lineal e interpretar el coeficiente de correlación y
determinación.
d) Qué aporte técnico consideraría Ud. respecto a los resultados obtenidos en éste análisis.

3. Dados los siguientes datos: X1 X2 Y


2 1 1.1
3 2 2.2
1 1 1.2
Donde: X1: Precio en soles
X2: Ingreso en cientos de soles,
Y: Demanda de cuadernos en miles de unidades
a) Calcular la ecuación de la demanda e interpretar sus pendientes.
b) Si los errores estándar de 1 y 2 son respectivamente 0.006 y 0.005 en una muestra de
tamaño n=15. Probar si es significativo el aporte del ingreso al modelo. Como debería ser
el modelo? ( Usar 1% de significancia)

3. Se tiene la información sobre venta semanal, puntuaciones de prueba de conocimientos,


calificación de desempeño y experiencia laboral para una muestra de vendedores:

venta desempeño
conocimientos experiencia
vendedor semanal laboral
Y X1 X2 X3
1 5 4 2 3
2 12 7 5 4
3 4 3 1 6
4 8 6 4 4
5 11 10 6 7

a) ¿Cuál es la ecuación de regresión múltiple?.


b) Supóngase que un solicitante de empleo en el departamento de ventas tuvo una
puntuación de 6.0 en la prueba y una calificación de desempeño de 3.8 ¿Cuáles son las
ventas estimadas del solicitante.
c) Probar si existe regresión lineal múltiple entre las variables ventas, puntuación y
calificación, usar un nivel significancia de 1% y 5%.
d) Probar si la variable puntuación de la prueba mejora el modelo una vez que la variable
calificación de desempeño esta incluida en el modelo y si la variable calificación de
desempeño mejora el modelo una vez que la variable puntuación esta incluida en el
modelo. Nivel significancia 5%.
e) Probar si existe efecto debido a la variable puntuación. Nivel de significancia de 5%
(prueba t).
f) Probar si la variable calificación de desempeño debe estar en el modelo (usar los
coeficientes de correlación parcial, con un error del 5%.

111
Elías Alberto Torres Armas, Lic. Ms. C.

g) Encontrar los intervalos de confianza 1 y 2, al 95% de probabilidad.

4. Al ingeniero de control de calidad de una industria le interesa pronosticar la resistencia a la


fusión de un alambre de acero fabricado, con base en su diámetro exterior y la cantidad de
molibdeno contenida en el metal. Como experimento, selecciona cuatro tramos de alambre,
mide a diámetro exterior y determina el contenido de molibdeno. Después mide la
resistencia a la tensión de cada tramo de alambre. Los resultados son:

RESIST. A LA TENSION (psi) DIAM. EXTERIOR (cm) ANT. DE MOLIBD.


11 3 6
9 2 5
16 4 8
12 3 7
a) ¿Cuál es la resistencia pronosticada a la tensión de un alambre de acero que tenga un
diámetro exterior de 3.5 cm. y 6.4 unidades de molibdeno.
b) Explique que significa el valor b1 y b2 en la ecuación.
c) Probar si existe regresión lineal múltiple entre la variable resistencia a la tensión y las
variables diámetro exterior. Cantidad de molibdeno. Usar el nivel de significancia al
1% y 5%.
d) Calcular e interpretar el coeficiente de determinación.
e) Probar si la variable diámetro exterior mejora el modelo una vez que la variable
cantidad de molibdeno está incluida en el modelo y si la variable cantidad de
molibdeno mejora el modelo una vez que la variable diámetro exterior está incluida
en el modelo. Usar un nivel de significancia del 5%.
f) Probar si existe efecto debido a la variable diámetro exterior. Usar un nivel de
significancia del 5%.
g) Probar si la variable cantidad de molibdeno debe estar en el modelo de regresión.
Usar los coeficientes de correlación parcial. Usar el nivel significancia de 5%.
h) Encontrar los intervalos de confianza 1 y 2, con una confianza del 5%.
i) Probar si la variable diámetro exterior debe estar en el modelo de regresión. Usar los
coeficientes de correlación parcial. Usar el nivel de significancia de 5%.

5. El señor López es presidente de una organización de profesores en el distrito de Rupa Rupa.


Al prepararse para futuras negociaciones, al señor López le gustaría investigar la estructura
de sueldos de los profesores del distrito. Considera que existe 2 factores que afectan el
sueldo de un profesor; año de experiencia y una calificación de la efectividad de la enseñanza
dada por el director. Una muestra de 8 profesores dio como resultado los datos que siguen.

SUELDO AÑOS DE EXPERIENCIA CALIFICACIÓN


(ciento de soles)
5.5 8 55
6.1 10 78
5.8 9 67
6.8 11 75
7.2 14 61
6.5 12 50
7.0 13 39
6.3 11 49

112
Métodos Estadísticos para la Investigación experimental

a) Qué sueldos estimaría usted para un profesor con 5 años de experiencia una
calificación del director de 72
b) Realice una prueba de hipótesis global para determinar alguno de los coeficientes de
regresión netos son diferentes de cero. Margen de error de 5%.
c) Realice una prueba de hipótesis para los coeficientes individuales de regresión
¿Considera usted eliminar cualquiera de las variables independientes usar un nivel de
significancia de 1% y 5%.
d) Determine los residuos.
e) Probar si la variable años de experiencia debe estar en el modelo de regresión usar los
coeficientes de correlación parcial, con un error del 5%.
f) Encontrar los intervalos de confianza para 1 y 2, con 1% de error.

6. El gerente de ventas distrital de un fabricante importante de automóviles está estudiando las


ventas. De manera específica le gustaría determinar que factores afectan el número de
automóviles vendidos en una distribución. Para investigar selecciona al azar 12
distribuidores . De estos últimos obtiene el número de automóviles vendidos el último mes
los minutos de publicidad en la televisión comprados el último mes y el número de
vendedores de tiempo completo empleados en la distribución. La información es como
sigue:

AUTOS VENDIDOS PUBLICIDAD FUERZA DE VENTA


127 18 10
138 15 15
159 22 14
144 23 12
139 17 12
128 16 12
161 25 14
180 26 17
102 15 7
163 24 16
106 18 10
149 25 11

a) Determine la ecuación de regresión ¿Cuántos automóviles esperaría usted que se


vendieran en una distribuidora con 20 vendedores y que paga 15 minutos de
publicidad.
b) Realice una prueba global de hipótesis para determinar si algunos de los coeficiente
netos de regresión difiere de cero. Error al 5%.
c) Realice una prueba de hipótesis para los coeficientes individuales de regresión.
¿Consideraría eliminar algunas de la variables independientes de error al 5%.
d) Calcular los coeficientes de correlación parcial.
e) Calcular e interpretar el coeficiente de correlación múltiple.

113
Elías Alberto Torres Armas, Lic. Ms. C.

CAPÍTULO IX

ANALISIS DE COVARIANZA

Es una técnica estadística ampliamente utilizada en estudios donde el experimentador advierte o


sospecha la presencia de una variable que podría estar influenciando el comportamiento de la
unidad experimental; la variable respuesta esta relacionada con una o más variables
concomitantes. Es una técnica que utiliza el análisis de regresión y el análisis de varianza para
manejar casos en los cuales se tienen una o más variables externas al experimento que no están
afectas a los tratamientos e influyen en el valor observado (Yij).

USOS DEL ANALISIS DE COVARIANZA


Dentro de los posibles usos del ANCOVA están:
i. Control de variables externas que implica una disminución del error que se traduce en una
mayor precisión del análisis.
ii. Ajuste de las medias de tratamientos de la variable dependiente (Y) por las diferentes
variables independientes (concomitantes).
iii. Ayudar en la interpretación de los datos, específicamente en la naturaleza del efecto de los
tratamientos.
Algunos ejemplos:
 El peso inicial (X) de animales relaciona al peso final (Y), cuando estos animales están
sujetos a diferentes raciones. Se estudia el efecto de las raciones a través de los pesos
observados.
 EL número de plantas (X) por parcela. Se estudia el rendimiento total (Y) de la parcela.
 El Rendimiento (X) de las parcelas en una producción anterior y el rendimiento (Y) de las
mismas parcelas al finalizar el experimento. El estudio consiste en comparan variedades
de un determinado cultivo.
 La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es
comparar las variedades.

En cada caso, se entiende que la variable X tiene un efecto en la variable Y, sin embargo
esta dependencia deberá ser probada estadísticamente mediante el ANALISIS DE
REGRESION.

114
Métodos Estadísticos para la Investigación experimental

En algunos casos puede existir más de una variable externa caso multivariante, ejemplo
X1, X2, X3. Este caso puede resolverse matricialmente y con ayuda del computador
porque los procesos manuales son tediosos.

CARACTERISTICAS

a) Técnica estadística que asocia el análisis de varianza y el análisis de regresión con el objeto
de controlar, en forma indirecta el error experimental al tomar en cuenta la presencia de
una variable concomitante (X) o acompañante a la variable principal (Y) acerca de la cual
se debe obtener conclusiones. Debe recordarse que una posibilidad de controlar el error
experimental en forma directa es mediante formación de grupos homogéneos o bloques.
Mediante la regresión se evalúa la influencia o no, de X en Y , la hipótesis es:
H 0 :   0 : No hay influencia de X en Y
H a :   0 : Si hay influencia de X en Y
Mediante el análisis de varianza se evalúa el efecto de los tratamientos:
H0 :  0 ó H 0 :  2  0 , según sea el modelo I o modelo II en los
experimentos simples.

b) El ANCOVA se emplea en cualquier diseño estadístico y en la mas diversa forma; con


igual o diferente número de repeticiones en DCA, DBCA, DCL.
c) Supuestos.- Al ANCOVA le corresponden los supuestos que pertenecen al análisis de
regresión y al análisis de varianza:

SUPOSICIONES DEL ANALISIS DE COVARIANCIA (ANCOVA). Los supuestos


requeridos para que sea válido el ANCOVA son:
i. Independencia de los errores.
ii. Normalidad en las variables aleatorias.
iii. Variancias homogéneas.
iv. Aditividad de los efectos involucrados en el modelo.
v. La variable X fija.
vi. La variable X no esta influenciada por los tratamientos.
vii. La variable Y está relacionada con X en forma lineal.

MODELO ESTADISTICO

Diseño completo al azar


Yij     i  X ij   ij i  1, ... , k j  1, ..., n

Diseño en bloque completo al azar


Yij    i   j  X ij   ij i  1, ... , k j  1, ..., t

Diseño cuadrado latino


Yij    i   j   k  X ij ( k )   ij ( k ) i  1, ... , m j  1, ..., m k  1, ..., m

En la práctica es más común expresar estas ecuaciones en términos de las desviaciones de la


variable X, a partir de su media, y así los modelos son:

115
Elías Alberto Torres Armas, Lic. Ms. C.

En todos los modelos, ß es un parámetro que representa el coeficiente de regresión. Se supone


que ß es distinto de cero, lo cual debe probarse, caso contrario en el modelo se elimina el término
afectado por ß.

ANÁLISIS DE VARIANZA

Se utiliza los criterios respectivos de cada diseño. Esto es, se utiliza las reglas prácticas para la
obtención de las sumas de cuadrados. Teniendo en cuenta a las variables X e Y, analizaremos al
DCA pudiendo extender este criterio al DBCA y DCL.

Ejemplo: (Extraido del trabajo “La nutrición minerales camote” realizado por Flor Milla A.
(1990) INIAA). Se desarrollo un DCA con desigual numero de repeticiones, su objetivo fue:
Comparar los rendimientos en parcela Kg/Parcela de las variedades Jonathan, Tiza y Urquirano
de camote. Se sospechó de la influencia de la profundidad de siembra en los rendimientos finales
la que de consideró como una covariable, por tanto se realizó un análisis de covarianza y el
modelo estadístico es el siguiente:

Donde: i=1,2,3; j=1,2,…,ri

Yij: Rendimiento en la pésima repetición de la i-esima variedad de camote


µ: Efecto de la media general
τi: Efecto de la i-esima variedad de camote
β: Coeficiente de regresión lineal simple de profundidad de siembra sobre el rendimiento de
camote
εij: Efecto aleatorio o error experimental en la obtención de Yij.
Xij: Profundidad de siembra de la j-ésima repetición de la i-esima variedad de camote.

Los datos se dan a continuación:

116
Métodos Estadísticos para la Investigación experimental

Jonathan Tiza Urquirano


Repetición Profundidad Rendimiento Profundidad Rendimiento Profundidad Rendimiento
1 21 35 34 44 23 24
2 26 39 26 38 29 32
3 22 36 29 39 30 40
4 28 45 18 27 16 21
5 29 43 29 28
6 14 19
Total 126 198 107 148 141 164
Promedio 25.2 39.6 26.75 37 23.5 27.33
Varianza 12.70 18.80 44.92 51.33 49.90 60.67

Ingrese los datos a una base de datos en el SPSS v.15. así:

Y X T
35 21 1
39 26 1
36 22 1
45 28 1
43 29 1
44 34 2
38 26 2
39 29 2
27 18 2
24 23 3
32 29 3
40 30 3
21 16 3
28 29 3
19 14 3
Analizar/Modelo lineal general/univariante/ ingrese Y a variable dependiente, T a
factores fijos, X a covariable/modelopersonalizadopase factores y covariables a
modelo-efctos principalescontinuar/opciones-pase el factor a mostrar las medias
para-estadisticos descriptivos- estimaciones de los parámetros-comparar efectos
principales (selecciones DMS , bonferroni o sidack)-continuar/aceptar

Factores inter-sujetos
Etiqueta del valor N
Variedades de cammote 1 Variedad de camote Jonathan 5
2 Variedad de camote Tiza 4
3 Variedad de camote Urquiaro 6

117
Elías Alberto Torres Armas, Lic. Ms. C.

HIPÓTESIS
a) Para la regresión
H0: β = 0
Ha: β = 0
b) Para tratamientos
H0: τi = 0 para i=1,2,....,t
Ha: τi ≠ 0

Visualicemos los resultados del SPSS


Pruebas de los efectos inter-sujetos
Variable dependiente: Rendimiento en Kg/parcela
Suma de
cuadrados Media Significació
Fuente tipo III Gl cuadrática F n
Modelo
905.282(a) 3 301.761 38.278 .000
corregido
Intersección 55.416 1 55.416 7.029 .023
T 302.746 2 151.373 19.201 .000
X 445.816 1 445.816 56.551 .000
Error 86.718 11 7.883
Total 18332.000 15
Total corregida 992.000 14
a R cuadrado = .913 (R cuadrado corregida = .889)
CONCLUSION

Las evidencias muestrales indican que existe relación lineal entre profundidad de siembra y
rendimiento, se justifica entonces el ANCOVA.

Dado que p=0.000 es menor que 1% se afirma que las variedades en estudio son
significativamente diferentes en cuanto al rendimiento promedio (después de ajustar los datos
con la variable concomitante profundidad de siembra).

Pruebas post hoc

Para efectuar comparaciones de promedios éstos deben ajustarse o corregirse del efecto de la
variable concomitante

PROMEDIOS AJUSTADOS DE TRATAMIENTOS

Estimaciones de los parámetros

Variable dependiente: Rendimiento en Kg/parcela


Intervalo de confianza
al 95%.
Significació Límite Límite
Parámetro B Error típ. t n inferior superior
Intersecció 3.544 3.365 1.053 .315 -3.861 10.950

118
Métodos Estadísticos para la Investigación experimental

n
[T=1] 10.546 1.716 6.147 .000 6.770 14.322
[T=2] 6.377 1.864 3.420 .006 2.273 10.480
[T=3] 0(a) . . . . .
X 1.012 .135 7.520 .000 .716 1.309
a Al parámetro se le ha asignado el valor cero porque es redundante.

Medias marginales estimadas

Variedades de camote

Estimaciones
Variable dependiente: Rendimiento en Kg/parcela
Intervalo de confianza
al 95%.
Variedades de camote Límite Límite
Media Error típ. inferior superior
Variedad de camote Jonathan 39.330(a) 1.256 36.565 42.095
Variedad de camote Tiza 35.161(a) 1.425 32.025 38.297
Variedad de camote Urquiaro 28.784(a) 1.162 26.226 31.343
a Las covariables que aparecen en el modelo se evalúan en los siguiente valores:
Profundidad de siembra en centímetros = 24.93.

Comparaciones por pares

Variable dependient e: Rendimiento en Kg/parcela

Interv alo de conf ianza al 95


a
Dif erencia % para la dif erencia
entre Límite
a
(I) Variedades de cammote (J) Variedades de cammote medias (I-J) Error típ. Signif icación Límite inf erior superior
Variedad de camot e Jonat han Variedad de camote Tiza 4.169 1.895 .150 -1.175 9.513
Variedad de camote Urquiaro 10.546* 1.716 .000 5.708 15.384
Variedad de camote Tiza Variedad de camot e Jonat han -4.169 1.895 .150 -9.513 1.175
Variedad de camote Urquiaro 6.377* 1.864 .017 1.119 11.634
Variedad de camote Urquiaro Variedad de camot e Jonat han -10.546* 1.716 .000 -15.384 -5.708
Variedad de camote Tiza -6.377* 1.864 .017 -11.634 -1.119
Basadas en las medias marginales est imadas.
*. La dif erencia de las medias es signif icativ a al niv el .05.
a. Ajuste para comparaciones múltiples: Bonf erroni.

Variable dependiente: Rendimiento en Kg/parcela


Diferencia
entre
(I) Variedades de cammote (J) Variedades de cammote medias (I-J)
Límite
inferior
Variedad de camote Jonathan Variedad de camote Tiza 4.169
Variedad de camote Urquiaro 10.546(*)
Variedad de camote Tiza Variedad de camote Jonathan -4.169
Variedad de camote Urquiaro 6.377(*)
Variedad de camote Urquiano Variedad de camote Jonathan -10.546(*)

119
Elías Alberto Torres Armas, Lic. Ms. C.

Variedad de camote Tiza -6.377(*)


Basadas en las medias marginales estimadas.
* La diferencia de las medias es significativa al nivel .05.
a Ajuste para comparaciones múltiples: Bonferroni.

Grupos homogéneos

(I) Variedades de camote


Variedad de camote X
Jonathan
Variedad de camote Tiza X X
Variedad de camote X
Urquiano

Conclusión: Existe un grupo homogéneo formado por la variedad Jonathan y Tiza que no
tienen diferencia significativa en el rendimiento medio, sin embargo la variedad Tiza tiene
rendimiento medio significativamente diferente a la variedad Urquiano que es de mínimo
rendimiento. La decisión será tomada entre tiza y Jonathan.

CAPÍTULO X

EXPERIMENTOS CON FACTORIALES

Los factoriales son combinaciones de factores (nitrógeno, fosforo, variedades, sustancias, niveles
de concentrado, etc.) para formar tratamientos, los cuales se aplican en los diseños
experimentales (DCA, DBCA, DCL). La información obtenida de estos experimentos es amplia,
ya que permiten comparar los niveles de cada factor entre si y evaluar las interacciones que
resulten como combinaciones de los factores, así como la comparación de niveles de un factor
bajo un nivel de otro factor.

En un experimento con factoriales, si todos los niveles de un factor se combinan con todos los
niveles de otro factor, entonces se dice que estos factores están cruzados. Si los niveles de un
factor se combinan con ciertos niveles de otro factor se dice que estos factores están anidados.

Ejemplo. Los niveles de un factor A a1, a2, y a3 se combinan con los niveles de un factor B b1,
b2 de la siguiente forma:

a1 a2 a3
b1 b2 b1 b2 b1 b2
Tratamientos: a1b1, a1b2, a2b1, a2b2, a3b1, a3b2
Los factores A y B están cruzados.

Ejemplo. Los niveles de un factor A: a1, a2, y a3 se combinan con los niveles de un factor B b 1,
b2, b3, b4, b5, b6 de la siguiente forma:

120
Métodos Estadísticos para la Investigación experimental

a1 a2 a3
b1 b2 b3 b4 b5 b6
Tratamientos: a1b1, a2b3, a2b4, a3b5, a3b6
El factor B esta anidado en A. Se representa como: B(A)

En el presente capitulo será tratado los factoriales con FACTORES CRUZADOS.

CONCEPTOS GENERALES

FACTOR.- Es sinónimo de tratamiento e involucra diferentes niveles. Por ejemplo el Nitrógeno


en la formación del abono, este puede contener diferentes porcentajes, cada uno constituye un
nivel que también representa un tratamiento.

FACTORIAL.- Es una combinación de factores para formar tratamientos.

NIVEL.- Es la dosis o cantidad del ingrediente (Factor) empleado en el tratamiento. Ejemplo.


2% de nitrógeno

EFECTO PRINCIPAL.- Es el efecto promedio del factor sobre los otros niveles del mismo
factor independiente de los otros factores. Ejemplo: Efecto de nitrógeno en las unidades
experimentales al aplicar un abono formado por nitrógeno, fosforo y potasio.
EFECTO INTERACCION.- Es el efecto adicional debido a la influencia combinada de dos o
más factores. Ejemplo. Efecto conjunto Nitrógeno-Fosforo en la unidad experimental.

EFECTO SIMPLE.- Es el efecto de los niveles del factor en un nivel de otro factor. Ejemplo.

Efecto del nitrógeno bajo la presencia de 0.5 % de fosforo. Es un efecto derivado del efecto de la
interacción.

EFECTO SIMPLE.- Es el efecto de los niveles del factor a una combinación de los otros
factores, por ejemplo, el efecto del nitrógeno en las unidades experimentales, bajo la presencia de
0.5% de fosforo y 1% de Potasio.

TIPOS DE FACTORES

FACTORES CUANTITATIVOS.- Si sus niveles son cantidades cuantificables. Ejemplo. Niveles


de Fosforo a 0.5%, 1% y 1.5%

FACTORES CUALITATIVOS.- Si sus niveles no tienen orden natural y corresponden a clases o


categorías. Ejemplo. Variedades de frijol.

Ejemplo. Un factor es definido por 3 sustancias de crecimiento a 4 niveles de concentración


aplicados en un experimento para evaluar la propagación vegetativa de un cultivo sobre medios
artificiales. La formación de callos se medirá a la cuarta semana.

El factor (A) sustancia de crecimiento con niveles:


a1: Acido Indolacetico (AIA)
a2: Cinetina (C)
a3: Acido Naftalenoacético (ANA)
El factor (B) concentracion con niveles:
b1: 0.0

121
Elías Alberto Torres Armas, Lic. Ms. C.

b2: 0.1 µM
b3: 1.0 µM
b4:10.0 µM
Al combinar ambos factores A y B se tiene 3x4 = 12 tratamientos para ser evaluados.

Los factores se identifican con letras mayúsculas y los niveles con letras minúsculas, por ejemplo:

Factor sustancia = A con niveles a1, a2, a3

Factor concentración = B con niveles b 1, b2, b3, b4

La combinación resultante: a1b1, a1b2, a1b3,...,a3b4

Estos tratamientos son:


a1b1 = 0.0 concentración de AIA
a1b2 = 0.1 µM concentracion de AIA
....
....
a3b4 = 10 µM de concentracion de ANA
Si cada tratamiento se aplica a 4 unidades experimentales, se requiere 48 u.e. para realizar el
experimento.

Los factoriales son expresados mediante la siguiente notación:

2A2B = 2x2 = 22: 2 niveles de A por 2 niveles de B.


2A3B = 2x3 : 2 niveles de A por 3 niveles de B.
2A2B2C = 2x2x2 = 23: 3 factores a 2 niveles cada uno.
2A3B3C = 2x32 : 2 niveles de A por 3 niveles de B y 3 niveles de C.

FORMACION DE FACTORIALES

En la formación de factoriales, se debe tener presente lo siguiente:


1. Qué factores deben incluirse.
2. Qué factores son fijos (modelo I) y que factores son al Azar (modelo II).
3. Cuantos niveles por factor
4. Si son factores cuantitativos, cual debe ser el espaciamiento entre los niveles del factor. Por
ejemplo: 0%, 5% y 10% de nitrógeno, significa igual espaciamiento.

VENTAJAS Y DESVENTAJAS EN EXPERIMENTOS CON FACTORIALES

Los experimentos con factoriales tienen las siguientes ventajas:


1. Permiten el estudio de los niveles de cada factor y las interacciones entre ellos.
2. Permiten el estudio de los niveles de un factor en la combinación de un solo nivel de otro
factor (estudio de efectos simples).
3. Todas las unidades experimentales intervienen en el estudio de todos los efectos del factor
(principales e interacción)

Desventajas:
1. El número de unidades experimentales utilizadas es mayor que en experimentos simples y es
más difícil contar con un número suficiente de unidades que requiere el experimento.
2. El análisis se complica, a medida que el numero de factores y niveles aumenta.

122
Métodos Estadísticos para la Investigación experimental

3. Algunas combinaciones pueda que no sean de importancia, pero deben incluirse para
completar el factorial, esto obliga a usar mas unidades experimentales.

ANALISIS ESTADISTICO DE LOS FACTORIALES


Los factoriales son los tratamientos en los diseños experimentales, esto significa que la fuente de
variación debida al efecto de tratamientos comprende los efectos derivados de la combinación de
los factores. Así, por ejemplo:

Factor A, con 3 niveles, factor B con 2 niveles. El numero de tratamientos son 3x2 = 6, con
grados de libertad igual a (6-1)= 5.

Esta fuente (tratamientos) está descompuesta en :


Efecto de A con (3-1) =2 gl.
Efecto de B con (2-1) = 1 gl.
Efecto de AB con (3-1)(2-1) = 2 gl.
La suma de los grados de libertad 2+1+2 = 5, es igual a los gl. de tratamientos.
La descomposición es ortogonal, esto significa que los tratamientos deben tener IGUAL
NUMERO DE REPETICIONES, de lo contrario no será posible descomponer en forma
ortogonal la suma de cuadrados de tratamientos. La suma de cuadrados de tratamiento cumple la
siguiente relación:

SC(tratamientos) = SC(A) + SC(B) + SC(AB)


En el caso de tres factores combinados (A,B y C), por ejemplo, 2 niveles de A, 3 niveles de B y 2
niveles de C resulta:

2x3x2 = 12 tratamientos, los gl. para tratamientos es 11

Las fuentes de variacion deducidas son:

De lo efectos principales:
A con (2-1) = 1 gl.
B (3-1) = 2 gl.
C (2-1) = 1 gl.
De los efectos de la interaccion:
AB (2-1)(3-1) = 2 gl.
AC (2-1)(2-1) = 1 gl.
BC (3-1)(2-1) = 2 gl.
De los efectos de Doble interaccion:
ABC (2-1)(3-1)(2-1) = 2 gl.
La suma de grados de libertad son: 1+2+1+2+1+2+2 = 11; que son los correspondientes grados
de libertad de tratamientos.

y SC(tratamientos) = SC(A)+SC(B)+SC(C)+SC(AB)+SC(AC)+SC(BC) +SC(ABC)

Los cuadrados medios de estas fuentes se obtienen dividiendo la suma de cuadrados entre los
grados de libertad, y para la prueba de F, se divide cada CM con el CM del error, solo cuando se
tiene factores aleatorios o anidados, es necesario hallar los esperados cuadrados medios.

INTERACCION DE FACTORES

123
Elías Alberto Torres Armas, Lic. Ms. C.

La interacción de los factores juega un papel importante en el análisis, de ahí que las pruebas de
F, se realizan en el siguiente orden: primero la interacción de orden superior, luego la de menor
orden y por último los factores principales.

Si la interacción de mayor orden resulta significativa, termina las prueba del cuadro del ANVA y
se procede a los análisis de los efectos simples-simples, esto significa comparar los niveles de un
factor en la combinación de los otros factores.

Si la interacción de mayor orden no es significativa, continúan las pruebas de F con las


Interacciones de menor orden, si alguna de estas interacciones resulta significativa, se procede a
los análisis de los efectos simples en estos factores; asi, comparar los niveles del factor bajo la
presencia de un nivel de otro factor. Si en una prueba de una interacción de menor orden no
resulta significativa, se continúan las pruebas de F de cada factor por separado, en el cuadro de
ANVA.

Los resultados de cuadros de ANVA para 3 factores (ABC) resultan:


Ejemplo.- ABC : *
No termina el ANVA, continúan los análisis de los efectos simples, es decir comparar los
niveles del factor A en cada una de las combinaciones de los otros factores, B y C de igual
forma.

Ejemplo.- ABC : ns
Continúan el análisis del ANVA.
AB : ns
AC : ns
BC : ns
Continúan el análisis del cuadro de ANVA, para los efectos principales de A, B y C.
Ejemplo.- ABC : ns
Continua el analisis del ANVA.
AB : *
AC : ns
BC : ns
Se prueban los efectos simples en cada factor (A y B), es decir comparar los niveles de A
bajo la presencia de cada nivel de B y comparar los niveles de B bajo la presencia de cada
nivel de A.
Luego continuar con el análisis en cuadro de ANVA solo para los efectos principales de
C.

Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *
BC : ns
Se prueban los efectos simples en cada factor (A y B), en los factores (A y C) se
compararan los niveles de A bajo la presencia de cada uno de los niveles de C y en C se
comparan sus niveles bajo la presencia de cada uno de los niveles de A.

Ejemplo.- ABC : ns
Continua el análisis del ANVA.
AB : *
AC : *

124
Métodos Estadísticos para la Investigación experimental

BC : *
Se prueban los efectos simples en cada factor (A y B), en (A y C) y en (B y C).
El análisis de los efectos simples-simples y efectos simples pueden realizarse mediante la prueba
de F (las sumas de cuadrados) o una prueba comparativa de promedios (DLS, TUKEY).

Solo para los casos de factores fijos es válido el análisis de efectos simples-simples, simples o
promedios.
Ejemplo 6. A es fijo y B al azar, AB resulta (*), no procede los análisis de efectos simples.

Ejemplo 7. A es fijo y B es fijo, AB resulta (*), procede los análisis de efectos simples.

GRAFICO DE LA INTERACCION

La interacción de factores se representa gráficamente, la tendencia indica el grado de interacción


entre los factores, la cual aumenta a medida que las líneas tiendan a cruzarse.

En los siguientes gráficos se muestran los casos posibles de interacción en dos factores: A con 3
niveles y B con 2 niveles. En el eje X se registra los niveles de A y en el eje Y los promedios de la
interacción de A y B. Los puntos son unidos con una línea, para cada nivel de B.

EFECTOS SIMPLES

El análisis de los efectos simples se realiza cuando existe una interacción de dos factores por
ejemplo A y B. Los efectos simples se calculan a partir del cuadro de promedios de la
combinación de factores.

Los experimentos factoriales son aquellos experimentos en que se estudian simultáneamente 2 o


más factores.

Los experimentos factoriales en si no constituyen un diseño experimental sino mas bien ellos
deben ser llevados a cualquiera de los diseños clásicos tales como DCA, DBCA, DCL etc. Por
diseño factorial se entiende aquel en el que se investigan todas las posibles combinaciones de los
niveles de los factores en cada ensayo completo o replica del experimento; es decir cuando los
factores están cruzados, cada combinación requiere al menos 1 repetición cada combinación.
Cada combinación se considera un tratamiento.

I. FACTORIAL EN UN DISEÑO COMPLETAMENTE AL AZAR

Debe usarse cuando existe homogeneidad en las unidades experimentales. El interés es comparar
el efecto de los tratamientos o el efecto de los niveles en cada uno de los factores y de la
interacción.

Esquema de campo

125
Elías Alberto Torres Armas, Lic. Ms. C.

a1 b1
A a2 B
a3 b2
niveles de A: 3
niveles de B: 2
t=3*2=6 tratam
si r=3
entonces:
n=t*r=18 unidades experimentales

Entonces:

Las combinaciones

a1 a2 a3
b1 b2 b1 b2 b1 b2

Los tratamientos

T1 T2 T3 T4 T5 T6
a1b1 a1b2 a2b1 a2b2 a3b1 a3b2

Asignación aleatoria de los tratamientos a las unidades experimentales

T4 T2 T1 T4 T2 T3

T1 T2 T6 T3 T6 T5

T5 T3 T1 T4 T5 T6

Para facilitar el análisis, los datos pueden ordenarse así:


a1 a2 a3
Observacion b1 b2 b1 b2 b1 b2 Total
1
2
3
Total
En general

126
Métodos Estadísticos para la Investigación experimental

jB
i 1 2 … b Yi..
Y111 Y121
Y112
1
A …
Y11r
Y211
Y212
… Yijk
2 Y21r

Y.j. Y…

MODELO

A partir del modelo para el DCA con t tratamientos con dos factores

Ylk    t l  lk
Donde : l  1,2,3,..., t
k  1,2,..., r

Los t tratamientos pueden desagregarse en los niveles de los factores e interacciones:

Yijk    Ai  B j  ABij  ijk


Donde : i  1,2,..., a; j  1,2,..., b; k  1,2,..., r
t  ab

Ai  i  
Bj   j  
ABij  ij  i   j  
 ijk  Yijk  ij

PROCEDIMIENTO DE PRUEBA

i) Hipótesis

H0: Todos los tratamientos tienen el mismo efecto


Ha: Al menos uno de los tratamientos tiene efecto diferente

127
Elías Alberto Torres Armas, Lic. Ms. C.

H 0 :  ij  0
H a : ij  0
H0: Todos los niveles del factor A tienen el mismo efecto
Ha: Al menos uno de los niveles del factor A tiene efecto diferente
H 0 : Ai  0
H a : Ai  0
H0: Todos los niveles del factor B tienen el mismo efecto
Ha: Al menos uno de los niveles del factor B tiene efecto diferente
H0 : Bj  0
Ha :Bj  0
H0: No existe interacción entre los factores
Ha: Si existe interacción entre los factores
H 0 : ABij  0 ij
H a : Al menos una ABij  0
ii) Nivel de significación: α
iii) Función de prueba: Fl=F del ANVA
iv) Valor tabular Ftab=Tabla F
v) Decisión: Rechazar H0 si F>Ftab

LA RAZON F DEL ANVA

Para determinar el cociente o razón F para un factor se debe apreciar la distribución de los
cuadrados medios esperados. Tanto el numerador como el denominador del cociente deben tener
las mismas componentes (con igual ponderación) a excepción del numerador, donde debe
aparecer una componente más, que corresponde al factor que se va a probar.

Ejemplo de ANVA para un factorial con 2 factores A y B

F de V Gl SC CM F
Tratam ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Error ab(r-1) Eyy E
Total abr-1 Wyy W

La sumas de cuadrados

Tyy 
Y 2
ij ..

Y...2
Ayy 
Y 2
i ..

Y...2
B yy 
Y 2
. j ..

Y...2
r abr br abr ar abr

128
Métodos Estadísticos para la Investigación experimental

AB yy 
 Y 2
ij .

Y 2
i ..

Y 2
. j ..

Y...2
r br ar abr

E yy   Yijk2 
 Y 2
ij .

r
2
Y
W yy   Yijk2  ...

abr

Para un factorial 3 con factores A, B, C el modelo puede escribirse como:

Yijk    Ai  B j  Ck  ABij  ACik  BC jk  ABC i jk  ijkl


Donde : i  1,2,..., a; j  1,2,..., b; k  1,2,..., c; l  1,2,..., r
Y el ANVA es:
F de V Gl SC CM F
Tratam abc-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
C c-1 Cyy C C/E
AB (a-1)(b-1) AByy AB AB/E
AC (a-1)(c-1) ACyy AC AC/E
BC (b-1)(c-1) BCyy BC BC/E
ABC (a-1)(b-1)(c-1) ABCyy ABC ABC/E
Error abc(r-1) Eyy E
Total abcr-1 Wyy W

La sumas de cuadrados:

Tyy 
Y 2
ijk .

Y....2
Ayy 
Y 2
i ...

Y....2
r abcr bcr abcr

Byy 
Y  Y
2
. j ..
2
....
C yy 
Y  Y....2 2
..k .

acr abcr abr abcr

AB yy 
 Yij..   Yi...   Y. j..  Y....
2 2 2 2

cr bcr acr abcr

AC yy 
 Yi.k .   Yi...   Y..k .  Y....2
2 2 2

br bcr abr abcr

BC yy 
 Y. jk .   Y. j..   Y..k .  Y....2
2 2 2

ar acr abr abcr

ABC yy 
 Yijk .  Yi.k .  Y. 2jk .  Yij2..  Yi...2  Y. 2j ..  Y..2k .
2


2

    
Y2
 ....
r br ar cr bcr acr abr abcr

E yy   Yijkl 2

 Yijk . 2

r
2
Y
W yy   Yijkl 2
 ...
abcr

129
Elías Alberto Torres Armas, Lic. Ms. C.

Idoneidad del modelo: Normalidad (ploteo normal), Homocedasticidad ( Ŷ ij vs.


Residuos, Ai vs. Residuos, Bj vs. Residuos)

Ejemplo I: Un ingeniero diseña uma bateria para su uso en un dispositivo que será sometido a
ciertas variaciones de temperatura. El único parâmetro de diseño que El puede seleccionar em
este punto ES El material de La cubierta de La bateria. El hace um ensayo de laboratório con 2
factores: tipo de material y temperatura(ºF), evaluando El resultado con La duración efectiva em
horas. Los datos ordenados se muestran a continuación:

tipo de Temperatura ºF (B)


material (A) 15 70 125 Yi..
1 130 155 74 180 34 40 80 75 20 70 82 58 998
2 150 188 159 126 136 122 106 115 25 70 58 45 1300
3 138 110 168 160 174 120 150 139 96 104 82 60 1501
Y.j. 1738 1291 770 3799

Factor A: Tipo de material

a1: 1 a2: 2 a3: 3 a=3


Factor B: Temperatura

b1: 15 b2:75 b3:125 b=3

Existen a*b=3*3=9 tratamientos com 4 repeticiones r=4  u.e=3*3*4=36

Variable respuesta: La duración efectiva en horas


Yij.
T1 T2 T3 T4 T5 T6 T7 T8 T9
130 34 20 150 136 25 138 174 96
155 40 70 188 122 70 110 120 104
74 80 82 159 106 58 168 150 82
180 75 58 126 115 45 160 139 60
a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 a3b1 a3b2 a3b3

3A3B
n=36 t=9 r=4

a1 a2 a3
b1 b2 b3 b1 b2 b3 b1 b2 b3
repeticiones a1b1 a1b2 a1b3 a2b1 a2b2 a2b3 a3b1 a3b2 a3b3
1 130 34 20 150 136 25 138 174 96
2 155 40 70 188 122 70 110 120 104
3 74 80 82 159 106 58 168 150 82
4 180 75 58 126 115 45 160 139 60

130
Métodos Estadísticos para la Investigación experimental

Digite los datos del caso ya sea en SPSS o en statgraphics

DURAC TIPOMAT TEMPER TRATAMIENTO


130 1 1 1
155 1 1 1
74 1 1 1
180 1 1 1
34 1 2 2
40 1 2 2
80 1 2 2
75 1 2 2
20 1 3 3
70 1 3 3
82 1 3 3
58 1 3 3
150 2 1 4
188 2 1 4
159 2 1 4
126 2 1 4
136 2 2 5
122 2 2 5
106 2 2 5
115 2 2 5
25 2 3 6
70 2 3 6
58 2 3 6
45 2 3 6
138 3 1 7
110 3 1 7
168 3 1 7
160 3 1 7
174 3 2 8
120 3 2 8
150 3 2 8
139 3 2 8
96 3 3 9
104 3 3 9
82 3 3 9
60 3 3 9

En SPSS haga lo siguiente:

Primero construyamos en cuadro de análisis de varianza con fuentes de variación:


Tratamientos/error/total:

Análisis/modelo lineal general/ univariante/Pase DURAC a dependiente TRATAMIENTO a


factores fijos/ aceptar.

131
Elías Alberto Torres Armas, Lic. Ms. C.

Pruebas de los efectos inter-sujetos


Variable dependiente: DURAC
Suma de
cuadrados Media Significació
Fuente tipo III gl cuadrática F n
TRATAMIEN
59416.222 8 7427.028 11.000 .000
TO
Error 18230.750 27 675.213
Total corregida 77646.972 35

Después de visualizar el cuadro resultante, construya el cuadro de efectos simples y la


interacción, así:

Análisis/modelo lineal general/ univariante/Pase DURAC a dependiente TIPO DE


MAT, TEMPER a factores fijosModelo/factorial completo/continuar/ aceptar.
Pruebas de los efectos inter-sujetos
Variable dependiente: DURAC
Suma de
cuadrados Media Significació
Fuente tipo III Gl cuadrática F n
TIPOPMAT 10683.722 2 5341.861 7.911 .002
TEMPER 39118.722 2 19559.361 28.968 .000
TIPOPMAT *
9613.778 4 2403.444 3.560 .019
TEMPER
Error 18230.750 27 675.213
Total corregida 77646.972 35

Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:

Variable dependiente: DURAC


Suma de cuadrados tipo Media
Fuente III gl cuadrática F Significación
TRATAMIENTO 59416.22222 8 7427.027778 11.00* 0.0000009426**
TIPOPMAT 10683.72222 2 5341.861111 7.91* 0.0019760826**
TEMPER 39118.72222 2 19559.36111 28.97* 0.0000001909**
TIPOPMAT *
TEMPER 9613.777778 4 2403.444444 3.56* 0.0186111682*
Error 18230.75 27 675.212963
Total corregida 77646.97222 35

F(8,27)F(8,25)=2.34 al 5%
F(2,27)F(2,25)=3.39 al 5%
F(4,27)F(4,25)=2.76 al 5% Lo correcto será hacer una interpolación.
Otra forma para interpretar: Significación= p-Valor=pSi p es menor que α=5% (0.05) ó
[α=1% (0.01)] el efecto será significativo
Conclusión:
 Respecto a tratamientos, existe al menos uno altamente significativo
 Existe efecto altamente significativo del tipo de material sobre la duración de la batería.
 Existe efecto altamente significativo de la temperatura sobre la duración de la batería.

132
Métodos Estadísticos para la Investigación experimental

 No existe efecto altamente significativo de la interacción de tipo de material y temperatura


sobre la duración de la batería.(si fuera altamente significativa, se tendrá que realizar el análisis
de los efectos simples)
El ANVA indica que al menos un tratamiento es altamente significativo, la pregunta es ¡¿cuál?,
para contestarla, realizamos la prueba de comparaciones múltiples de tratamientos:

Analisis/modelo lineal general/ univariante/Pase DURAC a dependiente


TRATAMIENTO a factores fijos/post hoc/seleccionar una o varias pruebas
apropiadas al caso/aceptar.

Salida del SPSS


Comparaciones múltiples
Variable dependiente: DURAC DHS de Tukey
(I) (J)
TRATAMIENT TRATAMIENT Diferencia entre medias Error Significació
O O (I-J) típ. n
1 2 77.50(*) 18.374 .007
3 77.25(*) 18.374 .007
4 -21.00 18.374 .962
5 15.00 18.374 .995
6 85.25(*) 18.374 .002
7 -9.25 18.374 1.000
8 -11.00 18.374 .999
9 49.25 18.374 .202
2 3 -.25 18.374 1.000
4 -98.50(*) 18.374 .000
5 -62.50(*) 18.374 .046
6 7.75 18.374 1.000
7 -86.75(*) 18.374 .002
8 -88.50(*) 18.374 .001
9 -28.25 18.374 .828
3 4 -98.25(*) 18.374 .000
5 -62.25(*) 18.374 .047
6 8.00 18.374 1.000
7 -86.50(*) 18.374 .002
8 -88.25(*) 18.374 .001
9 -28.00 18.374 .835
4 5 36.00 18.374 .582
6 106.25(*) 18.374 .000
7 11.75 18.374 .999
8 10.00 18.374 1.000
9 70.25(*) 18.374 .017
5 6 70.25(*) 18.374 .017
7 -24.25 18.374 .917
8 -26.00 18.374 .882
9 34.25 18.374 .642
6 7 -94.50(*) 18.374 .001
8 -96.25(*) 18.374 .000
9 -36.00 18.374 .582
7 8 -1.75 18.374 1.000
9 58.50 18.374 .074
8 9 60.25 18.374 .060
Basado en las medias observadas.
* La diferencia de medias es significativa al nivel .05.

133
Elías Alberto Torres Armas, Lic. Ms. C.

DURAC DHS de Tukey


TRATAMIE Subconjunto
NTO N 1 2 3
6 4 49.50
2 4 57.25
3 4 57.50
9 4 85.50 85.50
5 4 119.75 119.75
1 4 134.75 134.75
7 4 144.00 144.00
8 4 145.75 145.75
4 4 155.75
Significación .582 .060 .582
Se muestran las medias para los grupos en subconjuntos homogéneos.
Basado en la suma de cuadrados tipo III
El término error es la Media cuadrática (Error) = 675.213.
a Usa el tamaño muestral de la media armónica = 4.000
b Alfa = .05.

Duracion efectiva en horas


DHS de Tukey
Tratamient
o N Subconjunto
1 2 3 1
6 4 49.50c
2 4 57.25c
3 4 57.50c
9 4 85.50c 85.50b
5 4 119.75b 119.75ª
1 4 134.75b 134.75ª
7 4 144.00b 144.00a
8 4 145.75b 145.75ª
4 4 155.75ª
Significació
.582 .060 .582
n
Informe
Duracion efectiva en horas
Tratamient Desv.
o Media N típ.
1 134.75ab 4 45.353
2 57.25c 4 23.599
3 57.50c 4 26.851
4 155.75ª 4 25.617
5 119.75ab 4 12.659
6 49.50c 4 19.261
7 144.00ab 4 25.974
8 145.75ab 4 22.544
9 85.50bc 4 19.279
Total 105.53 36 47.101

134
Métodos Estadísticos para la Investigación experimental

EXPERIMENTO FACTORIAL EN DBCA

En un factorial en DBCA todos los tratamientos o combinación de niveles deben aparecer una
sola vez en cada bloque. El esquema de campo para un experimento 3A2B en 4 bloques:

a2b1 a3b2 a1b1 a3b1 a1b2 a2b2


I
30 51 41 45 35 31

a2b1 a3b2 a1b1 a3b1 a2b2 a1b2


II
39 58 40 53 34 41

a3b2 a3b1 a1b2 a2b1 a1b1 a2b2


III
60 54 38 38 48 33

a1b2 a2b2 a1b1 a3b2 a2b1 a3b1


IV
50 45 60 65 52 65

A (a1, a2, a3); B (b1, b2)

Los datos pueden ordenarse de la siguiente manera:


a1 a2 a3
Bloques Y..k
b1 b2 b1 b2 b1 b2
I Y111 Y121 Y211
II Y112 Y122 Y212
III Y113 Y123 Y213
IV Y114 Y124 Y214
Yij. Y11. Y12. Y21. Y22. Y31. Y32.
Y…
Yi. Y1.. Y2.. Y3..

El modelo puede escribirse así:

Yijk    Ai  B j  ABij  i   ijk


Donde : i  1,2,..., a; j  1,2,..., b; k  1,2,..., r (bloques )

El cuadro ANVA
F de V Gl SC CM F
Tratamientos ab-1 Tyy T T/E
A a-1 Ayy A A/E
B b-1 Byy B B/E
AB (a-1)(b-1) AByy AB AB/E
Bloques r-1 Ryy R R/E
Error (ab-1)(r-1) Eyy E
Total abr-1 Wyy W

La sumas de cuadrados

Tyy 
Y 2
ij .. Y2
 ... Ayy 
Y Y2
2

 ...
i ..
B yy 
Y 2
. j.

Y...2
r abr br abr ar abr

135
Elías Alberto Torres Armas, Lic. Ms. C.

AB yy 
 Y 2
ij .

Y 2
i ..

Y 2
. j.

Y...2
r br ar abr

R yy 
Y 2
..k

Y 2
...
ab abr

E yy   Y 2

 Y 2
ij .

Y 2
..k

Y...2
ijk
r ab abr
2
Y
W yy   Yijk2  ...
abr

EJEMPLO II: En un experimento 3A2B4R los siguientes resultados ordenados en 4 bloques,


son:

a1 a2 a3
Bloques Y..k
b1 b2 b1 b2 b1 b2
I 41 35 30 31 45 51 233 j 1 2
II 40 41 39 34 53 58 265 Y.j. 565 541
III 48 38 38 33 54 60 271
IV 60 50 52 45 65 65 337
Yij. 189 164 159 143 217 234
1106
Yi. 353 302 451

La sumas de cuadrados

Tyy 
 Y 2
ij ..

Y...2
r abr

Ayy 
Y 
Y...2
2
i ..

br abr

B yy 
Y 
Y...2
2
. j.

ar abr
AB yy 
 Y 2
ij .

Y 2
i ..

Y 2
. j.

Y...2
r br ar abr

Ryy 
Y 
Y...2
2
..k

ab abr

E yy     Y 2

 Y 2
ij .

Y 
2
..kY...2
ijk
r ab abr
Y...2
Wyy     Y  2
ijk
abr

136
Métodos Estadísticos para la Investigación experimental

Digite los datos del caso ya sea en SPSS o en statgraphics


Yij A B BLOQ TRATS
41 1 1 1 1
40 1 1 2 1
48 1 1 3 1
60 1 1 4 1
35 1 2 1 2
41 1 2 2 2
38 1 2 3 2
50 1 2 4 2
30 2 1 1 3
39 2 1 2 3
38 2 1 3 3
52 2 1 4 3
31 2 2 1 4
34 2 2 2 4
33 2 2 3 4
45 2 2 4 4
45 3 1 1 5
53 3 1 2 5
54 3 1 3 5
65 3 1 4 5
51 3 2 1 6
58 3 2 2 6
60 3 2 3 6
65 3 2 4 6

En SPSS haga lo siguiente: Primero construyamos en cuadro de análisis de varianza con fuentes
de variación: Bloques/tratamientos/error/total:

Análisis/modelo lineal general/ univariante/Pase Yij a dependiente BLOQ y TRATS a


factores fijos/ ModelopersonalisadoBLOQ, TRATSefectos fijos-continuar/Aceptar.

Pruebas de los efectos inter-sujetos


Variable dependiente: Y
Suma de
cuadrados Media Significació
Fuente tipo III gl cuadrática F n
BLOQ 952.500 3 317.500 47.864 .000
TRATS 1579.833 5 315.967 47.633 .000
Error 99.500 15 6.633
Total corregida 2631.833 23

Analsis/modelo lineal general/ univariante/Pase Yij a dependiente BLOQ , A, B a factores


fijos/ ModelopersonalisadoBLOQ, A, B, A*B Interacción  continuar / Aceptar.

Pruebas de los efectos inter-sujetos


Variable dependiente: Y
Suma de
cuadrados Media Significació
Fuente tipo III gl cuadrática F n
BLOQ 952.500 3 317.500 47.864 .000
A 1433.583 2 716.792 108.059 .000
B 24.000 1 24.000 3.618 .077
A*B 122.250 2 61.125 9.215 .002
Error 99.500 15 6.633

137
Elías Alberto Torres Armas, Lic. Ms. C.
Total corregida 2631.833 23

Ahora reúna los ambos resultados, y se tendrá el cuadro ANVA resultante, así:

Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
BLOQ 952.5 3 317.5 47.86 0.0000001
TRATS 1579.833333 5 315.9666667 47.63 0.0000000
A 1433.583333 2 716.7916667 108.06 0.0000000
B 24 1 24 3.62 0.0765341
A*B 122.25 2 61.125 9.21 0.0024530**
Error 99.5 15 6.633333333
Total corregida 2631.833333 23

Como la interacción a salido altamente significativa, nos interesa ver los efectos simples de la
interacción

Análisis de los efectos simples


Primero haga lo siguiente: B dentro de los niveles de A (a1, a2)

B dentro de a1
Datos/seleccionar casos/ si satisface la condición/si…/A=1 a la caja en blanco-
continuar/Aceptar.
Ahora:
Análisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar

ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
78.125 1 78.125 1.231 .310
grupos
Intra-
380.750 6 63.458
grupos
Total 458.875 7

B dentro de a2

Datos/seleccionar casos/ si satisface la condicion/si…/A=2 a la caja en blanco-


continuar/Aceptar.
Ahora:
Analisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar

ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
32.000 1 32.000 .522 .497
grupos
Intra-
367.500 6 61.250
grupos

138
Métodos Estadísticos para la Investigación experimental

Total 399.500 7

B dentro de a3
Datos/seleccionar casos/ si satisface la condicion/si…/A=3 a la caja en blanco-
continuar/Aceptar.
Ahora:
Analisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar

ANOVA
Y
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-
36.125 1 36.125 .714 .431
grupos
Intra-
303.750 6 50.625
grupos
Total 339.875 7

Datos/segmentar archivo/comparar los grupos/ A pasa grupos basados en /Aceptar.


Ahora:

Analisis/Comparar medias/anova de un factor/ Y a dependientes B a factor/Aceptar


En resumen
ANOVA
Y
Suma de Media
A cuadrados Gl cuadrática F Sig.
1 Inter-
78.125 1 78.125 1.231 .310
grupos
Intra-
380.750 6 63.458
grupos
Total 458.875 7
2 Inter-
32.000 1 32.000 .522 .497
grupos
Intra-
367.500 6 61.250
grupos
Total 399.500 7
3 Inter-
36.125 1 36.125 .714 .431
grupos
Intra-
303.750 6 50.625
grupos
Total 339.875 7

Segundo haga lo siguiente: A dentro de los niveles de B (b1, b2)

Datos/segmentar archivo/comparar los grupos/ B pasa grupos basados en /Aceptar.

Ahora:

139
Elías Alberto Torres Armas, Lic. Ms. C.
Analisis/Comparar medias/anova de un factor/ Y a dependientes A pasa a factor/Aceptar

ANOVA
Y
Suma de Media
B cuadrados Gl cuadrática F Sig.
1 Inter-
420.667 2 210.333 2.680 .122
grupos
Intra-
706.250 9 78.472
grupos
Total 1126.917 11
2 Inter-
1135.167 2 567.583 14.774 .001
grupos
Intra-
345.750 9 38.417
grupos
Total 1480.917 11

Nótese que las F de los anovas últimos no son válidos para el análisis, pues hay que corregirlos
dividiendo los correspondientes cuadrados medios entre el CM del error=6.633333333 del anova
previo a estos cálculos.

Finalmente el cuadro ANOVA queda asi:


Suma de
cuadrados Media
Fuente tipo III gl cuadrática F Significación
BLOQ 952.5 3 317.5 47.86 0.0000001
TRATS 1579.833333 5 315.9666667 47.63 0 **
A 1433.583333 2 716.7916667 108.06 0 **
B 24 1 24 3.62 0.0765341 ns
A*B 122.25 2 61.125 9.21 0.002453 **
A dentro de
b1 420.667 2 210.333 31.71 0.00000 **
A dentro de
b2 1135.167 2 567.583 85.57 0.00000 **
B dentro de a1 78.125 1 78.125 11.78 0.00000 **
B dentro de a2 32 1 32 4.82 0.00005 **
B dentro de a3 36.125 1 36.125 5.45 0.00002 **
Error 99.5 15 6.633333333
Total
corregida 2631.833333 23

140
Métodos Estadísticos para la Investigación experimental

CAPÍTULO XI

EXPERIMENTOS FACTORIALES 2k

Se refiere al estudio de k factores cada uno con dos niveles. Es un caso particular de los
experimentos factoriales; se puede realizar, además del método conocido, con otros métodos. Es
frecuentemente usado para estudios de sondeo.
Ejm.
A B t= 4 a0b0 a0b1 a1b0 a1b1 2A2B
22
a0 b0 = 4 (1) b a ab
a1 b1

A B C t= 8 a0 a1
23
a0 b 0 c0 = 8 b0 b1 b0 b1
a1 b 1 c1 c0 c1 c0 c1 c0 c1 c0 c1

a0
b0
c0 a0b0c1 a0b1c0 a0b1c1 a1b0c0 a1b0c1 a1b1c0 a1b1c1
1 C B BC A AC AB ABC
A B C D t= 16
24
a0 b 0 c0 d0 = 16
a1 b 1 c1 d1

Ejemplo I: Se presenta a continuación los resultados de un experimento factorial 2 2=2A2B.


j B A B I II III a0 a1
i b0 b1 - - 1 5 9 Replica b0 b1 b0 b1
1 2 - + 2 3 4 I 1 2 7 10
a0 5 3 24 ó + - 7 11 15 ó II 5 3 11 10
9 4 + + 10 10 10 III 9 4 15 10
A
7 10 24 63
a1 11 10 63 15 9 33 30
15 10
48 39 87 48 39

Digite los datos en statgrafics, de la siguiente forma:

141
Elías Alberto Torres Armas, Lic. Ms. C.
Y A B tratam
1 1 1 1
5 1 1 1
9 1 1 1
2 1 2 2
3 1 2 2
4 1 2 2
7 2 1 3
11 2 1 3
15 2 1 3
10 2 2 4
10 2 2 4
10 2 2 4
Luego ejecute el programa, así:
Primero resuelva el ANVA para los efectos de A, B y AB

Comparación/análisis de varianza/ANOVA factorial/Y pase a Variable dependiente y A, B


pase a factores/ aceptar.
Observe la salida, es:
Resumen del Procedimiento
Variable dependiente: Y
Factores:
A
B
Número de casos completos: 12
Análisis de la Varianza paraY - Sumas de Cuadrados de Tipo III
--------------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor
--------------------------------------------------------------------------------
EFECTOS PRINCIPALES
A:A 126,75 1 126,75 17,09 0,0025
B:B 6,75 1 6,75 0,91 0,3650

RESIDUOS 66,75 9 7,41667


--------------------------------------------------------------------------------
TOTAL (CORREGIDO) 200,25 11
--------------------------------------------------------------------------------
Los cocientes F están basados en el error cuadrático medio residual.

Luego resuelva el ANVA para el efecto de tratamientos Tratam


Comparación/análisis de varianza/ANOVA factorial/Y pase a Variable dependiente y Tratam
pase a factores/ aceptar.
Análisis de la Varianza paraY - Sumas de Cuadrados de Tipo III
--------------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor
--------------------------------------------------------------------------------
EFECTOS PRINCIPALES
A:tratam 134,25 3 44,75 5,42 0,0249

RESIDUOS 66,0 8 8,25


--------------------------------------------------------------------------------
TOTAL (CORREGIDO) 200,25 11
--------------------------------------------------------------------------------
Los cocientes F están basados en el error cuadrático medio residual.
Finalmente, una los dos cuadros ANVA en uno solo, el mismo que quedará así:
----------------------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor
----------------------------------------------------------------------------------------
Tratam 134,25 3 44,75 5,42 0,0249
A 126,75 1 126,75 15,36 0,0044
B 6,75 1 6,75 0,82 0,3921
AB 0,75 1 0,75 0,09 0,7707
RESIDUOS 66,0 8 8,25
----------------------------------------------------------------------------------------
TOTAL (CORREGIDO) 200,25 11
----------------------------------------------------------------------------------------

142
Métodos Estadísticos para la Investigación experimental

Nota: La descomposición de la suma de cuadrados puede hacerse con otros métodos: Signos y
Yates.

a) MÉTODO DE LOS SIGNOS

Efectos Yi..
Tratam A B AB
a0b0 1 - - + 15
a1b0 a + - - 33
a0b1 b - + - 9
a1b1 ab + + + 30
Cj= 39 -9 3 87 r= 3
Efecto= 6.5 -1.5 0.5 k= 2
SC= 126.75 6.75 0.75 r*2^k-1= 6
r*2^k= 12

( )
∑ {
( )
+: Si el tratamiento incluye nivel alto del factor
-: Si el tratamiento incluye nivel bajo del factor

El modelo de regresión para un diseño 22=2A2B puede escribirse:

̂
A: Efecto de A=6,50
B: Efecto de B=-1,50
AB: Efecto de AB=0,50
Media

Si X es cuantitativa: 

( ) ( )
{ ; {
( ) ( )

Usando statgrafics
Avanzado/diseño experimental/crear diseño/en pantalla/
Número de variables respuesta (1)
Número de factores experimentales (2)
Aceptar
factor: A Bajo(-1) Alto(+1)
B Bajo(-1) Alto(+1)
Aceptar
Variable respuesta: Nombre Y

143
Elías Alberto Torres Armas, Lic. Ms. C.
Aceptar
Vea las opciones y seleccione FACTORIAL 2^2/Aceptar
En la nueva pantalla: Puntos centrales (0)
Replica (2) (Nota: estas replicas se refiere a las replicas
adicionales a 1, pues por defecto considera 1, es decir cada tratamiento tiene 3 repeticiones
entonces sobra 2.
Desactivar ALEATORIO
ACEPTAR
Entrar al diseño creado, por la barra de herramientas/VENTANA/SIN NOMBRE/ Ingrese
los datos ahora.

Para ejecutar el análisis:

ANALIZANDO/ANALIZAR DISEÑO/DATOS Y/ACEPTAR


Visualice los resultados y analice e intérprete.

Para un experimento 23 con factores A, B, C (2A2B2C)el ANVA es:

F de V Gl SC CM F
Tratam 7 Tyy T T/E
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Error t(r-1) Eyy E
Total tr-1 Wyy W

El análisis puede realizarse con el método ordinario (muy laborioso) o con el método de los
signos.

EJEMPLO II. (DISEÑO FACTORIAL 23). Se desea analizar el efecto sobre el funcionamiento
de una bicicleta, al variar la altura del sillón (alto +, bajo -), la presión de los neumáticos (alta +,
baja -) y utilizar o no el dinamo (si +, no -). La variable respuesta que se mide es la diferencia
entre el pulso sanguíneo antes y después de realizar una determinada prueba.
C
A B No(-) Si(+) Total
Bajo(-) 56 58 68 67 249 498
Bajo(-)
Alta(+) 54 60 72 66 501 252
Bajo(-) 59 57 69 64 249 480
Alto(+)
Alta(+) 57 56 69 46 477 228
Total 457 521 978 b0=498 b1=480

144
Métodos Estadísticos para la Investigación experimental

Con el método de signos


1 + - - - + + + - 114
a + + - - - - + + 116
b + - + - - + - + 114
c + + + - + - - - 113
ab + - - + + - - + 135
ac + + - + - + - - 133
bc + - + + - - + - 138
abc + + + + + + + + 115
Cj= 978 -24 -18 64 -24 -26 -12 -18 r= 2
Efecto= -3.00 -2.25 8.00 -3.00 -3.25 -1.50 -2.25 k= 3
SC= 36.00 20.25 256.00 36.00 42.25 9.00 20.25 r*2^(k-1)= 8
Coefic= 61.125 -1.500 -1.125 4.000 -1.500 -1.625 -0.750 -1.125 r*2^k= 16

Modelo de regresión:

̂
̂

b) MÉTODO DE YATES (k factores)


De manera general, para realizar la descomposición de la suma de cuadrados de los tratamientos
pueden conformarse 2+k columnas auxiliares. En la 1ª columna se escriben los tratamientos en
orden estándar y en la 2ª columna el rendimiento total de cada combinación; en las siguientes k
columnas (1), (2), (3),…,(k) se realizan operaciones aritméticas. La 1ª mitad de la columna (1) se
obtiene sumando las respuestas por pares adyacentes y la segunda mitad se obtiene cambiando el
signo del primer elemento de cada par adyacente, luego igualmente sumando por pares. La
columna (2) se obtiene a partir de la columna anterior (1) de la misma forma que se obtuvo la
columna (1) y asi sucesivamente.
Para obtener la estimación del efecto se divide la ultima columna (k) entre r2 k-1 y finalmente las
sumas de cuadrados de los efectos se obtienen elevando al cuadrado los elementos de las
columnas (k) y dividiendo entre r2k.

( )

( )
( )
PARA EL EJEMPLO ANTERIOR
2k=23=8 k=3 r=2

145
Elías Alberto Torres Armas, Lic. Ms. C.
Tratam Yi… 1 2 3 ef SC
1 114 230 457 978 r= 2
a 116 227 521 -24 -3.00 36 k= 3
b 114 268 1 -18 -2.25 20.25 r*2^(k-1)= 8
c 113 253 -25 -24 -3.00 36 r*2^k= 16
ab 135 2 -3 64 8.00 256
ac 133 -1 -15 -26 -3.25 42.25
bc 138 -2 -3 12 1.50 9
abc 115 -23 -21 -18 -2.25 20.25

c. EXPERIMENTO 2k NO REPLICADO

En experimentos factoriales, cuando aumenta el número de factores, el número de corridas o


unidades experimentales crece rápidamente. Como usualmente los recursos son limitados el
numero de replicas para un experimento puede estar limitado. Frecuentemente los recursos
disponibles permiten ejecutar sólo una vez el experimento, con una sola replica, no hay forma
directa de estimar el error experimental. Una aproximación al análisis de un factorial 2k no
replicado consiste en suponer que ciertas interacciones de orden superior son despreciables y
combinar sus cuadrados medios para estimar el error experimental. Esta es una apelación al
principio de dispersidad de efectos, esto es, en la mayoría de los sistemas son dominados por
algunos de los efectos principales e interacciones de bajo orden y la mayoría de las interacciones
de orden superior son despreciables.

EJEMPLO
Un producto químico se fabrica en un vaso fresurizado. Se lleva a cabo un experimento factorial
en la planta piloto, para estudiar los factores que se piensa, influyen en el índice de filtración de
este producto. Los cuatro factores son la temperatura (A), presión (B), concentración de
formaldehido (C) y la velocidad de agitación (D). Cada factor está presente con dos niveles. La
matriz del diseño y los datos de la respuesta obtenidos en una sola replica del experimento 24 se
muestran a continuación:
Trat A B C D Yi
1 - - - - 45
a + - - - 71
b - + - - 48
ab + + - - 65
c - - + - 68
ac + - + - 60
bc - + + - 80
abc + + + - 65
d - - - + 43
ad + - - + 100
bd - + - + 45
abd + + - + 104
cd - - + + 75
acd + - + + 86
bcd - + + + 70
abcd + + + + 96

146
Métodos Estadísticos para la Investigación experimental
b - + - - - + + - - + + + - + - 48
ab + + - - + - - - - + - - + + + 65
c - - + - + - + - + - + - + + - 68
ac + - + - - + - - + - - + - + + 60
bc - + + - - - + + - - - + + - + 80
abc + + + - + + - + - - + - - - - 65
d - - - + + + - + - - - + + + - 43
ad + - - + - - + + - - + - - + + 100
bd - + - + - + - - + - + - + - + 45
abd + + - + + - + - + - - + - - - 104
cd - - + + + - - - - + + + - - + 75
acd + - + + - + + - - + - - + - - 86
bcd - + + + - - - + + + - - - + - 70
abcd + + + + + + + + + + + + + + + 96
Cj= 173 25 79 117 1 -145 133 19 -3 -9 15 33 -13 -21 11 1121
Ef= 21,625 3,125 9,875 14,625 0,125 -18,125 16,625 2,375 -0,375 -1,125 1,875 4,125 -1,625 -2,625 1,375
SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625

SC= 1870,5625 39,0625 390,0625 855,5625 0,0625 1314,0625 1105,5625 22,5625 0,5625 5,0625 14,0625 68,0625 10,5625 27,5625 7,5625

El análisis de varianza puede presentarse de la siguiente manera


F de V SC g.l
trat 15
A 1870,5625 1
B 39,0625 1
C 390,0625 1
D 855,5625 1
AB 0,0625 1
AC 1314,0625 1
AD 1105,5625 1
BC 22,5625 1
BD 0,5625 1
CD 5,0625 1
ABC 14,0625 1
ABD 68,0625 1
ACD 10,5625 1
BCD 27,5625 1
ABCD 7,5625 1
Error ¿?
Total 5730,9375 15

Para conformar el error experimental se puede mancomunar algunas interacciones. Las de mayor
orden (3 y 4 factores) y aquellas que tienen poco valor, también existe el CRITERIO DE
DANIEL.

METODO DE DANIEL

Daniel propone graficar las interacciones de los efectos (de menor a mayor) frente a una
probabilidad pi, donde:

( )
HACER EL GRAFICO, que permitirá mancomunar algunas interacciones para conformar
el error experimental

147
Elías Alberto Torres Armas, Lic. Ms. C.
El ANOVA puede considerar solamente a las interacciones AC y AD y las otras interacciones
conformaran el error experimental:
F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15

El modelo de regresión puede escribirse así:


̂

EFECTOS DE LOCALIZACION Y DISPERSION EN UN EXPERIMENTO


FACTORIAL 2k

Los residuos de un diseño 2k proporcionan muchas veces información acerca de la variabilidad o


dispersión de los datos localizados en diferentes efectos. Se puede examinar los residuos de un
experimento 2k no replicado para obtener información acerca de la variabilidad del proceso. Paras
cada efecto puede obtenerse la varianza muestral cuando el efecto está en su nivel alto s 2(+) y en
su nivel bajo S2(-), luego:
( )
( )
( )
La dispersión está bajo control (controlada) si:

PARA EL EJEMPLO. EL FACTOR A:

s2(+)=313,27
( )
S2(-)=238,21 luego: ( ) ESTE VALOR ESTA DENTRO DE
LOS INTERVALOS, POR TANTO LA DISPERSION ESTA BAJO CONTROL.

Resultados del experimento 2k no replicado (r=1)


Trat A B C D Yi
1 - - - - 45
a + - - - 71
b - + - - 48
ab + + - - 65
c - - + - 68
ac + - + - 60
bc - + + - 80
abc + + + - 65
d - - - + 43
ad + - - + 100
bd - + - + 45
abd + + - + 104
cd - - + + 75
acd + - + + 86
bcd - + + + 70
abcd + + + + 96

148
Métodos Estadísticos para la Investigación experimental

F de V SC g.l
trat 15
A 1870,5625 1
B 39,0625 1
C 390,0625 1
D 855,5625 1
AB 0,0625 1
AC 1314,0625 1
AD 1105,5625 1
BC 22,5625 1
BD 0,5625 1
CD 5,0625 1
ABC 14,0625 1
ABD 68,0625 1
ACD 10,5625 1
BCD 27,5625 1
ABCD 7,5625 1
Error ¿?
Total 5730,9375 15

Se pueden conformar las interacciones despreciables y los de mayor orden para conformar el
error experimental. La tabla puede quedar así:

F de V SC g.l CM F p-VALOR
trat 15
A 1870,5625 1 1870,5625 107,87 0,0000
B 39,0625 1 39,0625 2,25 0,1676
C 390,0625 1 390,0625 22,49 0,0011
D 855,5625 1 855,5625 49,34 0,0001
AC 1314,0625 1 1314,0625 75,78 0,0000
AD 1105,5625 1 1105,5625 63,76 0,0000
Error 156,0625 9 17,34027778
Total 5730,9375 15

El modelo de regresión puede escribirse así:

d. ADICION DE PUNTOS CENTRALES AL DISEÑO 2k

Cuando se usan diseños factoriales 2k (dos niveles) se debe suponer la linealidad en los efectos. Si
esto se cumple el sistema 2k funcionará bastante bien. Sin embargo si existe sospecha de no
linealidad existe un método para replicar ciertos puntos en un diseño factorial 2 k lo cual protegerá
contra la curvatura además de permitir obtener estimaciones de error independientes. Dicho
método consiste en agregar puntos centrales al diseño 2k, para lo cual se hacen replicas (n 0) en los
puntos Xi=0 (i=1,2,3,..,k). Se supone que los k factores son cuantitativos.

149
Elías Alberto Torres Armas, Lic. Ms. C.
El análisis de varianza para un diseño 2k (23) con n0 puntos centrales es:
F de V g.l. SC CM F(I)
A 1 Ayy A A/E
B 1 Byy B B/E
C 1 Cyy C C/E
AB 1 AByy AB AB/E
AC 1 ACyy AC AC/E
BC 1 BCyy BC BC/E
ABC 1 ABCyy ABC ABC/E
Curvatura 1 CUyy CU CU/E
Error nc-1 Eyy E
k
Total 2 +nc-1 Wyy
8+nc-1

H0: Curvatura es cero

∑( ̅)

(̅ ̅)

̅ (
̅ (
Si CU/E resulta no significativa, entonces, no hay evidencia de curvatura en la respuesta en la
región explorada.

EJEMPLO: (DISEÑO FACTORIAL 23 SIN REPLICACIONES CON 5 PUNTOS


CENTRALES) Una ingeniera química se encuentra estudiando el rendimiento de un proceso.
Existen tres variables de interés: Tiempo (bajo 10min, alto 12min), velocidad (bajo 30, alto 40),
temperatura (bajo º380, alto 420). Debido a que tiene duda a cerca de la suposición de linealidad
en la región que explora, decide realizar un diseño 23 (con una replica) aumentada con cinco
puntos centrales. Los datos ordenados y el diseño se muestra a continuación:

150
Métodos Estadísticos para la Investigación experimental

Efectos
Trat A B C AB AC BC ABC Y
1 - - - + + + - 18 324
a + - - - - + + 23 529
b - + - - + - + 21 441
ab + + - + - - - 27 729
c - - + + - - + 21 441
ac + - + - + - - 25 625
bc - + + - - + - 24 576
abc + + + + + + + 33 1089
Cj= 24 18 14 6 2 4 4 192 4754
Ef= 6,0 4,5 3,5 1,5 0,5 1,0 1,0 146
SC= 72,0 40,5 24,5 4,5 0,5 2,0 2,0
( )
CUyy= 3,07692308
CUADRO ANOVA
F de V SC g.l. CM F
A 72 1 72 32.0000
B 40.5 1 40.5 18.0000
C 24.5 1 24.5 10.8889
AB 4.5 1 4.5 2.0000
AC 0.5 1 0.5 0.2222
BC 2 1 2 0.8889
ABC 2 1 2 0.8889
Curvatura 3.077 1 3.077 1.3676
Error 9 4 2.25
Total 158.077 12

H0: Curv=0 se acepta


No hay evidencia de curvatura en la región de exploración.

DISEÑOS EXPERIMENTALES FACTORIALES FRACCIONARIOS DE DOS


NIVELES
Un experimento 2k cuando k aumenta, el número de ensayos o corridas para obtener una réplica
completa sobrepasa rápidamente los recursos de la mayoría de los experimentadores. En un 2 6,
una réplica completa requiere 64 ensayos, generándose 63 grados de libertad; del total de grados
de libertad solo 6 corresponden a los efectos principales, únicamente 15 corresponden a las
interacciones de 2 factores y los 42 restantes a las interacciones de 3 ó más factores. Si el
experimentador puede suponer que algunas interacciones de orden superior son despreciables, la
información sobre los efectos principales y las interacciones de menor orden pueden obtenerse
realizando solo una fracción del experimento factorial completo. En este caso se dice que se está
usando un diseño factorial fraccionario. Estos diseños factoriales fraccionarios se encuentran
entre los diseños más usados en la industria.

1. DISEÑO 2k CON ½ REPETICIÓN (2k-1 corridas)

También se conoce como fracción ½ porque solamente se usa la mitad de las corridas del
diseño completo (2k-1=2k/2).

151
Elías Alberto Torres Armas, Lic. Ms. C.
En un diseño factorial 24 con ½ repetición solo se deben usar 24-1=8 corridas, es decir 8
combinaciones de tratamientos y no las 16.
Para identificar las corridas o tratamientos a usar:

 Construir una tabla de signos 2k=24 con los efectos principales y con la interacción que
se va confundir (la de mayor orden ABCD).
 En la columna de la interacción confundida elegir los tratamientos que tienen el mismo
signo (positivo o negativo).

Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +

Eligiendo las combinaciones (-), se tiene la siguiente tabla:

Combinación A B C D AB AC AD BC BD CD ABC ABD ACD BCD Yi.


tratamiento
a + - - - - - - + + + + + + -
b - + - - - + + - - + + + - +
c - - + - + - + - + - + - + +
d - - - + + + - + - - - + + +
abc + + + - + + - + - - + - - -
abd + + - + + - + - + - - + - -
acd + - + + - + + - - + - - + -
bcd - + + + - - - + + + - - - +
Cj
Cj
ef  k 2
2

(C j ) 2
SC 
2 k 1

En la tabla de tratamientos y efectos, solo se consideran los tratamientos elegidos (-) y los efectos
de un diseño 24 sin considerar el efecto ABCD por estar confundida.

152
Métodos Estadísticos para la Investigación experimental

En los efectos o contrastes se verifica:


A=-BCD
B=-ACD
C=-ABD
AB=-CD
AC=-BD
AD=-BC

La suma de cuadrados son iguales, de: A=BCD, B=ACD, …, AB=CD; estos son los llamados
pares aliados. En el ANVA de cada para aliado solo se elige a uno de ellos.
Los pares aliados se obtienen así:
AxABCD=A2BCD=BCD aliado de A
BxABCD=AB2CD=ACD aliado de B
ABxABCD=A2B2CD=CD aliado de AB

En el análisis de varianza no se disponen de grados de libertad para el error experimental por lo


que pueden mancomunarse o conformarse con las interacciones de menos valor.

En los diseños fraccionarios se debe elegir adecuadamente la interacción a confundir evitando


que un efecto principal sea aliado de otro principal o de una interacción de primer orden (AB,
AC, AD,…).

Cuando en un diseño factorial fraccionario se elige adecuadamente una interacción a confundir,


de tal manera que los efectos principales tienen como aliados a las interacciones de mayor orden
posible, se dice que se ha obtenido un diseño de máxima resolución. Podemos mencionar:

DISEÑOS DE RESOLUSIÓN III

Estos son diseños en los que ningún efecto principal es aliado de otro principal pero si lo son de
interacciones de dos factores; así mismo las interacciones de dos factores son aliados entre sí. (
23III1 con I  ABC ).

DISEÑOS DE RESOLUSIÓN IV

Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
interacción de dos factores. Las interacciones de dos factores son aliados entre sí. (
24IV1 con I   ABCD )

DISEÑOS DE RESOLUSIÓN V

Estos son diseños en los que ningún efecto principal es aliado de otro principal, ni de alguna
interacción de dos factores. Las interacciones de dos factores son aliados de las interacciones de
tres factores. ( 2V51 con I   ABCDE )

RESOLUSIÓN DEL DISEÑO

Un diseño es de resolución R si ningún efecto de p factores es aliado de otro efecto que tenga
menor de R-p factores. Se usa el numeral romano para indicar su resolución.

153
Elías Alberto Torres Armas, Lic. Ms. C.

CONSTRUCCIÓN DE UN DISEÑO 2k CON ½ REPLICAS, DE MÁXIMA RESOLUSIÓN


Se puede construir escribiendo primero las combinaciones de tratamiento del diseño 2 k-1 y
agrupando después el k-ésimo factor como el producto de los signos de la interacción más
grandes del diseño 2k-1. En estos diseños, la máxima resolución R es R=k. Esta situación es
equivalente al procedimiento de la tabla de signos, cuando se elige a la interacción más grande
como interacción confundida.

EJEMPLO. Se desea iniciar una investigación experimental con 5 factores cada uno a dos niveles.
Sólo se dispone de una capacidad para 25-1=16 ensayos. Se puede construir el diseño de máxima
resolución y realizar el análisis con los datos registrados.

Combinación 2k-1=24 I=ABCDE Combinación Rpta


tratamiento A B C D E=ABCD tratamiento* Yi
(1) - - - - + e 8
a + - - - - a 9
b - + - - - b 34
ab + + - - + abe 52
c - - + - - c 16
ac + - + - + ace 22
bc - + + - + bce 45
abc + + + - - abc 60
d - - - + - d 6
ad + - - + + ade 10
bd - + - + + bde 30
abd + + - + - abd 50
cd - - + + + cde 15
acd + - + + - acd 21
bcd - + + + - bcd 44
abcd + + + + + abcde 63

*: Tratamientos a usar:

A: Temperatura : -, +
B: Presión : -, +
C: Velocidad : -, +
D: pH : -, +
E: Humedad : -, +
Y: Dureza

E=ABCD generador
I=ABCDE relación definición
Aliados: EfectosxI ( 2V51 )
A=BCDE AB=CDE BD=ACE
B=ACDE AC=BDE BE=ACD
C=ABDE AD=BCE CD=ABE
D=ABCE AE=BCD CE=ABD
E=ABCD BC=ADE DE=ABC

Para obtener los contrastes, efectos y suma de cuadrados por el método de los signos
t 16
C j   CijYi
i 1

154
Métodos Estadísticos para la Investigación experimental

En el análisis de varianza se puede optar por mancomunar los efectos de las interacciones a
excepción de AB que parece ser de importancia.

Combinación A B C D E AB AC AD AE BC BD BE CD CE DE Yi.
tratamiento
E - - - - + + + + - + + - + - - 8
A + - - - - - - - - + + + + + + 9
B - + - - - - + + + - - - + + + 34
Abe + + - - + + - - + - - + + - - 52
C - - + - - + - + + - + + - - + 16
Ace + - + - + - + - + - + - - + - 22
Bce - + + - + - - + - + - + - + - 45
Abc + + + - - + + - - + - - - - + 60
D - - - + - + + - + + - + - + - 6
Ade + - - + + - - + + + - - - - + 10
Bde - + - + + - + - - - + + - - + 30
Abd + + - + - + - + - - + - - + - 50
Cde - - + + + + - - - - - - + + + 15
Acd + - + + - - + + - - - + + - - 21
Bcd - + + + - - - - + + + - + - - 44
Abcde + + + + + + + + + + + + + + + 63
Cj 89 271 87 -7 5 55 3 9 9 5 -1 -1 7 3 -11 485
Cj
ef  k 2
11.125

33.875

10.875

-0.875

-0.125

-0.125

-1.375
0.625

6.875

0.375

1.125

1.125

0.625

0.875

0.375
2
4590.0625
495.0625

473.0625

189.0625

(C j ) 2
3.0625

1.5625

0.5625

5.0625

5.0625

1.5625

0.0625

0.0625

3.0625

0.5625

7.5625
SC 
2 k 1

El análisis de varianza

F de V gl SC CM F
A 1 495.0625 495.0625 189.10
B 1 4590.063 4590.0625 1753.23
C 1 473.0625 473.0625 180.69
D 1 3.0625 3.0625 1.17
E 1 1.5625 1.5625 0.60
AB 1 189.0625 189.0625 72.21
AC 1 0.5625
AD 1 5.0625
AE 1 5.0625
BC 1 1.5625
BD 1 0.0625
BE 1 0.0625
CD 1 3.0625
CE 1 0.5625
DE 1 7.5625
Error 9 23.5625 2.6181
Total 15 5775.4375

155
Elías Alberto Torres Armas, Lic. Ms. C.

2. DISEÑO 2k CON 1/4 REPETICIÓN

Se conoce como fracción ¼ porque solamente puede usarse la cuarta parte de las corridas de
un diseño completo. En este diseño solo se dispone 2k-2 unidades experimentales. Para
construir este diseño primero se escriben las combinaciones para el diseño 2 k-2 y después se
agregan dos factores como generadores, cada uno como el producto de los signos de
interacciones del diseño 2k-2 elegidas adecuadamente, los mismos que generan dos relaciones
de definición I1, I2, de tal manera que la relación generalizada I3= I1xI2 sea de orden adecuado
(mod2). En este caso cada efecto tiene tres aliados, multiplicando cada efecto por I1, I2 y I3.

Ejemplo. Construir un diseño 26 (ABCDEF) con solo 26-2=16 corridas

Combinación 2k-1=24 I1=ABCE Combinación


tratamiento A B C D I2=BCDF tratamiento* Yi
E=ABC
F=BCD
(1) - - - - - - (1) 6
a + - - - + - ae 10
b - + - - + + bef 32
ab + + - - - + abf 60
c - - + - + + cef 4
ac + - + - - + acf 15
bc - + + - - - bc 26
abc + + + - + - abce 60
d - - - + - + df 8
ad + - - + + + adef 12
bd - + - + + - bde 34
abd + + - + - - abd 60
cd - - + + + - cde 16
acd + - + + - - acd 5
bcd - + + + - + bcdf 37
abcd + + + + + + abcdef 52

I1=ABCE I2=BCDF
I3=ABCExBCDF=AB2C2DEF=ADEF

Los aliados se obtienen multiplicando por I1=ABCE, I2=BCDF, I3=ADEF

A=BCE=DEF=ABCDF AD=EF=ABCF=BCDF
B=ACE=CDF=ABDEF AE=BC=DF=ABCDEF
C=ABE=BDF=ACDEF AF=DE=ABCD=BCDF
D=AEF=BCF=ABCDE BD=CF=ABDF=ACDE
E=ABC=ADF=BCDEF BF=CD=ABDE=ACEF
F=ADE=BCD=ABCEF ABD=CDE=ACF=BEF
AB=CE=ACDF=BDEF ACD=BDE=ABF=CEF
AC=BE=ABDF=CDEF

Existen tablas con generadores para obtener diseños de máxima resolución. Este diseño 2 6IV2
(Resolución IV). Resol: Longitud palabra más corta de I i.

156
Métodos Estadísticos para la Investigación experimental

Para obtener los contrastes, efectos y sumas de cuadrados

Combinación A B C D E F AB AC AD AE AF BD BF ABD ACD Yi.


tratamiento
(1) - - - - - - + + + + + + + - - 6
Ae + - - - + - - - - + - + + + + 10
Bef - + - - + + - + + - - - + + - 32
Abf + + - - - + + - - - + - + - + 60
Cef - - + - + + + - + - - + - - + 4
Acf + - + - - + - + - - + + - + - 15
Bc - + + - - - - - + + + - - + + 26
Abce + + + - + - + + - + - - - - - 60
Df - - - + - + + + - + - - - + + 8
Adef + - - + + + - - + + + - - - - 12
Bde - + - + + - - + - - + + - - + 34
Abd + + - + - - + - + - - + - + - 60
Cde - - + + + - + - - - + - + + - 16
Acd + - + + - - - + + - - - + - + 5
Bcdf - + + + - + - - - + - + + - - 37
Abcdef + + + + + + + + + + + + + + + 52
Cj 111 285 -7 11 3 3 95 -13 -43 -15 5 -1 -1 1 -39 437
Cj
ef  k 3
13.875

35.625

11.875
-0.875

-1.625

-5.375

-1.875

-0.125

-0.125

-4.875
1.375

0.375

0.375

0.625

0.125
2
5076.5625
770.0625

564.0625

115.5625

(C j ) 2
10.5625

14.0625

95.0625
3.0625

7.5625

0.5625

0.5625

0.5625

0.0625

0.0625
SC 
2 k 2 0.0625

El modelo completo de regresión


437 13.875 35.625 0.875 1.375 0.375 0.375 11.875 1.625 4.875
Y  X1   X2  X3  X4  X5  X6  X1 X 2  X1 X 3  ....  X1 X 3 X 4
16 2 2 2 2 2 2 2 2 2
Sin embargo para el error experimental se deben mancomunar interacciones, pudiendo elegir
como importante solo la interacción AB.

El análisis de varianza
F de V gl SC CM F
A 1 770.0625 770.0625 25.99
B 1 5076.563 5076.563 171.36
C 1 3.0625 3.0625 0.10
D 1 7.5625 7.5625 0.26
E 1 0.5625 0.5625 0.02
F 1 0.5625 0.5625 0.02
AB 1 564.0625 564.0625 19.04
Error 8 237 29.625

157
Elías Alberto Torres Armas, Lic. Ms. C.

Total 15 6659.438
PROYECCION DEL FACTORIAL FRACCIONARIO

Cualquier diseño factorial fraccionario de resolución R contiene diseños factoriales completos (o


posiblemente réplicas de diseños factoriales) de cualquier subconjunto de R-1 factores.

Si tomamos como referencia el último ejemplo, basado en el análisis de varianza, podemos


eliminar del análisis al factor F, entonces el diseño quedará ajustado a un diseño 2 5 con ½
repetición. Si a partir de este último diseño ajustado eliminamos, basado en el análisis de varianza,
al factor E, el nuevo diseño queda ajustado a un diseño 24 con una réplica completa; y así
sucesivamente. Este esquema funciona siempre que los factores no eliminados, no constituyan
generador alguno.

TÉCNICA DE CONFUSIÓN EN EL DISEÑO FACTORIAL 2k

Cuando en experimentos 2k se desea usar bloques, entonces cada uno de los bloques debe tener
2k unidades experimentales, para que en dichos bloques puedan correrse todos los tratamientos;
sin embargo en experimentos 2k el número de factores crece rápidamente (23, 24, 25,…) por lo
que hacer una réplica completa en cada bloque resulta poco viable. Si cada bloque dispone de 2 k-1,
2k-2, 2k-3, unidades experimentales, se puede hacer uso de la técnica de la confusión (confundido).
La técnica de la confusión es aquella es aquella que nos permite acomodar un experimento
factorial completo en bloques incompletos, donde el tamaño de cada uno de estos bloques es de
2k-1, 2k-2, …, unidades experimentales; es decir el tamaño de cada bloque incompleto es la mitad, o
la cuarta parte, … , del bloque completo.
Al usar la técnica de la confusión se pierde la información de una o de más interacciones, las que
deben ser elegidas adecuadamente por el investigador; estas, generalmente son las que parecen
tener poco valor o poco interés.
Vamos a desarrollar la construcción y análisis del diseño factorial 2k en 2p bloques incompletos
cada réplica con p<k.
Si p=1 2k en 2 bloques incompletos cada replicación
Si p=2 2k en 4 bloques incompletos cada replicación
Si p=3 2k en 8 bloques incompletos cada replicación
El tamaño de cada bloque
p=1 2k-1 u.e, p=2 2k-2 u.e, p=3 2k-3 u.e

1. DISEÑO FACTORIAL 2k EN 2 BLOQUES

La construcción de este diseño ( o asignación de los tratamientos a los bloques incompletos)


puede usarse usando varios métodos; formularemos 2 métodos: El método de los signos y el
contraste de definición L.

a. USANDO MÉTODO DE LOS SIGNOS

- Se elabora un cuadro de signos para los tratamientos, y efectos de un experimento 2k


- Elegimos el efecto que se desea confundir
- Se asignan las combinaciones de tratamientos con signos positivos en un bloque
incompleto y las combinaciones con signo negativo en el otro bloque (el bloque que
contiene al tratamiento (1) se denomina bloque principal)

158
Métodos Estadísticos para la Investigación experimental

- Se realiza el análisis de la forma conocida, teniendo como fuente la variación del


ANVA, a bloques incompletos, tratamientos o efectos de factores (sin considerar la
interacción confundida), error experimental y total.
Cj (C j ) 2
Efect  k 1 SCefectos 
r2 r 2k
Si el experimento se realizó sin replicaciones, los bloques incompletos tienen 1 grado
de libertad y
Cj (C j ) 2
Efect  k 1 SCefectos  k
2 2

b. USANDO CONTRASTE DE DEFINICIÓN L

- Se escribe el contraste de definición L


L  1 X 1   2 X 2   3 X 3  ...   k X k con
 i : Exponente que aparece en i-ésimo factor del efecto que será confundido con:
 i  0 Factor i no aparece en la interacción a confundirse
 i  1 Factor i si aparece en la interacción a confundirse
1  1
 1
Si 24=2A2B2C2D se confunde ABD (A1B1C0D1)  2
3  0
4 1
L=X1+X2+X4
Xi: Nivel del i-ésimo factor que aparece en una combinación de tratamiento
particular
Xi=1 Nivel alto
Xi=0 Nivel bajo
i: 1, 2, 3,…,k (1=factor A, 2=factor B, 3=factor C, …)

- Aplicar L a todas las combinaciones de tratamientos

- Asignar a un mismo bloque incompleto aquellas combinaciones de tratamiento que


tienen el mismo valor L (mod 2)
L=0 Bloque incompleto 1
L=1 Bloque incompleto 2

- Realizar el análisis de la forma conocida.

EJEMPLO. En un experimento 2A2B2C2D=24, con bloques de tamaño 23=8


- Si se confunde ABCD L=X1+X2+X3+X4
- Si se confunde ABC L=X1+X2+X3
- Si se confunde ACD L=X1+X3+X4

EJEMPLO 1. (23 con replicación, confundiendo interacción ABC)

Se estudiarán 3 factores A, B, C (23=8) con 3 repeticiones, disponiéndose bloques de


tamaño 4 (2k-1=22=4). Se decide confundir ABC.

159
Elías Alberto Torres Armas, Lic. Ms. C.

a. Escribir el diseño, usando tabla de signos y el contraste de definición L


b. Analizar los resultados

SOLUCIÓN

a. El diseño
i. Tabla de signos
Trat A B C AB AC BC ABC
(1) - - - -
a + - - +
b - + - +
ab + + - -
c - - + +
ac + - + -
bc - + + -
abc + + + +

Dos bloques:

Bloque principal: (1), ab, ac, bc


Bloque no principal: a, b, c, abc
Obsérvese que para ABC (interacción confundido) se asigna signo (-) al bloque
principal y (+) al bloque no principal.
ii. Contraste de definición L
L  1 X 1   2 X 2   3 X 3 1   2   3  1
L  X1  X 2  X 3 mod 2, para residuo
Trat: X1 X2 X3
(1)=0,0,0 L=0+0+0=0
a=1,0,0 L=1+0+0=1
b=0,1,0 L=0+1+0=1
ab=1,1,0 L=1+1+0=2 mod2=0
.
.
abc=1,1,1 L=1+1+1=3 mod2=1

Bloques incompletes

I. Principal: (1), ab, ac, bc


II. No principal a, b, c, abc

b. Análisis de los resultados

Suponga que después de ejecutar el experimento, los resultados fueron:

160
Métodos Estadísticos para la Investigación experimental

b c abc a ac (1) ab bc
40 35 60 60 195 58 39 45 70 212

bc ab (1) ac a abc c b
64 60 38 70 232 45 69 45 47 206

a c b abc ac bc (1) ab
39 43 48 71 201 60 60 30 65 215

El modelo estadístico de este diseño

Yijk     e  Ai  B j  ABij  C k  ( AC ) ik  ( BC ) jk   ijkl


i  1,2; j  1,2; k  1,2; l  1,2,3,4,5,6 (2r )

El análisis de varianza asociado a este modelo es:


F de V gl SC CM F
Bloques incompletos 5 208.71 41.74 0.69
A 1 852.04 852.04 14.16
B 1 708.04 708.04 13.00
C 1 925.04 925.04 15.37
AB 1 155.04 155.04 2.58
AC 1 0.04 0.04 0.00
BC 1 35.05 35.05 0.58
Error experimental 12 722.01 60.17
Total 23 3679.96
195 2  212 2  ...  215 2 12612
(BI) yy =   208.71
4 24
12612
W yy  40 2  ...  65 2   3679.96
24
Para obtener las sumas de cuadrados, con el método de los signos
Trat A B AB C AC BC Yi…
(1) - - + - + + 107
A + - - - - + 144
B - + - - + - 135
Ab + + + - - - 170
C - - + + - - 123
Ac + - - + + - 188
Bc - + - + - + 194
Abc + + + + + + 200
Cj 143 137 -61 149 -1 29 1261
Cj Cj 11.916… -11.416… 5.083… 12.416… -0.083… 2.416…
Efect  k 1 
r2 3 * 22
852.04 782.04 155.04 925.04 0.04 35.04
(C j ) 2 (C j ) 2
SCefectos  
r 2k 3 * 23
=

161
Elías Alberto Torres Armas, Lic. Ms. C.

107=39+38+30

EJEMPLO 1. (24 sin replicación, confundiendo interacción ABCD)

Se está estudiando el efecto que tienen 4 factores Temperatura (A), fusión (B), concentración de
los reactivos (C) y rapidez de mezclado (D) sobre la tasa de filtración de un producto en una
planta piloto. Suponga que no se pueden efectuar las 24 combinaciones de tratamientos en un
mismo día. Diariamente el experimentador puede ensayar 8 combinaciones por lo que un diseño
24 confundido en 2 bloques resulta apropiado. Es lógico confundir la interacción de mayor
orden ABCD.

a. Construir el diseño usando tabla de signos y contraste de definición L.


b. Analizar los resultados (ABCD confundido con bloques)

SOLUCIÓN
a. Construcción del diseño
i. Usando tabla de signos
Combinación A B C D ABCD
tratamiento
(1) - - - - +
a + - - - -
b - + - - -
ab + + - - +
c - - + - -
ac + - + - +
bc - + + - +
abc + + + - -
d - - - + -
ad + - - + +
bd - + - + +
abd + + - + -
cd - - + + +
acd + - + + -
bcd - + + + -
abcd + + + + +

Observe: en ABCD los signos positivos indican el BI (bloque principal) y los


signos negativos indican el BII (bloque no principal)
BI B II
(1) a
ab b
ac c
bc abc
ad d
bd abd
cd acd
abcd bcd
(+) (-)
ii. Usando contraste de definición L
L=X1+X2+X3+X4 L=0 y L=1 mod2

162
Métodos Estadísticos para la Investigación experimental

b. Análisis de los resultados


Suponga que los resultados obtenidos fueron: (ya ordenados)

I (1) ab ac bc ad bd cd abcd
45 65 60 80 100 45 75 96 566
1121
II a b c d abc bcd acd abd
71 48 68 43 65 70 86 104 555

Para facilitar los cálculos puede usarse el algoritmo de YATES. El experimentador piensa que la
interacción de 3 factores son despreciables, las que al mancomunarse conforman el error
experimental.

Combinación Rpta 1 2 3 4 (C j ) 2 (C j ) 2 (C j ) 2
(C j )
tratamiento
Cj ef  , r  1 SC   
r 2 k 1 r 2k 1* 2 4 16
(1) 45 116 229 502 1121
a 71 113 273 619 173 21.625 1870.5625
b 48 128 294 20 25 3.125 39.0625
ab 65 145 327 153 1 0.125 0.0625
c 68 143 43 14 79 9.875 390.0625
ac 60 149 -23 11 -145 -18.125 1314.0625
bc 80 161 116 -16 19 2.375 22.5625
abc 65 166 37 17 15 1.875 14.0625
d 43 26 -3 44 117 14.625 855.5625
ad 100 17 17 35 133 16.625 1105.5625
bd 45 -8 6 -66 -3 -0.375 0.5625
abd 104 -15 5 -79 33 4.125 68.0625
cd 75 57 -9 20 -9 -1.125 5.0625
acd 86 59 -7 -1 -13 -1.625 10.5625
bcd 70 11 2 2 -21 -2.625 27.5625
abcd 96 26 15 13 11 1.375 7.5625

566 2  555 2 11212


SC.bloques =   7.5625  ABCD
8 16
11212
W yy  45 2  ...  96 2   5730.9375
16

El cuadro de análisis de varianza


F de V gl SC CM F
Bloques (ABCD) 1 7.5625
A 1 1870.5625 1870.5625 62.2224532
B 1 39.0625 39.0625 1.2993763
C 1 390.0625 390.0625 12.975052

163
Elías Alberto Torres Armas, Lic. Ms. C.

D 1 855.5625 855.5625 28.4594595


AB 1 0.0625 0.0625 0.002079 <1
AC 1 1314.0625 1314.0625 43.7110187
AD 1 1105.5625 1105.5625 36.7754678
BC 1 22.5625 22.5625 0.75051975 <1
BD 1 0.5625 0.5625 0.01871102 <1
CD 1 5.0625 5.0625 0.16839917 <1
Error 4 120.25 30.0625
(ABC+ABD+ACD+BCD)
Total 15 5730.9375
Observe los valores de F que son menores que 1, indican efectos despreciables que también
pasarían a conformar el error experimental.

2. DISEÑO FACTORIAL 2k EN 4 BLOQUES


Consiste en construir diseños factoriales confundidos en 4 bloques con 2 k-2 unidades
experimentales en cada bloque para luego realizar el análisis de la forma conocida. Se deben
confundir 3 interacciones: 2 generadoras y otra generalizada.
i. Usando contraste de definición
Se deben definir dos contrastes de definición para dos interacciones a confundirse. Como
existen 4 bloques incompletos, estos usan 3 grados de libertad, por lo que se requiere
confundir otra interacción. Esta tercera interacción a confundirse denominada interacción
GENERALIZADA se obtiene multiplicando las dos primeras interacciones con modulo
2.
Como ejemplo considere el experimento 25, si solo es posible asignar 8 combinaciones de
tratamientos a cada bloque se requieren entonces 4 bloques. Este es un diseño 2 5 con 4
bloques para cada replicación.
Se seleccionan 2 efectos que van a confundirse con los bloques, por ejemplo las
interacciones ADE y BCE, estos efectos tienen asociados los contrastes de definición:
L1=X1+X4+X5
L2=X2+X3+X5
Ahora, cada combinación de tratamiento produce un par de valores (para L 1 mod2 y para
L2 mod2) que producen las siguientes:
(L1,L2)=(0,0),(1,0),(0,1),(1,1) BI, BII, BIII, BIV.
Las combinaciones de tratamientos que tengan el mismo valor de (L 1,L2) se asignan a un
mismo bloque
(1)= 0, 0, 0, 0, 0  L1 =0 L2=0 BI
a= 1, 0, 0, 0, 0  L1 =1 L2=0 BII
.
.
bce= 0, 1, 1, 0, 1 L1 =1 L2=1 BIV
.
.
Los bloques con sus respectivos tratamientos son:
BI BII BIII BIV
L1=0, L2=0 L1=1, L2=0 L1=0, L2=1 L1=1, L2=1
(1) abe a be b abce e abcde
ad ace d abde abd ae ade bd
bc cde abc ce c bcde bce ac
abcd bde bcd acde acd de ab cd

164
Métodos Estadísticos para la Investigación experimental

ADE, BCE, (ADE)(BCE)=ABCD generalizada ABCDE2=ABCD

ii. Usando tabla de signos


Se elabora la tabla de signos con los tratamientos, efectos principales y las dos
interacciones generadoras.
Los resultados de las dos columnas anteriores generan 4 grupos:
- - + - - + + +
I II III IV
BI BII BIII BIV Bloques incompletos
Se realiza el análisis de la manera conocida sin consideran las tres interacciones (dos
generadoras I1=ABC I2=CDE y una generalizada I3=ABDE).
A B C D E ABC CDE
(1) - - - - - - - I
a + - - - - + - II
b - + - - - + - II
ab + + - - - - - I
c - - + - - + + IV
ac + - + - - - + III
bc - + + - - - + III
abc + + + - - + + IV
d - - - + - - + III
ad + - - + - + + IV
bd - + - + - + + IV
abd + + - + - - + III
cd - - + + - + - II
acd + - + + - - - I
bcd - + + + - - - I
abcd + + + + - + - II
e - - - - + - + III
ae + - - - + + + IV
be - + - - + + + IV
abe + + - - + - + III
ce - - + - + + - II
ace + - + - + - - I
bce - + + - + - - I
abce + + + - + + - II
de - - - + + - - I
ade + - - + + + - II
bde - + - + + + - II
abde + + - + + - - I
cde - - + + + + + IV
acde + - + + + - + III
bcde - + + + + - + III
abcde + + + + + + + IV

3. DISEÑO FACTORIAL 2k EN 8 BLOQUES (2k en 2p-3 bloques)

En este diseño 2k, cada bloque debe tener 2k-3 unidades experimentales. Deben seleccionarse
p=3 efectos independientes que serán confundidos. Por independiente se entiende que
ningún efecto elegido es igual a la interacción generalizada de los otros. Los bloques se
165
Elías Alberto Torres Armas, Lic. Ms. C.

pueden generar usando los contrastes de definición L 1, L2, L3, los otros 4 efectos serán
confundidos con los bloques, siendo estos las interacciones generalizadas de los 3 efectos
independientes elegidos originalmente. Los efectos que serán confundidos deben elegirse
cuidadosamente para no sacrificar alguna información importante. El análisis estadístico de
estos diseños es directo, las sumas de cuadrados de todos los efectos se calculan como si no
existieran los bloques. La suma de cuadrados de bloques puede determinarse sumando las
sumas de cuadrados de los efectos que se confunden con los bloques. (Ver tabla 7.8 de
Montgomery).

DISEÑOS DE SUPERFICIE DE RESPUESTA

El uso de diseños de superficie de respuesta es una alternativa más adecuada que utiliza técnicas
matemáticas y estadísticas para establecer la relación entre los factores y la variable dependiente,
siendo el objetivo principal optimizar la respuesta. Se desarrolla en las siguientes etapas:
 Diseño y recopilación de datos experimentales
 Aplicación de las técnicas de región múltiple para elegir la mejor para elegir la mejor ecuación
que representa a los datos
 Determinar los valores de los factores o variables de control que producirán una respuesta
óptima
 Describir gráficamente cómo es la superficie de respuesta en las inmediaciones de la respuesta
óptima.

Se puede decir que el modelo de segundo orden es indispensable en la etapa de optimización y


que puede describir adecuadamente la región óptima:
k k k k
Yˆ  b0   b j X j   b jj X 2j   bij X i X j
j 1 j 1 i 1 j 1
En el análisis de los diseños de superficie de respuesta debe considerarse los siguientes aspectos:
 Estimación del modelo matemático
 Evaluación de la significancia de los coeficientes de regresión y la falta de ajuste del modelo
 Localización del punto estacionario (donde se hace mínima o máxima (óptima) la variable
respuesta)
 Representación gráfica de la superficie de respuesta.

i. EVALUACIÓN DEL MODELO MATEMÁTICO

k k k k
Yˆ  b0   b j X j   b jj X 2j   bij X i X j
j 1 j 1 i 1 j 1

Los coeficientes del modelo matemático de segundo orden pueden estimarse por mínimos
cuadrados, de manera matricial:

b  ( X ' X ) 1 X 'Y
X  1, X 1 , X 2 , X 12 , X 22 , X 1 X 2
Donde:
b: Vector de coeficientes,
X: matriz del diseño,

166
Métodos Estadísticos para la Investigación experimental

X’: matriz transpuesta de X,


Y: Datos observados (vector respuesta)

ii. ANÁLISIS DE SIGNIFICANCIA DE LOS COEFICIENTES DE REGRESION Y DE


LA FALTA DE AJUSTE

Se hace a través del análisis de varianza. Por ejemplo para un diseño de dos factores
F de V SC gl CM F
A F1(yy) 1 F1 F1/E
B F2(yy) 1 F2 F2/E
AA F11(yy) 1 F11 F11/E
BB F22(yy) 1 F22 F22/E
AB F12(yy) 1 F12 F12/E
Error experimental Eyy n-6 E
Falta de ajuste Qyy n-nc-5 Q Q/P
Puro error Pyy nc-L P
Total Wyy n-1

Pyy: se obtiene por los puntos centrales (es su varianza muestral)


b 2j
Fj(yy)  C jj : elemento de la diagonal de ( X ' X ) 1
C jj
W yy   (Yij  Y ) 2 n datos E yy  W yy  R yy
nc
R yy   ' XY  SCregresión Pyy   (Yi  Yc ) 2

Eyy  Q yy  Pyy Q yy  E yy  Pyy

iii. LOCALIZACIÓN DEL PUNTO ESTACIONARIO

A partir del modelo de regresión, los valores óptimos de los factores se obtienen por métodos
analíticos de optimización. En los modelos matemáticos de segundo orden se construye el
sistema de ecuaciones:
Y Y Y
0 0 ... 0
X 1 X 2 X k
Se resuelve el sistema y se obtienen los valores óptimos.
iv. REPRESENTACIÓN GRÁFICA
La representación gráfica hace considerando a dos factores manteniendo fijos los otros. Es
fundamental analizar si el modelo de segundo orden estimado tiene un máximo o un mínimo,
o no tiene un valor extremo. Para el caso de varios factores se evalúa la matriz HESSIANA H:

167
Elías Alberto Torres Armas, Lic. Ms. C.

  2Y  2Y  2Y 
 X 2 
 1 X 1 X 2 X 1 X k 
  2Y  2Y  2Y 
  
H   X 1 X 2 X 22 X 2 X k 
    
 2 
 Y  2Y 
 X X  
 1 k X k2 
Para la existencia de un máximo el determinante de Hj debe tener signos alternados.
Los diseños experimentales más usados para describir adecuadamente los modelos de segundo
orden para diseños de superficie de respuesta son:
 DISEÑOS ROTABLES
 DISEÑOS COMPUESTOS CENTRALES
 EXPERIMENTOS CON MEZCLAS
 DISEÑOS DE BOX – BEHNKEN

a. DISEÑOS ROTABLES

Un diseño experimental es rotable cuando se tiene igual facultad de predicción en todas las
direcciones a partir de un punto experimental centrado (X0) y donde los otros puntos
experimentales están a una distancia constante del punto central. Esto significa que la varianza
depende solamente de la distancia del punto (X 1, X2,…, Xk) al punto central del diseño
(X0). En un diseño rotable los contornos de la varianza son círculos concéntricos alrededor del
punto central. Así por ejemplo son diseños rotables para k=2:

a.1. DISEÑO EXAGONAL

Consiste en 6 puntos experimentales que corresponden a un hexágono regular, más los


puntos replicados en el centro para estimar la varianza del error experimental. El diseño con 3
puntos centrales:
Corrida X1 X2 P X2 P2(x,0)
1 1.0000 0.0000 3

2 0.5000 0.8660
3 -0.5000 0.8660 1
x
4 -1.0000 0.0000 P0(0,0) P1(1,0)
5 -0.5000 -0.8660 P4(-
0.5 X1
6 0.5000 -0.8660 1,0)
7 0 0
8 0 0
9 0 0
 1  1 P P6
X1   , X2   , valores codificado s; Z i : valores
5 originales
 1  1

168
Métodos Estadísticos para la Investigación experimental

Z max  Z min
 1 si Z i  Min Zi 
2 Z i  Z1
A  X1   Xi  
 1 si Z i  Max Z max  Z min Z max  Z min
2 2
Z  Z min
 1 si Z i  Min Z i  max
2 Zi  Z 2
B  X2   Xi  
 1 si Z i  Max Z max  Z min Z max  Z min
2 2
a.2. DISEÑO OCTOGONAL

Este diseño es más confiable, debido a que utiliza un mayor número de pruebas
experimentales. Este diseño consta de 8 vértices correspondientes a un octágono regular, más
los puntos centrales para estimar la varianza del error experimental. Ejemplo: Realizar el
análisis del siguiente experimento:

Corrida Codificados Originales Y


X1 X2 Z1 Z2
1 1.000 0.000 85.9 750 12
2 0.707 0.707 76.8 812 15
3 0.000 1.000 54.9 837 23
4 -0.707 0.707 33.0 812 25
5 -1.000 0.000 23.9 750 23
6 -0.707 -0.707 33.0 688 14
7 0.000 -1.000 54.9 663 23
8 0.707 -0.707 76.8 688 14
9 0.000 0.000 54.9 750 21
10 0.000 0.000 54.9 750 21
11 0.000 0.000 54.9 750 23

Variables originales
Variables Niveles
Inferior Superior
Z1=%Cal 23.9 85.9
Z2=Temperatura 663 83.7

Los valores experimentales Zi originales se obtienen despejando

Z1:%Cal

169
Elías Alberto Torres Armas, Lic. Ms. C.

Z max  Z min 85.9  23.9


Zi  Z1 
Xi  2  0.707  2  Z1  76.8
Z max  Z min 85.9  23.9
2 2

Z2: Temperatura
Z  Z min 837  663
Z i  max Z1 
Xi  2  0.707  2  Z 2  812
Z max  Z min 837  663
2 2

k k k k
El modelo matemático de segundo orden Yˆ  b0   b j X j   b jj X 2j   bij X i X j
j 1 j 1 i 1 j 1

Los coeficientes estimarse por mínimos cuadrados, de manera matricial:


X  1, X 1 , X 2 , X 12 , X 22 , X 1 X 2
1 1.0 0 
1 0.7 0.7 
 
X  1 0 1.0 
 
   
1 0 0 
De donde :
b  ( X ' X ) 1 X 'Y

La tabla de análisis de varianza (ANVA) para probar la significación de coeficientes de


regresión y de la falta de ajuste del modelo es:

F de V SC gl CM F p-valor
A 81.6436 1 81.6436 4.27 0.0937
B 17.9973 1 17.9973 0.94 0.3767
AA 47.3389 1 47.3389 2.47 0.1765
BB 0.1197 1 0.1197 0.01 0.9400
AB 25 1 25.0000 1.31 0.3048
Error experimental 95.6628 5 19.1326
Falta de ajuste 42.9961 3 14.3320 10.75 0.0863
Puro error 2.6667 2 1.3334
Total 220.727 10

Varianza muestral de los puntos centrales (21, 21, 23) = 1.3334

b. DISEÑOS COMPUESTOS CENTRALES

170
Métodos Estadísticos para la Investigación experimental

Un diseño compuesto central es un diseño factorial 2k cuando k  5 , o un diseño fraccionario


2k-p cuando k  5 , más las siguientes características (F=2k ó F=2k-p)
 Los puntos adicionales o puntos axiales o puntos estrella (2k puntos) en los ejes
coordenados a una distancia ( ,0,0,...), (0, ,0,...),..., (0,0,..., ) del punto central del
diseño
 Puntos replicados en el centro del diseño (0,0,…,0) necesarios para hallar la varianza del
error experimental (nc puntos centrales).
 El número de pruebas experimentales o el número de corridas es:
En un diseño 2k cuando k  5 , n=2k+2k+nc
En un diseño fraccionario 2k-p cuando k  5 , n=2k-p+2k+n c
Decidir en función de la capacidad económica para ejecutar las corridas. (k es número de
factores)

Para que el diseño compuesto central sea rotable α=(F) 1/4


k Diseño F N°de nc n α
puntos
axiales 2k
2 22 4 4 5 13 1.4142
3
3 2 8 6 6 20 1.6818
4 24 16 8 7 31 2.0000
5
5 2 32 10 10 52 2.3784
5 25-1 16 10 6 32 2.0000
6-1
6 2 32 12 9 53 2.3784
7 27-1 64 14 14 92 2.8284

Ejemplo. Para k=2


F=4(P1,P2,P3,P4)Factoriales
2k=4(P5,P6,P7,P8)Axiales
nc=5(P9,P10,P11,P12, P13)Centrales

EJEMPLO. Una ingeniera agroindustrial está interesada en determinar las condiciones de


operación que maximizan el rendimiento de una reacción, con dos variables, Z 1: tiempo de
reacción, Z2: Temperatura de reacción; con la intención de ajustar a un modelo de segundo
orden decide usar un diseño compuesto central con 5 puntos centrales. Ella considera:

Variables Niveles Z Z max  Z min


Mínimo Máximo 2
Z1 23.9 85.9 85 5
Z2 663 83.7 175 5

El diseño compuesto central con valores codificados y experimentales:

171
Elías Alberto Torres Armas, Lic. Ms. C.

X1 X2 Z1 Z2 Y
-1 -1 80 170 76.5
-1 1 80 180 77.0
1 -1 90 170 78.0
1 1 90 180 79.5
0 0 85 175 79.5
0 0 85 175 80.3
0 0 85 175 80.0
0 0 85 175 79.7
0 0 85 175 79.8
1.414 0 92.07 175 78.4
-1.414 0 77.93 175 75.6
0 1.414 85 182.07 78.5
0 -1.414 85 167.93 77.0
 Z  85
Z i  Z1  para X 1  1.414 se tiene : 1.414  i
5
 Z1  92.07
Xi  , 
Z max  Z min Z  175
 para X  1.414 se tiene :  1.414  i  Z 2  167.93
2  2
5

El modelo de segundo orden (datos codificados)

Y  79.940  0.995 X1  0.515 X 2  1.376 X12  1  001X 22  0.250 X1 X 2

El punto estacionario (punto óptimo)

Y
 0  0.995  2.752 X 1  0.250 X 2  0
X 1
Y
 0  0.515  2.002 X 2  0.250 X 1  0
X 2
 2.752 X 1  0.250 X 2  0.995  X 1  0.3896  Z1  86.94
   Yˆmáx  80.23
 2.002 X 2  0.250 X 1  0.515  X 2  0.3051  Z 2  176.76

El análisis de varianza de los coeficientes y de la falta de ajuste es:

F de V SC gl CM F p-valor
A 7.9198 1 7.9198 111.93 0.00001
B 2.1232 1 2.1232 30.01 0.00093
AA 13.1761 1 13.1761 186.22 0.00000
BB 6.9739 1 6.9739 98.56 0.00002
AB 0.25 1 0.25 3.53 0.10221
Error experimental 0.4953 7 0.07076
Falta de ajuste 0.2833 3 0.0944 1.78 0.28969
Puro error 0.212 4 0.053

172
Métodos Estadísticos para la Investigación experimental

Total 12

EJERCICIO: Presentar un diseño compuesto central para 3 factores y n c=6 puntos centrales.
La región de exploración es: Z1(13, 17), Z2(80, 100) y Z3(300, 400). Z1:Velocidad, Z2: Tiempo y
Z3:Temperatura.

c. EXPERIMENTOS CON MEZCLAS

En diferentes campos de la actividad productiva, es común encontrar productos como textiles,


pinturas, cerámica, etc, que se fabrican con la mezcla de dos o más elementos. Las cualidades
del producto no dependes de la calidad total de los ingredientes en la mezcla, sino de las
proporciones de los mismos.
En temas anteriores, los diseños de superficie de respuesta, los niveles de los factores son
independientes de los niveles de los otros factores; en experimentos de mezclas, los factores
son los componentes o ingredientes de una mezcla y por lo tanto sus niveles no son
independientes.

Si X1, X2, … , Xp denota las proporciones de una mezcla, éstas deben satisfacen ciertas
restricciones:

i. 0  X i  1.0 para cada componente, con restricciones L1  X i  L2


ii. X i  1.0

En experimentos con mezclas, los modelos que permiten pronosticar el valor de la variable
dependiente en función de sus componentes pueden expresarse de una manera especial:

Modelo lineal:
p
Y   i X i
i 1

Modelo cuadrático
p
Y    i X i    ij X i X j
i 1 i j

Modelo cúbico

p
Y    i X i   ij X i X j    ij X i X j ( X i  X j )    ijk X i X j X k
i 1 i j i j i j

Modelo cúbico especial

173
Elías Alberto Torres Armas, Lic. Ms. C.

p
Y   i X i   ij X i X j    ijk Xi X j Xk
i 1 i j i  j k

Los diseños de mezcla a usar se puede considerar: (paquete)

 Simplex rejilla: Solamente usa dos componentes en la mezcla.


 Simple centroide: Usa dos componentes en la mezcla + centroide.
 Vértices extremos: Sólo usa los puntos extremos (0%, 100%)

Se puede agregar:

 Puntos duplicados
 Puntos de argumento (% para las p componentes)

1. EJEMPLO:

En un experimento de mezcla se combinan 3 componentes, polietileno (X 1), poliestireno (X2), y


polipropileno (X3) para formar una fibra la cual se convierte en hilo de tela de tapicería. La
variable de respuesta de interés es la elongación de la madeja, en centímetros por kg de fuerza
aplicada. Se usó un diseño simplex rejilla para un modelo cuadrático, sin restricciones.

Pto Proporción Y
X1 X2 X3
1 1 0 0 11.7
2 0.5 0.5 0 15.3
3 0 1 0 9.4
4 0 0.5 0.5 10.5
5 0 0 1 16.4
6 0.5 0 0.5 16.9

El modelo matemático:

Y  11.7 X1  9.4 X 2  16.4 X 3  19.0 X1 X 2  11.4 X1 X 3  9.6 X 2 X 3

Valores óptimos

A=29.38%
B=0.0%
C=70.62%
Yˆ  17.38

174
Métodos Estadísticos para la Investigación experimental

2. EJEMPLO:

Para un experimento de mezcla, con tres componentes y restricciones

X1 : 0.3  X 1  0.4
X2 : 0.1  X 2  0.2
X3 : 0.5  X 3  0.6

Escribir es diseño consecuente.

d. DISEÑOS DE BOX – BEHNKEN

Es otra alternativa para la estimación de superficies de respuesta. Estos diseños tienen ventajas
sobre los diseños compuestos centrales:

 Utilizan menos corridas (excepto k=5), especialmente k=3.

 Existen solamente 3 niveles en cada factor (-1, 0, 1), mientras que en el diseño compuesto
central deben controlarse 5 niveles (-α, 1, 0, 1, α)

 Para construir diseños de 3-5 factores, se forman todos los posibles pares factoriales 22,
manteniendo en cero o su nivel medio en cero o su nivel medio al factor no considerado,
añadiendo los puntos centrales; en los diseños de 6-9 factores se consideran factoriales 23,
completando con ceros los factores no considerados, agregando puntos centrales.

El diseño de Box-Behnken para factores con puntos centrales

Corrida X1 X2 X3 Z1 Z2 Z3 Y1 Y2
1 -1 -1 0 80 7 310 13 87.6
2 1 -1 0 90 7 310 14 91.6
3 -1 1 0 80 7.4 310 7.3 71
4 1 1 0 90 7.4 310 6 69.8
5 -1 0 -1 80 7.2 300 12 83.1
6 1 0 -1 90 7.2 300 9.8 76
7 -1 0 1 80 7.2 320 7.5 72.4
8 1 0 1 90 7.2 320 5.7 68.5
9 0 -1 -1 85 7 300 11 82.2
10 0 1 -1 85 7.4 300 9.8 76.5
11 0 -1 1 85 7 320 13 90

175
Elías Alberto Torres Armas, Lic. Ms. C.

12 0 1 1 85 7.4 320 6.8 70.7


13 0 0 0 85 7.2 310 11 78.1
14 0 0 0 85 7.2 310 14 92.2
15 0 0 0 85 7.2 310 4.8 65.6

Donde:

Variables Niveles
Inferior Superior
Z1 80 (-1) 90 (1)
Z2 7.0 (-1) 7.4 (1)
Z3 300 (-1) 320 (1)

Para k=6, Box-Behnken presenta el siguiente diseño.

BLOQUE Factor_A Factor_B Factor_C Factor_D Factor_E Factor_F Var_1


1 1 -1 -1 0 -1 0 0 16
2 1 1 -1 0 -1 0 0 15
3 1 -1 1 0 -1 0 0 19
4 1 1 1 0 -1 0 0 18
5 1 -1 -1 0 1 0 0 18
6 1 1 -1 0 1 0 0 17
7 1 -1 1 0 1 0 0 20
8 1 1 1 0 1 0 0 21
9 1 0 -1 -1 0 -1 0 17
10 1 0 1 -1 0 -1 0 18
11 1 0 -1 1 0 -1 0 21
12 1 0 1 1 0 -1 0 21
13 1 0 -1 -1 0 1 0 25
14 1 0 1 -1 0 1 0 25
15 1 0 -1 1 0 1 0 25
16 1 0 1 1 0 1 0 25
17 1 0 0 -1 -1 0 -1 21
18 1 0 0 1 -1 0 -1 26
19 1 0 0 -1 1 0 -1 21
20 1 0 0 1 1 0 -1 25
21 1 0 0 -1 -1 0 1 25
22 1 0 0 1 -1 0 1 22
23 1 0 0 -1 1 0 1 18
24 1 0 0 1 1 0 1 15
25 1 -1 0 0 -1 -1 0 16
26 1 1 0 0 -1 -1 0 19
27 1 -1 0 0 1 -1 0 21
28 1 1 0 0 1 -1 0 24
29 1 -1 0 0 -1 1 0 25
30 1 1 0 0 -1 1 0 21
31 1 -1 0 0 1 1 0 15
32 1 1 0 0 1 1 0 21
33 1 0 -1 0 0 -1 -1 24
34 1 0 1 0 0 -1 -1 21
35 1 0 -1 0 0 1 -1 23
36 1 0 1 0 0 1 -1 25
37 1 0 -1 0 0 -1 1 21
38 1 0 1 0 0 -1 1 20

176
Métodos Estadísticos para la Investigación experimental

39 1 0 -1 0 0 1 1 22
40 1 0 1 0 0 1 1 25
41 1 -1 0 -1 0 0 -1 24
42 1 1 0 -1 0 0 -1 27
43 1 -1 0 1 0 0 -1 25
44 1 1 0 1 0 0 -1 35
45 1 -1 0 -1 0 0 1 21
46 1 1 0 -1 0 0 1 25
47 1 -1 0 1 0 0 1 20
48 1 1 0 1 0 0 1 25
49 1 0 0 0 0 0 0 18
50 1 0 0 0 0 0 0 19
51 1 0 0 0 0 0 0 20
52 1 0 0 0 0 0 0 20
53 1 0 0 0 0 0 0 18
54 1 0 0 0 0 0 0 15
El análisis se realiza de manera similar a los desarrollados anteriormente. Suponga que se realiza una
investigación con F=6 factores con la aplicación de Box-Behnken con 6 puntos centrales. Los
resultados se presentan en la última columna, junto al diseño. Realizar el análisis.
REFERENCIAS BIBLIOGRÁFICAS

ANDERSON McLEAN (1980). Desing of Experiments. A realistics Approach Marcel


Dekker Inc. New York USA.

AYALA-PARDO. (1995). Optimización por Diseños Experimentales, Talleres A&B S.A.


Lima.

BOX, HUNTER, HUNTER (1995). Estadística para Investigadores. Editorial Reverté S.A.
de Barcelona España.

COCHRAN, COX (1974) Diseños Experimentales. Editorial Trillas. México. Tercera


Reimpresión.

KRUSKAL-TANUR EDITORES (1978) International enciclopedia Of Statistics. Vol IV


The Free Press-Macmillam Publishing Co. Inc. New York USA.

LAWSON-MADRIGAL-ERJAVEC. (1992). Estrategias Experimentales para el


Mejoramiento de la Calidad en la Industria. Ed. Iberoamericana, México DF.

LEE WAYNE (1975) Experimental Desing and Analysis W.H. Freedman and Company.
San Francisco USA.

LIZARZABURU LIDIA (1981) Diseño y Análisis de Experimentos Vol. I y II U.N.T.


Trujillo, PERU.

MONTGOMERY DOUGLAS (1991) Diseño y Análisis de Experimentos. Tercera Edición


Editorial Iberoamericana. México.

OSTLE BERNARD (1973) Estadística Aplicada. Editorial Limusa Willey S.A. de México.
Tercera Reimpresión.

PHILIPPO BRUNO (1982) Introducción a la Optimización de Procesos. Ediciones


Universidad Católica de Chile. Alfa Beta Impresiones Stgo. De Chile. CHILE.

177
Elías Alberto Torres Armas, Lic. Ms. C.

PLUTCHIK ROBERT (1985) Fundamentos de Investigación Experimental. Harla S.A. de


C.V. México.

SNEDECOR, COCHRAN (1971) Métodos Estadísticos. Compañía Editorial Continental


S.A. de México.
DI RIENZO, JULIO ALEJANDRO; CASANOVES, FERNANDO; GONZALEZ,
LAURA ALICIA; TABLADA, ELENA MARGOT; DÍAZ, MARÍA DEL PILAR;
ROBLEDO, CARLOS WALTER. (2008). Estadística para las Ciencias Agropecuarias.
Balzarini, Mónica Graciela, Séptima Edición. EDICIÓN ELECTRÓNICA

HÉCTOR ADOLFO QUEVEDO URIAS (2006). Métodos estadísticos para la ingeniería


ambiental y la ciencia. Impreso en Cd. Juárez, Chihuahua, México Library of Congress
Cataloging in Publication Data. Este libro fue publicado en el Internet en Enero de 2006
por la Biblioteca Virtual de la Universidad Autónoma de Cd. Juárez.. La dirección
electrónica del libro es:
http://bivir.uacj.mx/LibrosElectronicosLibres/UACJ/ua00001.pdf

178
Métodos Estadísticos para la Investigación experimental

179

Вам также может понравиться