Вы находитесь на странице: 1из 37

MASTER

Eduardo Andraders Caravaca Picado

FECHAS: DEL 21 AL 25 DE OCTUBRE


HORARIO: DE 7.30 A 3.30

1
2
Razones del uso del D.X
Por lo general, un experimento es realizado por
una o varias de las razones siguientes:
 Identificar las principales causas de variación
en la respuesta
 Encontrar las condiciones que permitan
alcanzar un valor ideal en la respuesta
 Comparar las respuestas a diferentes niveles
de factores controlados por el investigador
 Construir modelos que permitan obtener
predicciones de la respuesta.

3
VENTAJAS DEL DISEÑO EXPERIMENTAL
- Elimina el efecto de variables perturbadoras o extrañas,
mediante el azar.
- El control y manejo de las variables predictoras aclaran la
dirección y naturaleza de la causa.
- Requiere una estrecha colaboración entre los investigadores
aplicados y investigadores estadísticos con las consiguientes
ventajas en el análisis e interpretación de las etapas del
programa.
- Debe enfocarse la atención a las interrelaciones y a la
estimación y cuantificación de fuentes de variabilidad en los
resultados.
-El número de pruebas requerido puede determinarse con
certeza y a menudo puede reducirse.
- La comparación de los efectos de los cambios es más precisa
debido a la agrupación de resultados.
- La exactitud de las conclusiones se conoce con una precisión
matemáticamente definida.
4
DESVENTAJAS DEL DISEÑO EXPERIMENTAL

1. Tales diseños y sus análisis, usualmente están


acompañados de enunciados basados en el lenguaje técnico del
estadístico. De hecho, siempre debería considerarse la
representación gráfica como un paso preliminar de un
procedimiento más analítico.

2. Muchos diseños estadísticos, especialmente cuando


fueron formulados por primera vez, se han criticado como
demasiado caros, complicados y que requieren mucho tiempo.
Tales críticas, cuando son válidas, deben aceptarse de buena fe
y debe hacerse un intento honesto para mejorar la situación,
siempre que no sea en detrimento de la solución del problema.

5
1. COMPRENSIÓN Y PLANTEAMIENTO DEL PROBLEMA

• Identificar el problema y diseñar un experimento aceptable.


• Involucrar al personal de todas las áreas que estén implicados.
• Un planteamiento claro del problema facilita el conocer del fenómeno y
a la solución del problema.
2. ELECCIÓN DE FACTORES Y NIVELES

• El experimentador elige los factores que variarán en el experimento.


• Elegir los intervalos de variación y niveles específicos.
• Se recomienda iniciar con dos niveles.
• Establecer cómo controlar los factores y cómo se medirán.

3. SELECCIÓN DE LA VARIABLE DE RESPUESTA

• Seleccionar la variable dependiente que dé información útil del problema


• Considerar las repeticiones para obtener el error de medición.

4. ELECCIÓN DEL DISEÑO EXPERIMENTAL

• Seleccionar el diseño experimental en base a los objetivos definidos.


• Considerar el tamaño muestral (número de repeticiones).
• Seleccionar el orden de ejecución de los experimentos (aleatorizar).
• Considerar la necesidad del bloqueo u otras restricciones de
aleatorización. 6
5. REALIZACIÓN DEL EXPERIMENTO

• Capacitarse en el manejo de técnicas e instrumentos de medición.


• Verificar coeficiente de variación (%C.V.) del analista.
• Calibrar equipos de medición.
• Verificar caducidad y condiciones de almacenamiento de reactivos.
• Estandarización de soluciones (reactivos químicos).
• Verificar condiciones de seguridad.

6. ANÁLISIS DE DATOS

• Usar métodos estadísticos para analizar los datos (Ej.: paramétricas


y no parametricas).
• Usar paquetes de análisis de datos.
• Obtener el error de las estimaciones.
• Asignar un nivel de confiabilidad a los resultados.

7. CONCLUSIONES Y RECOMENDACIONES

• Se deben obtener conclusiones prácticas de los resultados y recomendar


cursos de acción.
•Deben hacerse corridas de seguimiento y pruebas de confirmación para
validar las conclusiones del experimento (REPRODUCIBILIDAD).

7
LOS TRES PRINCIPIOS BÁSICOS
DEL
DISEÑO DE EXPERIMENTOS

1. Obtención de réplicas

2. Aleatorización y,

3. Análisis por bloques

8
TAMAÑO DE MUESTRA EN EL D.X
Según Fisher, para tener una estimación valida del
error experimental (EE) se requiere como condiciones
básicas: 1) replicación y 2) aleatorización .
La necesidad de replicar en experimentación fue
reconocida por investigadores experimentales desde
1864, haciendo una observación, si los tratamientos
son aplicados a material experimental absolutamente
homogéneo entonces una única replicación es
suficiente para sacar conclusiones acerca de la
población.
El numero de observaciones para un experimento es
determinado por:
1. El grado de precisión deseado.
2. La cantidad de variabilidad presente en el material
experimental.
3. Los recursos disponibles, incluyendo personal y
equipo (costo del experimento).
4. El tamaño y forma de la unidad experimental.
9
TAMAÑO DE MUESTRA EN EL D.X

• Para decidir el número de réplicas que se hará por cada


tratamiento (tamaño de muestra), si se esperan diferencias
pequeñas entre tratamientos será necesario un tamaño grande de
muestra.
• Estimar el tamaño muestral muchas veces requiere cierto
conocimiento previo sobre la varianza del error experimental.
• Si se recurre a la experiencia en los diseños se involucran un solo
factor varía entre cinco y diez.
• Considerar los costos y tiempo del experimento global.

Consideraciones

(1) Si espera poca variación entre tratamientos, tendra mas


réplicas si se quiere detectar diferencias significativas y viceversa.
Si se esperan grandes diferencias, quizá con pocas réplicas sea
suficiente.
(2) Si espera mucha variación dentro de cada tratamiento, debido
a variación de fuentes no controladas como métodos de medición,
medio ambiente, materia prima, etc., entonces será necesario más
réplicas.
(3) Si son varios tratamientos (cuatro o más), entonces éste es un
punto favorable para reducir el número de réplicas.
10
Recomendaciones del muestreo
1. Los sitios de referencia se deben muestrear usando una red
sistemática.
2. Pendientes simples sin curvaturas significativas pueden ser
muestreadas empleando un simple transecto(banda 8-10m). Este
debe extenderse desde la cumbre de la pendiente hasta la base de
la misma.
3. Si la curvatura es significativa una red sistemática no estratificada
debe ser empleada para muestreo descriptivo o de patrones. La red
debe extenderse desde el tope a la base de la pendiente a lo largo
del eje de la pendiente y a través de al menos una secuencia de
convexa/concava en la pendiente.
4. Para pendientes complejas con múltiples y pequeñas cuencas o
áreas de captación, se debe emplear una red sistemática. La
distancia entre puntos debe ser de 10 a 25 m.
5. Para análisis geoestadísticos se requieren el empleo de redes con 2
o más escalas en un diseño anidado para una evaluación adecuada
del variograma.
6. Para muestreo analítico (pruebas de diferencias entre grupos)
deberá emplearse una red de muestreo estratificado. El sitio deberá
ser estratificado antes del muestreo y al menos 10 muestras de cada
grupo se seleccionaran aleatoriamente.
11
PRINCIPIOS BÁSICOS DEL DISEÑO DE EXPERIMENTOS

1.- Reproducción. Proporciona una estimación del error


experimental. Permite obtener una estimación más precisa
del efecto medio de cualquier factor.

2.- Aleatorización. Asignación al azar del tratamiento a las


unidades experimentales. La aleatorización hace válida esta
suposición de que los errores son normales de varianza
constante.

3.- Control Local. Cantidad de balanceo, bloqueo y


agrupamiento de las unidades experimentales que se
emplean en el diseño estadístico adaptado.

12
Principios Básicos Del Diseño De
Experimentos
1) Control Local: son las acciones empleadas por el
investigador para disminuir o controlar el error
experimental
• Técnica
• Selección De Unidades Experimentales Homogéneas
• Bloquización
• Selección del Diseño Experimental Adecuado
• Utilizacion De Covariables

Ejemplo 1. Controlar el nivel de fertilidad del terreno.

Para esto se determinan unidades homogéneas de terreno


llamadas bloques según el grado de fertilidad, cada bloque se
subdivide en parcelas de igual área preferiblemente y sobre
estas se aleatorizan los tratamientos buscando que cada unidad
experimental reciba un único tratamiento y que la totalidad de
los tratamientos estén en el bloque (caso de bloques
completos).

13
Principios Básicos Del Diseño De
Experimentos

2) Replicación como un medio para estimar la variancia del


error experimental. La réplica implica una repetición
independiente del experimento básico.
Dicho de manera más específica, cada tratamiento se
aplica de manera independiente a dos o más unidades
experimentales.
• Proporciona medias para estimar la variancia del error
experimental
• Permite aumentar la precisión para estimar las medias de
los tratamientos.
• Da seguridad contra resultados anormales por accidentes no
previstos.

14
REPLICACION
El número de réplicas (r ) necesario para cada grupo en
tratamiento, se estima mediante:

donde

α: probab. error tipo I (significancia)(Rechazo Ho/Ho Cierta)


β: probab. error tipo II, (No Rechazo Ho/Ho Falsa)
potencia de la prueba=1- β (Rechazo Ho/Ho Falsa)
µ: la media Poblacional
σ2 = la varianza
δ= la magnitud de la diferencia entre las medias,
Z o T α /2 : valor tabular de la distribución normal,
Z o T β : valor tabular de la distribución normal,
CV : coeficiente de variación y dado por CV = 100(σ /µ)%:

15
Ejemplo
Considere el problema del número de semillas que germinan.
Suponga que el nivel de significancia es del 1%, una potencia del
95%, y un coeficiente de variación del 10% y un δ igual al 27% de µ
¿cuántas replicas son necesarias para cada grupo en tratamiento?
Reemplazando en la formula
Entonces, para cada una de las tres condiciones de fertilizantes, se
deberían considerar 5 repeticiones. El tamaño de muestra total sería
de 15 grupos.

TAMAÑO MUESTRAL TEORICO


El numero de replicas necesario para un Coeficiente de
variación dado(CV%) con probabilidad(1-β) de obtener una
diferencia significativa de δ ente dos medias de tratamiento,
con una prueba doble-cola con un nivel de significancia α

16
Número de muestras necesarias para
obtener una potencia de 0.80 en una
prueba t, de dos colas y 2 muestras.
Margen Probabilidad de error de tipo I ()
Error(%) 0.01 0.05 0.10 0.20
Número de muestras necesarias para una
potencia de 0.80
5 376 253 199 145
10 96 64 51 37
15 44 29 23 17
20 26 17 14 10
25 17 12 9 7
30 13 9 7 5
40 8 6 4 3
50 6 4 3 3

β = no rechaza la hipótesis nula siendo esta falsa


α = rechazar la hipótesis nula siendo esta verdadera

El poder o potencia (1- β ) del estudio es el complementario


del error de tipo II (1-β) representa la probabilidad de
observar en la muestra una determinada diferencia o
efecto, si existe en la población

17
Libreta de datos de campo
1. Nombre del sitio, 1. Geología/litología
2. Código de la muestra, 2. Precipitación media anual
3. Fecha del muestreo, 3. Pendiente media
4. Método de muestreo 4. Longitud de la pendiente
5. Superficie y profundidad de 5. Vegetación y uso de la tierra al
la muestra. muestrear
6. número del sitio y 6. Historia del uso de la tierra
7. Número de muestras 7. Profundidad máxima de
tomadas cultivo
8. Fecha del muestreo 8. Principales eventos de
9. Muestrista erosión(Agua, Viento)
10.Dueño propiedad (finca, 9. Condiciones del sitio en el
campo) momento del muestreo
11. Nombre de la propiedad 1. % cubierta de tierra
12.Mapa hoja 2. Presencia de erosivos
13.Escala del mapa 10.Otras características que se
14.Sistema de coordenadas consideren relevantes
15.Ubicación de los puntos
18
Muestreo de Areas

19
20
Para obtener el número de muestras se utiliza la norma MIL STD 105.
Esta norma presenta planes de muestreo simples, dobles y múltiples,
está basado en el NAC (nivel de calidad aceptado) y se puede usar para
controlar la proporción de defectos por unidad.
Para utilizar la norma MIL STD 105D se debe definir el nivel de
inspección, el cual está relacionado con el tamaño muestral.
Usualmente se utiliza el nivel II pero el nivel III se usa cuando el
costo de inspección es bajo y el nivel I cuando el costo es alto
21
PRINCIPIOS BÁSICOS DEL DISEÑO
DE EXPERIMENTOS
3) Aleatorización para validar la estimación de la variancia
del error experimental.

Consiste en aplicar en forma aleatoria los tratamientos a las


unidades experimentales.

La aleatorización tiende a promediar entre los tratamientos


cualquier efecto sistemático presente de forma que las
comparaciones entre tratamientos midan sólo los efectos de
los tratamientos mismos.

22
Aleatorización del DCA
Mediante una tabla de números al azar:
 1º paso: localizar el punto de comienzo en una
tabla de números al azar

 2º paso:
 Utilizando el punto de comienzo obtenido en el 1º
paso,
 seleccionar n números de tres dígitos, donde n es el
número total de UE (n=12).
 Se prefiere números de tres dígitos porque es más
difícil encontrar valores iguales.

23
 3º paso: Se ranquean los 12 números
seleccionados del menor al mayor.

Número al azar Secuencia Número al azar Secuencia Rango


149 1 149 1 2
361 2 361 2 7
180 3 180 3 4
018 4 018 4 1
427 5 427 5 8
243 6 243 6 6
494 7 494 7 9
704 8 704 8 12
549 9 549 9 10
157 10 157 10 3
571 11 571 11 11
226 12 226 12 5

4º paso: Asignar los tratamientos a las UE. Usar el rango como números de UE y la
secuencia con la cual se obtuvieron los números aleatorios para referirse a los
tratamientos. Por ejemplo el tratamiento A : al 2,7,4,1, el tratamiento B, al 8,6,9,12,
etc.
1 2 3 4
A C A
A
5 6 7 A 8

C B B
9 10 11 12

B C C B 24
Aleatorizacion DCA
Ejemplo 2: A cada conjunto de condiciones de empaque, (al
vacío, una mezcla de gases y 100% CO2), se le asignaron al azar
5 cortes del mismo tamaño (75 g). Cada corte tiene la misma
probabilidad de recibir cada uno de los tres tratamientos y se
asume que los cortes forman un grupo homogéneo (DCA). Se
mide el crecimiento bacterial se expresa como el número de
bacterias por centímetro cuadrado.
Los 15 cortes de carnes se enumeraron del 1 al 15, como muestra
el siguiente diagrama, asignando 5 a c/tratamiento luego se
generan 15 numeros aleatorios y se rankean, asignando cada
valor de rango a cada corte de carne y a su respectivo
tratamiento .

25
id trat rand_num rank
UE1 1-Trat Al vacio 0,516 8
UE2 1-Trat Al vacio 0,089 2
UE3 1-Trat Al vacio 0,388 6
UE4 1-Trat Al vacio 0,923 14
UE5 1-Trat Al vacio 0,824 13
UE6 2-Mezcla de gases 0,632 10
UE7 2-Mezcla de gases 0,713 11
UE8 2-Mezcla de gases 0,258 5
UE9 2-Mezcla de gases 0,231 4
UE10 2-Mezcla de gases 0,991 15
UE11 3-100% CO2 0,581 9
UE12 3-100% CO2 0,408 7
UE13 3-100% CO2 0,777 12
UE14 3-100% CO2 0,118 3
UE15 3-100% CO2 0,02 1
Por ejemplo, asigne el tratamiento 1 (Al vacio) a los cortes de
carnes # 8, 2, 6, 14 y 13. Así, por el estilo.
Posteriormente, se mide el número de bacterias por cm2

Ordenan
do los
datos

26
Verificación de normalidad en SPSS

27
CARGAR ARCHIVO DE CARPETA
PRACT1\DCA ej1-carne.SAV

28
29
COMPARACIONES MULTIPLES

30
¿Qué es la validez externa?
Validez externa: generalizar resultados

Fuentes de invalidación externa:


-Las condiciones del experimento
-Contexto experimental no luzca genuino
-Interacción entre tratamientos
-Falta de réplicas
-Poca descripción de tratamientos
-Mediciones de la var. dep.

31
Regresion en el ANOVA
• Un polinomio ortogonal es una ecuación de regresión.

• Cuando se planean experimentos, puede darse el caso


que los niveles de los factores o los tratamientos sean
cuantitativos.
• Por ejemplo, cuando se evalúa la aplicación de dosis
crecientes de un fertilizante en un determinado cultivo
con el objetivo de observar su efecto sobre la
producción.
• Si además, los niveles o tratamientos de interés tienen
incrementos igualmente espaciados, es interesante
conocer la naturaleza de la respuesta más que la
comparación entre tratamientos o niveles; para ello se
recurre a la técnica de polinomios ortogonales.

MODELOS DE REGRESIÓN POLINOMIAL

32
REGRESION Y CORRELACION LINEAL
ecuación de la recta

• Son dos herramientas para investigar la dependencia de


una variable dependiente Y en función de una variable
independiente X. Y = f(X)

Y = Variable dependiente que se desea explicar o predecir, también se


llama regresor o respuesta
X = Variable independiente, también se llama variable explicativa,
regresor o predictor
Regresión lineal - La relación entre X y Y se representa una línea recta
Regresión curvilinea - La relación entre X y Y se representa una curva

El coeficiente de Correlación r de Pearson es un indicador de


la fuerza de la relación entre las variables X y Y, puede asumir
valores entre -1 y 1 para correlación negativa y positiva
perfecta respectivamente, y 0 para nula.
coeficientes β0 y β 1 son parámetros del modelo llamados
coeficientes de regresión, 33
supuestos de regresión lineal
Los principales supuestos que se hacen en el análisis de
regresión lineal son los siguientes:
1. La relación entre las variables Y y X es lineal, o al menos
bien aproximada por una línea recta.
2. El término de error є tiene media cero(μ=0).
3. El término de error tiene varianza constante (σ2=k).
4. Los errores no están correlacionados.
5. Los errores están normalmente distribuidos.

Supuesto 1: Graficar X vs Y
Supuesto 2 a 3: Graficar los errores
Supuesto 3: Calcular el D de Durbin Watson para ver si hay
independencia secuencial, si es cercano a cero entonces hay
correlación positiva, pero si esta cercano a 4 será negativa, SE DESEA
SEA CERCANO A 2.

34
ANOVA vs REGRESION
Regresión:

• Estudia la relación estadística entre una o más


variables
predictoras y un variable respuesta.
• La función de regresión establece la naturaleza de la
relación entre la respuesta media y los niveles de las
variables predictoras.

ANOVA:
• Los niveles de las variables predictoras son tratados
como poblaciones separadas, cada una conduciendo
a una distribución de probabilidad diferenciada por
su media.
• Las diferencias cuantitativas entre niveles de un
factor y sus relaciones estadísticas con los valores
separados de la variable respuesta no son
consideradas.
35
ANOVA vs REGRESION

36
servic tiempo
io
a) Trazar un diagrama de dispersión
1 10,30 b) Obtener la ecuación de regresión lineal
10 34,93 y cuadrática y comparar
15 46,59 c) Estimar el consumo de energía para un
15 44,88 ajuste de máquina de 20 con regresión
16 54,12 cuadrática
17 56,63 d) Obtener los intervalos de predicción y
6 22,13 de confianza para un ajuste de máquina
5 21,15
de 20
2 9,95
8 24,45 e) Obtener el coeficiente de correlación y
11 31,75 de determinación R2=0,98
10 35
El coeficiente de determinación(R2)
8 25,02
4 16,86
indica el porcentaje de la variación total
2 14,38 que es explicada por la regresión.
2 9,6 El coeficiente beta nos indica la variacion
9 24,35 en Y por cada cambio unitario en X, o sea
8 27,5 la pendiente
4 17,08 Alfa es la interseccion con el eje Y
11 37
12 41,95
2 11,66
4 21,65
4 17,89
37
20 69

Вам также может понравиться