Вы находитесь на странице: 1из 31

UNIVERSIDAD NACIONAL DE HUANCAVELICA

ESCUELA DE POST-GRADO
DOCTORADO EN CIENCIAS AMBIENTALES

ASIGNATURA: ESTADÍSTICA APLICADA Y DISEÑOS


EXPERIMENTALES

DISEÑOS EXPERIMENTALES Y MUESTRALES

Dr. ALFONSO CORDERO FERNÁNDEZ


JUNIO 2019
DISEÑOS EXPERIMENTALES Y MUESTRALES

a) Estudio experimental
Se requiere tomar una decisión sobre un conjunto de manipulaciones
biológicamente realistas que incluyen controles apropiados.
b ) Estudio observacional
Se tiene que decidir que variables se va medir para responder de una
mejor manera las preguntas que descubriremos.

Estudio experimental

¿Cual es el efecto del factor X sobre la variable Y?


Esta pregunta se responde directamente por un experimento
manipulativo.

En un experimento de campo o en otras condiciones el investigador


establece activamente diferentes niveles del factor X y mide la respuesta
de la variable Y.
. Resultados estadísticamente significativos sugiere
que el factor X influye en la variable Y.

Los modelos estadísticos y matemáticos son


herramientas poderosas en ecología y en las
ciencias ambientales. Ellos permiten la previsión
de como las poblaciones y comunidades van ha
cambiar a lo largo del tiempo o responder a
condiciones ambientales alteradas.

El diseño de un experimento o estudio


observacional se refiere a como las replicas son
físicamente organizadas en el espacio y como son
muestreadas con el pasar del tiempo.
El diseño del experimento está íntimamente relacionado
a los principios básicos de la experimentación:
Replicación, randonización y el control local.

Diferenciación entre Variables Categóricas y


Continuas

a) Variables categóricas. Son clasificadas en dos o más


categorías.
Ejemplo:
- Sexo (macho, hembra)
- Categoría trófica (productor, carnívoro, herbívoro)
- Tipo de habitad (sol, sombra).
b) Variables continuas. Son medidas en una escala
numérica continua, pudiendo asumir una gama de
números reales o valores enteros.
Ejemplos:
- Las medidas del tamaño de los individuos
- La riqueza de las especies
- La cobertura de hábitats y la densidad
poblacional.
La distinción entre variables continuas y
categóricas no siempre es obvia, en muchos casos
la designación depende como el investigador
escogió medir la variable.
Ejemplo:
- Una variable categórica de habitad como
sol/sombra podría ser medida, en una escala
continua, usando un medidor de luz y registrando
la intensidad luminosa en diferentes lugares.
- Al contrario una variable continua salinidad podría
ser clasificada en tres niveles (bajo, medio, alto) y
tratada como una variable categórica.
Las variables categóricas y continuas describen
los tipos de datos que nosotros realmente
medimos en el campo o en el laboratorio.
Variables dependientes e independientes
Después de identificar los tipos de variables, se designa
las variables dependientes e independientes.
Ello, implica una hipótesis de causa y efecto que se está
intentando probar.
. La de tipo dependiente es la variable respuesta, la que
se está midiendo y la que se está interesado
determinar sus causas.
. La de tipo independiente es la variable predictora, la
que se supone ser responsable de la alteración en la
variable respuesta.
En un estudio experimental
Se manipula o se controla directamente los niveles
de la variable independiente y se mide la respuesta
de la dependiente.
En un estudio observacional
Va depender de la variación natural de la variable
independiente entre las replicas.

En estudios naturales y observacionales no se


conoce de antemano el poder de la variable
predictora.
CUATRO CLASES DE DISEÑOS DE EXPERIMENTOS

Variable Variable independiente


dependiente Continua Categórica
Continua Regresión ANOVA
Regresión
Categórica logística
Tabular
Este cuadro caracteriza datos univariados, donde
existe una UNICA VARIABLE DEPENDIENTE.
. Cuando las variables independientes fueran
continuas, las clases son regresión (variables
dependientes continuas) o regresión logística
(variables dependientes categóricas).
. Cuando las variables independientes son
categóricas, las clases son ANOVA ( variable
dependiente continua) o tabular (variable
dependiente categórica).
. El análisis de covarianza (ANCOVA) es usada
cuando existen 2 variables independientes:
a) una categórica
b) y otra continua (la covariable).
. Cuando existe más de una variable dependiente
se tiene un vector de variables dependientes
correlacionadas (MANOVA) u otros métodos
multivariados.
1. Diseños de Regresión
Cuando las variables independientes son medidas
en escalas numéricas continuas el esquema
muestral es un diseño de regresión. Si la variable
dependiente también es medida en una escala
continua, se usa modelos de regresión lineal o no
lineal. Es decir, la regresión es utilizada para
analizar relaciones entre variables continuas, que
describe la relación lineal entre una variable
predictora (X) y una variable respuesta (Y).
Si se mide en una escala ordinal (una respuesta
ordenada), se usa regresión logística.

a) Regresión de un factor
En este caso, se procede a la colección de datos de
un conjunto de replicas independientes. Para cada
replica, considere las variables predictora y
respuesta.
A modo de ejemplo, consideremos la simulación del
estudio de Brown y Leiberman (1973).
Hipótesis: La densidad de roedores del desierto es
controlada por la disponibilidad de semillas.
En cada parcela, se mide la densidad de semillas y
la densidad de roedores del desierto.
N° parcela Semillas/m2 (X) Roedores/m2 (Y)
1 12000 10.0
2 8000 3.0
3 3000 1.0
4 4500 1.5
5 5000 1.2
6 15000 12.0
7 10000 8.0
8 7500 3.0
9 4200 2.2
10 2000 1.0
11 1500 1.5
12 6000 5.0
Parcela 1:
- Densidad de semilla :
12000
- Densidad de roedores:
10.0
Cada cuadrado representa una parcela de 25 m2 .
En este estudio experimental, los niveles de la
variable predictora (X) son controlados y
manipulados directamente, y se mide la variable
respuesta (Y).
La hipótesis es de que la densidad de semillas es
responsable por la de roedores y no al contrario. Se
puede manipular la densidad de semillas en un
estudio experimental, es decir, adicionando o
retirando semillas para alterar su disponibilidad para
los roedores.
 En un estudio observacional, ninguna de las 2
variables es manipulada, y su muestreo es dada
por los niveles de variación natural de la variable
independiente (en el presente caso, semillas).
 Tanto en el estudio experimental como en el
observacional, el presupuesto es de que variable
predictora (independiente) es una causal: cambios
en el valor del predictor (densidad de semillas)
podrían causar una alteración en el valor de la
variable respuesta (densidad de roedores).
Resolución
Modelo estadístico
Y = B0 + B1 X + 𝜖
Obtener B0 y B1 .
෡ = (X ΄ X)−1 X ΄ Y
Se trata de estimar B
Luego:
B0 = -1.548859 B1 = 0.000863866
La ecuación de regresión de primer grado, es:
Y෡ = -1.548859 + 0.000863866X ,
donde (1500 ≤ X ≤ 15000).
El valor 0.000863866 , indica que existe un
aumento de 0.0008638 roedores/m2 por cada
m2 de semilla.
Análisis de varianza de la regresión

FV GL SC CM F

Regresión 1 139.739246 139.739246 67.58∗∗


67.58
Error 10 20.6774208 2.067742

Valor de F de la tabla:
1 con 10 g.l. (5% = 4.96 1% = 10.04)

Verificamos que la regresión lineal fue significativo


P < 0.01), indicando que existe la relación funcional
entre las cantidades de semillas/m2 y los números de
roedores/m2 .
Para obtener R2 establecemos la relación entre la SCRegresión y la SCTotal:
SCRegresión 139.739246
R2 = = = 0.871101.
SCTotal 160.416667
Resolución por el SAS
data SEMILLAS;
inputx y;
cards;
12000 10.0
8000 3.0
3000 1.0
4500 1.5
5000 1.2
15000 12.0
10000 8.0
7500 3.0
4200 2.2
2000 1.0
1500 1.5
6000 5.0
procregdata =SEMILLAS;
modely = x;
run;
Análisis de la varianza

Suma de Cuadrado
Fuente DF cuadrados de la media F-Valor Pr > F

Model 1 139.73765 139.73765 67.57 <.0001


Error 10 20.67902 2.06790
Total corregido 11 160.41667

Raíz MSE 1.43802 R-cuadrado 0.8711


Media dependiente 4.11667 Adj R-Sq 0.8582
Var Coef 34.93166

Estimadores de parámetros

Estimador del Error


Variable DF parámetro estándar Valor t Pr > |t|

Intercept 1 -1.54886 0.80457 -1.93 0.0831


x 1 0.00086387 0.00010509 8.22 <.0001
෡ = -1.54886 + 0.00086387X ∗∗
Y
Se puede también considerar el comando procplot
en la programación con el SAS :
data SEMILLAS;
input x y;
cards;
12000 10.0
8000 3.0
3000 1.0
4500 1.5
5000 1.2
15000 12.0
10000 8.0
7500 3.0
4200 2.2
2000 1.0
1500 1.5
6000 5.0
proc reg data =SEMILLAS;
model y = x;
run;
PROC PLOT;
PLOT Y*X/VPOS= 20 HPOS= 40;
RUN;
QUIT;
REGRESION LINEAL

Trazado def y*x. Leyenda: A = 1 obs, B = 2 obs, etc.

y‚
15 ˆ



‚ A

10 ˆ A

‚ A



5ˆ A

‚ AA
‚ A
‚ A A
‚ A A A

Šˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆ
0 5000 10000 15000
DATA SEMILLAS;
OPTIONS NODATE NOCENTER NONUMBER PS=80 LS=80;
TITLE 'REGRESION LINEAL';
INPUT X Y;
CARDS;
12000 10.0
8000 3.0
3000 1.0
4500 1.5
5000 1.2
15000 12.0
10000 8.0
7500 3.0
4200 2.2
2000 1.0
1500 1.5
6000 5.0
PROC PRINT;
RUN;
PROC REG;
MODEL Y=X;
RUN;
PROC PLOT;
PLOT Y*X/VPOS= 20 HPOS= 40;
RUN;
QUIT;
REGRESION LINEAL

Trazado def Y*X. Leyenda: A = 1 obs, B = 2 obs, etc.

Y‚
15 ˆ



‚ A

10 ˆ A

‚ A



5ˆ A

‚ AA
‚ A
‚ A A
‚ A A A

Šˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒƒƒƒƒˆ
0 5000 10000 15000

Вам также может понравиться