Вы находитесь на странице: 1из 13

PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE

FACULTAD DE MATEMÁTICAS
DEPARTAMENTO DE ESTADÍSTICA

TAREA 1 - PAUTA
Métodos Estadı́sticos I - EPG3306

Profesor : Anita Araneda


Ayudante : Fabián Fuentealba
Fecha de entrega : jueves 26 de abril, 15:30

Parte I: Resuelva los siguientes ejercicios:

1. Un grupo de veterinarios está interesado en estudiar si la mediana del peso de los perros de
determinada raza ha aumentado con respecto a tiempos pasados, en que era de 30 kg. Para
esto, registran el peso de 15 perros seleccionados de manera aleatoria, obteniedo los siguientes
resultados (expresados en kg.):

23,8 26,0 26,9 27,4 28,0 30,3 30,7 31,2


31,3 32,8 33,2 33,9 34,3 34,9 35,0

Realice un test paramétrio y uno no parámetrico para evaluar la validez de la conjetura de estos
veterinarios. Utilice α = 5 %.

Solución:

a) Test paramétrico: Se pide un test para medianas. Dado que no conocemos tests paramétri-
cos para medianas, miraremos un qqplot para estudiar la simetrı́a de la distribución de los
datos:

Métodos Estadśiticos I 1 Primer Semestre 2018


La distribución de los datos no muestra diferencias sistemáticas con respecto a una distri-
bución Normal, lo que sostiene el argumento de simetrı́a, donde media y mediana coin-
ciden. Por ello, para estudiar la conjetura, realizaremos un test de medias. Utilizaremos
iid
el estadı́stico t aprovechando la Normalidad de los datos. Supuestos: X1 , . . . , Xn ∼
Normal(µ, σ 2 ).
H0 : M = µ ≤ 30 H1 : M = µ > 30.
El estadı́stico del test corresponde a:

X̄ − µ0 30,65 − 30
t0 = √ = √ = 0,71.
S/ n 3,52/ 15

El valor-p corresponde a:

P (T14 ≥ t0 ) = 1 − pt(0,71, 14) = 1 − 0, 76 = 0, 24 > α.

Con significancia 5 %, no encontramos evidencia para concluir que la mediana ha aumen-


0,95
tado. (Alternativamente, se puede comparar t0 < t14 = 1, 76 < 0,71.)

Puntaje: [1,0] por justificar test de medias - [0,5] por argumentar Normalidad para utilizar
test t - [1,0] por test t bien aplicado - [0,5] por conclusión bien redactada.

b) Test no paramétrico: Podemos realizar el Test de Signos para las mismas hipótesis. El es-
tadı́stico del test corresponde al número de observaciones en la muestra mayores o iguales
a 30 , y0 = 10. El valor-p correspode a:

1 − pbinom(9, 15, 1/2) = 1 − 0,85 = 0,15 > α.

Al igual que con el test paramétrico, con significancia 5 %, no podemos concluir que la
mediana ha aumentado.
Alternativamente, se puede plantear el test para la probabilidad de que una observación
sea mayor o igual a 30:

H0 : p ≤ 0, 5 H1 : p > 0, 5.

En este caso, el estadı́stico del test corresponde a:

p̂ − 0, 5 10/15 − 0, 5
z0 = q = q = 1, 29.
0,5×0,5 0,5×0,5
n 15

El valor-p corresponde a:

1 − pnorm(1, 29) = 1 − 0, 90 = 0, 10 > α.

Métodos Estadśiticos I 2 Primer Semestre 2018


También podemos realizar el Test de Rangos Signados:
Xi |Xi − 30| Zi Ri
23,8 6,2 0 15
26,0 4,0 0 11
26.9 3,1 0 8
27,4 2.6 0 6
28,0 2,0 0 5
30,3 0,3 1 1
30,7 0,7 1 2
31,2 1,2 1 3
31,3 1,3 1 4
32,8 2,8 1 7
33,2 3,2 1 9
33,9 3,9 1 10
34,3 4,3 1 12
34,9 4,9 1 13
35,0 5 ,0 1 14
15
X
W = Zi Ri = 75.
i=1

El valor-p corresponde a:

1 − psignrank(74, 15) = 1 − 0,79 = 0, 21 > α.

Al igual que los tests anteriores, con significancia 5 %, no podemos concluir que la media-
na ha aumentado.

Puntajes: Basta uno de los dos tests: Signos o Rangos Signados.


Test de Signos: [1,0] por estadı́stico - [1,5] por valor-p, ya sea por aproximación
Normal o exacto - [0,5] por conclusión precisa.

Test de Rangos Signados: [1,0] por estadı́stico (debe mostrar el trabajo) - [1,5] por
valor-p (debe mostrar trabajo). No es aceptable la aplicación directa de función wilcox.test
- [0,5] por conclusión precisa.

[1,0] punto base

Métodos Estadśiticos I 3 Primer Semestre 2018


2. En un experimento diseñado para verificar si existe diferencia sistemática entre los resultados
obtenidos por dos balanzas de tecnologı́as diferentes, se recolectó los siguientes pesos de 20
rocas:

Balanza 1 11,23 14,36 8,33 10,50 23,42 9,45 13,47 6,47 12,40 19,38
Balanza 2 6,46 14,41 8,35 13,52 9,17 23,41 10,52 19,35 12,45 11,27

Realice un test no paramétrico para estudiar la conjetura de interés.

Solución: Utilizaremos el test de Mann-Whitney. La hipótesis alternativa es que las distribu-


ciones se encuentran transladadas: una tiende a ser mayor que la otra. El ordenamiento para
calcular los estadı́sticos corresponde a:

Obs. Balanza Rango


6.46 2 1
6.47 1 2
8.33 1 3
8.35 2 4
9.17 2 5
9.45 1 6
10.50 1 7
10.52 2 8
11.23 1 9
11.27 2 10
12.40 1 11
12.45 2 12
13.47 1 13
13.52 2 14
14.36 1 15
14.41 2 16
19.35 2 17
19.38 1 18
23.41 2 19
23.42 1 20

De este modo, R1 = 104, R2 = 106, y:


10 × 11
U1 = 104 − = 49
2
10 × 11
U2 = 106 − = 51.
2
Un estadı́stico Normal aproximado corresponde a:
|U1 − 10 × 10/2|
z0 = q = 0, 08.
10×10×21
12

El valor-p aproximado del test corresponde a:


2 · (1 − pnorm(0, 08)) = 0, 94,

Métodos Estadśiticos I 4 Primer Semestre 2018


que no permite rechazar H0 . Con significancia 5 % no se encontró evidencia para afirmar que
una distribución tiende a ser mayor que la otra.
Es posible verificar el resultado a través de:

> wilcox.test(x,y)

Wilcoxon rank sum test

data: x and y
W = 49, p-value = 0.9705
alternative hypothesis: true location shift is not equal to 0

Puntajes: [1,0] por hipótesis - [2,0] por cálculo “manual”de U1 o U2 - [2,0] por valor-p Normal
aproximado - [1,0] or conclusión correctamente redactada.

[1,0] punto base

Métodos Estadśiticos I 5 Primer Semestre 2018


En las Partes II y III de esta tarea, se le pide analizar los datos que dieron origen al articulo Habitat
Association Studies of the Northern Spotted Owl, Sage Grouse and Flammulated Owl (Ramsey et al.
1994).
Contexto: El estudio se enmarca en un esfuerzo por la preservación de especies en peligro de ex-
tinción en los bosques estatales de la zona nor-oeste de Estados Unidos, donde se ha desarrollado
particularmente la industria maderera. El estudio fue diseñado para estudiar asociaciones de variables
relacionadas a los hábitats de diferentes tipos de búhos. Para esto, se localizaron 30 nidos de búhos
utilizando vocalizaciones humanas grabadas y silbatos para detectar a las aves.
Los datos se encuentran en el archivo bosques.txt y las variables corresponden a:

Variable Desripción
tipo : Indica si el lugar en el que se centran las mediciones corresponde a un nido de búhos (N)
o ha sido escogido de manera aleatoria (R)
r0.91 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio 0,91 km. alrededor
del sitio
r1.18 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 1,18 km. y radio
interior 0,91 km. alrededor del sitio
r1.40 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 1,40 km. y radio
interior 1,18 km. alrededor del sitio
r1.60 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 1,60 km. y radio
interior 1,40 km. alrededor del sitio
r1.77 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 1,77 km. y radio
interior 1,60 km. alrededor del sitio
r2.41 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 2,41 km. y radio
interior 1,77 km. alrededor del sitio
r3.38 : Porcentaje de bosque maduro (mayor a 80 años) en un anillo de radio exterior 3,38 km. y radio
interior 2,41 km. alrededor del sitio
Parte II
Utilizando las herramientas de tests de hipótesis aprendidas en clases, realice un estudio para
detectar posibles asociaciones entre los hábitats preferidos por los búhos y la densidad del bosque,
teniendo en cuenta lo siguiente:
Realice tanto análisis descriptivos como inferenciales, comparando sitios escogidos de manera
aleatoria con sitios donde fueron localizados nidos.
Realice tanto análisis descriptivos como inferenciales para estudiar asociaciones entre la densi-
dad del bosque en sitios ubicados a diferentes distancias.
Utilice tanto tests paramétricos como no paramétricos.
No olvide verificar supuestos cuando corresponda.
Trabaje en base a valores-p y utilice significancia α = 0, 05 para obtener sus conclusiones.
Escriba un reporte sobre sus hallazgos

Parte III
Se piensa que una densidad de 80 % de bosque maduro es adecuada para la residencia de estos tipos
de búhos. Estudie esta conjetura a través de tests de hipótesis, teniendo en cuenta las observaciones en
la Parte I. Escriba un reporte sobre sus hallazgos.

Métodos Estadśiticos I 6 Primer Semestre 2018


1. Introducción
Debe explicar el objetivo del estudio.

2. Análisis descriptivos preliminares


Se esperan algunas representaciones gráficas que comparen la situación tanto entre lugares de nidos
y lugares aleatorios como entre porcentajes de bosque maduro ubicados a diferentes distancias, espe-
cialmente en el caso de los sitios con nido. A modo de ejemplo, se muestran algunas figuras:

Figura: Boxplots sitios de nidos, a diferentes radios, y boxplot sitios aleatorios (todos juntos). Se observa que
las distribuciones se van concentrando en menores porcentajes de bosque maduro en la medida en que las
mediciones se alejan del sitio de nido. Se observa que el centro de la distribución del porcentaje de bosque
maduro en sitios escogidos de manera aleatoria se encuentra en valores más bajos que el de las distribuciones
de porcentaje de bosque maduro en los alrededores de un sitio de nido, a excepción del anillo externo, a
distancia 3,38km.

Métodos Estadśiticos I 7 Primer Semestre 2018


Figura: Boxplots comparativos sitios de nidos y aleatorios. Esta figura sirve para los mismos fines que la figura
anterior, sin embargo es cuestionable separar las mediciones realizadas alrededor de sitios escogidos de
manera aleatoria. Hasta una distancia de 2,41km alrededor de un sitio con nido se observa que las
distribuciones de porcentaje de bosque maduro están concentradas en valores mayores en las mediciones
realizadas alrededor de sitios aleatorios.

Métodos Estadśiticos I 8 Primer Semestre 2018


Figura: Distribuciones suavizadas porcentaje de bosques a distintos radios, sitios de nidos. Hasta los 2,41km
alrededor de un sitio de nido, las distribuciones del porcentaje de bosque maduro se encuentran entre 40 % y
100 %. A una mayor distancia, en el anillo exterior (linea roja gruesa) la distribución baja y se concentra
entre 20 % y 80 %.

Figura: Distribuciones suavizadas porcentaje de bosques a distintos radios, sitios aleatorios. Dado que el
centro de las mediciones fue escogido de manera aleatoria, no se observan diferencias importantes entre las
distribuciones a diferentes distancias al dentro de las mediciones.

Métodos Estadśiticos I 9 Primer Semestre 2018


Figura: distribuciones suavizadas sitios de nidos a diferentes radios y sitios aleatorios (todos). La distribución
del porcentaje de bosque maduro en sitios escogidos de manera aleatoria (curva gruesa roja) está más a la
izquiera que las distribuciones alrededor de sitios con nidos, a excepción del anillo más externo (linea gruesa
verde) a 3,38km. La distribución en el anillo interior de un lugar de nido (linea gruesa negra) está ubicada
más a la derecha que las demás

A modo general, las figuras muestran:


Para los sitios donde se encontraron nidos de búhos, las distribuciones del porcentaje de bosque
maduro se van trasladando hacia la izquierda (valores más bajos) en la medida en que uno se
aleja del nido (centro de las mediciones).

Este efecto no se detecta (y no hay razón de que exista) en las mediciones realizadas en torno a
sitios escogidos de manera aleatoria.

A excepción del anillo más externo de las mediciones, de radio exterior 3,38km, se observa
que las distribuciones de bosque maduro alrededor de sitios en los que se encuentran nidos
están hacia la derecha (valores mayores) de la distribución del porcentaje de bosque maduro
alrededor de sitios escogidos de manera aleatoria.
También es posible explorar correlaciones entre los porcentajes de bosques en los diferentes ani-
llos, notando que éstas son todas positivas, moderadas a fuertes, disminuyendo en la medida en que
las mediciones se alejan.
> round(cor(N),2)
r0.91 r1.18 r1.40 r1.60 r1.77 r2.41 r3.38
r0.91 1.00 0.69 0.55 0.48 0.53 0.66 0.12
r1.18 0.69 1.00 0.70 0.74 0.69 0.65 0.32
r1.40 0.55 0.70 1.00 0.74 0.69 0.58 0.37
r1.60 0.48 0.74 0.74 1.00 0.78 0.62 0.36
r1.77 0.53 0.69 0.69 0.78 1.00 0.76 0.44
r2.41 0.66 0.65 0.58 0.62 0.76 1.00 0.44
r3.38 0.12 0.32 0.37 0.36 0.44 0.44 1.00

Métodos Estadśiticos I 10 Primer Semestre 2018


> round(cor(R),2)
r0.91 r1.18 r1.40 r1.60 r1.77 r2.41 r3.38
r0.91 1.00 0.71 0.59 0.51 0.48 0.49 0.25
r1.18 0.71 1.00 0.85 0.78 0.56 0.64 0.37
r1.40 0.59 0.85 1.00 0.75 0.48 0.56 0.31
r1.60 0.51 0.78 0.75 1.00 0.60 0.67 0.52
r1.77 0.48 0.56 0.48 0.60 1.00 0.75 0.63
r2.41 0.49 0.64 0.56 0.67 0.75 1.00 0.69
r3.38 0.25 0.37 0.31 0.52 0.63 0.69 1.00

3. Análisis inferenciales I
Los análisis inferenciales deben incluir tests de hipótesis adecuados para verificar las conjeturas
realizadas en base a los análisis descriptivos. Para todos los tests de medias utilizados, se debe revisar
los supuestos necesarios para su aplicación. La siguiente tabla resume algunos de los posibles tests y la
verificación de sus supuestos. La Normalidad fue evaluada a través de qqplots, y la homocedasticidad
a través de intervalos de confianza Fisher para la razón entre las varianzas.

A modo general, a partir de los diversos tests de hipótesis (los que se muestran en la tabla y otros),
se concluye que:
Para mediciones realizadas alrededor de sitios de nido: no se detectan diferencias significativas
entre la media del porcentaje de bosque maduro en el anillo interior y los restantes, a excepción
de los dos anillos más externos, 2,41km y 3,38 km, que tienen una media significativamente
menor. Estas conclusiones también aplican a las medianas.
Para mediciones realizadas alrededor de sitios aleatorios: no se detectan diferencias significati-
vas entre las medias de los porcentajes de bosque maduro en diferentes anillos. Estas conclusio-
nes también aplican a las medianas.
Anillos alrededor de sitios con nidos: se detecta evidencia significativa de que las medias de los
porcentajes de bosque maduro en estos anillos son mayores a la media de los anillos alrededor
de sitios escogidos de manera aleatoria.
Anillos alrededor de sitios con nidos: se detecta evidencia significativa de que las medianas de
los porcentajes de bosque maduro en estos anillos son mayores a la mediana de los anillos
alrededor de sitios escogidos de manera aleatoria, a excepción del anillo externo a 3,38km.

Métodos Estadśiticos I 11 Primer Semestre 2018


4. Análisis inferenciales II
La siguiente tabla resume algunos de los posibles tests de comparación de proporciones de bosque
maduro mayores o iguales a 80 %.

A modo general, a partir de los diversos tests de hipótesis (los que se muestran en la tabla y otros),
se concluye que:

Para mediciones realizadas alrededor de sitios de nido: no se detectan diferencias significativas


entre la proporción de bosque maduro mayor o igual a 80 % en el anillo interior y los restantes,
a excepción de los dos anillos más externos, 2,41km y 3,38 km, que tienen una proporción
significativamente menor.

Para mediciones realizadas alrededor de sitios aleatorios: no se detectan diferencias significati-


vas entre las proporciones de porcentajes de bosque maduro mayor o igual a 80 % en diferentes
anillos.

Anillos alrededor de sitios con nidos: se detecta evidencia significativa de que las proporciones
de los porcentajes de bosque maduro mayor o igual a 80 % en estos anillos son mayores a la
proporción de los anillos alrededor de sitios escogidos de manera aleatoria, a excepción del
anillo externo a 3,38km.

5. Conclusiones
Debe argumentar cómo los resultados de los análisis anteriores, descriptivos e inferenciales, sus-
tentan la hipótesis de que los búhos prefieren hábitats de bosque maduro para localizar sus nidos. En
general, se encuentran diferencias significativas en calidad y cantidad de bosque maduro hasta el anillo
de radio externo 2,41km.

Métodos Estadśiticos I 12 Primer Semestre 2018


Puntajes:

[0,5] Introducción

[1,5] Análisis descriptivos (deben ser multivariados)

[1,0] Pertinencia de los tests de hipótesis realizados, con revisión de sus supuestos

[1,0] Completitud del análisis de medias y medianas de modo de llegar a las conclusiones

[1,0] Completitud del análisis de proporciones de modo de llegar a las conclusiones

[1,0] Conclusiones generales

[1,0] punto base

NOTA IMPORTANTE: La nota del reporte tiene doble ponderación en la nota de la tarea

Métodos Estadśiticos I 13 Primer Semestre 2018

Вам также может понравиться