Вы находитесь на странице: 1из 7

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD.

APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

Actividades
Tema 6
Complementaria

TRABAJO REALIZADO POR: CARMEN M SNCHEZ CAMPOY

PROFESORES:

RAMN GUTIRREZ SNCHEZ


MARIA DOLORES RUIZ MEDINA

CURSO: DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD.


APLICACIONES EN BIOCIENCIAS E INGENIERA

- MASTER ESTADSTICA APLICADA 1

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

ENUNCIADO
Realizar traduccin y resumen del Seminario del Profesor Guillas.

SPLINES BIVARIADOS PARA MODELOS DE REGRESIN FUNCIONAL ESPACIAL


Se Considera el modelo funcional de regresin lineal donde la variable explicativa es
una superficie aleatoria y la respuesta es una variable real aleatoria, en diversas
situaciones en las que tanto la variable explicativa y el ruido puede ser ilimitados y
dependientes. Los Splines bivariados sobre triangulaciones representan superficies
aleatorias. Se utiliza esta representacin para la construccin de estimadores de
mnimos cuadrados de la funcin de regresin con un trmino de penalizacin. Bajo el
supuesto de que los regresores en la muestra abarcan un gran espacio de funciones,
las propiedades de aproximacin de los splines bivariados producen la consistencia
de los estimadores.

1. INTRODUCCIN Y PRELIMINARES
En varios campos, como la ciencia del medio ambiente, las finanzas, la ciencia
geolgica y la ciencia biolgica, grandes conjuntos de datos estn disponibles, por
ejemplo, por monitorizacin en tiempo real como en los satlites que circulan alrededor
de la Tierra. Por lo tanto, el objeto de estudio estadstico son curvas, superficies y
distribuidores, adems de los puntos tradicionales, nmeros o vectores. El anlisis de
datos funcionales (FDA) puede ayudar a representar y analizar los procesos aleatorios
de dimensin infinita (Ramsay y Silverman 2005; Ferraty y Vieu 2006).
En la regresin, cuando la variable explicativa es una funcin aleatoria y la respuesta
es un variable real aleatoria, podemos definir el denominado modelo lineal funcional,
consulte el Captulo 15 en Ramsay y Silverman (2005) y las referencias en l. Dicho
modelo puede generalizarse a la configuracin bivariada.
Sea Y una variable aleatoria con valores reales. Sea D un dominio poligonal en R 2 .
El modelo de regresin es como sigue:

Y = f ( X ) + = g , X + = g ( s ) X ( s )ds +
D

(1)

Donde g(s) est en un espacio funcional H (normalmente = L2 (D ) ), es una variable


aleatoria real que satisface:

E ( ) = 0 y E ( X ( s ) ) = 0 s D
Uno de los objetivos en FDA es determinar o aproximar g, la cual se define en un
dominio espacial 2 D de las observaciones en X obtenidas sobre un conjunto de
puntos de diseo en D e Y.
Motivado por diferentes estudios, consideramos un modelo de regresin funcional,
donde la variable explicativa es una superficie aleatoria y la respuesta es una variable
aleatoria real. Para expresar una superficie aleatoria en un 2 D irregular poligonal
dominio D , vamos a utilizar splines bivariados que son partes de funciones
polinomiales suaves sobre un dominio triangulado polinomial 2 D . Son similares a
2

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

splines univariados definidos en subintervalos a trozos. La teora de tales funciones


spline bivariados ha madurado recientemente, vea la monografa por Lai y Schumaker
(2007).
Nuestros splines bivariados son funciones de polinomios a trozos. Hay que tener en
cuenta que la funcin bases para nuestros espacios de splines son polinomios de
Bernstein-Bzier sobre tringulos que son localmente soportados y no negativos. Las
funciones de base forman una particin de la unidad, una base estable y son
adecuados para el clculo.
Se ha implementado nuestro aproximacin utilizando splines bivariados y ejecutando
simulacin numrica, y la prediccin con un conjunto de datos reales. Se compara con
los mtodos de previsin univariante para mostrar que nuestro mtodo funciona muy
bien. Hasta donde sabemos, nuestro estudio es el primer trabajo en la regresin
funcional de una variable aleatoria real sobre superficies aleatorias.
El trabajo se organiza de la siguiente manera. Despus de presentar splines
bivariadas en la seccin previa, consideramos aproximaciones de funcionales lineales
con un trmino de penalizacin en la siguiente seccin. Entonces abordamos el caso
de observaciones discretas de superficies aleatorias en la Seccin 4. Con el fin de
ilustrar los hallazgos en una zona irregular, en la Seccin 5 se llevan a cabo
simulaciones y previsiones con datos reales, para el que el dominio est delimitado por
las fronteras de los EE.UU., y los puntos de muestreo son la Agencia de Proteccin
Ambiental de EE.UU. (EPA) localizaciones de monitorizacin. Nuestros experimentos
numricos demuestran la eficacia y la conveniencia de utilizar splines bivariados para
aproximar funciones lineales en el anlisis de regresin de datos funcional.

3. APROXIMACIN DE FUNCIONALES LINEAL CON PENALIZACIN


A lo largo de esta seccin se presentan una serie de Teoremas y Lemas con sus
correspondientes demostraciones que nos llevan a obtener las siguientes conclusiones:
Suponemos que X e Y sigue el modelo de regresin (1), definido en la seccin anterior.
En aplicacin tenemos la solucin H que se resuelve con el siguiente problema
de minimizacin:

= arg min E (Y , X
H

2
r

donde > 0 es un parmetro y r denota la semi-norma de :


2

2
r

= Er ( , ) donde Er ( , ) =

D D D D

D k =0 i + j = k

i
1

j
2

i
1

j
2

Con D1 , D2 posicin de la derivada parcial con respecto a la primera y segunda


variables. Salvo que la penalizacin sea igual a cero, no es necesariamente igual a g.
Desde S dr ( ) puede ser denso en el espacio de Hilbert H como 0 , se considera
un espacio spline S dr ( ) para una suavidad r 0 y el grado d > r sobre una
triangulacin

de D

con

suficientemente pequeas.

La aproximacin

S , Sdr ( ) de es:
3

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

S , = arg min
E ( Y , X

Sdr ( )

Sea {1 ,..., m } una base para S dr ( ) , entonces, S =

cii , X +

i =1

+ E ( )
r

c
j =1

c
i =1

=0

i i
r

Sea X 1 ,..., X n una sucesin de variables aleatorias funcional tal que slo el polinomio
cero es perpendicular al subespacio generado por { X 1 ,..., X n } , excepto en un evento
tiende a cero cuando n + . La estimacin emprica

cuya probabilidad pn

r
S
, , n S d ( ) es la solucin de:

1 n
S
=
arg
min
(Yi , X i

, ,n
Sdr ( ) n
i =1

2
d

con > 0 el parmetro suavizado. La solucin de la minimizacin est dada por:


m

S
, , n = cn ,ii
i =1

 n c = b n , donde:
con vector de coeficientes cn = (cn ,i , i = 1,..., m) que satisface
n
n

n = 1

i , X l j , X l + Er (i , j )

n
l =1
i , j =1,...,m

1 n

1 n

b n = Yl j , X l
= ( f ( X l ) + l ) j , X l
n l =1
j =1,..., m n l =1
j =1,..., m

Mediante un serie de Teoremas y Lemas se demuestra que S , ,n se aproxima a S ,


en probabilidad.

4. APROXIMACIN DE FUNCIONALES LINEALES


BASADO EN OBSERVACIONES DISCRETA
Sea X las observaciones sobre algunos puntos diseado sk , k = 1,..., N en D . Sea

S X la aproximacin spline en forma de cuadrado mnimo discreto de X asumiendo que


sk , k = 1,..., N se distribuye uniformemente sobre de D con respecto a S dr () .
Consideramos S que resuelve el siguiente problema de minimizacin:

S = arg min E ( Y , S X
H

2
r

Se busca aproximar S S dr ( ) de S tal que:


S

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

S = arg min
E ( Y , S X
S

S dr ( )

2
r

Primero se analiza como S se aproxima a .

F ( ) = E ( Y , X

es una funcin estrictamente convexa y as FS ( ) = E Y , S X

2
r

La estimacin emprica de S X basado en observaciones discretas de superficies

 S r () es la solucin de:
aleatorias X 1 ,..., X n . La estimacin emprica S
d
, ,n

1 n
S
Yi , S X i

, , n = arg min
Sdr ( ) n
i =1

2
d

La solucin de la minimizacin de la ecuacin anterior est dada por:


m


S
, , n = cn ,ii
i =1

 
con coeficiente vector cn = (c
n ,i , i = 1,..., m ) que satisface n cn = b n , y
n
n = 1

n i , S X l
l =1

j , S X + Er (i , j )
l

i , j =1,...,m

donde S X l es el cuadrado mnimo discreto en forma de X l y

1 n

b n = Yl j , S X l
n l =1
j =1,...,m

 S r () .
Se pretende llegar a la demostracin de la estimacin emprica S
d
, ,n
5. EXPERIMENTO Y SIMULACIN NUMRICA
Las Simulaciones demuestran la calidad de las propiedades asintticas en un
escenario real. Se lleva a cabo una aplicacin a la concentracin de ozono sobre la
previsin de EE.UU. que ilustra las capacidades de pronstico del mtodo, muestra las
habilidades de prediccin del mtodo. Se compara el mtodo de mnimos cuadrados
con pena al principal mtodo de regresin de componentes. Tamaos de muestra
moderados proporcionan pronsticos de buena calidad en ambos casos con poco
esfuerzo computacional. Se ilustra la variabilidad de las previsiones debido a la
eleccin de suavizado de penalizacin. Por ltimo, se compara nuestras predicciones
con los obtenidos utilizando splines de placa delgada. Las predicciones basadas en
splines bivariados requieren menos tiempo de clculo, son ms precisos, y exhiben
mayor robustez a las variaciones en el muestreo.
Se cuenta con splines bivariados ms triangulaciones para construir la superficie.

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

SIMULACIN
En primer lugar se realiza un ejemplo de simulacin de un dominio completo
delimitado por la frontera de EE.UU. con funciones de splines bivariados, .
Se utiliza la functional lineal Y = g , X

con g ( x, y ) = sen(2 ( x 2 + y 2 )) sobre el

dominio de EE.UU. (escalado) el propsito de la simulacin es estimar g a partir del


valor Y basado en superficies aleatorias X, aadiendo ruido de media cero y
desviacin estandar 0.0002, para obtener el valor del ruido Yi del funcional.
Se lleva a cabo un experimento de Monte Carlo con 20 semillas aleatorias diferentes,
los resultados numricos muestran que se producen una buena aproximacin del
funcional lineal.

PREDICCIN CONCENTRACIN DE OZONO


Basndose en la simulacin anterior se quiere realizar una prediccin de la
concentracin del nivel en tierra de ozono en el centro de Atlanta, utilizando las
superficies aleatorias de todo el territorio de EE.UU. basadas en las medidas de las
969 estaciones de la EPA de los das previos.
Lo que se desea es que a partir de los valores de las concentraciones en todo el
territorio de EE.UU. a una hora dada en un da concreto, se pueda predecir el valor de
la concentracin en el centro de Atlanta en esa misma hora al da siguiente.
Los pasos realizados son:
Paso1: Basado en las observaciones X de las 969 estaciones EPA alrededor
de EE.UU. a una hora concreta en un da sealado, se calcula mediante
computacin el spline de ajuste por mnimos cuadrados S X , con parmetro de
penalizacin 10-2. Se donota por f X la concentracin de ozono en Atlanta a
esa misma hora del da siguiente.
Paso2:Encontramos una funcin spline S A sobre la misma triangulacin que
resuelva el siguiente problema de minimizacin:

1
min
sS51 ( ) 24 N

( f

24 N
i =1

Xi

s, S X i

para N das.
Paso3: Basado en los valores del ozono Z sobre EE.UU. a una hora
determinada el 6 de septiembre se calcula el ajuste de penalizacin por
mnimos cuadrados y se calcula tambin el producto interno de S Z con S A
para predecir el valor del ozono a la misma hora el 8 de septiembre.
Posteriormente se realiza el mismo experimento para una triangulacin menor de
EE.UU. quedandose con 1/4 de todo el territorio, para aumentar la eficiencia
computacional.

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


AUTORA: CARMEN MARA SNCHEZ CAMPOY

Comparando las predicciones con los resultados reales, se demuestra que la tcnica
que splines bivariados utilizada predice muy bien los valores de concentracin de
ozono, para los 5 das siguientes. Especialmente en los picos de concentracin